0% found this document useful (0 votes)

124 views

Arm PPT

The document discusses using association rule mining and market basket analysis to generate product recommendations for customers on Bigbasket. It describes how association rule mining can be used to find rules that predict the occurrence of an item based on other co-occurring items in transactions. The key steps involve finding frequent itemsets whose support is above a minimum threshold, and then generating high confidence rules from these itemsets. Examples of applications discussed include generating recommendations for supermarket shelf management by identifying commonly purchased item combinations.

Uploaded by

Rupesh Jain

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

124 views

Arm PPT

Uploaded by

Rupesh Jain

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 15

Customer Analytics at Bigbasket

– Product Recommendations
Association Rule Mining
• Given a set of transactions, find rules that will predict the occurrence
of an item based on the occurrences of other items in the transaction

Market-Basket transactions
Example of Association Rules
TID Items
{Diaper} → {Beer},
1 Bread, Milk {Milk, Bread} → {Eggs,Coke},
2 Bread, Diaper, Beer, Eggs {Beer, Bread} → {Milk},
3 Milk, Diaper, Beer, Coke
4 Bread, Milk, Diaper, Beer Implication means co-occurrence,
5 Bread, Milk, Diaper, Coke not causality!
Definition: Frequent Itemset
• Itemset TID Items
• A collection of one or more items 1 Bread, Milk
• Example: {Milk, Bread, Diaper}
2 Bread, Diaper, Beer, Eggs
• k-itemset 3 Milk, Diaper, Beer, Coke
• An itemset that contains k items
4 Bread, Milk, Diaper, Beer
• Support count () 5 Bread, Milk, Diaper, Coke
• Frequency of occurrence of an itemset
• E.g. ({Milk, Bread, Diaper}) = 2
• Support
• Fraction of transactions that contain an itemset
• E.g. s({Milk, Bread, Diaper}) = 2/5
• Frequent Itemset
• An itemset whose support is greater than or equal to a minsup threshold
Definition: Association Rule
TID Items
1 Bread, Milk
• Association Rule 2 Bread, Diaper, Beer, Eggs
– An implication expression of the form X → Y, where 3 Milk, Diaper, Beer, Coke
X and Y are itemsets 4 Bread, Milk, Diaper, Beer
5 Bread, Milk, Diaper, Coke
– Example:
{Milk, Diaper} → {Beer}
Example:
• Rule Evaluation Metrics {Milk , Diaper }  Beer
– Support (s)
◆ Fraction of transactions that contain both X and Y  (Milk, Diaper, Beer ) 2
s= = = 0.4
– Confidence (c) |T| 5
◆ Measures how often items in Y  (Milk, Diaper, Beer ) 2
appear in transactions that c= = = 0.67
 (Milk, Diaper ) 3
contain X
Association Rule Mining Task
• Given a set of transactions T, the goal of association rule mining is to
find all rules having
• support ≥ minsup threshold
• confidence ≥ minconf threshold
• Brute-force approach:
• List all possible association rules
• Compute the support and confidence for each rule
• Prune rules that fail the minsup and minconf thresholds
 Computationally prohibitive!
Mining Association Rules
• Two-step approach:
1. Frequent Itemset Generation
– Generate all itemsets whose support  minsup

2. Rule Generation
– Generate high confidence rules from each frequent itemset, where each rule is a binary
partitioning of a frequent itemset
Frequent Itemset Generation: Apriori
• Apriori principle:
• If an itemset is frequent, then all of its subsets must also be frequent

• Apriori principle holds due to the following property of the support measure:

X , Y : ( X  Y )  s( X )  s(Y )
• Support of an itemset never exceeds the support of its subsets
Frequent Itemset Generation: Apriori
null

A B C D E

AB AC AD AE BC BD BE CD CE DE

Found to be
Infrequent
ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE

ABCD ABCE ABDE ACDE BCDE

Pruned
ABCDE
supersets
Frequent Itemset Generation: Apriori
• A level-wise, candidate-generation-and-test approach (Agrawal &
Srikant 1994)

Data base D
1-candidates Freq 1-itemsets 2-candidates
TID Items
Itemset Sup Itemset Sup Itemset
10 a, c, d a 2 a 2 ab
20 b, c, e Scan D b 3 b 3 ac
30 a, b, c, c 3 c 3 ae
e
d 1 e 3 bc
40 b, e
e 3 be
Min_sup=2 ce
3-candidates Freq 2-itemsets Counting
Scan D Itemset Itemset Sup Itemset Sup
bce ac 2 ab 1
bc 2 ac 2 Scan D
be 3 ae 1
Freq 3-itemsets ce 2 bc 2
Itemset Sup be 3
bce 2 ce 2
TID Items

Apriori: Example 1
2
Bread, Milk
Bread, Diaper, Beer, Eggs
3 Milk, Diaper, Beer, Coke
4 Bread, Milk, Diaper, Beer
Item Count Items (1-itemsets)
5 Bread, Milk, Diaper, Coke
Bread 4
Coke 2
Milk 4 Itemset Count Pairs (2-itemsets)
Beer 3 {Bread,Milk} 3
Diaper 4 {Bread,Beer} 2 (No need to generate
Eggs 1
{Bread,Diaper} 3 candidates involving Coke
{Milk,Beer} 2 or Eggs)
{Milk,Diaper} 3
{Beer,Diaper} 3
Minimum Support = 3
Triplets (3-itemsets)
Itemset Count
{Bread,Milk,Diaper} 3
Rule Generation
• Given a frequent itemset L, find all non-empty subsets f  L such that
f → L – f satisfies the minimum confidence requirement
• If {A,B,C,D} is a frequent itemset, candidate rules:
ABC →D, ABD →C, ACD →B, BCD →A,
A →BCD, B →ACD, C →ABD, D →ABC
AB →CD, AC → BD, AD → BC, BC →AD,
BD →AC, CD →AB,

• If |L| = k, then there are 2k – 2 candidate association rules (ignoring L

→  and  → L)
Association Rules: Applications
• Supermarket shelf management
• Goal: to identify items which are bought together (by sufficiently
many customers)
• Approach: process POS data to find dependencies among items
• Example:
• If a customer buys diaper and milk then he is very likely to buy beer
• So stack six-packets next to diaper
Cosine Similarity
Item-Item similarity: Cosine similarity
𝑆1 = [1, 1, 1, 1, 1, 1, 0, 0, 0, 0]
𝑆2 = [0, 0, 1, 1, 1, 1, 1, 1, 1, 1]
Item-Item similarity: Cosine similarity

2020 02. DNNRec A Novel Deep Learning Based Hybrid Recommender System
No ratings yet
2020 02. DNNRec A Novel Deep Learning Based Hybrid Recommender System
14 pages
Recommendation System Final
No ratings yet
Recommendation System Final
16 pages
Ant Colony Optimization
No ratings yet
Ant Colony Optimization
18 pages
Help File
No ratings yet
Help File
92 pages
Prisoner Escape
17% (6)
Prisoner Escape
5 pages
Assignment 1. Module No. 1 Data Structures and Algorithm (BOTE)
No ratings yet
Assignment 1. Module No. 1 Data Structures and Algorithm (BOTE)
2 pages
Association Rule Mining: - Algorithms For Frequent Itemset Mining - Apriori - Elcat - FP-Growth
No ratings yet
Association Rule Mining: - Algorithms For Frequent Itemset Mining - Apriori - Elcat - FP-Growth
45 pages
ML Project Movie Recommendation System
No ratings yet
ML Project Movie Recommendation System
2 pages
Market Basket Analysis and Advanced Data Mining: Professor Amit Basu
No ratings yet
Market Basket Analysis and Advanced Data Mining: Professor Amit Basu
24 pages
Movies Recommendation System Using Cosine Similarity
No ratings yet
Movies Recommendation System Using Cosine Similarity
5 pages
Association Analysis: Unit-V
No ratings yet
Association Analysis: Unit-V
12 pages
A Movie Recommendation System Based On A Convolutional Neural Network
No ratings yet
A Movie Recommendation System Based On A Convolutional Neural Network
13 pages
Student Franchisee Management System
No ratings yet
Student Franchisee Management System
21 pages
A Project Report: A Study On Recommender Systems Employed by Indian E-Commerce Companies
No ratings yet
A Project Report: A Study On Recommender Systems Employed by Indian E-Commerce Companies
64 pages
Quiz 3 - Recommendation systems , Association rule mining_ Machine Learning 3 - Ravi
No ratings yet
Quiz 3 - Recommendation systems , Association rule mining_ Machine Learning 3 - Ravi
7 pages
Data Mining: Concepts and Techniques: - Slides For Textbook - Chapter 6
No ratings yet
Data Mining: Concepts and Techniques: - Slides For Textbook - Chapter 6
82 pages
Project Title "Impact of Fii'S On Indian Stock Market"
No ratings yet
Project Title "Impact of Fii'S On Indian Stock Market"
12 pages
Recommender Systems Capstone Report
No ratings yet
Recommender Systems Capstone Report
7 pages
JNTUK R20 B.Tech CSE 3-2 Machine Learning Unit 4 Notes
No ratings yet
JNTUK R20 B.Tech CSE 3-2 Machine Learning Unit 4 Notes
23 pages
Creditcard Fraud Detection
No ratings yet
Creditcard Fraud Detection
26 pages
Week 8-Association Rules Part 1
No ratings yet
Week 8-Association Rules Part 1
31 pages
Study On Movie Recommendation System Using Machine Learning
No ratings yet
Study On Movie Recommendation System Using Machine Learning
4 pages
Movie Recommendation System
No ratings yet
Movie Recommendation System
5 pages
UNIT-5-IDS
No ratings yet
UNIT-5-IDS
19 pages
SOC Lab Manual
No ratings yet
SOC Lab Manual
11 pages
Data Mining & Business Intelligence (2170715) : Unit-5 Concept Description and Association Rule Mining
No ratings yet
Data Mining & Business Intelligence (2170715) : Unit-5 Concept Description and Association Rule Mining
39 pages
SE 7204 BIG Data Analysis Unit I Final
No ratings yet
SE 7204 BIG Data Analysis Unit I Final
66 pages
Market Basket Analysis For Data Mining - Msthesis PDF
No ratings yet
Market Basket Analysis For Data Mining - Msthesis PDF
75 pages
Customer Analytics at Flipkart
No ratings yet
Customer Analytics at Flipkart
4 pages
Unit 4
No ratings yet
Unit 4
4 pages
Heart
No ratings yet
Heart
28 pages
Jntuk R20 ML Unit-Iii
100% (1)
Jntuk R20 ML Unit-Iii
21 pages
Movie Recommendation System
No ratings yet
Movie Recommendation System
46 pages
Supervised Vs Unsupervised Learning What S The Difference IBM 24062021 035331pm
No ratings yet
Supervised Vs Unsupervised Learning What S The Difference IBM 24062021 035331pm
9 pages
Movi3 Recommender System
No ratings yet
Movi3 Recommender System
15 pages
Movie Recommendation Engine Using Artificial Intelligence
No ratings yet
Movie Recommendation Engine Using Artificial Intelligence
30 pages
ResearchPaperRecommenderSystems ALiteratureSurvey Preprint
No ratings yet
ResearchPaperRecommenderSystems ALiteratureSurvey Preprint
70 pages
Mini Project 2A PPT 2.0
No ratings yet
Mini Project 2A PPT 2.0
19 pages
Data Mining - Density Based Clustering
No ratings yet
Data Mining - Density Based Clustering
8 pages
Movie Recommender System PDF
100% (1)
Movie Recommender System PDF
5 pages
Mining Frequent Itemset-Association Analysis
No ratings yet
Mining Frequent Itemset-Association Analysis
59 pages
DataMining Lecture 1
No ratings yet
DataMining Lecture 1
35 pages
Artificial Neural Networks Kluniversity Course Handout
No ratings yet
Artificial Neural Networks Kluniversity Course Handout
18 pages
Recommendation System
No ratings yet
Recommendation System
11 pages
Association and Recommendation System
No ratings yet
Association and Recommendation System
24 pages
Unit 4 - Data Mining - WWW - Rgpvnotes.in
No ratings yet
Unit 4 - Data Mining - WWW - Rgpvnotes.in
12 pages
Capstone Notes-Model
No ratings yet
Capstone Notes-Model
20 pages
What Are The Differences Between Supervised and Unsupervised Learning?
No ratings yet
What Are The Differences Between Supervised and Unsupervised Learning?
22 pages
Market Basket Analysis
No ratings yet
Market Basket Analysis
12 pages
Building A Movie Recommendation System Using Collaborative Filtering With TF-IDF-IJRASET
No ratings yet
Building A Movie Recommendation System Using Collaborative Filtering With TF-IDF-IJRASET
13 pages
Mysql 7-10
No ratings yet
Mysql 7-10
4 pages
Insurance Recommender System
No ratings yet
Insurance Recommender System
4 pages
Bias Variance Tradeoff
No ratings yet
Bias Variance Tradeoff
6 pages
Data Science Techniques Classification Regression and Clustering
No ratings yet
Data Science Techniques Classification Regression and Clustering
5 pages
Movie Recommendation System Using TF-IDF Vectorization and Cosine Similarity
No ratings yet
Movie Recommendation System Using TF-IDF Vectorization and Cosine Similarity
9 pages
Data Mining:: Concepts and Techniques
100% (1)
Data Mining:: Concepts and Techniques
63 pages
Dinya Antony MRA ML2
100% (1)
Dinya Antony MRA ML2
24 pages
Optimizing Hadoop for MapReduce
From Everand
Optimizing Hadoop for MapReduce
Khaled Tannir
No ratings yet
Equity of Cybersecurity in the Education System: High Schools, Undergraduate, Graduate and Post-Graduate Studies.
From Everand
Equity of Cybersecurity in the Education System: High Schools, Undergraduate, Graduate and Post-Graduate Studies.
Joseph O. Esin
No ratings yet
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
From Everand
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
Janet Laane Effron
No ratings yet
Touchpad Plus Ver. 1.1 Class 7
From Everand
Touchpad Plus Ver. 1.1 Class 7
Nisha Batra
No ratings yet
ISO 80000-3 A Complete Guide
From Everand
ISO 80000-3 A Complete Guide
Gerardus Blokdyk
No ratings yet
BAR, Term - V
No ratings yet
BAR, Term - V
3 pages
Brand Asset Valuator Model - Coca Cola
0% (1)
Brand Asset Valuator Model - Coca Cola
2 pages
Commentaries On Katona, "Psychology and Consumer Economics"
No ratings yet
Commentaries On Katona, "Psychology and Consumer Economics"
7 pages
Case Thompson Data
No ratings yet
Case Thompson Data
108 pages
Final Placement Report 2017
No ratings yet
Final Placement Report 2017
8 pages
Group 2 - MR Project 2
No ratings yet
Group 2 - MR Project 2
9 pages
Liu Bai: A Chinese Successor's Dilemma: Report On The Case
No ratings yet
Liu Bai: A Chinese Successor's Dilemma: Report On The Case
8 pages
Mathematics - Grade 10 Week 6 Division of Polynomials, Remainder Theorem and Factor Theorem
No ratings yet
Mathematics - Grade 10 Week 6 Division of Polynomials, Remainder Theorem and Factor Theorem
4 pages
Binarry
No ratings yet
Binarry
3 pages
Q9) Write A Program in C++ For Stack and Its Applications
No ratings yet
Q9) Write A Program in C++ For Stack and Its Applications
5 pages
DSA Lab Session 6
No ratings yet
DSA Lab Session 6
2 pages
Chapter 6 Job Scheduling
No ratings yet
Chapter 6 Job Scheduling
25 pages
IT 802 ML Unit-2 Notes
No ratings yet
IT 802 ML Unit-2 Notes
19 pages
CS 510 - Algorithms Exercise 22.1-1 Given An Adjacency-List Representation
100% (2)
CS 510 - Algorithms Exercise 22.1-1 Given An Adjacency-List Representation
4 pages
C++ Programming CODE-Algorithm-Flowchart of Positive Negative Zero
No ratings yet
C++ Programming CODE-Algorithm-Flowchart of Positive Negative Zero
2 pages
Graph Traversals PDF
No ratings yet
Graph Traversals PDF
47 pages
Chapter 6-Distribution and Network Models: Multiple Choice
100% (1)
Chapter 6-Distribution and Network Models: Multiple Choice
24 pages
NLPP Complete Perfect
No ratings yet
NLPP Complete Perfect
14 pages
JAVA - MCA 2021 - UNIT 3 - Student - 230926 - 204632
No ratings yet
JAVA - MCA 2021 - UNIT 3 - Student - 230926 - 204632
193 pages
Stdio.h Stdlib.h: // Prim's Algorithm #Include #Include
No ratings yet
Stdio.h Stdlib.h: // Prim's Algorithm #Include #Include
3 pages
Project #1: Maze Solving Task 03 - Coding The Solution Documentation
No ratings yet
Project #1: Maze Solving Task 03 - Coding The Solution Documentation
2 pages
DSA CIF
No ratings yet
DSA CIF
3 pages
Diploma CS III Sem Algorithm Unit 2 Notes
No ratings yet
Diploma CS III Sem Algorithm Unit 2 Notes
22 pages
Linear Regression With Multiple Variables: Reading Material: Part 1 of Lecture Notes 1
No ratings yet
Linear Regression With Multiple Variables: Reading Material: Part 1 of Lecture Notes 1
24 pages
Lecture 0 - CS50's Introduction To Artificial Intelligence With Python
No ratings yet
Lecture 0 - CS50's Introduction To Artificial Intelligence With Python
13 pages
2.6 Hashing
No ratings yet
2.6 Hashing
11 pages
DISJOINT SETS
No ratings yet
DISJOINT SETS
16 pages
159.201 Algorithms and Data Structures - Massey - Exam - I10 - 1401
No ratings yet
159.201 Algorithms and Data Structures - Massey - Exam - I10 - 1401
9 pages
Adaline, Madaline, Widrow Hoff
No ratings yet
Adaline, Madaline, Widrow Hoff
34 pages
SVKM'S Nmims Mukesh Patel School of Technology Management & Engineering Computer Engineering Department
No ratings yet
SVKM'S Nmims Mukesh Patel School of Technology Management & Engineering Computer Engineering Department
10 pages
Data Normalization
No ratings yet
Data Normalization
6 pages
Dijkstra's and A-Star in Finding The Shortest Path: A Tutorial
No ratings yet
Dijkstra's and A-Star in Finding The Shortest Path: A Tutorial
5 pages
Preconditioning: Condition Number
No ratings yet
Preconditioning: Condition Number
5 pages
Dsa Review 3
No ratings yet
Dsa Review 3
14 pages
Subject: Bcs-303 Data Structure & Algorithms Class: Sybsc (CS) - Semester Iii
No ratings yet
Subject: Bcs-303 Data Structure & Algorithms Class: Sybsc (CS) - Semester Iii
12 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Arm PPT

Uploaded by

Arm PPT

Uploaded by

Customer Analytics at Bigbasket

ABCD ABCE ABDE ACDE BCDE

• If |L| = k, then there are 2k – 2 candidate association rules (ignoring L

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.