CS 432/536 (SP 17-18) - Dr. Mian Muhammad Awais Page 1 of 2

Încărcat de

Zain Aamir

0% au considerat acest document util (0 voturi)

32 vizualizări2 pagini

Titlu original

assignment+2

Drepturi de autor

Formate disponibile

DOC, PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

Drepturi de autor:

Formate disponibile

Descărcați ca DOC, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (0 voturi)

32 vizualizări2 pagini

CS 432/536 (SP 17-18) - Dr. Mian Muhammad Awais Page 1 of 2

Încărcat de

Zain Aamir

Drepturi de autor:

Formate disponibile

Descărcați ca DOC, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 2

Căutați în document

CS 536/CS 432 – Data Mining

Assignment 2
Due: March 04 (Monday) at 12 midnight

Instructions: Submit a soft-copy report to the submission folder on LMS. Include

report and code needed to reproduce your results.

1. Apriori and FP-Growth Algorithms (25 points)

Consider the following transactional database:
TID Items
1 BD
2 ABD
3 AC
4 EF
5 CDEF
6 BE
7 AE
8 AEF
9 ADE
10 AE
11 BDF
12 DE
13 DFF
14 CDE
a. Find all frequent itemsets using the Apriori algorithm. Assume minimum
support count is 2.
b. Find all frequent itemsets using the FP-growth algorithm. Assume minimum
support count is 2.
c. Identify all closed and max itemsets.
d. Generate all strong association rules from the longest closed pattern(s) found
in the database. Assume minimum confidence is 70%.

2. Frequent Itemset Mining Using Rapid Miner (45 points)

Experiment with RapidMiner’s implementation of Apriori and FP-growth algorithms.
Apply these algorithms to the Adult data set (available from LMS)

a. For Apriori generate rules and itemsets for (i) default parameter values, (ii)
rules = 50, (iii) confidence = 0.7; rules = 50, (iv) minimum support is 0.1.
Summarize the results and discuss/interpret them w.r.t income of individuals
and their information.
b. For FP-growth, generate itemsets for (i) default parameter values, (ii)
minimum support = 0.1, (iii) find min number of itemsets is unchecked, and
(iv) find min number of itemsets is unchecked; minimum support = 0.1.
Summarize and interpret the interesting results.
c. From results in (a), separate out all strong classification rules, i.e., rules that
contain the class attribute (income) on the right-hand-side.
d. Provide a summary of the results.

Note: You can find dataset description details on the below link.

CS 432/536 (Sp 17-18) – Dr. Mian Muhammad Awais Page 1 of 2

https://hpi.de/naumann/projects/repeatability/datasets/dblp-dataset.html

3. Download the census-income dataset from LMS. (30 points)

a. Divide the dataset into 4 equal bins and find the correlated attributes from
each bin. Compare the results from each bin.
b. Apply dimensionality reduction to reduce computations. Report results
from each part separately after dimensionality reduction. You can use
various techniques of your choice for data preprocessing and
dimensionality reduction. Please report your technique in document, you
will be evaluated based on your findings in report.

Bonus Question: (20)

Note: You can submit it within 4 days after deadline of assignment with a separate
report with results and findings. You can do it in Python or R.
2. Find the DBLP dataset on LMS. Preprocess the data if needed. You can use
Python, R or MATLAB to answer below questions. Submit your code file,
instructions to run code file and report. (40)

a. Fine the top 10 pair of authors mostly work together.

b. Find the top 5 authors with maximum no of publications and citations.
Compare your results with support, confidence, lift, imbalance ratio, and
chi-square separately. Which one gives the best result and why? Select the
attributes of your choice

CS 432/536 (Sp 17-18) – Dr. Mian Muhammad Awais Page 2 of 2

S-ar putea să vă placă și

Project Questions
Document4 pagini
Project Questions
vansh gupta
Încă nu există evaluări
Chapter 10,11,12
Document6 pagini
Chapter 10,11,12
Danielle Myself
100% (6)
Dosxyz Show Manual
Document4 pagini
Dosxyz Show Manual
Ignacio Verdugo
100% (1)
How To Retrieve License From Deltav Dongle and How To Load It Using Hasphl PDF
Document9 pagini
How To Retrieve License From Deltav Dongle and How To Load It Using Hasphl PDF
yuriy2fedorovych
0% (1)
CIT Customer System Research
Document4 pagini
CIT Customer System Research
Abdul Raheman
Încă nu există evaluări
2021 - Software Eng
Document3 pagini
2021 - Software Eng
Yogita Samar
Încă nu există evaluări
CS3430 Project Instructions 2023
Document7 pagini
CS3430 Project Instructions 2023
Bokang Lerata
Încă nu există evaluări
Detect Fraudulent Bank Notes Using Neural Network
Document3 pagini
Detect Fraudulent Bank Notes Using Neural Network
harith danish
Încă nu există evaluări
Data Mining and Warehousing Lab Syllabus
Document4 pagini
Data Mining and Warehousing Lab Syllabus
PhamThi Thiet
Încă nu există evaluări
Individual Assignment 2
Document4 pagini
Individual Assignment 2
jemal yahyaa
Încă nu există evaluări
It 4004 2019
Document6 pagini
It 4004 2019
Malith Jayasinghe
Încă nu există evaluări
Day14-PCA - Problem Statement
Document4 pagini
Day14-PCA - Problem Statement
Priya kamble
0% (1)
National University: CS 409 - Data Warehouse Fall-2018 Sections: A & D Assignment #1
Document2 pagini
National University: CS 409 - Data Warehouse Fall-2018 Sections: A & D Assignment #1
Ali Chowdrii
Încă nu există evaluări
ITECH2302 MainAssessment Report
Document8 pagini
ITECH2302 MainAssessment Report
sedobi1512
Încă nu există evaluări
DP 500 Demo
Document8 pagini
DP 500 Demo
Rahul Thakur
Încă nu există evaluări
1 - BDA Summative Assessment Brief
Document21 pagini
1 - BDA Summative Assessment Brief
peterthiongo150
Încă nu există evaluări
E4 DS203 2023 Sem2
Document2 pagini
E4 DS203 2023 Sem2
sparee1256
Încă nu există evaluări
Assignment3 A20
Document3 pagini
Assignment3 A20
April Ding
Încă nu există evaluări
Answer Sheet 5 Semester Regular Examination 2017-18 B.Tech PCS5H002 Data Mining & Data Warehousing Branch: Cse Max Marks: 100 Q. CODE: B307
Document14 pagini
Answer Sheet 5 Semester Regular Examination 2017-18 B.Tech PCS5H002 Data Mining & Data Warehousing Branch: Cse Max Marks: 100 Q. CODE: B307
Aswini Kumar Palo
Încă nu există evaluări
GTU Machine Learning Fundamentals Course Code 4341603
Document9 pagini
GTU Machine Learning Fundamentals Course Code 4341603
Devam Rameshkumar Rana
Încă nu există evaluări
2018 t3 Mn405 Assignment 1 Mel Syd v1.3
Document7 pagini
2018 t3 Mn405 Assignment 1 Mel Syd v1.3
Sarah Evan
Încă nu există evaluări
UEL-CN-7031 - Big Data Analytics Resit
Document6 pagini
UEL-CN-7031 - Big Data Analytics Resit
Alex Munala
Încă nu există evaluări
Projects Guider
Document19 pagini
Projects Guider
innovative studies
Încă nu există evaluări
SEN PT2 QB SOLUTION
Document13 pagini
SEN PT2 QB SOLUTION
Sarthak kadam
Încă nu există evaluări
MIE1624 - Assignment 3
Document6 pagini
MIE1624 - Assignment 3
josengi158
Încă nu există evaluări
Data Warehousing and Mining Exam
Document9 pagini
Data Warehousing and Mining Exam
Jamie Ross
Încă nu există evaluări
Discussion Questions
Document6 pagini
Discussion Questions
elisha emilian
Încă nu există evaluări
Question 12
Document2 pagini
Question 12
ejaknon
Încă nu există evaluări
Ass 2
Document3 pagini
Ass 2
ﭐﭠﮯﮚ ﻐﯿﺂﺒﮛ
Încă nu există evaluări
MidTerm2!00!11 08 Solutions
Document7 pagini
MidTerm2!00!11 08 Solutions
shimz1
0% (2)
Predictive Analytics Exam-December 2019: Exam PA Home Page
Document9 pagini
Predictive Analytics Exam-December 2019: Exam PA Home Page
justtestit
Încă nu există evaluări
Day13 K Means Clustering
Document4 pagini
Day13 K Means Clustering
Priya kamble
Încă nu există evaluări
Week 11 Question 202108 Revision I
Document6 pagini
Week 11 Question 202108 Revision I
Sun Chong Hon
Încă nu există evaluări
Sample Exam Problems
Document9 pagini
Sample Exam Problems
SherelleJiaxinLi
100% (1)
DP 500 Questions
Document8 pagini
DP 500 Questions
james scott
Încă nu există evaluări
DWDM Lab Manual: Department of Computer Science and Engineering
Document46 pagini
DWDM Lab Manual: Department of Computer Science and Engineering
Dilli Books
Încă nu există evaluări
Instructions for adding companies and colleges to a document
Document25 pagini
Instructions for adding companies and colleges to a document
Hari Madhavan Krishna Kumar
Încă nu există evaluări
2018 Exam Pa Syllabi
Document9 pagini
2018 Exam Pa Syllabi
justtestit
Încă nu există evaluări
hw1 Problem Set
Document8 pagini
hw1 Problem Set
Billy bob
Încă nu există evaluări
Unit I
Document6 pagini
Unit I
112 Pranav Khot
Încă nu există evaluări
ML Lab Manual 18csl76 1
Document54 pagini
ML Lab Manual 18csl76 1
Kollipara Sai Sandeep
Încă nu există evaluări
ITSC203_Lab3a
Document9 pagini
ITSC203_Lab3a
ktftj5ydfv
Încă nu există evaluări
Informatics Practices
Document9 pagini
Informatics Practices
dadan vishwakarma
Încă nu există evaluări
Computing and IT Workplace Report
Document7 pagini
Computing and IT Workplace Report
David Ong
Încă nu există evaluări
Analytics Handbook Final
Document136 pagini
Analytics Handbook Final
mamibo5118
Încă nu există evaluări
Assignment 2
Document7 pagini
Assignment 2
Seema Rani
Încă nu există evaluări
Group Assignment - Question
Document6 pagini
Group Assignment - Question
Wong Hui Chuo
Încă nu există evaluări
Total Marks: 10 Important Instructions Regarding Selection of Project Topic and Group Members
Document3 pagini
Total Marks: 10 Important Instructions Regarding Selection of Project Topic and Group Members
Divyansh Rastogi
Încă nu există evaluări
Financial Technology Program HW4: You Should Have Executed It and Keep The Result
Document3 pagini
Financial Technology Program HW4: You Should Have Executed It and Keep The Result
王柏勛
Încă nu există evaluări
Bits Pilani, Dubai Campus
Document11 pagini
Bits Pilani, Dubai Campus
satya
Încă nu există evaluări
Heq Sep15 Cert Is
Document4 pagini
Heq Sep15 Cert Is
Mega Services Coparation
Încă nu există evaluări
Format Project Report
Document12 pagini
Format Project Report
rajesh_34
Încă nu există evaluări
Mini Project - Factor Hair Analysis: Sravanthi.M
Document24 pagini
Mini Project - Factor Hair Analysis: Sravanthi.M
Sweety Sekhar
Încă nu există evaluări
Lab Manual Ds&Bdal
Document100 pagini
Lab Manual Ds&Bdal
SEA110 Kshitij Bhosale
Încă nu există evaluări
Untitled
Document4 pagini
Untitled
Dr.sunder selwyn T
Încă nu există evaluări
Applying Big Data Analytics Techniques
Document4 pagini
Applying Big Data Analytics Techniques
Adam GameChannel
Încă nu există evaluări
Day13-K-Means Clustering
Document10 pagini
Day13-K-Means Clustering
SBS Movies
Încă nu există evaluări
2018 & 2019 DATA MINING ANSWERS-converted
Document25 pagini
2018 & 2019 DATA MINING ANSWERS-converted
tumarebawa
Încă nu există evaluări
Predictive Analytics Exam-June 2019: Exam PA Home Page
Document9 pagini
Predictive Analytics Exam-June 2019: Exam PA Home Page
justtestit
Încă nu există evaluări
AT3 202110 FinalVersion
Document8 pagini
AT3 202110 FinalVersion
Hussain
Încă nu există evaluări
Data Mining: Concepts and Techniques: - Slides For Textbook - Chapter 6
Document82 pagini
Data Mining: Concepts and Techniques: - Slides For Textbook - Chapter 6
Stuti Chandra
Încă nu există evaluări
COMP551 Fall 2020 P1
Document4 pagini
COMP551 Fall 2020 P1
Alain
Încă nu există evaluări
Machine Learning with the Raspberry Pi: Experiments with Data and Computer Vision
De la Everand
Machine Learning with the Raspberry Pi: Experiments with Data and Computer Vision
Donald J. Norris
Încă nu există evaluări
Assessment Activity: Marketing Concepts: Aamer Adam
Document11 pagini
Assessment Activity: Marketing Concepts: Aamer Adam
Zain Aamir
Încă nu există evaluări
A Market Basket Analysis Conducted With A Multivariate Logit Mod
Document8 pagini
A Market Basket Analysis Conducted With A Multivariate Logit Mod
Zain Aamir
Încă nu există evaluări
Data Mining Assignment 1
Document2 pagini
Data Mining Assignment 1
Zain Aamir
Încă nu există evaluări
INFO 415 Quiz1 – Systems Analysis
Document9 pagini
INFO 415 Quiz1 – Systems Analysis
Ashley Portega
100% (2)
Expert Systems with Applications 29 (2005) 472–484
Document13 pagini
Expert Systems with Applications 29 (2005) 472–484
Zain Aamir
Încă nu există evaluări
1 s2.0 S1094996802701631 Main
Document17 pagini
1 s2.0 S1094996802701631 Main
Saurav Ray
Încă nu există evaluări
Next-Item The Market Basket: Discovery Analysis
Document2 pagini
Next-Item The Market Basket: Discovery Analysis
Zain Aamir
Încă nu există evaluări
Combination of Multiple Classifiers For The Customer's Purchase Behavior Prediction
Document9 pagini
Combination of Multiple Classifiers For The Customer's Purchase Behavior Prediction
Zain Aamir
Încă nu există evaluări
Repeat Buyer Prediction For E-Commerce
Document10 pagini
Repeat Buyer Prediction For E-Commerce
Zain Aamir
Încă nu există evaluări
Early Prediction of Market Success for New Grocery Products (40 characters
Document8 pagini
Early Prediction of Market Success for New Grocery Products (40 characters
Zain Aamir
Încă nu există evaluări
Journal of Fashion Marketing and Management: An International Journal
Document18 pagini
Journal of Fashion Marketing and Management: An International Journal
Zain Aamir
Încă nu există evaluări
HCPC Husson Josse
Document17 pagini
HCPC Husson Josse
Zain Aamir
Încă nu există evaluări
Application of Predictive Analytics in Customer Relationship Mana
Document8 pagini
Application of Predictive Analytics in Customer Relationship Mana
Zain Aamir
Încă nu există evaluări
Paper
Document5 pagini
Paper
Zain Aamir
Încă nu există evaluări
Mining Users Web Navigation Patterns and Predicti
Document12 pagini
Mining Users Web Navigation Patterns and Predicti
Zain Aamir
Încă nu există evaluări
Market Basket Analysis Across Multiple Stores and Time Periods
Document16 pagini
Market Basket Analysis Across Multiple Stores and Time Periods
Zain Aamir
Încă nu există evaluări
AND Research Notes Communications
Document10 pagini
AND Research Notes Communications
Zain Aamir
Încă nu există evaluări
Sen 2003
Document15 pagini
Sen 2003
Zain Aamir
Încă nu există evaluări
Journal of Interactive Marketing Winter 2000 14, 1 ABI/INFORM Global
Document15 pagini
Journal of Interactive Marketing Winter 2000 14, 1 ABI/INFORM Global
rajat02
Încă nu există evaluări
Predicting Online Purchase Intentions For Clothing Products
Document15 pagini
Predicting Online Purchase Intentions For Clothing Products
Zain Aamir
Încă nu există evaluări
Mendes 2013
Document15 pagini
Mendes 2013
Zain Aamir
Încă nu există evaluări
Gender Prediction Based On Given Information
Document6 pagini
Gender Prediction Based On Given Information
Zain Aamir
Încă nu există evaluări
PBL On Oops: Submitted by
Document10 pagini
PBL On Oops: Submitted by
Saubhagya Srivastava
Încă nu există evaluări
In Ac aktu-DGMST-1637310030X4
Document1 pagină
In Ac aktu-DGMST-1637310030X4
Anikate Sharma
Încă nu există evaluări
eQUEST v3 65 Update Summary
Document8 pagini
eQUEST v3 65 Update Summary
James Young
Încă nu există evaluări
About TCS Cloud Plus
Document4 pagini
About TCS Cloud Plus
kmanikannan1977_7427
Încă nu există evaluări
John Doe Design Engineer Resume
Document1 pagină
John Doe Design Engineer Resume
Sharath Joshi
Încă nu există evaluări
Configuracion Andover
Document634 pagini
Configuracion Andover
WilliamAlfonsoSanchezPaez
100% (1)
IGraph:M
Document238 pagini
IGraph:M
hecaicedo77
Încă nu există evaluări
C++ Notes
Document144 pagini
C++ Notes
Suchit Kumar
Încă nu există evaluări
Unit 3
Document68 pagini
Unit 3
Bhargav Raj
Încă nu există evaluări
04 PandasSQL PDF
Document18 pagini
04 PandasSQL PDF
mgrubisic
Încă nu există evaluări
Andro-Socio: Tressa Poulose, Gauri Palshikar, Sneha Chandra & Anushri Patil
Document5 pagini
Andro-Socio: Tressa Poulose, Gauri Palshikar, Sneha Chandra & Anushri Patil
Ashish kumar Neela
Încă nu există evaluări
FT800 Programmers Guide
Document251 pagini
FT800 Programmers Guide
bl19cm7
Încă nu există evaluări
Ece
Document6 pagini
Ece
Ahmad Khanif Fikri
Încă nu există evaluări
Switching Theory and Logic Design
Document2 pagini
Switching Theory and Logic Design
Manjunath Badiger
Încă nu există evaluări
Competitive Intelligence and The Web
Document13 pagini
Competitive Intelligence and The Web
Chaimaa El
Încă nu există evaluări
Guide To Web Application Development
Document4 pagini
Guide To Web Application Development
Haftamu Hailu
Încă nu există evaluări
Amcat Automata
Document2 pagini
Amcat Automata
Rakesh Chadalavada
Încă nu există evaluări
Thesis Final Document Tall Buildings
Document194 pagini
Thesis Final Document Tall Buildings
Pab Fer Man
100% (3)
Writing The Basic Sales Letter
Document6 pagini
Writing The Basic Sales Letter
Angel dream
Încă nu există evaluări
Chapter 3: User Interfaces: Objectives
Document24 pagini
Chapter 3: User Interfaces: Objectives
AbdullahSarfaraz
Încă nu există evaluări
Conversion
Document4 pagini
Conversion
Bernard Garcia Orihuela
Încă nu există evaluări
Manohara Profile Lab Support Engineer
Document3 pagini
Manohara Profile Lab Support Engineer
Giduthuri Aditya
Încă nu există evaluări
Output
Document33 pagini
Output
Mike Jones
Încă nu există evaluări
Ericsson Basic GSM Commands
Document3 pagini
Ericsson Basic GSM Commands
umarghazanfar
Încă nu există evaluări
Dynamic Pricing
Document9 pagini
Dynamic Pricing
koolboyankit
Încă nu există evaluări
The Code of Ethics Book by Lex Eugene Peregrino Final Draft
Document189 pagini
The Code of Ethics Book by Lex Eugene Peregrino Final Draft
Lex Eugene Peregrino
Încă nu există evaluări