Bine ați venit la Scribd!

Bagging and Boosting in Data Mining: Carolina Ruiz

Încărcat de

0% au considerat acest document util (0 voturi)

29 vizualizări8 pagini

Bagging and boosting are two approaches to improve the stability and accuracy of models. Bagging creates multiple bootstrap replicates of the dataset and fits a model to each, then averages the predictions. Boosting iteratively reweights instances to focus on those misclassified by previous models, improving accuracy. Both methods are easy to implement and parallelizable. Bagging stabilizes unstable models while boosting explicitly improves classification performance.

Descriere originală:

NBNB

Titlu original

Bagging Boosting

Drepturi de autor

Formate disponibile

PPT, PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

Drepturi de autor:

Attribution Non-Commercial (BY-NC)

Formate disponibile

Descărcați ca PPT, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (0 voturi)

29 vizualizări8 pagini

Bagging and Boosting in Data Mining: Carolina Ruiz

Încărcat de

Rocking Ridz

Drepturi de autor:

Attribution Non-Commercial (BY-NC)

Formate disponibile

Descărcați ca PPT, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 8

Căutați în document

Bagging and Boosting in Data Mining

Carolina Ruiz
ruiz@cs.wpi.edu http://www.cs.wpi.edu/~ruiz

Motivation and Background

Problem Definition:

Given: a dataset of instances and a target concept Find: a model (e.g. set of association rules, decision tree, neural network) that helps in predicting the classification of unseen instances. The model should be stable (i.e. shouldnt depend too much on input data used to construct it) The model should be a good predictor (difficult to achieve when input dataset is small)

Difficulties:

Two Approaches

Bagging (Bootstrap Aggregating)

Leo Breiman, UC Berkeley

Boosting

Rob Schapire, ATT Research Jerry Friedman, Stanford U.

Bagging

Model Creation:

Create bootstrap replicates of the dataset and fit a model to each one Average/vote predictions of each model

Prediction:

Advantages

Stabilizes unstable methods Easy to implement, parallelizable.

Bagging Algorithm

1. Create k bootstrap replicates of the dataset 2. Fit a model to each of the replicates 3. Average/vote the predictions of the k models

Boosting

Creating the model:

Construct a sequence of datasets and models in such a way that a dataset in the sequence weights an instance heavily when the previous model has misclassified it.

Prediction:

Merge the models in the sequence

Improves classification accuracy

Advantages:

Generic Boosting Algorithm

1. Equally weight all instance in dataset 2. For I = 1 to T

2.1. Fit a model to current dataset 2.2. Upweight poorly predicted instances 2.3 Downweight well-predicted instances

3. Merge the models in the sequence to obtain the final model

Conclusions and References

Boosted nave Bayes tied for first place in KDD-cup 1997 Reference:

Combining Estimators to Improve Performance KDD-99 tutorial notes

John F. Elder Greg Ridgeway

S-ar putea să vă placă și

Data Mining for the Social Sciences: An Introduction
De la Everand
Data Mining for the Social Sciences: An Introduction
Paul Attewell
Încă nu există evaluări
Jntuk R20 ML Unit-Iii
Document21 pagini
Jntuk R20 ML Unit-Iii
Mahesh
100% (1)
Cybersecurity and Applied Mathematics
De la Everand
Cybersecurity and Applied Mathematics
Leigh Metcalf
Încă nu există evaluări
Introduction To Machine Learning and Python
Document19 pagini
Introduction To Machine Learning and Python
rokr58
Încă nu există evaluări
JNTUK R20 B.Tech CSE 3-2 Machine Learning Unit 3 Notes
Document21 pagini
JNTUK R20 B.Tech CSE 3-2 Machine Learning Unit 3 Notes
Harini
Încă nu există evaluări
Importany Questions Unit 3 4
Document30 pagini
Importany Questions Unit 3 4
Mubena Hussain
Încă nu există evaluări
Ensemble Learning: Wisdom of The Crowd
Document12 pagini
Ensemble Learning: Wisdom of The Crowd
Ravi Verma
100% (1)
004 This Course 2
Document8 pagini
004 This Course 2
Teja Kamal
Încă nu există evaluări
Cross Validation Thesis
Document5 pagini
Cross Validation Thesis
afcnftqep
100% (3)
CO3 Topicwise
Document37 pagini
CO3 Topicwise
VV PRAVEEN
Încă nu există evaluări
Research On Machine Learning
Document5 pagini
Research On Machine Learning
api-591105446
Încă nu există evaluări
Unit 3 Modelling and Evaluation
Document40 pagini
Unit 3 Modelling and Evaluation
Yash Desai
Încă nu există evaluări
Problem Statement - RS - Amazon Product Recommendation
Document2 pagini
Problem Statement - RS - Amazon Product Recommendation
Abusya Seyd
Încă nu există evaluări
What Is Data Mining Again?: Unsuspected Relationships Summarize Understandable and Useful Models
Document29 pagini
What Is Data Mining Again?: Unsuspected Relationships Summarize Understandable and Useful Models
Joseph Conteh
Încă nu există evaluări
SOM-based Generating of Association Rules
Document5 pagini
SOM-based Generating of Association Rules
Kishor Peddi
Încă nu există evaluări
Enhancement of Qualities of Clusters by Eliminating Outlier For Data Mining Application in Education
Document27 pagini
Enhancement of Qualities of Clusters by Eliminating Outlier For Data Mining Application in Education
diptipatil20
Încă nu există evaluări
CS583 Chapter 4 Supervised Learning
Document166 pagini
CS583 Chapter 4 Supervised Learning
Kunal Deore
Încă nu există evaluări
CS583 Supervised Learning
Document166 pagini
CS583 Supervised Learning
Ahmad Helmy
Încă nu există evaluări
DWM Mid 2 Question Bank
Document5 pagini
DWM Mid 2 Question Bank
Indu Alluru
Încă nu există evaluări
Modeling Research Paper
Document5 pagini
Modeling Research Paper
h02rj3ek
100% (1)
3 DM Classification
Document55 pagini
3 DM Classification
dawit gebreyohans
Încă nu există evaluări
ALL PH.D - CourseSyllabus
Document27 pagini
ALL PH.D - CourseSyllabus
VIPIN KUMAR MAURYA
Încă nu există evaluări
ABP DWDM UNIT 4 Classification 1
Document51 pagini
ABP DWDM UNIT 4 Classification 1
Tatipamula Ratnakar
Încă nu există evaluări
Cohen Sanborn Shiffrin 2008
Document22 pagini
Cohen Sanborn Shiffrin 2008
Ardneran Azer
Încă nu există evaluări
3 - Big Data Insight V.2019 PDF
Document28 pagini
3 - Big Data Insight V.2019 PDF
Innayah Madania
Încă nu există evaluări
Using Deep Neural Networks To Automate Large Scale Statistical Analysis For Big Data Applications
Document16 pagini
Using Deep Neural Networks To Automate Large Scale Statistical Analysis For Big Data Applications
bhavanisankari s
Încă nu există evaluări
BMW M-4
Document108 pagini
BMW M-4
Tarun K
Încă nu există evaluări
Decision Trees For Handling Uncertain Data To Identify Bank Frauds
Document4 pagini
Decision Trees For Handling Uncertain Data To Identify Bank Frauds
WARSE Journals
Încă nu există evaluări
2004-Multimodel Inference Understanding AIC and BIC in Model Selection
Document44 pagini
2004-Multimodel Inference Understanding AIC and BIC in Model Selection
Oplifora Thilastika
Încă nu există evaluări
KDD Research Paper
Document8 pagini
KDD Research Paper
wlyxiqrhf
100% (1)
Book MCS226 DataScience BigData 2022
Document70 pagini
Book MCS226 DataScience BigData 2022
rajesh.sgh214
Încă nu există evaluări
(IJCST-V3I6P15) : M. Naveena Priya, Mrs. P.Anitha
Document8 pagini
(IJCST-V3I6P15) : M. Naveena Priya, Mrs. P.Anitha
EighthSenseGroup
Încă nu există evaluări
Chapter 4 Classification
Document78 pagini
Chapter 4 Classification
Mohamedsultan Awol
Încă nu există evaluări
Unit 8 Classification and Prediction: Structure
Document16 pagini
Unit 8 Classification and Prediction: Structure
Kamal Kant
Încă nu există evaluări
Missing Value Imputation Based On Data Clustering: January 2008
Document12 pagini
Missing Value Imputation Based On Data Clustering: January 2008
viju001
Încă nu există evaluări
Unit 3 Modelling and Evaluation
Document40 pagini
Unit 3 Modelling and Evaluation
Kalash Shah
Încă nu există evaluări
Book Exercises NayelliAnswers
Document3 pagini
Book Exercises NayelliAnswers
Nayelli Valeria Pc
Încă nu există evaluări
Supervised Learning Compressed
Document165 pagini
Supervised Learning Compressed
yefifluffy
Încă nu există evaluări
Data Mining Course Overview
Document38 pagini
Data Mining Course Overview
harishkode
Încă nu există evaluări
MATLAB Central - File Exchange Pick of The Week Finding The Best Distribution That Fits The Data
Document2 pagini
MATLAB Central - File Exchange Pick of The Week Finding The Best Distribution That Fits The Data
winsaravanan
Încă nu există evaluări
DM Mod4 PDF
Document108 pagini
DM Mod4 PDF
Pushkal KS Vaidya
Încă nu există evaluări
HMC Report-3
Document13 pagini
HMC Report-3
Phạm Hùng Phát
100% (2)
Assignment1 2020
Document6 pagini
Assignment1 2020
Adam Master
Încă nu există evaluări
A High-Throughput Screening Approach To Discovering Good Forms of Biologically Inspired Visual Representation
Document12 pagini
A High-Throughput Screening Approach To Discovering Good Forms of Biologically Inspired Visual Representation
Umar Farooq Zia
Încă nu există evaluări
Dwdmsem 6 QB
Document13 pagini
Dwdmsem 6 QB
Suresh Kumar
Încă nu există evaluări
Homology Modeling Thesis
Document5 pagini
Homology Modeling Thesis
lauraochoaalbuquerque
100% (2)
Automatic Differentiation Variational Inference
Document45 pagini
Automatic Differentiation Variational Inference
Peter
Încă nu există evaluări
20mid0209 Lab - 6
Document11 pagini
20mid0209 Lab - 6
R B SHARAN
Încă nu există evaluări
Bagging and Boosting
Document4 pagini
Bagging and Boosting
sumit rakesh
Încă nu există evaluări
Data Strategy Feb 9 Part 2
Document36 pagini
Data Strategy Feb 9 Part 2
Harsh Patel
Încă nu există evaluări
Ensembling in Python
Document20 pagini
Ensembling in Python
Luciano
Încă nu există evaluări
Tutor Test and Home Assignment Questions For de
Document4 pagini
Tutor Test and Home Assignment Questions For de
achaparala4499
Încă nu există evaluări
Notes On Intro To Data Science Udacity
Document8 pagini
Notes On Intro To Data Science Udacity
Hari
Încă nu există evaluări
Ghahramani 2015 Nature PDF
Document24 pagini
Ghahramani 2015 Nature PDF
NîKüñj Døbåríÿâ
Încă nu există evaluări
MET CS777 Summer2-2022 Big-Data-Analytics
Document9 pagini
MET CS777 Summer2-2022 Big-Data-Analytics
boremshiva1201
Încă nu există evaluări
CIKM Final Unexpected
Document4 pagini
CIKM Final Unexpected
Wii Nguyen
Încă nu există evaluări
Kaggle Talk Online Version
Document13 pagini
Kaggle Talk Online Version
Muhammad Asad Bhutta
Încă nu există evaluări
Burnham and Anderson 2004 Multimodel Inference
Document44 pagini
Burnham and Anderson 2004 Multimodel Inference
IsabelVinhal
Încă nu există evaluări
Research Paper
Document8 pagini
Research Paper
dharm sagparia
Încă nu există evaluări
Data Mining AND Data Warehousing: Computer Science & Engineering
Document14 pagini
Data Mining AND Data Warehousing: Computer Science & Engineering
api-19799369
0% (1)
Answers: 1. Dcba 2. Abdec 3. Aebdc 4. Bedac 5. Cbda 6. Bdca 7. Bdca 8. Decab 9. Cbeda 10.DEABC
Document1 pagină
Answers: 1. Dcba 2. Abdec 3. Aebdc 4. Bedac 5. Cbda 6. Bdca 7. Bdca 8. Decab 9. Cbeda 10.DEABC
Rocking Ridz
Încă nu există evaluări
State Nomiation Requirement For Nursing
Document2 pagini
State Nomiation Requirement For Nursing
Rocking Ridz
Încă nu există evaluări
Strategic Analysis of Apple Inc.: Brian Masi
Document35 pagini
Strategic Analysis of Apple Inc.: Brian Masi
Rocking Ridz
Încă nu există evaluări
A Complete Reference of HTML
Document160 pagini
A Complete Reference of HTML
Rocking Ridz
Încă nu există evaluări
Part A
Document1 pagină
Part A
Rocking Ridz
Încă nu există evaluări
Article: Southeast Asian Stock Market Linkages: Evidence From Pre-And Post-October 1997
Document7 pagini
Article: Southeast Asian Stock Market Linkages: Evidence From Pre-And Post-October 1997
Rocking Ridz
Încă nu există evaluări
Introduction To Accounting
Document36 pagini
Introduction To Accounting
Rajnikant Patel
Încă nu există evaluări
Option - 1 Option - 2 Option - 3 Option - 4 Correct Answer Marks
Document4 pagini
Option - 1 Option - 2 Option - 3 Option - 4 Correct Answer Marks
KISHORE BADANA
Încă nu există evaluări
Compound Wall Design (1) - Layout1
Document1 pagină
Compound Wall Design (1) - Layout1
Sandeep
Încă nu există evaluări
In The High Court of Delhi at New Delhi
Document3 pagini
In The High Court of Delhi at New Delhi
Sundaram Ojha
Încă nu există evaluări
MEC 400 CHAPTER 4 (Engineering Solution)
Document21 pagini
MEC 400 CHAPTER 4 (Engineering Solution)
hidayatullah
Încă nu există evaluări
Food Truck Ordinance Letter
Document7 pagini
Food Truck Ordinance Letter
The Daily News Journal
Încă nu există evaluări
Arvind Textiles Internship Report
Document107 pagini
Arvind Textiles Internship Report
Dipan Sahoo
Încă nu există evaluări
A
Document2 pagini
A
ẄâQâŗÂlï
Încă nu există evaluări
Dorma 2012 Price List
Document284 pagini
Dorma 2012 Price List
Security Lock Distributors
Încă nu există evaluări
Iso 269-2022-014 Rotary Table NDT Cat IV - Rev1
Document1 pagină
Iso 269-2022-014 Rotary Table NDT Cat IV - Rev1
Durgham Adel Escander
Încă nu există evaluări
Ex-Capt. Harish Uppal Vs Union of India & Anr On 17 December, 2002
Document20 pagini
Ex-Capt. Harish Uppal Vs Union of India & Anr On 17 December, 2002
vivek6593
Încă nu există evaluări
Public Instructions For Death Corrections
Document4 pagini
Public Instructions For Death Corrections
Mukuru Technologies
Încă nu există evaluări
Application Rebuilding Kits: Kit Bulletin
Document2 pagini
Application Rebuilding Kits: Kit Bulletin
hidraulic
100% (1)
Why Is Inventory Turnover Important?: ... It Measures How Hard Your Inventory Investment Is Working
Document6 pagini
Why Is Inventory Turnover Important?: ... It Measures How Hard Your Inventory Investment Is Working
abhi
Încă nu există evaluări
Design of Footing (Square FTG.) : M Say, L 3.75
Document2 pagini
Design of Footing (Square FTG.) : M Say, L 3.75
victoria
Încă nu există evaluări
Forod 2bac en s2 6 PDF
Document4 pagini
Forod 2bac en s2 6 PDF
wwe forever
Încă nu există evaluări
Application For Leave - EO
Document1 pagină
Application For Leave - EO
comelec carmen
Încă nu există evaluări
Boeing 247 Notes
Document5 pagini
Boeing 247 Notes
albloi
100% (1)
1962 BEECHCRAFT P35 Bonanza - Specifications, Performance, Operating Cost, Valuation, Brokers
Document12 pagini
1962 BEECHCRAFT P35 Bonanza - Specifications, Performance, Operating Cost, Valuation, Brokers
Richard Lund
Încă nu există evaluări
ITMC (International Transmission Maintenance Center)
Document8 pagini
ITMC (International Transmission Maintenance Center)
akilaama
Încă nu există evaluări
Wind Turbines Fundamentals Technologies Application Economics 2nd Edition
Document3 pagini
Wind Turbines Fundamentals Technologies Application Economics 2nd Edition
hafidztampan
0% (1)
A Job Interview
Document8 pagini
A Job Interview
a.rodriguezmarco
Încă nu există evaluări
Analyzing Sri Lankan Ceramic Industry
Document18 pagini
Analyzing Sri Lankan Ceramic Industry
rasithapradeep
50% (4)
Mosaic Charter School TIS Update 12202019
Document73 pagini
Mosaic Charter School TIS Update 12202019
Brandon Atchley
Încă nu există evaluări
Broucher
Document2 pagini
Broucher
Vishal Poul
Încă nu există evaluări
Assignment of Killamsetty Rasmita Scam 1992
Document8 pagini
Assignment of Killamsetty Rasmita Scam 1992
rkillamsetty
Încă nu există evaluări
Teshome Tefera Article
Document5 pagini
Teshome Tefera Article
Magarsa Gamada
Încă nu există evaluări
Standard C4C End User Guide
Document259 pagini
Standard C4C End User Guide
Kanali Paari
Încă nu există evaluări
Manual de Partes Dm45-50-l
Document690 pagini
Manual de Partes Dm45-50-l
klaus
Încă nu există evaluări
NATIONAL DEVELOPMENT COMPANY v. CA
Document11 pagini
NATIONAL DEVELOPMENT COMPANY v. CA
Andrei Anne Palomar
Încă nu există evaluări