Case 2 Predicting Boston Housing

Încărcat de

Sai Nath

0% au considerat acest document util (6 voturi)

642 vizualizări2 pagini

CASE

Drepturi de autor

Formate disponibile

DOCX, PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

CASE

Drepturi de autor:

Formate disponibile

Descărcați ca DOCX, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (6 voturi)

642 vizualizări2 pagini

Case 2 Predicting Boston Housing

Încărcat de

Sai Nath

CASE

Drepturi de autor:

Formate disponibile

Descărcați ca DOCX, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 2

Căutați în document

Predicting Boston Housing Prices

The file BostonHousing.csv contains information collected by the US Bureau of the Census
concerning housing in the area of Boston, Massachusetts. The dataset includes information on
506 census housing tracts in the Boston area. The goal is to predict the median house price in
new tracts based on information such as crime rate, pollution, and number of rooms. The dataset
contains 13 predictors, and the response is the median house price (MEDV). Table describes
each of the predictors and the response.

Description of Variables in the Boston Housing Dataset

CRIM Crime rate
ZN Percentage of residential land zoned for lots over 25,000 sq.ft
INDUS Percentage of land occupied by nonretail business
CHAS Does tract bound Charles River? (= 1 if tract bounds river, = 0 otherwise)
NOX Nitric oxide concentration (parts per 10 million)
RM Average number of rooms per dwelling
AGE Percentage of owner-occupied units built prior to 1940
DIS Weighted distances to five Boston employment centers
RAD Index of accessibility to radial highways
TAX Full-value property tax rate per $10,000
PTRATIO Pupil-to-teacher ratio by town
LSTAT Percentage of lower status of the population
MEDV Median value of owner-occupied homes in $1000s
CAT.MEDV Is median value of owner-occupied homes in tract above $30,000 (CAT.MEDV =
1) or not (CAT.MEDV = 0)?

a. Why should the data be partitioned into training and validation sets? What will the training set
be used for? What will the validation set be used for?

b. Fit a multiple linear regression model to the median house price (MEDV) as a function of
CRIM, CHAS, and RM. Write the equation for predicting the median house price from the
predictors in the model.

c. Using the estimated regression model, what median house price is predicted for a tract in the
Boston area that does not bound the Charles River, has a crime rate of 0.1, and where the average
number of rooms per house is 6? What is the prediction error?

d. Reduce the number of predictors:

i. Which predictors are likely to be measuring the same thing among the 13 predictors? Discuss
the relationships among INDUS, NOX, and TAX.

ii. Compute the correlation table for the 12 numerical predictors and search for highly correlated
pairs. These have potential redundancy and can cause multicollinearity. Choose which ones to
remove based on this table.
iii. Use stepwise regression with the three options (backward, forward, both) to reduce the
remaining predictors as follows: Run stepwise on the training set. Choose the top model from
each stepwise run. Then use each of these models separately to predict the validation set.
Compare RMSE, MAPE, and mean error, as well as lift charts. Finally, describe the best model.

S-ar putea să vă placă și

Entity Analysis Resolution
Document22 pagini
Entity Analysis Resolution
alfredo14838
100% (1)
PROJECT REPORT Regression Analysis SPECU PDF
Document8 pagini
PROJECT REPORT Regression Analysis SPECU PDF
VICKY GAURAV
Încă nu există evaluări
MBA Academic Professional Document Guidelines
Document10 pagini
MBA Academic Professional Document Guidelines
zeeshan
Încă nu există evaluări
MUNAR - Linear Regression - Ipynb - Colaboratory
Document30 pagini
MUNAR - Linear Regression - Ipynb - Colaboratory
TRISTAN JAYSON MUNAR
Încă nu există evaluări
Data Mining (Banking)
Document8 pagini
Data Mining (Banking)
Anonymous R0vXI894T
Încă nu există evaluări
Data Mining For Fraud Detection 4381
Document27 pagini
Data Mining For Fraud Detection 4381
eleodor
Încă nu există evaluări
Process Optimization
Document70 pagini
Process Optimization
planket
Încă nu există evaluări
An Introduction To Data Mining
Document47 pagini
An Introduction To Data Mining
Pablo Morete
Încă nu există evaluări
Tune Gaussian Mixture Models - MATLAB & Simulink - MathWorks India
Document6 pagini
Tune Gaussian Mixture Models - MATLAB & Simulink - MathWorks India
sunshinesun49
Încă nu există evaluări
Dependency Parsing
Document96 pagini
Dependency Parsing
hoyeung411
Încă nu există evaluări
Using Logistic Regression Predict Credit Default
Document6 pagini
Using Logistic Regression Predict Credit Default
Sneha Singh
Încă nu există evaluări
Math 1010 Optimization Project
Document5 pagini
Math 1010 Optimization Project
api-272741642
Încă nu există evaluări
A Review A Review of Financial Accounting Fraud Detection Based On Data Mining Techniquesof Financial Accounting Fraud Detection Based On Data Mining Techniques
Document11 pagini
A Review A Review of Financial Accounting Fraud Detection Based On Data Mining Techniquesof Financial Accounting Fraud Detection Based On Data Mining Techniques
khuongcomputer
Încă nu există evaluări
Chapter 13 - Association Rules: Data Mining For Business Intelligence
Document22 pagini
Chapter 13 - Association Rules: Data Mining For Business Intelligence
jay
Încă nu există evaluări
Crime Analysis Through Machine Learning: November 2018
Document7 pagini
Crime Analysis Through Machine Learning: November 2018
Meghanath Reddy Chavva
Încă nu există evaluări
Customer Segmentation Based On GRFM Case Study
Document6 pagini
Customer Segmentation Based On GRFM Case Study
World of Computer Science and Information Technology Journal
Încă nu există evaluări
Feature Selection Techniques in ML With Python-1
Document7 pagini
Feature Selection Techniques in ML With Python-1
Дхиа Еддине
Încă nu există evaluări
Applications of Data Mining in The Banking Sector
Document8 pagini
Applications of Data Mining in The Banking Sector
Gunjan Jain
Încă nu există evaluări
Big Data Analytics On Banking Sector
Document16 pagini
Big Data Analytics On Banking Sector
ajith
100% (1)
Association Rule Generation For Student Performance Analysis Using Apriori Algorithm
Document5 pagini
Association Rule Generation For Student Performance Analysis Using Apriori Algorithm
thesij
Încă nu există evaluări
Reflection Paper
Document3 pagini
Reflection Paper
api-486066385
Încă nu există evaluări
Detecting and Preventing Fraud With Data Analytics
Document10 pagini
Detecting and Preventing Fraud With Data Analytics
Hey Fool
Încă nu există evaluări
A Comprehensive Supply Chain Management Project Selection Framework Under Fuzzy Environment PDF
Document10 pagini
A Comprehensive Supply Chain Management Project Selection Framework Under Fuzzy Environment PDF
ramirali
Încă nu există evaluări
Why Good Matters Governance: Relevant Business Knowledge
Document78 pagini
Why Good Matters Governance: Relevant Business Knowledge
prameyak1
100% (1)
Crime Data Analysis, Visualization and Prediction
Document10 pagini
Crime Data Analysis, Visualization and Prediction
IJRASETPublications
Încă nu există evaluări
Curse of Dimensionality
Document9 pagini
Curse of Dimensionality
subithaperiyasamy
Încă nu există evaluări
Watson by IBM
Document12 pagini
Watson by IBM
Rhythm Arora
Încă nu există evaluări
The Credit Assignment Problem
Document3 pagini
The Credit Assignment Problem
PVV RAMA RAO
Încă nu există evaluări
Big Data and Cognitive Computing
Document10 pagini
Big Data and Cognitive Computing
Rajesh Murugesan
Încă nu există evaluări
Data Preparation
Document87 pagini
Data Preparation
jessie nando
100% (1)
Paper 30-Financial Statement Fraud Detection Using Text Mining
Document3 pagini
Paper 30-Financial Statement Fraud Detection Using Text Mining
Editor IJACSA
Încă nu există evaluări
BlockchainTechnologyandItsApplicationsinBusiness 13F3Y1 by Antef
Document17 pagini
BlockchainTechnologyandItsApplicationsinBusiness 13F3Y1 by Antef
Antef Idrisi
Încă nu există evaluări
Exploratory Data Analysis - Komorowski PDF
Document20 pagini
Exploratory Data Analysis - Komorowski PDF
EdinssonRamos
Încă nu există evaluări
How To Code A Neural Network With Backpropagation in Python
Document133 pagini
How To Code A Neural Network With Backpropagation in Python
Suman Roy
Încă nu există evaluări
Customer Churn: by Dinesh Nair Adrien Le Doussal Fiona Tait Fatma Ahmadi Fulya Percin
Document20 pagini
Customer Churn: by Dinesh Nair Adrien Le Doussal Fiona Tait Fatma Ahmadi Fulya Percin
Fati Ahmadi
100% (1)
Hp1047, Vmr286 Loan Default Prediction Final Report
Document8 pagini
Hp1047, Vmr286 Loan Default Prediction Final Report
Jyosna Aragonda
Încă nu există evaluări
Kaisler2013 - Big Data - Issues and Challenges Moving Forward
Document10 pagini
Kaisler2013 - Big Data - Issues and Challenges Moving Forward
skid235
Încă nu există evaluări
Telematics and Informatics
Document27 pagini
Telematics and Informatics
Abhishek
Încă nu există evaluări
ForecastMETHODS TECHNIQUES
Document116 pagini
ForecastMETHODS TECHNIQUES
Venkata Nelluri Pmp
100% (1)
Suraksha Kavach Crime Prediction and Analysis
Document13 pagini
Suraksha Kavach Crime Prediction and Analysis
IJRASETPublications
Încă nu există evaluări
A Design To Predict and Analyze Crime
Document12 pagini
A Design To Predict and Analyze Crime
IJRASETPublications
Încă nu există evaluări
Machine Learning Basics
Document68 pagini
Machine Learning Basics
vishal
Încă nu există evaluări
Introduction To Data Mining
Document643 pagini
Introduction To Data Mining
Dong-gu Jeong
100% (1)
Seminar Data Mining
Document10 pagini
Seminar Data Mining
Sreedevi Kovilakath
Încă nu există evaluări
Tutorial 2018 Optimization
Document7 pagini
Tutorial 2018 Optimization
burhan
Încă nu există evaluări
Getting Started With Data Science Using Python
Document25 pagini
Getting Started With Data Science Using Python
Jatin Borah
100% (1)
Implementation of Credit Card Fraud Detection Using Random Forest Algorithm
Document10 pagini
Implementation of Credit Card Fraud Detection Using Random Forest Algorithm
IJRASETPublications
100% (1)
Digital Analytics Maturation Model
Document3 pagini
Digital Analytics Maturation Model
Jason Luis
Încă nu există evaluări
Data Mining Final Report
Document44 pagini
Data Mining Final Report
kanagambal
100% (1)
Data Deduplication Strategies in Cloud Computing
Document5 pagini
Data Deduplication Strategies in Cloud Computing
International Journal of Innovative Science and Research Technology
Încă nu există evaluări
E-Mail Spam Detection Using Machine Learning and Deep Learning
Document7 pagini
E-Mail Spam Detection Using Machine Learning and Deep Learning
IJRASETPublications
Încă nu există evaluări
Final Reduced Objective Allowable Allowable Cell Name Value Cost Coefficient Increase Decrease
Document7 pagini
Final Reduced Objective Allowable Allowable Cell Name Value Cost Coefficient Increase Decrease
Deepanshu Raj
Încă nu există evaluări
Data Mart Info
Document5 pagini
Data Mart Info
srpothul
Încă nu există evaluări
2 Probability and Statistics
Document3 pagini
2 Probability and Statistics
Joy Dacuan
100% (1)
Exploring Boston Housing Data
Document7 pagini
Exploring Boston Housing Data
Nikhil Shaganti
Încă nu există evaluări
Experiment 1
Document4 pagini
Experiment 1
21bme145
Încă nu există evaluări
Experiment 1
Document4 pagini
Experiment 1
21bme145
Încă nu există evaluări
Exp 1 145
Document4 pagini
Exp 1 145
21bme145
Încă nu există evaluări
Experiment 1
Document4 pagini
Experiment 1
21bme145
Încă nu există evaluări
The Boston Housing Dataset
Document4 pagini
The Boston Housing Dataset
Swastik Mishra
100% (1)
Segmenting Consumers of Bath Soap Business Situation
Document4 pagini
Segmenting Consumers of Bath Soap Business Situation
Sai Nath
Încă nu există evaluări
Predicting Bankruptcy
Document3 pagini
Predicting Bankruptcy
Sai Nath
0% (1)
Lab Assignment 1 - Implementing Security-Firewall - Updated
Document12 pagini
Lab Assignment 1 - Implementing Security-Firewall - Updated
Sai Nath
Încă nu există evaluări
Global Marketing - Patanjali DantKanti Report2
Document11 pagini
Global Marketing - Patanjali DantKanti Report2
Sai Nath
Încă nu există evaluări
Segmenting Consumers of Bath Soap Business Situation
Document4 pagini
Segmenting Consumers of Bath Soap Business Situation
Sai Nath
Încă nu există evaluări
Rosettanet Etd Library User'S Guide: Release 4.5.2
Document38 pagini
Rosettanet Etd Library User'S Guide: Release 4.5.2
Sai Nath
Încă nu există evaluări
Service Management
Document133 pagini
Service Management
Sai Nath
Încă nu există evaluări
Rajeev Ranjan 6.6yrs Informatica
Document3 pagini
Rajeev Ranjan 6.6yrs Informatica
Sai Nath
Încă nu există evaluări
Service MKTG Bba Notes 123
Document53 pagini
Service MKTG Bba Notes 123
Risker Ravi
Încă nu există evaluări
Service MKTG Bba Notes 123
Document53 pagini
Service MKTG Bba Notes 123
Risker Ravi
Încă nu există evaluări
Quiz Questions
Document8 pagini
Quiz Questions
Sai Nath
Încă nu există evaluări
Quality Function Deployment
Document23 pagini
Quality Function Deployment
Sai Nath
Încă nu există evaluări
Service MKTG Bba Notes 123
Document53 pagini
Service MKTG Bba Notes 123
Risker Ravi
Încă nu există evaluări
Quiz Questions
Document8 pagini
Quiz Questions
Sai Nath
Încă nu există evaluări
Chapter 3 Quanti
Document5 pagini
Chapter 3 Quanti
Christine Navidad
Încă nu există evaluări
Research Guide
Document8 pagini
Research Guide
Amber Ebaya
Încă nu există evaluări
Research Design
Document34 pagini
Research Design
Sakshi Sharma
Încă nu există evaluări
RSC2601 Full Summary
Document87 pagini
RSC2601 Full Summary
Adelinah
Încă nu există evaluări
Science Process Skills and Achievement in Science Among High School Students
Document9 pagini
Science Process Skills and Achievement in Science Among High School Students
syariva maris hasan
Încă nu există evaluări
PSEUDOREPLICACION
Document25 pagini
PSEUDOREPLICACION
David Mero del Valle
Încă nu există evaluări
Devin Wijaya Herianto - CA - Ceftaroline Fosamil
Document30 pagini
Devin Wijaya Herianto - CA - Ceftaroline Fosamil
Kyefas
Încă nu există evaluări
Certificate of Installation
Document5 pagini
Certificate of Installation
tyasdwiarum
Încă nu există evaluări
CH 1 Introduction To Chemistry Form 4 KSSM (1) Student
Document43 pagini
CH 1 Introduction To Chemistry Form 4 KSSM (1) Student
JASON CHONG CHIA HANG Moe
100% (1)
Chapter 1 PDF
Document10 pagini
Chapter 1 PDF
Liandra Marie Collante
Încă nu există evaluări
7 - Sampling Design and Measurement
Document28 pagini
7 - Sampling Design and Measurement
Zin Del
Încă nu există evaluări
DLL Science 7 June - Docx Version 1
Document8 pagini
DLL Science 7 June - Docx Version 1
Ayala Andrew Carmelo
100% (2)
PSUnit III Lesson 2 Finding The Mean - and Variance of The Sampling Distribution of Means
Document21 pagini
PSUnit III Lesson 2 Finding The Mean - and Variance of The Sampling Distribution of Means
Janeth Marcelino
50% (4)
Introduction To Statistics
Document134 pagini
Introduction To Statistics
Miliyon Tilahun
95% (43)
BGS Project Report
Document55 pagini
BGS Project Report
Krishna Sahu
100% (3)
Completely Randomized Design: Arif Rahman
Document48 pagini
Completely Randomized Design: Arif Rahman
Moh. Khafid Ridlo Pratama
Încă nu există evaluări
Course Syllabus - Practical Research 2 - SecondRevised
Document10 pagini
Course Syllabus - Practical Research 2 - SecondRevised
Francis Andres Gumawa
Încă nu există evaluări
Portofolio Stase Keperawatan Manajemen: Disusun Oleh: Salma Eka Oktaryza P1337420921103
Document6 pagini
Portofolio Stase Keperawatan Manajemen: Disusun Oleh: Salma Eka Oktaryza P1337420921103
Mega ayu lestari
Încă nu există evaluări
Student Name: Gaurav Raut University ID: 2038584: 6CS012 Workshop 4
Document48 pagini
Student Name: Gaurav Raut University ID: 2038584: 6CS012 Workshop 4
Gaurav Raut
Încă nu există evaluări
DBC011 Business Economics EM
Document338 pagini
DBC011 Business Economics EM
sandi
Încă nu există evaluări
Method of Chi Square
Document3 pagini
Method of Chi Square
Monika Joseph
Încă nu există evaluări
Hulin and Smith A Linear Model of Job Satisfaction
Document8 pagini
Hulin and Smith A Linear Model of Job Satisfaction
Aaron
Încă nu există evaluări
Parameter Vs Statistic
Document2 pagini
Parameter Vs Statistic
mamuka kassa
Încă nu există evaluări
Reasons of Late Submission of High School Students Requirements in NFPS PPT 1
Document12 pagini
Reasons of Late Submission of High School Students Requirements in NFPS PPT 1
11 Castillo Zechariah
Încă nu există evaluări
STAT212 093 Old-Exam First-Major Solved
Document4 pagini
STAT212 093 Old-Exam First-Major Solved
andi royhan alby
Încă nu există evaluări
Wave-Particle Duality: A. Diffraction
$Wave-Particle Duality: A. Diffraction$
Document4 pagini
Wave-Particle Duality: A. Diffraction
Mahnoor Siddiqi
Încă nu există evaluări
Jurnal
Document9 pagini
Jurnal
Rahmat Sumitra
Încă nu există evaluări
ICQ-Sec-B-DADM-2021: 1/1 POINT
Document3 pagini
ICQ-Sec-B-DADM-2021: 1/1 POINT
pas tarun kumar
Încă nu există evaluări
Journal of Baltic Science Education, Vol. 9, No. 1, 2010
Document81 pagini
Journal of Baltic Science Education, Vol. 9, No. 1, 2010
Scientia Socialis, Ltd.
100% (1)
Data Analysis Text Book
Document292 pagini
Data Analysis Text Book
claire
Încă nu există evaluări