Documente Academic
Documente Profesional
Documente Cultură
Database using R
Manajemen data
Analisis prediktif
menggunakan Regresi
DATABASES
USING R
DATABASE MANAGEMENT
SYSTEM
Open Source
Lisence
Main Language
DATABASES IN R
RMySQL ROracle
RSQLite odbc
RPostgres bigrquery
DBI : R DATABASE INTERFACE
RSQLite
odbc
bigrquery
CONNECTING TO A DATABASE
dbConnect(MySQL(), user="username", password="pass",
host="localhost", dbname="dbname")
dbConnect(SQLite(), dbname="dbname")
dbConnect(RPostgres::Postgres(), host="localhost",
port="db_port", user="db_user",
password="db_password", dbname="dbname")
CONNECTING TO A DATABASE
dbConnect(Oracle(), user="user", password=“pass",
host="localhost", dbname="dbname")
dbConnect(odbc::odbc(),driver="SQL Server",
server=01wh155073, database="mydbname",
uid="username", pwd="passwd")
dbWriteTables(con,"tablename","dataframe“,
Write a dataframe to a database table
header=T,row.names=F)
or
dbGetQuery returns a data frame that contains the complete data from the table using SQL Query
EXAMPLE : LOAD DATA
returns a data frame that selecting only the data meeting certain criteria from the table
EXAMPLE : CLOSING
mengambil 3
kolom pertama
SELECT()
> subset2 <- select(country, -(Code:Continent))
> head(subset2)
Menghilangkan 3
kolom pertama
FILTER()
Fungsi filter() digunakan untuk mengekstrak baris dari data frame.
> GNP100 <- filter(country, GNP < 100)
> str(GNP100)
GNP kurang
dari 100
FILTER()
> Filter2 <- filter(country, Continent=="North America"
& Population > 10000)
> str(Filter2) Continent “North America” dan
population >10.000,
MUTATE()
Fungsi mutate() dapat digunakan untuk melakukan transformasi variabel
dalam suatu data frame.
> country$kat=ifelse(country$GNP<500,"low",
ifelse(sleep$sleep_total<1000,
"moderate","high"))
IF ELSE
ANALISIS
PREDIKTIF
MENGGUNAKAN
REGRESI
ANALISIS
PREDIKTIF
Prediktif Analitik digunakan untuk
membuat prediksi tentang suatu
kejadian masa depan.
Jenis analitik membuat suatu model
statistik yang dapat memprediksi suatu
nilai dari kejadian baru dan kejadian masa
depan.
ILUSTRASI
Diambil sampel acak dari ratusan rumah yang ada dalam daerah tersebut,
kemudian hitung nilai tengah/ rataan harga jualnya
Padahal informasi ini akan lebih bermanfaat jika digunakan untuk menaksir
nilai jual rumah yang bersangkutan. Mengapa????
MENGAPA ????
1. Antara harga jual sebuah rumah dengan luas lantai, banyaknya kamar
mandi dan toilet serta umur rumah bisa saja memiliki hubungan
2. Jika diketahui bahwa terjadi hubungan, maka akan mudah untuk
menentukan dan memprediksikan kejadian dari harga jual rumah tersebut
Model regresi
Y β 0 β1x ε
Dengan :
0 dan 1 adalah parameter regresi
adalah sisaan/galat (peubah acak)
Y adalah peubah tak bebas (peubah acak)
X adalah peubah bebas yang nilainya diketahui
dan presisinya sangat tinggi (bukan peubah acak)
Model Regresi Linier Berganda
Y β0 β1X1 β 2 X 2 βk Xk ε
Import
menggunakan ffdf
ILUSTRASI REGRESI PADA BIG
DATA
Seorang peneliti ingin melihat pengaruh luas lantai, banyaknya kamar tidur, banyaknya kamar
mandi dan umur rumah terhadap nilai jual sebuah rumah sehingga nantinya bisa dilakukan
prediksi pada nilai jual rumah. Pada kasus ini diambil sekitar 5 jutaan rumah untuk dijadikan
sampel, dan terdapat 30 rumah baru dengan kriteria (luas lantai, banyaknya kamar tidur,
banyaknya kamar mandi dan umur rumah) masing-masing.