Sunteți pe pagina 1din 5

#

#
#
#
#

Analiz de date pentru afaceri - Administrarea afacerilor, anul III


Universitatea din Bucuresti,
Facultatea de administratie si afaceri
Titular de curs: Prof. Univ. Dr. Elena Druica,
Email: elena.druica@faa.unibuc.ro

# Codul pentru sptmna 7


# Creat: 16 noiembrie 2015
# Copiai i rulai comenzile de mai jos n R - Studio
# EXEMPLUL 1
# DESCRIEREA DATELOR
# Datele sunt cele din sptmna 2 i se refer la o serie de
indicatori de dezvoltare economic
# SCOPUL ANALIZEI
# Descrierea relaiei dintre rata mortalitii infantile ca variabil
dependent
# i gdp per capita ca variabil explicativ
# Modelul 1
# Construcia unui model de regresie care arat dependena
# mortalitii infantile de GDP per capita
plot(wb$gdp_per_capita, wb$infant_mortality, xlab = 'GDP per
capita', ylab = "Rata mortalitii infantile", main = "Relaia dintre
GDP per capita i rata mortalitii infantile")
model_infant <- lm(wb$infant_mortality ~ wb$gdp_per_capita)
summary(model_infant)
abline(model_infant, col = "red")
# Relaia dintre variabile este de tip y = 1/x
# Modelul funcional: wb$infant_mortality = f(1/
(wb$gdp_per_capita))
# Crem o nou variabil
wb$gdp_ratio = 1/(wb$gdp_per_capita)
# Refacem modelul
plot(wb$gdp_ratio, wb$infant_mortality, xlab = " 1/GDP", ylab =
"Rata mortalitii infantile", main = "Relaia dintre inversul GDP i
rata mortalitii infantile")
model_infant_ratio <- lm(wb$infant_mortality ~ wb$gdp_ratio)
summary(model_infant_ratio)
abline(model_infant_ratio, col = "red")
# Prin reconsiderarea formei funcionale a modelului, puterea
explicativ a crescut semnificativ
# Modelul 2
# Definirea variabilei "rata analfabetismului", pe baza variabilei
"rata alfabetismului"

wb$illiteracy_all <- 100 - wb$literacy_all


# Construcia unui model de regresie care arat dependena
# ratei analfabetismului de GDP per capita
plot(wb$gdp_per_capita, wb$illiteracy_all, , xlab = 'GDP per capita',
ylab = "Rata analfabetismului", main = "Relaia dintre GDP per
capita i rata analfabetismului")
mymodel <- lm(wb$illiteracy_all ~ wb$gdp_per_capita)
summary(mymodel)
abline(mymodel)
# Relaia dintre variabile este de tipul y = 1/x. Refacei
raionamentul anterior.
plot(wb$gdp_ratio, wb$illiteracy_all, xlab = " 1/GDP", ylab = "Rata
analfabetismului", main = "Relaia dintre inversul GDP i rata
analfabetismului")
model_illiteracy_ratio <- lm(wb$illiteracy_all ~ wb$gdp_ratio)
summary(model_illiteracy_ratio)
abline(model_illiteracy_ratio, col = "red")
# TEMA 1 PENTRU SEMINAR
# Preluai din codul saptmnii 2 subseturile de date care se refer
la cele mai bogate
# i la cele mai srace 50 de ri. Verificai unde trebuie folosit un
model
# neliniar i analizai rezultatele.
# EXEMPLUL 2
# Descrierea relaiei dintre cheltuielile pe diverse categorii, n
relaie cu totalul cheltuielilor personale
# Sursa datelor: SUA, anii 1993 - 1999
# Descrierea variabilelor
# Cheltuielile pentru servicii
# Cheltuielile pentru bunuri durabile
# Cheltuielile pentru bunuri non - durabile
# Cheltuielile personale totale
str(expenditures)
# Modelul 1: relaia dintre cheltuielile totale i totalul cheltuielilor
personale
model1 <- lm(expenditures$chelt_nondurabile ~
expenditures$chelt_pers)
summary(model1)
plot(expenditures$chelt_pers, expenditures$chelt_nondurabile, xlab
= "Total cheltuieli personale", ylab = "Cheltuieli cu bunurile
nedurabile")
abline(model1)
# MODELE LOGARIRMICE

# Elasticitatea cheltuielilor pentru bunuri non - durabile n raport cu


cheltuielile totale
# Definim variabilele log
expenditures$LOGchelt_nondurabile <log(expenditures$chelt_nondurabile)
expenditures$LOGchelt_pers <- log(expenditures$chelt_pers)
model2 <- lm(expenditures$LOGchelt_nondurabile ~
expenditures$LOGchelt_pers)
summary(model2)
plot(expenditures$LOGchelt_pers,
expenditures$LOGchelt_nondurabile, xlab = "Logaritm din total
cheltuieli personale", ylab = "Logaritm din cheltuieli cu bunurile
nedurabile")
abline(model2)
#
#
#
#
#
#
#

MODELE SEMILOGARITMICE
Modele care arat rata de cretere, sau modele de tip log - lin
rata de cretere a cheltuielilor personale pentru servicii
yt = y0(1+r)^t
log(yt) = log(y0) + t*log(1+r)
log(yt) = b0 + b1*t
b1 = semielastivitatea lui y n raport cu regresorul

# Modelul fr logaritm: modelul trendului liniar


model3 <- lm(expenditures$chelt_servicii ~ expenditures$time)
summary(model3)
# Definirea variabilei log cheltuieli pentru servicii
expenditures$LOGchelt_servicii <- log(expenditures$chelt_servicii)
# Reprezentrile grafice ale celor dou variabile
plot(expenditures$time, expenditures$chelt_servicii, xlab =
"Timpul", ylab = "Cheltuielile cu serviciile")
plot(expenditures$time, expenditures$LOGchelt_servicii, xlab =
"Timpul", ylab = "Logaritmul cheltuielilor cu serviciile")
# Modelul cu logaritm: log - lin
model4 <- lm(expenditures$LOGchelt_servicii ~ expenditures$time)
summary(model4)
# Interpretare:
# Pe parcursul perioadei analizate, cheltuielile cu serviciile cresc cu
o rat trimestrial de 0.0074*100% = 0.74%
# Aceasta este o rat instantanee a dobnzii i nu rata dobnzii
compuse trimestriale
rata_trimestriala <- (exp(0.0074258) - 1)*100
rata_trimestriala
# Rata trimestrial a dobnzii compuse este 0.745%, un pic diferit
de cea instantanee

# Semnificaia interceptului 7.7890086: log cheltuieli la nceputul


perioadei
log(cheltuieli) = 7.7890086
cheltuieli = exp(7.7890086)
cheltuieli
# Observaie: alegerea ntre modelul 3 i 4 depinde de ceea ce
urmrim s obinem
# Modelele de tip lin - log
# Au n logaritm regresorul, iar variabila dependent este n valori
absolute
# Relaia dintre cheltuielile totale i cheltuielile pentru bunuri non durabile
model5 <- lm(expenditures$chelt_nondurabile ~
expenditures$chelt_pers)
summary(model5)
# Reprezentrile grafice ale celor dou variabile, nainte i dup
logaritmarea regresorului
plot(expenditures$chelt_pers, expenditures$chelt_nondurabile, xlab
= "Cheltuieli totale", ylab = "Cheltuielile pentru bunuri nedurabile")
plot(expenditures$LOGchelt_pers, expenditures$chelt_nondurabile,
xlab = "Logarirmul cheltuielilor totale", ylab = "Cheltuielile pentru
bunuri nedurabile")
# Modelul cu logaritm: lin - log
model6 <- lm(expenditures$chelt_nondurabile ~
expenditures$LOGchelt_pers)
summary(model6)
# Interpretare
# coeficientul regresorului = 1105.20
# dac n cheltuielile totale apar schimbri de 0.01 (adic de 1%;
regresorul se exprim procentual, pentru c are logaritm)
# atunci n cheltuielile cu bunurile non - durabile apar schimbri de
0.01*1105.20
# deci de 11.052 uniti monetare
# TEMA 2 PENTRU SEMINAR
# Construii modelele aferente variabilelor dependente "cheltuieli
pentru bunuri durabile" i "cheltuieli cu serviciile"
# TEMA 3 PENTRU SEMINAR
# Extrageti de pe World Bank date referitoare la aceste tipuri de
cheltuieli, plus cheltuielile alimentare
# referitoare la anul 2006 i la anul 2010, pentru rile europene.

# Realizai cte un model de regresie pentru aceste uniti cross sectional


# i verificai dac au aprut modificri ale coeficienilor variabilelor
independente
# ca urmare a crizei financiare din 2008 - 2009

S-ar putea să vă placă și