Documente Academic
Documente Profesional
Documente Cultură
Obiective
• Calcularea şi interpretarea corelaţiei simple
dintre două variabile
• Elaborarea şi interpretarea modelului de
regresie liniară unifactorială pentru un set de
date
• Elaborarea de prognoze pe baza modelului
Diagrama Scatter (Scatter Plot)
şi Corelaţia
• Diagrama norului de puncte este utilizată pentru a descrie
existenţa,forma şi direcţia relaţiei dintre două variabile
• Corelatia este utilizată pentru a măsura intensitatea
legăturii liniare dintre două variabile numerice, nu şi
cauzalitatea.
y y
x x
y y
x x
Exemple de Scatter Plot
(continuare)
Legături puternice Legături slabe
y y
x x
y y
x x
Exemple de Scatter Plot
(continuare)
Nu există legături
x
Coeficientul de corelaţie
• Coeficientul de corelaţie la nivelul
eşantionului r este utilizat pentru măsurarea
intensităţii legăturii liniare dintre două
variabile numerice pe baza datelor din
eşantion, nu şi cauzalitatea.
Aprecieri referitoare la r
• Nu are unitate de măsură
• Valori între -1 şi 1
• Apropierea de -1, implică o legătură inversă
şi puternică între cele două variabile
• Apropierea de 1, implică o legătură directă şi
puternică între cele două variabile
• Apropierea de 0, implică o legătură liniară
foarte slabă
Exemple pentru aproximarea
valorilor lui r
y y y
x x x
r = -1 r = -0.6 r=0
y y
x x
r = +0.3 r = +1
Calculul
Coeficientului de corelaţie
Coeficientul de corelaţie la nivelul eşantionului:
r
( x x)( y y)
[ ( x x ) ][ ( y y ) ]
2 2
Înălţimea n xy x y
copacului, r
y 70 [n( x 2 ) ( x)2 ][n( y 2 ) ( y)2 ]
60
8(3142) (73)(321)
50
40
[8(713) (73)2 ][8(14111) (321) 2 ]
30
0.886
20
10
0
r = 0.886 → legătură directă,
0 2 4 6 8 10 12 14
puternică între x şi y
Diametrul trunchiului,
x
Excel Output
Excel Correlation Output
Tools / data analysis / correlation…
Inaltimea Diametrul
Inaltimea 1
Diametrul 0.886231 1
6 (di) 2
rs 1
n(n 2 1)
A Gimnazial 25 5 3 2 4
B Primar 10 6 5,5 0,5 0,25
C Universitar 8 1,5 7 -5,5 30,25
D Liceal 10 3,5 5,5 -2 4
E Liceal 15 3,5 4 -0,5 0,25
F Fără studii 50 7 2 5 25
G Universitar 60 1,5 1 0,5 0,25
Exemplu de calcul a
coeficientului Spearman
6 64
rs 1 0.1
7(48)
y b 0 b1x ε
reziduală
Variabila
dependentă
Interceptia =
b0
xi x
Metoda celor mai mici pătrate
e 2
(y ŷ) 2
(y (b 0 b1x))
2
Metoda celor mai mici pătrate
• Formulele pentru b1 şi b0 sunt:
b1
( x x )( y y )
(x x) 2
şi
xy x y
b1 n b0 y b1 x
x 2
( x ) 2
n
Interpretarea pantei dreptei
(slope) şi a intercepţiei
• b0 este valoarea estimată a lui y când
x este zero
ANOVA
df SS MS F Significance F
350
Panta
300
250
= 0.10977
200
150
100
50
Interceptia 0
= 98.248 0 500 1000 1500 2000 2500 3000
Square Feet