Documente Academic
Documente Profesional
Documente Cultură
Context
z Statistica dispune de o seam de metode de
studiere a dependenelor dintre dou sau mai multe
variabile. Printre acestea sunt i cele cuprinse n
"analiza de regresie i corelaie". n cadrul
acesteia se studiaz dependena dintre o variabil
(caracteristic) rezultativ (y) i una sau mai multe
variabile (caracteristici) independente (x).
z
Caracteristica rezultativ se mai numete
caracteristica dependent, endogen sau efect, iar
caracteristica independent se mai numete
caracteristica factorial, exogen sau cauz.
z
Regresia ne arat cum (ca form analitic) o
variabil este dependent de alt variabil (sau de
alte variabile), iar corelaia ne arat gradul n care o
variabil este dependent de o alt variabil (sau
alte variabile).
Clasificri
a) dup numrul caracteristicilor independente luate
n studiu:
- legturi simple
- legturi multiple
b) dup direcia legturilor, acestea pot fi:
- legturi directe
- legturi inverse
c) dup expresia analitic a legturilor, acestea pot
fi:
- legturi liniare
- legturi neliniare (curbilinii)
d) metode de abordare
- metode simple (elementare)
- metode analitice
z
z
z
z
Clasificri
a) dup numrul caracteristicilor independente luate
n studiu:
- legturi simple
- legturi multiple
b) dup direcia legturilor, acestea pot fi:
- legturi directe
- legturi inverse
c) dup expresia analitic a legturilor, acestea pot
fi:
- legturi liniare
- legturi neliniare (curbilinii)
d) metode de abordare
- metode simple (elementare)
- metode analitice
Concluzii:
- caracteristica y se ordoneaz aproximativ cresctor rezult c putem aprecia c ntre cele dou variabile
exist o legtur direct;
- caracteristica y se ordoneaz aproximativ descresctor
rezult c putem aprecia c ntre cele dou variabile
exist o legtur invers;
- caracteristica y nu nregistreaz o tendin de ordonare
(cresctor sau descresctor) - rezult c putem aprecia
c ntre cele dou variabile nu exist legtur.
Metoda gruprilor
z Se repartizeaz unitilor n grupe omogene n
funcie de o caracteristic independent.
z Pentru fiecare grup astfel constituit se
centralizeaz datele numerice referitoare la
caracteristica rezultativ i se calculeaz medii
pe fiecare grup i mrimi relative.
z Prin comparaia variaiei caracteristicii
independente cu indicatorii calculai pentru
caracteristica rezultat se poate aprecia
existena i forma legturilor dintre cele dou
variabile.
General
Slovaci
Altele
Ortodox
Romanocatolic
.
.
.
General
.
.
.
Musulman
Altele
Total
Total
Romn
Religia/
Naionalitatea
n11
n21
n12
n22
.
.
.
.
n1j
n2j
.
.
.
.
n1p-1
n2p-1
n1p
n2p
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
nip-1
.
.
.
nr-1p-1
nip
.
.
.
nr-1p
ni.
nr-1j
.
.
.
.
.
.
.
.
.
.
.
ni2
.
.
.
nr-12
.
.
.
.
.
.
.
.
.
.
.
ni1
.
.
.
nr-11
.
.
.
.
.
.
.
.
nr1
n.1
nr2
n.2
.
.
.
.
nrj
n.j
.
.
.
.
nrp-1
n.p-1
nrp
n.p
nr.
n
nij
.
.
.
n1.
n2.
.
.
.
.
.
.
nr-1.
Metoda grafic
Graficul se construiete pornind de le perechile de valori
observate (x, y) care se reprezint n sistemul de axe
rectangulare. Pe axa OX se reprezint variabila
independent x, iar pe axa OY variabila dependent y.
x
x
x
y
x
x
x
x
x
Fig. 8.4.
x
x
x
x
xx
x
x
x
x
x
0
0
Fig. 8.6. Leg` tur` invers`
Numr curent
Mireasa (A)
Mirele (B)
17
18
2.
22
25
3.
28
36
4.
19
21
5.
20
22
6.
19
19
7.
23
24
8.
27
32
9.
32
38
10.
25
26
11.
20
22
12.
22
25
13.
20
23
14.
22
15.
21
23
Media
22,466666667
25,266666667
Abaterea standard
3,862066229
5,579326921
Dispersia
14,915555556
31,128888889
25
Reprezentarea grafic
Vrsta mirelui
40
35
30
25
20
15
15
20
25
30
35
Vrsta m iresei
y i
Punerea problemei
Fie f:R->R o
funcie liniar,
avnd forma
analitic:
f(x)=a+bx, xR.
Pentru diferitele
valori ale lui a i
b funcia va lua
valori diferite.
Dou cazuri
concrete i unul
general este
redat n tabelul
urmtor.
Nr.
crt.
Vrsta
mirelui
Vrsta
miresei
f(x)=
15+2x
f(x)=9+x/2
xi
yi
zi
wi
f(x)=a+bx
1.
18
17
21
18
2.
25
22
35
21,5
a+25b
3.
36
28
57
27
a+36b
a+18b
4.
21
19
27
19,5
a+21b
5.
22
20
29
20
6.
19
19
23
18,5
a+19b
7.
24
23
33
21
a+24b
a+22b
8.
32
27
49
25
a+32b
9.
38
32
61
28
a+38b
10.
26
25
37
22
a+26b
11.
22
20
29
20
a+22b
12.
25
22
35
21,5
a+25b
13.
23
20
31
20,5
a+23b
14.
25
22
35
21,5
a+25b
15.
23
21
31
20,5
a+23b
Concepte
Chiar i printr-o inspectare sumar a tabelului putem afirma c valorile w sunt mai bune dect
cele din coloana lui z. Dar trebuie s alegem cea mai bun pereche de alori a i b. n continuarea
studiului trebuie s introducem o noiune foarte important.
Definiie:
Fie (xi,yi), i=1..m un set de date, f:RR o funcie.
Variabila e definit prin ei = yi f(xi) = y i y i , i=1..m, se numete variabil rezidual, iar
valorile acestei variabile se numesc valori reziduale.
Este clar c n rezolvarea problemei conteaz valoarea absolut a valorilor reziduale, dar
pentru a lucra cu expresii lum ptratele acestora. Expresia cea mai des utilizat este suma
ptratelor valorilor reziduale, care sum vom numi pe scurt suma ptratic rezidual.
(y i a bx i )2
= minim.
na + b x i = y i
a x i + b x i = x i y i
unde n reprezint numrul unitilor observate, adic numrul perechilor (x,y).
Rezult c y = a + bx sau a = y - bx, ceea ce nseamn c dreapta de
regresie trece prin punctul mediu (x, y).
Rezolvnd sistemul de ecuaii normale, se obin parametrii a" i b".
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
xi2
324
625
1296
441
484
361
576
1024
1444
676
484
625
529
625
529
10043
xi
xi y i
yi
18
25
36
21
22
19
24
32
38
26
22
25
23
25
23
379
306
550
1008
399
440
361
552
864
1216
650
440
550
460
550
483
8829
17
22
28
19
20
19
23
27
32
25
20
22
20
22
21
337
y = 0.672758423 x + 5.468303843
Interpretri
Y = a bx +
Prin logaritmare, modelul se poate transforma ntr-un model liniar de
forma:
lg Y = lg a + x lg b
Fcnd urmtoarele nlocuiri:
Y = lg Y ;
a' = lg a ;
respectiv:
y' = a' + b' x
y=+
sau
y=
+
x
Y = a+
1
b+
xi
iar cei doi parametri rezult din rezolvarea sistemului de ecuaii normale:
na + b x = y i
1
1
1
+ b
= yi
a
xi
xi
x i2
na + b lg x i = y i
2
a lg x i + b (lg x i ) =
y i lg x i
Y
(X11,X21,Y1)
3,5
(X12,X22,Y2)
3,0
2,5
(X13,X23,Y3)
Y 2,0
(X14,X24,Y4)
Y5
1,5
(X15,X25,Y5)
X15
1,0
X25
X1
4 3
2 1
0 -1
X1 -2 -3
X2
-1 0
-3 -2
X2
Metoda corelaiei
Corelaia parametric
Metoda corelaiei prezint avantajul c ofer o msur sintetic a
legturilor dintre variabilele statistice. Indicatorii care msoar
intensitatea legturii sunt: covariana, coeficientul de corelaie i
raportul de corelaie.
COVARIANA
Covariana se calculeaz sub forma mediei aritmetice simple a produselor
abaterilor celor dou variabile corelate, x i y, de la mediile lor aritmetice x i y ,
conform relaiei:
cov(x, y ) =
1 n
xi x yi y
n i =1
Covariana (2)
Covariaia este nul dac variabilele sunt independente (lipsa legturii de
corelaie).
Valoarea sa absolut cov (x,y) nu are limit superioar. Pe msur ce
intensitatea corelaiei crete i covariaia crete.
Indicatorul reprezint avantajul c se calculeaz destul de uor. n acelai
timp, prezint i dezavantajul c depinde de unitile n care se msoar
variabilele aleatoare.
Deci nu este comparabil de la o variabil la alta.
Indicatorul ia valori pozitive dac legtura dintre variabile este direct i
valori negative n coz contrar. Valori apropiate de zero semnific lipsa
oricrei legturi ntre x i y; valori ridicate ale indicatorului arat o legtur
puternic.
x x
zx = i
x
yi y
y
zy =
(x i x )(y i y ) =
x xy =
n x y
(x i x )(y i y )
(x i x )
(y i y )2
cov (x , y )
=
xy
rxy =
(x i x )(y i y )
n x y
r=
[n x
n x i y i x i y i
2
i
][
( x i )2 n y i2 ( y i )2
r =b x ,
y
n care:
b - este coeficientul de regresie simpl;
x - abaterea medie ptratic a caracteristicii factoriale;
y - abaterea medie ptratic a caracteristicii rezultative.
10