Sunteți pe pagina 1din 21

ANALIZA LEGTURII DINTRE VARIABILELE

STATISTICE
REGRESIE I CORELAIE (I)

Cuprins:

Forma legturii dintre variabile


Metode elementare de caracterizare
legturii dintre dou variabile

Analiza de regresie
Aprecierea calitii i validarea modelului de
regresie

1. FORMA LEGTURII DINTRE


VARIABILE
O variabil dependent (sau variabil rezultativ, variabil
efect sau explicat, notat Y) i una sau mai multe
variabile independente (variabile factoriale, explicative sau
cauzale, notate Xj) se pot afla, una fa de cealalt, ntruna din urmtoarele patru situaiile:

legtur univoc

legtur biunivoc

evoluia paralel

simplu paralelism

1. FORMA LEGTURII DINTRE


VARIABILE
Legturile existente ntre variabilele cauzale i cea rezultativ se pot
clasifica dup mai multe criterii.
A. Dup tipul relaiei dintre variabilele numerice, distingem:

legturi deterministe;

legturi probabiliste.
Influena variabilelor nespecificate este luat n considerare n
modelul probabilist sub forma variaiei reziduale, frecvent numit i
eroare aleatoare (). De aceea, modelul probabilist are urmtoarea
form general:

Y = f(x) +

1. FORMA LEGTURII DINTRE


VARIABILE
B. n funcie de numrul variabilelor factoriale (X) luate n
considerare exist:

legturi simple;

legturi multiple.
C. Dup direcia legturii:

legturi directe;

legturi inverse.
D. Dup timpul n care se realizeaz legtura ntre variabile:

legturi sincrone (concomitente);

legturi asincrone (cu decalaj).

1. FORMA LEGTURII DINTRE


VARIABILE
E. Dup forma funciei (expresia analitic a legturii):

legturi liniare;

legturi neliniare.
Dac legtura dintre variabila dependent i cea independent se
apropie de forma unei drepte, legtura este liniar. n cazul
legturilor neliniare, dependena dintre variabilele factorial i
rezultativ se exprim grafic cu ajutorul unei curbe (de exemplu:
funcia parabolic, exponenial, logistic).

2. METODE ELEMENTARE DE CARACTERIZARE A


LEGTURII DINTRE DOU VARIABILE

metoda seriilor paralele


metoda grafic
metoda tabelului de corelaie

2. METODE ELEMENTARE DE CARACTERIZARE A


LEGTURII DINTRE DOU VARIABILE

Metoda seriilor paralele, numit i metoda seriilor


interdependente, presupune compararea seriilor de
date corespunznd celor dou variabile analizate, dup
ce, n prealabil, s-au ordonat, cresctor sau descresctor,
valorile caracteristicii independente (X).

2. METODE ELEMENTARE DE CARACTERIZARE A


LEGTURII DINTRE DOU VARIABILE

Metoda grafic const n reprezentarea grafic, n


sistemul de axe caterzian, a perechilor de valori (xi, yi),
sub form de puncte.
Astfel, pe abscis se msoar valorile caracteristicii
independente (X), iar pe ordonat, valorile caracteristicii
dependente (Y). Coordonatele punctelor de pe grafic
sunt valorile celor dou caracteristici pentru fiecare
nregistrare n parte.
Se obine astfel o diagram de corelaie sau o

corelogram.

2. METODE ELEMENTARE DE CARACTERIZARE A


LEGTURII DINTRE DOU VARIABILE

Metoda tabelului de corelaie pornete de la


gruparea concomitent a celor n elemente ale unei
colectiviti n funcie de cele dou variabile.
Se obine astfel un tabel cu dubl intrare, n care, pe
coloane sunt trecute intervalele de variaie dup
caracteristica independent (X) ordonate cresctor de la
stnga la dreapta, iar pe linii, intervalele dup Y,
ordonate, de preferin, descresctor.

3. ANALIZA DE REGRESIE

Metoda regresiei analizeaz cu ajutorul unor expresii analitice


denumite funcii de regresie, modul n care variabila dependent
Y evolueaz n raport cu modificarea uneia sau mai multor variabile
independente Xj.
Estimarea parametrilor funciei ce aproximeaz cel mai bine norul de
puncte este cunoscut i sub numele de determinare a curbei de

regresie.

Funcia de regresie exprim modificarea cantitativ a caracteristicii

rezultative (Y) ca urmare a modificrii caracteristicii factoriale (X), n


condiiile n care aciunea altor factori este considerat a fi
neesenial.

Yi= f(X1, X2,...., Xk) + i

3. ANALIZA DE REGRESIE

Regresia unifactorial liniar

yi a bxi i

Parametrul a numit i termen liber reprezint ordonata la


origine i exprim valoarea lui y cnd x = 0 (punctul n care linia
intersecteaz axa Oy). Acest parametru nu are semnificaie
economic.
Parametrul b reprezint, din punct de vedere matematic, panta
dreptei de regresie i poart denumirea de coeficient de regresie. El
arat cu cte uniti se modific variabila rezultativ (Y) la
modificarea cu o unitate a variabilei factoriale (X).

3. ANALIZA DE REGRESIE

Semnul coeficientului de regresie arat direcia


legturii dintre cele dou variabile cercetate:

dac b > 0 legtura ntre variabile este direct;

dac b < 0 legtura ntre variabile este invers


(negativ);
dac b = 0 nu exist legtur ntre variabile.

3. ANALIZA DE REGRESIE

Estimarea parametrilor a i b ai ecuaiei liniare de


regresie se realizeaz, de regul, prin metoda celor mai
mici ptrate. Ea se bazeaz pe criteriul minimizrii sumei
ptratelor erorilor:
2 min

S ( y i y i ) 2 min
i 1

S ( y i a bxi ) 2 min
i 1

S
0 2 ( y i a bx i )(1) 0

a
i 1

n
S 0 2 ( y a bx )( x ) 0

i
i
i

b
i 1

3. ANALIZA DE REGRESIE

Dup prelucrare, sistemul de ecuaii normale devine:


n
n

na b xi y i

i 1
i 1
n
n
n
2
a x b x
xi y i

i
i

i 1
i 1
i 1

y x
x y x
n
x
x x
i

i
2

y x x y x

n x ( x )
2

n
b

i
2

y
x y
x
x
i

i
2

n xi y i xi y i
n x i2 ( xi ) 2

3. ANALIZA DE REGRESIE
Exemplu
Magazin

Nr.spoturi

Nr. vizitatori
(mii pers.)

42

32

10

40

10

61

35

34

45

10

11

c. S se estimeze i analizeze parametrii


funciei liniare de regresie.

11

12

64

12

37

d. S se previzioneze numrul vizitatorilor


n ipoteza c se vor difuza 15 spoturi
publicitare.

13

30

14

11

55

15

25

Pentru 15 magazine on-line s-au


cules date privind numrul de
spoturi publicitare difuzate i
numrul vizitatorilor.
Se cere:

a. S se reprezinte grafic legtura dintre


cele dou variabile (corelograma).
b. S se observe sensul i forma legturii
ntre cele dou variabile folosind metoda
grafic.

Nr. vizitatori (mii persoane)

a. S se reprezinte grafic legtura dintre cele dou


variabile (corelograma).

70
60
50
40
30
20
10
0
0

Nr. spoturi

10

12

14

b. S se estimeze i analizeze parametrii funciei liniare de regresie.

y x x y x

a
n x ( x )
2

529 767 4135 95


5,21
15 767 (95) 2

n xi yi xi yi

n x i2 ( xi ) 2
15 4135 95 529

4,75
15 767 (95) 2

y i 5,21 4,75 xi

y i yi

xi

yi

xi

42

49

294

38.43

32

25

160

28.94

10

10

9.95

40

64

320

43.18

10

61

100

610

52.67

16

14.70

35

36

210

33.68

34

49

238

38.43

45

81

405

47.92

10

11

33

19.45

11

12

64

144

768

62.16

12

37

64

296

43.18

13

30

16

120

24.19

14

11

55

121

605

57.41

15

25

50

14.70

95

529

767

4135

529

Total

xi yi

y i 5,21 4,75 xi

Magazin

4. APRECIEREA CALITII I VALIDAREA MODELULUI DE


REGRESIE

Eroarea standard se calculeaz ca abatere medie ptratic a


valorilor reale fa de cele teoretice corespunztoare:

S yi / yi

(y

y i ) 2
n

Coeficientul de eroare cuantific intensitatea variaiei n jurul


funciei de regresie n expresie procentual:

S yi / y i
y

100

4. APRECIEREA CALITII I VALIDAREA


MODELULUI DE REGRESIE

Coeficientul de determinaie arat proporia n care variabila


independent (X) explic variaia caracteristicii dependente (Y):
2

(
y

y
)

i
i
2
R 1
100
2
(
y

y
)

Validarea modelului de regresie - testul Fisher-Snedecor (testul F).


Fcalc

( y i y ) 2 ( yi y i ) 2 dispersia exp licata prin mod el / k 1

k 1
nk
dispersi ane exp licata / n k

Condiia necesar pentru validarea modelului de regresie este ca:

Fcalc F ,k 1,n k

Mag.

xi

yi

xi

xi yi

2
2
yi 5,21 4,75 xi ( yi y i ) ( yi yi )

( y i y ) 2

42

49

294

38.43

12.74

45.34

10.01

32

25

160

28.94

9.37

10.67

40.04

10

10

9.95

0.00

638.40

640.69

40

64

320

43.18

10.09

22.40

62.57

10

61

100

610

52.67

69.41

662.20

302.83

16

14.70

44.90

743.47

422.95

35

36

210

33.68

1.73

0.07

2.50

34

49

238

38.43

19.63

1.60

10.01

45

81

405

47.92

8.54

94.74

160.17

10

11

33

19.45

71.35

588.87

250.27

11

12

64

144

768

62.16

3.38

825.60

723.28

12

37

64

296

43.18

38.15

3.00

62.57

13

30

16

120

24.19

33.72

27.74

122.63

14

11

55

121

605

57.41

5.83

389.40

490.53

15

25

50

14.70

106.07

105.40

422.95

Total

95

529

767

4135

529

434.93

4158.93

3724.00

4. APRECIEREA CALITII I VALIDAREA MODELULUI DE


REGRESIE

Eroarea standard

(y

S yi / yi

Coeficientul de eroare
e

y i ) 2

S yi / y i
y

100

434,93
/ 5,38
15

5,38
* 100 15,27 %
35,27

Coeficientul de 2 ( yi y i ) 2
434,93

R 1

100

2
4158,93 100 89,54%
determinaie
(
y

y
)

Testul F

Fcalc

( y i y ) 2 ( yi y i ) 2 3724 434 ,93

:
111,3
k 1
nk
2 1 15 2

Fcritic Fk 1;n k F1;13 4,67

S-ar putea să vă placă și