Sunteți pe pagina 1din 29

ANALIZA

LEGĂTURILOR
DINTRE VARIABILE
1. CONCEPTUL DE
LEGĂTURĂ
STATISTICĂ
obiectivi

subiectivi

Fenomenele şi esențiali
procesele studiate în
statistică sunt
influenţate de o
mulţime de factori întâmplători

principali

secundari
Legăturile dintre variabile
Funcţionale = pot fi descrise printr-o
funcţie matematică; unei anumite valori a
variabilei-cauză "x" îi corespunde o singură
valoare a variabilei-efect "y"; întotdeauna
când se produce fenomenul cauză, se produce
acelaşi efect
yi = f(x1, x2, ......, xn)

Stohastice = care sunt definite prin faptul că


unei valori a variabilei-cauză "x" îi corespunde
o distribuţie de valori ale variabilei-efect "y"
deoarece asupra lui "y" îşi exercită influenţa şi
alţi factori, cu excepţia lui "x"; legile
determinate în cazul acestor legături se pot
verifica numai la nivelul ansamblului, ca
tendinţă.
Legăturile statistice

Unifactoriale = variabila rezultativă


"y" depinde de o singură variabilă
factorială ► variabila factorială "x" este
considerată ca fiind singurul factor
esenţial, important

Multifactoriale = variabila rezultativă


"y" depinde de o serie de variabile
factoriale considerate esenţiale,
importante: "x", „z", ....., „q".
Legăturile statistice – după tipul variabilelor

După tipul variabilelor – corelații / asocieri

După direcția legăturii – directe / inverse

După momentul modificării – sincrone / asincrone

După forma legăturii – liniare/ neliniare


Legăturile statistice se pot studia folosind
- metode elementare
- metode analitice
2. METODELE
ELEMENTARE
Metoda seriilor paralele = înscrierea în paralel a şirurilor
de variante corespunzătoare variabilelor factorială şi
rezultativă, cea factorială fiind trecută în ordine
crescătoare sau descrescătoare.

Procedeul presupune compararea vizuală a celor două


şiruri.

Ex Profit 100 70 90 85 60 55
Producţie 25 14 22 20 11 10

se observă că atunci când creşte volumul producţiei, creşte


şi profitul, deci există o legătură directă între cele două
variabile.
Metoda grupărilor = gruparea unităţilor din
colectivitate în funcţie de variabila
factorială, iar apoi calcularea, pentru
variabila rezultativă, a mărimilor relative şi
medii la nivelul fiecărei grupe.

Prin compararea variaţiei celor două


variabile, se pot aprecia existenţa, direcţia şi
intensitatea legăturii.
Tabelul de corelaţie = tabel cu dublă intrare.

În capetele coloanelor se înscriu grupele formate în


funcţie de factorul "x", în ordine crescătoare, iar în
capetele rândurilor se înscriu grupele formate în
funcţie de variabila rezultativă "y", în ordine
crescătoare.

În căsuţele tabelului se înscriu frecvenţele


corespunzătoare grupelor.
grupe x grupa 1 grupa 2 grupa n
grupe y după x după x ……….. după x
grupa 1
după y
grupa 2
după y

………
grupa m
după y
Graficul de corelaţie (corelograma) = pe axa
abscisă se înscriu valorile individuale sau grupele
după variabila factorială "x", iar pe axa ordonată
valorile individuale sau grupele după variabila
rezultativă "y„.

Valorile lui "x" sunt în ordine crescătoare spre


dreapta, iar ale lui "y" în ordine crescătoare în
sus.

În originea sistemului de axe nu se află valoarea


zero, ci valorile cele mai mici din serie, deci
minime, ale lui "x" şi "y".
12
*
9 ****
*** ****
6 ****
*** ** **
3 ****
***
1 **
0 10 20 30 40
3. REGRESIA
STATISTICĂ
UNIFACTORIALĂ
Dacă variabilele evoluează
aproximativ în progresie aritmetică, se
foloseşte o relaţie de tip liniar. Forma
funcţiei de regresie este:

yteoretic = a + bx + 
Metoda cel mai des utilizată pentru
determinarea lui "a" şi "b" este
"metoda celor mai mici pătrate".
n


i 1
(y i real - y i teoretic)2 = min

i 1
(y i real - a - b x i real)2 = min
n
Derivata în funcţie de "a": 2 *  (y i real - a - b x i real) * 1 = 0,
i 1
n n
deci: 2 (  y i real - na - b  x i real) = 0,
i 1 i 1
n n
adică: 
i 1
y i real - na - b  i 1
x i real = 0,
ceea ce conduce la:
n n
n a + b 
i 1
xi real = i 1
yi real .
n
Derivata în funcţie de "b": 2 *  (y i real - a - b x i real) * (x i real ) = 0,
i 1
n
deci: 2 *  ( x i real y i real - a x i real - b x i 2real) = 0,
i 1
n n n
de unde: i 1
x i real y i real - a 
i 1
x i real - b 
i 1
x i 2real = 0,

ceea ce este echivalent cu relaţia:


n n n
a 
i 1
xi real + b 
i 1
xi real2 =  i 1
xi real yi real
Cele două ecuaţii obţinute prin egalarea derivatelor cu zero, formează "sistemul de ecuaţii
normale", pe baza căruia se pot calcula necunoscutele, care sunt valorile concrete ale parametrilor
"a" şi "b":
n n
n a + b 
i 1
xi real = 
i 1
yi real
n n n
a 
i 1
xi real + b i 1
xi real2 =  i 1
xi real yi real
Dacă variabilele evoluează neliniar, cel
mai des se folosește funcția parabolică.
Forma funcţiei de regresie este:

yteoretic = a + b x + c x2 + 
n n n
n a+b 
i 1
xi real + c i 1
2
xi real = 
i 1
yi real
n n n n
a 
i 1
xi real + b 
i 1
2
xi real + c 
i 1
xi real3 = 
i 1
xi real yi real
n n n n
a 
i 1
xi real2 + b 
i 1
xi real3 + c 
i 1
xi real4 = 
i 1
xi real2 yi real
Dacă factorul x crește în progresie
geometrică se folosește funcția
exponențială. Forma funcţiei de
regresie este:

yteoretic = a bx + 

lg y = lg a + x lg b.
 
n n
n lg a + (lg b)  xi real =  lg yi real
i 1 i 1
n n n
(lg a)  xi real + (lg b)  xi real2 =  xi real lg yi real
i 1 i 1 i 1
Legătura logaritmică folosește
funcția logaritmică. Forma funcţiei de
regresie este:

yteoretic = a + b log x + 

 
n n
n a + b  lg xi real =  yi real
i 1 i 1
n n n
a  lg xi real + b  (lg xi real)2 =  (yi real lg xi real)
i 1 i 1 i 1
Legătura hiperbolică folosește
funcția hiperbolică. Forma funcţiei de
regresie este:

1
y=a+ b+
x
 
n n
1
na+b  =  yi real
i 1 xi real i 1
n n n
1 1 1
a +b  2 =  yi real
i 1 xi real i 1 x i real i 1 xi real
Unităţi (i) y i real y ajustat Abaterile Pătratele
(yi teoretic) yi real - yi abaterilor
teoretic

Se calculează suma pătratelor


abaterilor pentru fiecare formă de
funcție și se alege cea pentru care suma
este cea mai mică.

S-ar putea să vă placă și