Documente Academic
Documente Profesional
Documente Cultură
Curs 9 Statistica
Curs 9 Statistica
Cuprins:
1
2. Tipuri de legături statistice
Legăturile ce se pot forma sunt legături stohastice, în care un fenomen este factor de
influenta, iar celălalt este efect. Statistica, printr-o gamă largă de procedee şi metode
specifice, poate studia manifestarea concretă a acestor legături, le poate exprima cantitativ şi
măsura intensitatea cu care se produc. Legătura (dependenţa) statistică se caracterizează prin
faptul că, la modificarea unui factor de influenţă, factorul influenţat răspunde cu o distribuţie
de valori.
Legăturile statistice se pot clasifica astfel:
1) După natura relaţiei de cauzalitate distingem:
a) legături funcţionale. Acestea se manifestă între două fenomene în care unul este cauza iar
celălalt efectul. Se întâlnesc în natură, tehnică etc. Dacă se notează fenomenul cauză cu “x” şi
fenomenul efect cu “y” atunci relaţia matematică este: y = f(x)
b) legături statistice (stohastice) apar atunci când fenomenul efect este rezultatul combinării
influenţei mai multor cauze, care pot acţiona în condiţii egale sau diferite. Relaţia matematică
este: y = f(x1,x2,………..,xn), unde: x1, x2, ..., xn – sunt valorile fenomenelor cauză care au
fost înregistrate; y = valorile fenomenului efect.
☺ Exemplu
O legatura stohastica este legătura dintre capacitatea de cazare (xi) şi valoarea încasărilor din
activitatea hotelieră (yi). Între cele două caracteristici există o legătură statistică pentru că
asupra încasărilor acţionează şi alte cauze: tarifele practicate, gradul de confort etc.
☺ Exemplu
Un exemplu de legătura simpla este cea dintre suprafaţa comercială şi valoarea vânzărilor.
2
yn) de o variabilă factorială (xi). Ecuaţiile de estimare sunt: y = f(x1, x2, x3,...,xn) şi y1, y2,...,
yi,...yn = f(xi).
☺ Exemplu
Un exemplu de legătura multiplă este cea dintre valoarea încasărilor ce depinde de zona de
amplasare (x1), de categoria de confort (x2), de baza materială (x3) etc.
☺ Exemplu
O astfel de legatura este legătura dintre dinamica desfacerilor de mărfuri şi dinamica
câştigului mediu salarial.
3
3. Metode simple de stabilire a existenţei şi a formei de legătură dintre
fenomenele şi procesele economico-sociale
Pentru a caracteriza legătura dintre fenomene, se pot folosi mai multe procedee ce se
încadrează în categoria metodelor simple de caracterizare a legăturilor. Aceste metode sunt
uşor de aplicat şi se bazează pe analiza calitativă a variabilelor corelate, oferind informaţii
asupra naturii şi trăsăturilor esenţiale ale legăturii cercetate.
Metodele simple de caracterizare a legaturilor stohastice sunt urmatoarele:
1) Metoda seriilor paralele interdependente are la bază serii paralele de date, obţinute prin
operaţia de centralizare la nivelul unităţilor simple sau complexe, fără a fi grupate. Se pot
folosi serii: de timp, de spaţiu şi atributive. Această metodă ne oferă posibilitatea de a stabili
existenţa legăturii şi direcţia de realizare a acesteia, prin analiza valorilor perechii x, y.
Această metodă este mai puţin sugestivă în cazul seriilor formate dintr-un număr foarte mare
de termeni şi implică într-o măsură importantă subiectivismul cercetătorului.
2) Metoda grupărilor este o metodă de sistematizare a datelor pe baza căreia se pot cerceta
legăturile (conexiunile) statistice. Se poate folosi gruparea simplă sau gruparea combinată.
☺ Exemplu
Despre 22 de salariaţi ce activează în ramura comerţului se cunosc datele:
4
3) Metoda tabelului de corelaţie presupune utilizarea unui tabel combinat cu dublă
intrare care ne sugerează existenţa legăturii, direcţia de realizare a ei şi unele aprecieri
empirice privind intensitatea legăturii prin analiza modului în care frecvenţele comune (nij) se
distribuie în rubricile interioare ale tabelului. Dacă frecvenţele nij tind a se concentra către
cele două diagonale trasate în tabelul următor, legătura între xi şi yj va fi intensă. În schimb,
dacă se împrăştie la întâmplare în reţeaua tabelului, legătura este slabă sau poate lipsi. În
concluzie, procedeul tabelului de corelaţie este o combinare a metodei grupării cu
principiile de construire şi interpretare a unei reprezentări grafice.
Metodele analitice iau în consideraţie valorile reale ale varibilelor corelate şi parametrii
corespunzători acestora. Acestea poartă denumirea de metode parametrice şi sunt:
5
1) metoda regresiei;
2) metoda covarianţei;
3) metoda raportului de corelaţie;
4) metoda coeficientului de corelaţie;
5) metoda analizei dispersionale.
1) Metoda regresiei reprezintă o metodă statistică de analiză a legăturii dintre variabile cu ajutorul
unor funcţii, numite funcţii de regresie. Funcţia de regresie se alege printr-o modalitate empirică
folosind graficul de corelaţie (corelograma) si prin aplicarea testelor de semnificaţie (de exemplu:
testul “F” de analiză dispersională). În funcţie de numărul de variabile incluse în model,
distingem: regresie unifactorială (o varibilă factorială xi şi o variabilă rezultativă yi) şi
regresie multifactorială (mai multe variabile factoriale şi o singură variabilă rezultativă).
a) Regresia unifactorială liniară are la bază ecuaţia dreptei (funcţia de gradul întâi):
y xi a bx i
6
a legăturii avem: f ( y i a bx i ) 2 = minim. In functia de mai sus condiţia de minim a unei
funcţii de două derivabile se anulează când derivatele parţiale, în raport cu cei doi parametri
df df
(a, b), sunt: 2 ( y i a bx i )(1) 0 si 2 ( y i a bx i )( x i ) 0
da db
na b x i y i
; i = 1, n . Rezolvand sistemul se calculeaza termenul liber, a, si panta
a x i b x i2 x i y i
yi xi
dreptei, b, dupa metoda determinantilor, astfel: a x i y i x i2 y i x i2 x i x i y i ;i= 1, n
a
n xi n x i2 ( x i ) 2
xi x i2
n yi
b x i x i yi n x i yi x i yi ; i = 1, n
b
n xi n x i2 ( x i ) 2
xi x i yi
Interpretarea pantei: daca b > 0 legătura de corelaţie este directă (pe măsură ce
cresc valorile lui xi cresc şi valorile ecuaţiei de regresie calculate); daca b < 0 legătura de
corelaţie este inversă (pe măsură ce creşte valoarea caracteristicii factoriale (xi) scade valoarea
caracteristicii rezultative (yi) si daca b = 0 cele două variabile sunt independente şi yxi = 0.
Funcţia de regresie exprimă statistic modul în care caracteristica rezultativă (yi) se modifică,
dacă ar influenţa numai caracteristica factorială (xi), iar ceilalţi factori sunt consideraţi cu
acţiune constantă.
a) y b) y
tgα x tgα x
a < 0 şi b > 0 legătură directă a > 0 şi b < 0 legătură inversă
figura 1.1 figura 1.2
c) y d) y
7
Fig. 1 Interpretarea geometrică a parametrilor
n i x i yi n i x i n i yi n i
b
n i x i2 n i ( x i n i ) 2
Pentru cazul (2) (grupare combinată) rezultatele se prezintă într-un tabel combinat cu
dublă intrare, iar sistemul de ecuaţii se determină prin analogie cu cel de la cazul (1):
K m K m
a n ij b x n
i i y jn j
i j i j
K K K m
a x i n i b x i2 n i x i y j n ij
i i i j
directă), minus (legătura indirectă), iar covarianţa nulă ne indică lipsa legăturii de corelaţie
(variabilele sunt independente). Covarianţa are ca neajuns faptul că depinde de unităţile în
care se măsoară variabilele aleatoare.
3) Metoda raportului de corelatie
8
Pentru stabilirea intensităţii legăturii dintre două varibile (xi, yi) se calculează un
indicator sintetic de corelaţie numit “raport de corelaţie” simbolizat cu Rx/y. Acesta permite
măsurarea gradului de intensitate a realizării legăturii dintre caracteristica considerată factor
de influenţă (xi) şi caracteristica rezultativă (yi), indiferent de forma legăturii: liniară sau
neliniară. Calculul se bazează pe descompunerea variaţiei totale (dispersiei) a caracteristicii
rezultative “y” astfel:
(yi y 0 ) = ( y i y xi ) + ( y xi y 0 )
abaterea întâmplătoare abaterea sistematică
Prin însumare şi ridicare la pătrat se obţine:
( y i y 0 ) 2 [( y i y x i ) ( y x i y 0 )] 2
(y y i xi )2 2 ( yi yxi )( yxi y 0 ) ( y xi y 0 )2
0
(y i y0 )2 ( y i y xi ) 2 ( y xi y 0 ) 2
(yi y0 )2
( y i y xi ) 2
( y xi y 0 ) 2
n n n
2y = 2y + 2y
r x
Dispersia totală: arată
influenţa tuturor factorilor Dispersia reziduală: arată Dispersia sistematică:
esenţiali şi întâmplători acea parte din variaţia arată influenţa factorului
care determină variabilei rezultative “yi” “xi” asupra variaţiei
variaţia totală a variabilei datorată acţiunii factorilor caracteristicii
rezultative “yi” întâmplători rezultative “yi”
2y / x 2y / r
nedeterminaţie ( K 2y / x ): R 2y / x 100 si K 2y / r 100 . Raportul de corelaţie se
2y 2y
( y i y xi ) 2
R y / x R 2y / x
2y / x
2y 2y / r
1
2y / r
1
n
1
( yi y xi ) 2
; i = 1, n
(1)
2y 2y
2y (yi y 0 ) 2
( yi y0 ) 2
(2) n (3)
9
Formula de calcul simplificat a raportului de corelaţie se determină astfel:
R y/x 1
y i2 a y i b x i y i ; i = 1, n . Raportul de corelaţie ia valori în intervalul [0,1]
2
( y i )
y i2
n
(y i y xi ) 2 n i
R y/x 1 ; i = 1, n
( y i y) 2 n i
y i2 n i a y i n i b x i y i n i
1 ; i = 1, r
( y i n i ) 2
yi n i
2
ni
b) se dau valorile lui xi, frecvenţele după variabila xi (ni), frecvenţele după variabila
yj (nj) şi frecvenţa comună nij:
( y j y x i ) 2 n ij
R y/x 1
(y j y 0 ) 2 n j
y 2j n j a y j n j b x i y j n ij
= 1 ; j = 1, m ; i = 1, K
( y j n j ) 2
y 2j n j
nj
10
xi x
Zx
x
yi y
Zy
y
( y i y) 2 n x i yi x i yi
y se obţine relaţia: ry/x = ; i = 1, n (2)
n [n x i2 ( x i ) 2 ][n y i2 ( y i ) 2 ]
cov( x i , y i )
Folosind covarianţa: ry/x =
x i yi
Interpretare:
1) ry/x [-1,1] apreciem din punct de vedere al semnului direcţia legăturii şi din
punct de vedere al mărimii intensitatea legăturii.
Dacă: ry/x = 0 legătura lipseşte şi variabilele xi şi yi sunt independente;
ry/x 0 legătura dintre cele două varibile este slabă;
ry/x = 1 legătură de tip funcţional (fie directă dacă semnul coeficientului este
pozitiv, fie inversă dacă semnul coeficientului este negativ);
ry/x 1 variabilele sunt puternic corelate, legătura fiind intensă.
2) ry/x = Ry/x se apreciează că legătura de corelaţie este de forma liniară, ceea ce
înseamnă că se poate folosi fie coeficientul, fie raportul de corelaţie.
3) Valoarea coeficientului de corelaţie depinde de forma liniei de regresie, motiv pentru
care acest indicator este semnificativ pentru corelaţiile de tip liniar şi mai puţin semnificativ
pentru corelaţiile de tip neliniar (în cazul din urmă folosindu-se raportul de corelaţie).
4) În cazul legăturii liniare se mai poate calcula ca o medie geometrică a coeficienţilor
de regresie (b) astfel:
ry / x b y / x b x / y
11
n x i yi x i yi
by/x
n x i2 ( x i ) 2
unde: ; i = 1, n
n x i yi x i yi
bx / y
n y i2 ( y i ) 2
(x i x )( y i y)n i
ry / x ; i = 1, n
nix y
xini yi n i (x i x) 2 n i ( y i y) 2 n i
unde: x ;y ;x ;y ; i = 1, n
ni ni ni ni
Înlocuind în formula (1) a lui ry/x se obţine:
ry / x
n x y n x n y n
i i i i i i i i
; i = 1, n
[ n x n ( x n ) ][ n y n ( y n ) ]
i
2
i i i i
2
i
2
i i i i
2
c) se cunosc valorile lui xi, yj, ni, nj, nij, obţinute prin gruparea combinată, rezultatul
fiind prezentat într-un tabel combinat cu dublă intrare şi atunci relaţia de calcul devine:
n x y n x n y n
ij i j ij i i j j i 1, n
ry / x
i j ;
n x n x n ) ][ n y n y n ) j 1, m
2
[ i
2
i i ( i i
2
j
2
j j ( j j ]
12
analiza regresiei. Analiza dispersională se poate utiliza în următoarele situaţii: înainte de
aplicarea metodei corelaţiei, caz în care se poate verifica gradul de semnificaţie a factorului
considerat principal pentru producerea variaţiei caracteristicii rezultative si după utilizarea
metodei regresiei şi corelaţiei, caz în care se poate verifica corectitudinea funcţiei matematice
cu ajutorul căreia s-au estimat valorile caracteristicii rezultative în raport cu variaţia
caracteristicii factoriale.
Pentru prezentarea modelului analizei dispersionale prin care se testează forma de
legătură, pornim de la variaţia totală a varibilei (Y) care se descompune în următoarele trei
elemente: (yj - y 0 ) = (yj - y i ) + ( y i - yxi) + (yxi - y 0 ),
dispersiile medii corelate ale variabilei Y, respectiv dispersia totală S2y, dispersia în postura
de estimaţii ale dispersiei totale, adică: Pentru măsurarea dependenţei legăturii între variabila
endogenă şi factorii de regresia se calculează raportul de determinare (R2).
SSR SSE
R2 1
SST SST
Calculele necesare determinării lui R2 sunt realizate din cadrul unei analize dispersionale
(ANOVA).
Tabel ANOVA pot fi folosite pentru modelul de regresie
Sursa variabilei Suma pătratelor Grade de libertate Media sumei pătratelor
Regresia reziduală SSR K-1 MSSR=SSR/K-1
SSE T-K MSSE=SSE/T-K
TOTAL SST T-1
13
MSSR
F
MSSE
F urmează o distribuţie Fisher cu K-1 şi T-K grade de libertate. Pentru un prag de semnificaţie
α se stabileşte valoarea teoretică Fα;K-1;T-K
Dacă:
F cal < Fα;K-1;T-K – influenţa regresiei diferă semnificativ de cea a factorilor reziduali;
deci modelul este valid.
F cal > Fα;K-1;T-K – modelul este invalid.
De asemenea dacă:
•F calc >F teoretic atunci apreciem că legătura dintre X, Y este semnificativă şi se pot
aplica în continuare şi alte metode de calcul statistic pentru a cuantifica legătura dintre
X şi Y.
• F calc < F teoretic legătura nu este semnificativă, variabilele sunt necorelate.
☺ Exemplu
În vederea estimării cheltuielilor lunare pentru alimentaţia publică,
s-a efectuat o cercetare prin sondaj, pe baza unui eşantion de 15%, selectat întâmplător şi
nerepetat din numărul total de persoane. Persoanele chestionate au fost împărţite în cinci
grupe tipice, după veniturile medii lunare nete. În urma înregistrării şi prelucrării datelor, s-au
obţinut rezultatele:
14
2. Să se măsoare intensitatea legăturii dintre veniturile lunare şi cheltuielile medii pentru
alimentaţie publică pentru persoanele din eşantion, folosind un indicator de corelaţie adecvat.
Rezolvare:
Calculam media generala si dispersiile din fiecare grupa aplicand regula de adunare a
dispersiilor:
yi n i 8 150 7 150 11 300 15 180 18 120
y 11,2 11 zecimiiUM
ni 11,8
2 14,06
R 2 100
2
100 72%
0 19,4
2
y y n 8 11 150 7 11 225 11 11
i
2
i
2 2
300
n i 975
15 112 180 18 112 120 14,06
975
Dacă R 2 72% , adică k 2 28% . Pentru ca R2 k 2 ; 72% 28% veniturile lunare
constituie factor semnificativ pentru cheltuielile cu alimentaţia publică. Pentru certitudine, se
va folosi testul „F” de analiză dispersională.
y n
2
S y2 / x 2y / x 2y / z y ni 2
b) Fcalc : i
: i i
S y2 / z nx nz r 1 n r
i
13708,5 5206,5
: 638 , Deoarece Fcalc Fteoretic ; 638 4,62 , veniturile lunare
4 970
influenţează semnificativ cheltuielile pentru alimentaţia publică.
15
5. Metode neparametrice de măsurare a legaturilor dintre fenomenele
economico-sociale
Aceste metode, pe lângă faptul că pot stabili intensitatea legăturii făcând abstracţie de
tipul de distribuţie, permit măsurarea intensităţii legăturii nu numai pentru caracteristicile
cantitative, dar şi pentru cele calitative. Poartă denumirea de metode neparametrice deoarece
nu iau în calcul întotdeauna valorile variabilelor corelate şi nici parametrii lor corespunzatori.
În concluzie, se folosesc în următoarele situaţii: când distribuţia variabilelor corelate nu e
normală sau asimptotic normală; când nu este cunoscută forma de distribuţie a variabilelor;
când variabilele corelate sunt asimetrice, deci prezintă asimetrie pronunţată sicând avem de-a
face cu variabile calitative şi cantitative care în prealabil necesită o anumită cuantificare.
Metodele neparametrice uzuale sunt:
1) Coeficientul de asociere a lui Yule presupune întocmirea tabelului de asociere, care
este un tabel combinat cu dublă intrare utilizat pentru variabilele de tip alternativ (DA/NU;
F/M; etc.). Tabelulul de asociere este format din două rânduri şi două coloane:
n11 n12
n21 n22
în care în capătul rândurilor se trec valorile celor două caracteristici asociate, iar în interiorul
tabelulului se trec frecvenţele corespunzătoare lor.
Exemplu: Dacă avem în vedere două variabile statistice “xi” şi “yi” şi considerăm că
sunt variabile de tip alternativ, atunci asocierea dintre “xi” şi “yi” se prezintă astfel:
yi
DA NU Total
xi
DA n11 n12 n11 + n12
NU n21 n22 n21 + n22
(în interiorul tabelului se consemnează concomitent răspunsurile privind cele două variabile
corelate “xi” şi “yi”). Pentru stabilirea valorii numerice a coeficientului de asociere care să
indice existenţa şi intensitatea legăturii, se calculează coeficientul lui Yule conform relaţiei:
n 11 n 22 n 21 n 12
Q ; unde Q [-1,1]
n 11 n 22 n 21 n 12
16
Q = ±1 asociere perfectă între xi şi yi
Produsul n11 · n22 = arată gradul de realizare a legăturii între caracteristicile corelate “x i” şi
“yi” si produsul n12 · n21 = arată lipsa legăturii dintre cele două variabile. Avantajul
utilizării: se poate calcula cu multă rapiditate, utilizându-se şi în cazul când datele provin de la
unităţi statistice complexe.
2) Coeficienţii de corelaţie a rangurilor
Coeficienţii de corelaţie se calculează înlocuind valorile individuale ale variabilelor cu
numărul lor de ordine numit RANG. Rangurile se atribuie după ce în prealabil s-au ordonat
datele individuale ale celor două variabile în ordine crescătoare, astfel încât va trebui să
vedem dacă există concordanţă între rangurile caracteristicii factoriale de la 1 n şi rangurile
caracteristicii rezultative de la 1 n. Avantajul utilizării acestora:
1) pot fi utilizaţi cu succes şi în cazul unor distribuţii asimetrice;
2) pot fi utilizaţi pentru un număr restrâns de unităţi pentru care nu se poate verifica
reprezentativitatea datelor parţiale.
a) Coeficientul de corelaţie a rangurilor Spearman este o aplicaţie a coeficientului de
corelaţie liniară simplă la distribuţiile celor două şiruri de ranguri. [3]
Acesta se calculează parcurgând următoarele etape:
1) se identifică cele două variabile corelate xi şi yi;
2) se acordă ranguri de regulă crescătoare în aceeaşi manieră atât pentru variabila “xi” cât şi
pentru variabila “yi”;
Rangurile sunt numere de ordine care evoluează în progresie aritmetică cu raţia egală cu 1.
3) se determină diferenţa dintre ranguri (di) şi se ridică la pătrat;
17
1) se identifică variabilele corelate “xi” şi “yi”;
2) se ordonează crescător variabila “xi” şi, în corespondenţă cu aceasta, se trec valorile
corespunzatoare variabilei “yi”;
3) se acordă ranguri crescătoare în aceeaşi manieră ca şi la coeficientul Spearman;
4) se determină concordanţa notată cu P şi discordanţa notată cu Q;
5) se calculează scorul sau diferenţa (S = P – Q);
2S
6) se aplică formula de calcul: rk unde: ∑S = ∑P – ∑Q [-1, 1]
n (n 1)
Concordanţa (P) este mereu pozitivă şi reprezintă numărul de ranguri superioare fiecarui
rang considerat al variabilei yi. Discordanţa (Q) este mereu negativă şi reprezintă numărul de
ranguri inferioare fiecărui rang considerat al variabilei yi. Coeficientul rangurilor calculat
după formula lui Kendall este de obicei mai mic decât cel calculat după formula lui
Spearman, având aceeaşi interpretare.
☺ Exemplu
Pentru exemplificare, presupunem că notele înregistrate la examenul de bacalaureat şi media
înregistrată la examenul de admitere la Colegiu Comerţ pentru 10 candidaţi se caracterizează
prin datele:
Media Ranguri
Media 2
admisă di P Q S
bacalaureat (xi)
(yi) Rx i ( ) Ry i ( )
7,00 6,90 1 4 9 6 3 3
7,07 6,50 2 2 0 7 1 6
7,75 6,00 3 1 4 7 0 7
7,80 7,20 4 6 4 4 2 2
7,90 7,10 5 5 0 4 1 3
8,00 6,80 6 3 9 4 0 4
8,15 7,25 7 7 0 3 0 3
8,65 7,30 8 8 0 2 0 2
9,25 7,80 9 10 1 0 0 -1
9,80 7,60 10 9 1 0 0 0
28 37 7 29
Pentru a caracteriza legătura dintre media la bacalaureat şi media la admitere folosind metode
neparametrice, vom determina cei trei coeficienţi prezentaţi anterior. (Yule, Spearmen,
Kendall). Pentru coeficientul de asociere Yule, se întocmeşte tabelul de asociere, stabilind
18
yi
Sub y Peste y Total
xi
n 11n 22 n 21n 12 4 4 0 2 16
Q1 1 [-1,1]
n 11n 22 n 21n 12 4 4 0 2 16
6. Testul de autoevaluare 1
1. Un număr de 150 de studenţi din două centre universitare participă la un examen de burse
în străinătate. Cei 100 de studenţi din prima universitate obţin un punctaj mediu de 88 puncte,
cu un coeficient de variaţie de 8%, iar cei din a doua universitate obţin un punctaj mediu de
96 puncte, cu o abatere standard de 0,65 puncte. În ce măsură factorul de grupare centrul
universitar contribuie la variaţia punctajelor obţinute de studenţi? În ce măsură diferă
semnificativ punctajul de la un centru universitar la altul?
3. Din datele furnizate de Ancheta Integrată în Gospodării se cunosc următoarele date pentru
zece familii.
Venituri lunare ce revin în medie pe o Cheltuieli pentru achiziţionarea
Familia
perioadă pe familie (zeci mii u.m) produsului „x” (zeci mii u.m)
1 7,2 3,2
2 9,9 3,8
19
3 8,5 4,0
4 11,8 5,5
5 19,2 6,2
6 10,9 4,1
7 13,4 5,4
8 12,5 5,9
9 11,5 6,0
10 16,1 6,3
Se cere: Să se caracterizeze şi să se măsoare legătura dintre venituri şi cheltuieli
folosind:
a) graficul de corelaţie;
b) metoda regresiei;
c) metoda raportului de corelaţie;
d) metoda coeficientului de corelaţie;
1. Rezolvare:
Se cunosc următoarele elemente pentru determinarea coeficientului de determinare
R : n
2
1 100 y1 88 1 8%
n2 50 y 2 96 2 0,65
• Coeficientul de determinare R 2 :
2 14,22
R2 100 100 30% unde
0
2
47,40
• Dispersia dintre grupe 2 :
y
m
2
y 0 ni
2 i 1
i
88 90,66 100 96 90,66 50
2 2
14,22
m
n
150
i
i 1
y i ni
88 100 96,50
y0 i 1
m
90,67 puncte
n
150
i
i 1
2
i
2
ni
0,4225 50 49,56 100 4977,125
i
i 1
m
33,18
n
150 150
i
i 1
20
1 1
Deoarece 1 8% 0,08 , 1 0,08 1 88 0,08 7,04
y1 88
y
m
2
y 0 ni
2 i 1
i
20 23,62 107 26 23,62 15 129,6 86,4 8,64
m 25
n
25
i
i 1
i
2
ni
12 10 22 15 120 330
dispersiilor de grupă: 2 i 1
18
i m
n
25 25
i
i 1
1. (a) Corelaţia dintre veniturile lunare (medii) pe o persoană din familie şi cheltuielile pentru
achiziţionarea produsului „z”
21
Y
7,2
x x
6,2 x x
x x
5,2
Yxi a bxi
4,2 x
x
3,2
a x b x x y
2
i i i i
a 1,79885 1,8 zeci mii u.m. Deci funcţia de regresie este Yxi 1,8 0,268 xi
b 0,26786 0,268 zeci mii u.m.
y Y
2
c) 3,59
Ry / x 1 1 0,83
i xi
y y
2
i
11,824
sau
Ry / x 1
y 2
i a yi b xi yi
1
265,84 1,8 50,4 0,268 639,83
0,83
y 2
265,84
50,4 2
y 2
i
n
i
10
22
continuare tabelul
Nr. crt. xi2 yi2 Yxi 1,8 0,268 xi y Y
i xi
2
0 6 7 8 9
1 51,84 10,24 3,7 0,25
2 98,01 14,44 4,5 0,49
3 72,25 16,00 4,1 0,01
4 139,24 30,25 5,0 0,25
5 368,64 38,44 6,9 0,49
6 118,81 16,81 4,7 0,36
7 179,56 29,16 5,4 0
8 156,25 34,81 5,2 0,49
9 156,25 36,0 4,9 1,21
10 259,21 39,69 6,1 0,04
1576,06 265,84 50,5 3,59
Total
x y Y y Yxi
2 2 2
i i xi i
8. Teme de control
1. Identificaţi funcţia de regresie liniară ce modelează legătura dintre două variabile utilizând
metoda celor mai mici pătrate. Scrieţi funcţia de regresie. Calculaţi şi comentaţi interpretarea
coeficienţilor funcţiei de regresie
23
Numar membrii 4 3 2 5 6 4 3
Venit pe membru al 350 260 180 380 420 300 220
gospodariei <RON>
Calculaţi şi comentaţi coeficienţii funcţiei de regresie, reprezentaţi grafic legătura dintre cele
două variabile prin graficul de împrăştiere.
4. Despre un eşantion stratificat de angajaţi de 5%, selectat întâmplător, nerepetat din totalul
angajaţilor unei societăţi comerciale se cunosc datele:
Vechime Numărul Vânzări medii zilnice Număr de angajaţi care se plasează
(ani) angajaţilor (mii RON) peste media vânzărilor zilnice
sub 10 90 500 30
10-20 150 640 80
20-30 100 980 50
peste 30 60 … 25
TOTAL 400 - 185
Ştiind că pentru grupa de angajaţi cu peste 30 de ani vechime, vânzările maxime au
fost de 1.100 mii RON, abaterea maximă pozitivă a vânzărilor faţă de media vânzărilor
acestei grupe a fost de 250 mii RON iar, pe total, valoarea modală a vânzărilor eşantionului a
fost de 800 mii RON, cu un coeficient de asimetrie (Cas = -0,35), se cere:
24
asociere al lui Yule, metoda coeficientului de corelaţie a rangurilor Spearman şi metoda coeficientului
de corelaţie a rangurilor Kendall).
1. Cristache, S.E., Şerban, D., Lucrări aplicative de Statistică şi Econometrie, Ed. ASE,
Bucureşti, 2007, 433 pg. (191 - 416) ISBN 978 - 973 – 594 – 986 – 2;
2. Isaic Maniu, Al., Voineagu, V., Mitruţ, C., Baron, T., Ţiţan, E., Matache S., Şerban D.,
Voineagu, M., Statistică teoretică. Studii de caz şi aplicaţii, Ed. Economică, 255 pg. (189 -
219), Bucureşti, 1998, ISBN 973-590-086-6;
3. Isaic Maniu, Al., Mitruţ, C., Voineagu, V., Statistica Pentru afaceri, ed. Economică,
Bucuresti 2003.
25