Documente Academic
Documente Profesional
Documente Cultură
4
1
4
1
4
1
dar
D C A D C A
P P P P = =
8
1
0
Analog se poate demonstra c dac moneda este
aruncat de trei ori evenimentele A={SSS, SSB, SBS, SBB };
C={SSS, SSB, SBS, BSS}; D={SSS, BSB, BBS, BBB} sunt
independente trei cte trei dar nu sunt independente dou cte
dou.
14
Conchidem c, evenimentele care se produc (S sau B)
sunt independente, rezultatul ateptat nu depinde de
evenimentul anterior.
Considerm acum experiena ce const n aruncarea
unui zar. n acest caz, mulimea evenimentelor posibile este
={1, 2, 3, 4, 5, 6 }
n mulimea P() putem distinge:
i) Evenimentul imposibil ; de exemplu la aruncarea
zarului s apar faa cu numrul 16.
ii) Evenimentul sigur .
IV) A={1, 3, 5}, la aruncarea zarului s apar una din
feele cu numr impar.
Spre exemplu evenimentul contrar evenimentului E este
evenimentul ={2, 4, 6}.
Considerm ultimul experiment, ce const n extragerea
bilelor.
Presupunem c urna U
i
conine a
i
bile albe i b
i
bile
negre, i=1,2. Din fiecare urn extragem la ntmplare cte o
bil. S se calculeze probabilitatea ca bila extras s fie alb.
Soluie. Observm c numrul cazurilor egal posibile
este (a
1
+b
1
)(a
2
+b
2
) ntruct un eveniment elementar posibil este
o pereche (m,n), unde m este bila provenit din U
1
i n este bila
provenit din U
2
. Fie acum A evenimentul ca bilele extrase s
15
fie albe. Numrul cazurilor favorabile producerii lui A este a
1
a
2
ntruct eveniment elementar favorabil lui A este o pereche
(m,n) format cu o bil alb din U
1
i o bil alb din U
2
.
Deci :
) ( ) (
2 2 1 1
2 1
b a b a
a a
P
A
+ +
=
Astfel de exemple ne sugereaz c probabilitatea
teoretic , legea statistic se apropie de realitatea empiric
n cazul producerii n numr mare a evenimentelor respective
(legea numerelor mari). Cu alte cuvinte nu putem formula
concluzii dac numrul evenimentelor observate nu este
suficient de mare.
2. Repartiia normal a evenimentelor
ntmpltoare.
Revenind la exemplul aruncarea monedei, observm
c producerea n serie B este posibil, dar cu att mai puin
probabil cu ct numrul succesiv de apariii este mai mare, cu
alte cuvinte nu putem formula concluzii dac numrul
evenimentelor observate nu este suficient de mare.
Astfel, producerea n serie a evenimentelor B, B, B, B,
B, B, B, B, B, B are ansa de a se realiza de
1024
1
2
1
10
=
|
\
|
16
Dac nregistram fiecare eveniment din cele 1024 de
ncercri s-ar fi obinut urmtoarea distribuie probabil a
evenimentelor:
o dat 10 B i 10 S;
de 10 ori 9B/1S i 1B/9S;
de 45 de ori 8B/2S i 2B/8S;
de 120 de ori 7B/3S i 3B/7S;
de 210 ori 6B/4S i 4B/6S;
de 252 de ori 5B/5S;
observndu-se o distribuire simetric a evenimentelor cu
frecvena crescnd pn la 5B/5S.
Astfel, numrul mare de evenimente aleatoare, la un
numr mare de repetri pentru care se obine o repartiie
aproape constant a evenimentelor, compun repartiia normal.
Din experien, fiecare eveniment n sine este
determinat de ntmplare, marea sum a evenimentelor
aleatoare ns fiind repartizate invariabil, astfel c aciunea
simultan a multor evenimente aleatoare conduc la un rezultat
nonntmpltor obinndu-se un model teoretic al unor
evenimente determinate de o sum de elemente ntmpltoare
echiprobabile.
Din reprezentarea unor evenimente reale s-a constatat
c distribuia lor se aseamn cu cea normal, deci se justific
17
extinderea proprietilor distribuiei teoretice pentru
evenimentele reale distribuite analog.
3. Eantionarea
Eantionarea (selecia) este metoda prin care putem
deduce caracteristicile unei populaii ntregi, interognd doar o
parte din subieci, parte numit eantion.
Exist dou tipuri de eantioane:
aleatoare, care se realizeaz atunci cnd fiecare individ
din populaie are o ans diferit de zero de a fi ales n
eantion;
nealeatoare, este acea procedur invers celei
aleatoare.
Este de observat faptul c reprezentativitatea
eantionului se poate calcula numai n cazul eantioanelor
probabilistice.
Eantionarea simpl aleatoare. Subiecii componeni ai
eantionului sunt alei uniform i cu o probabilitate identic
pentru fiecare, fr a mai fi necesar o grupare a subiecilor sau
repetarea seleciei, care la rndul ei implic dou proceduri:
procedura loteriei sau a tragerii la sori, care const n
introducerea n urn a fiei fiecrui subiect, i
18
extragerea numrului necesar de fie realizrii
eantionului.
procedeul tabelului cu numere la ntmplare, caz n
care se alctuiete un tabel alfabetic care conine 5
coloane i 40 de rnduri (numerotate de la 1 la 5
respectiv de la 1 la 40) n care fiecare subiect al
populaiei este reprezentat printr-un numr de ordine.
Utilizarea acestui tabel const n extragerea din cadrul
populaiei a unitilor ale cror numere de ordine
stabilite printr-o numrtoarea prealabil, au fost citite
dup o anumit ordine din tabelul numerelor aleatoare.
Direcia n care pornim n tabel se poate stabili prin
aruncarea banului (stnga-dreapta, jos-sus n ordine
cresctoare a numerelor de ordine ale coloanelor i ale
rndurilor).
Exist posibilitatea ca n alctuirea eantionului s nu
se poat aplica procedeele menionate datorit unor diferene
calitative n structura populaiei, ns n cercetri pilot sau
cercetri experimentale cu autocontrol se pot trage concluzii i
fr respectarea strict a regulilor menionate aa cum vor arta
exemplele din seciunile urmtoare.
Numrul elementelor care compun eantionul se
stabilete fcnd un compromis ntre cerinele de economicitate
19
ale cercetrii, care tind s reduc numrul subiecilor supui
cercetrii i cerina de a mri numrul subiecilor pentru a
obine date semnificative.
20
Capitolul III
Serii statistice i reprezentri grafice
1.Introducere
Datele statistice sunt utile dac sunt supuse unor
operaiuni de prelucrare ce vizeaz cunoaterea att a
operaiilor de ordin cantitativ ct i a celor de ordin calitativ,
astfel nct specialistul s poat separa tendinele eseniale de
cele ntmpltoare, elementele obiective de cele subiective.
Prelucrarea statistic, ca etap a cercetrii statistice,
presupune efectuarea unor operaii cu ajutorul crora se
realizeaz trecerea de la date individuale la indicatori derivai,
sintetici, care reflect esena din manifestarea fenomenelor.
Prelucrarea statistic a datelor culese poate fi primar
sau secundar. Prelucrarea primar presupune efectuarea unor
operaii de clasificri, de grupri, comparaii i prezentarea
centralizat a datelor sub form de tabele, grafice sau serii
statistice. Datele statistice sunt astfel sintetizate pe grupe, se
calculeaz indicatorii absolui i relativi, iar rezultatele obinute
sunt prezentate n form sintetizat prin tabele, grafice sau serii
21
statistice. Rezultatele operaiilor de prelucrare primar sunt
prima etap pentru prelucrarea secundar, n urma creia se
estimeaz valorile tipice, se apreciaz omogenitatea i
asimetria repartiiilor, intensitatea corelaiei dintre diferite
fenomene analizate, etc.
2.Serii statistice
Definiie. Seria statistic reprezint o paralel ntre
dou sau mai multe iruri de date, din care cel puin unul
vizeaz caracteristica de grupare. O serie statistic simpl este
o paralel ntre dou iruri de date, primul ir coninnd
valorile individuale ale variabilei de grupare iar cel de-al 2
-lea
valorile individuale ale unei caracteristici oarecare. O serie
complex cuprinde trei sau mai multe iruri paralele, coninnd
dou sau mai multe carcteristici de grupare.
n funcie de tipul caracteristicii de grupare seriile
statistice se clasific n: serii statistice de distribuie, serii
statistice de timp (cronologice) i serii statistice de spaiu.
2.1.Seriile de distribuie
Deosebim serii de distribuie simple i serii de
distribuie complexe.
22
Seria de distribuie simpl (unidimensional) este o
paralel ntre irul variantelor sau intervalelor de variaie ale
caracteristicii atributive i irul frecvenelor corespunztoare
fiecrei variante sau interval de variaie. Seria de distribuie
complex (bi sau multi-dimensional) este o paralel ntre 3
sau mai multe iruri de date, cu dou sau mai multe
caracteristici atributive.
Frecvenele specifice acestor serii pot fi:
Frecvene absolute: evideniaz numrul de apariii din
fiecare grup. Se noteaz cu f
i
, iar
=
=
n
i
i
N f
1
; N-
numrul de uniti statistice ale colectivitii;
Frecvene relative: evideniaz ponderea frecvenelor
absolute n totalul colectivitii din care fac parte. Se
noteaz cu 100 ;
1
* *
=
=
n
i
i
i
i i
f
f
f f .
Pentru determinarea mrimii intervalului de variaie, n
cazul seriilor de distribuie pe intervale de variaie se
folosete formula lui H.A. Stuhges:
,
lgN 322 , 3 1
min max
+
=
x x
K unde x
min
i x
max
reprezint varianta
minim i respectiv cea maxim a carcteristicii de grupare.
23
Pentru determinarea centrului de interval se vor utiliza
formulele:
,
2
sup inf
i i c
i
x x
x
+
= dac
inf
1
sup
+
=
i i
x x i
2
inf
k
x x
i
c
i
+ = , dac
cele dou limite sunt distincte, fiind distanele cu o unitate
egal cu cifra de cel mai mic ordin.
c
i
x centru de interval;
inf
i
x limita inferioar a intervalului;
sup
i
x limita superioar a intervalului;
k lungimea intervalului.
Exemplu de distribuie unidimensional:
Distribuia studenilor grupei 101, secia educaie fizic
i sport din Tg-Jiu, dup numrul de factori:
Nr. de factori Nr. de studeni Frecvene relative
2
1-4
4-6
6-8
8-10
10-12
12-14
14-16
10
30
10
18
20
5
5
2
0,1
0,3
0,1
1,8
0,2
0,05
0,05
0,02
Total 100 1
24
Exemplu de distribuie bidimensional. Distribuia
studenilor grupei 101, secia Educaie fizic i sport dup
numrul de flotri efectuate i sexul studenilor:
Nr. fl.
Sex
1-5 5-10 10-15 15-20 20-25 25-30
Feminin 20 5 10 15 5 5
Masculin 5 10 15 25 30 20
Total 25 15 25 40 35 25
2.2.Serii cronologice
Sunt de dou tipuri: serii cronologice simple i serii
cronologice complexe.
Seria cronologic simpl este o paralel ntre dou
iruri de date, unul corespunztor carcteristicii de timp iar
cellalt unei caracteristici oarecare.
Seria cronologic complex este o paralel ntre irul
caracteristicii de timp i mai multe iruri de date, aferente unei
caracteristici oarecare.
O alt clasificare a seriilor cronologice este:
a)seria cronologic de momente, n cadrul creia
variantele caracteristicii de timp sunt momente sau intervale
foarte mici. De exemplu: ziua, data, etc.
25
Seria cronologic de momente evideniaz evoluia unei
fenomen supus observrii statistice pn la un moment dat de
timp sau de la un moment la altul.
Exemplu de serie cronologic de momente de timp:
Numrul de mingi de baschet existente n depozitul
seciei de educaie fizic i sport este:
Data Nr. de mingi
1.1.2004
1.2.2004
1.3.2004
1.4.2004
1.5.2004
1.6.2004
1.7.2004
1.8.2004
1.9.2004
1.10.2004
1.11.2004
1.12.2004
10
20
25
30
40
40
42
44
45
50
45
40
b)Serii cronologice de intervale de timp n cadrul
crora intervalele de timp variantele caracteristicii de timp sunt
intervalele mari de timp, de exemplu: luna, trimestrul, anul etc.
Exemplu de serie cronologic de intervale de timp:
26
Situaia numrului de studeni nscrii la specializarea
Educaie fizic i sport a Universitii Constantin Brncui din
Tg-Jiu.
Anul Nr. studeni
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
100
120
150
110
200
205
210
250
300
320
2005 350
2.3.Serii de spaiu
Seria de spaiu simpl este o paralel ntre irul
variantelor caracteristicii de spaiu i irul nivelurilor
individuale ale unei caracteristici oarecare. Seria de spaiu
complex este o paralel ntre irul variantelor caracteristicii de
spaiu i 2 sau mai multe iruri de variante ale unor variabile
oarecare.
Exemplu de serie de spaiu. Distribuia cluburilor
sportive de baschet i volei n judeele Gorj, Dolj, Olt, Vlcea.
27
Judeul Nr. cluburi baschet Nr. cluburi volei
Gorj
Dolj
Olt
Vlcea
10
25
15
5
15
30
30
40
3.Grafica seriilor de distribuie
Reprezentrile grafice specifice seriilor de distribuie
sunt: histograma, poligonul frecvenelor i curba frecvenelor
cumulate (ogiva).
3.1.Histograma
Deosebim:
Histograma prin batoane-se folosete n cazul
seriilor de distribuie; dup variante ale
caracteristicii atributive, poate fi folosit i n
cazul distribuiilor dup intervale de variaie pe
Ox, folosindu-se centrele intervalelor.
0
1
2
3
4
5
1 2 3 4
28
Histograma prin dreptunghiuri: se folosete
pentru reprezentarea grafic a distribuiilor dup
intervale de variaie. Pe axa Ox se trec
intervalele de variaie iar pe Oy frecvenele
corespunztoare. De pe abscis, din dreptul
diviziunilor scrii se ridic dreptunghiuri a cror
nlime este proporional cu frecvenele
corespunztoare fiecrui interval.
Histograma prin dreptunghiuri se folosete i la
determinarea grafic a dominantei.
0
1
2
3
4
5
6
1234 5
III.3.2.Poligonul frecvenelor
Metodologia de construcie este asemntoare
histogramei, cu deosebirea c se vor uni vrfurile batoanelor
sau mijlocul bazelor superioare ale dreptunghiurilor,
obinndu-se astfel poligonul frecvenelor.
29
0
1
2
3
4
1 2 3 4
1 2 3 4
0
1
2
3
4
12345
3.3.Curba frecvenelor cumulate (ogiva)
Metodologia de construcie este asemntoare
histogramei, cu deosebirea c pe ordonat sunt trecute, n
conformitate cu scara de reprezentare, frecvenele cumulate.
Cumularea frecvenelor poate fi fcut de la nceputul seriei
spre sfrit, obinndu-se curba ascendent a frecvenelor, sau
de la sfritul seriei spre nceput, obinndu-se curba
descendent a frecvenelor. Prin unirea extremitilor din
30
dreapta ale bazelor superioare ale dreptunghiurilor se obine
ogiva.
0
1
2
3
4
5
6
12345
Curba frecvenelor cumulate poate fi folosit, aa cum
vom vedea n capitolul Indicatorii tendinei centrale, la
determinarea grafic a medianei.
4.Grafica seriilor cronologice
Reprezentrile grafice specifice seriilor cronologice
sunt cronograma, histograma, diagrama prin coloane i
diagrama polar.
4.1.Cronograma
Metodologia de construcie a cronogramei este
urmtoarea: pe axa Ox se trec valorile caracteristicii de timp, n
dreptul diviziunilor scrii, dac seria este de momente sau n
dreptul intervalelor dintre diviziuni dac seria este de intervale
31
de timp; pe axa Oy se trec valorile scrii de reprezentare
corespunztoare fenomenului urmrit. De pe axa Ox, din
dreptul diviziunilor sau centrelor intervalelor se ridic
perpendiculare a cror nlime este proporional cu indicatorii
reprezentai n grafic. Prin unirea vrfurilor acestor
perpendiculare se va obine cronograma.
0
1
2
3
4
1,01 1,02 1,03 1,04 1,05 1,06
4.2.Histograma
Metodologia de construcie a acesteia este
asemntoare cu cea a cronogramei, deosebirea constnd n
faptul c pe orizontal sau pe vertical va apre un canal de
ntrerupere, ce ilustreaz renunarea la unele poriuni din scara
de reprezentare.
4.3.Diagrama prin coloane
Se folosete pentru reprezentarea grafic a seriilor
cronologice de intervale de timp. Metodologia de construcie
este asemntoare cu cea a cronogramei, deosebirea constnd
32
n faptul c de pe abscis se ridic dreptunghiuri din dreptul
intervalelor dintre diviziuni, a cror nlime este proporional
cu nivelurile indicatorului supus observrii. Figurile
geometrice folosite n construcia diagramei prin coloane sunt:
dreptunghiul, paralelipipedul, cilindrul, conul, etc.
4.4.Diagrama polar
Pentru reprezentarea grafic a seriilor cronologice ce
evideniaz o evoluie sezonier, ciclic, ste folosit diagrama
polar.
Deosebim:
a)diagrama radial. Metodologia de construcie
presupune folosirea sistemului axelor polare.
Suportul diagramei este un cerc, iar raza cercului este
elementul care asigur proporionalitatea valorilor reprezentate
grafic. Mrimea razei se determin ca raport ntre nivelul
mediu al seriei i valoarea prestabilit a unui centimetru.
Variantele caracteristicii de timp se trec n dreptul razelor n
jurul cercului suport. Nivelurile efective ale indicatorului supus
observrii se trec n funcie de scara de reprezentare pe raze sau
pe prelungirile acestora. Prin unirea cu segmente de dreapt a
acestor niveluri vom obine diagrama radial.
b)Diagrama sectoraial. Metodologia de construcie
este aceeai cu deosebirea c variantele caracteristicii de timp
33
se trec n dreptul sectoarelor de cerc, n jurul cercului, iar
nivelurile efective ale indicatorului urmrit se trece de
asemenea n dreptul sectoarelor. Se vor trasa arce de cerc din
punctele corespunztoare acestor niveluri, paralele cu cercul
folosit ca suport, determinndu-se astfel sectoare de cerc a
cror arie e proporional cu nivelurile reprezentate grafic. Prin
unirea capetelor acestor
5.Grafica diverselor comparaii
Pentru grafica diverselor comparaii se folosesc:
a)Dreptunghiul. Deosebim 2 situaii:
cnd aria dreptunghiului este funcie doar de mrimea
unei laturi, cealalt meninndu-se constant;
cnd aria dreptunghiului este funcie de ambele laturi,
situaie ntlnit atunci cnd sunt reprezentai grafic
indicatorii bifactoriali.
b)Ptratul. Latura ptratului este element de
proporionalitate.
A L =
A-aria ptratului;
c)Cercul. Elementul de proporionalitate l constituie
raza. Ea se determin cu ajutorul relaiei:
34
Q A
R = =
A-reprezentnd aria cercului;
Q-nivelul indicatorului supus observrii statistice.
d)Paralelipipedul. Este folosit pentru reprezentarea
grafic a indicatorilor trifactoriali (fiecare latur reprezentnd
un indicator, volumul proporional cu nivelul indicatorului
general).
e)Cilindrul. Se folosete pentru reprezentarea
indicatorilor bifactoriali. Suprafaa bazei este proporional cu
nivelul unui factor, iar nlimea cilindrului este proporional
cu cellalt factor. Volumul cilindrului reliefeaz nivelul
indicatorului general supus observrii statistice.
6.Grafica structurilor
Diagramele de structur se folosesc pentru
reprezentarea grafic a elementelor structurale ale unui
indicator supus observrii statistice. Figurile geometrice
folosite sunt divizate n sectoare a cror dimensiune este
proporional cu nivelurile indicatorilor structurali reprezentai
grafic. Metodologia de construcie a diagramelor de structur
este urmtoarea:
35
se alege figura geometric construirea acesteia fcndu-
se pe baza nivelurilor totale ale indicatorilor
reprezentai grafic;
Se divizez figura geometric n funcie de scara de
reprezentare aleas i de nivelurile indicatorilor
structurali;
n cazul n care figura aleas este cercul, 1% =3,6
grade. Mrimea unui sector de cerc este dat de
produsul dintre 3,6 grade i valoarea indicatorului
structural exprimat n procente;
legenda este obligatorie.
7.Diagrama prin coloane n aflux
Dac se urmrete compararea mai multor indicatori ce
fac parte din aceeai grup, reprezentarea grafic a acestora
este realizat cu ajutorul diagramei prin coloane n aflux.
Metodologia de construcie este urmtoarea: pe axa Ox se vor
construi coloane a cror nlime este proporional cu cea a
indicatorului reprezentat grafic; coloanele sunt dispuse n
ordine cresctoare una n spatele celeilalte, cu o deplasare spre
dreapta egal cu jumtate din mrimea bazei coloanelor.
Legenda este obligatorie. Indicatorii reprezentai grafic
trebuie exprimai n aceeai unitate de msur.
36
7.Aplicaii
Aplicaia 1. Se dau urmtoarele date nregistrate pentru
proba de exerciiu n 4 timpi, grupa 202 fete, Facultatea de
Drept, Universitatea Constantin Brncui din Tg-Jiu.
Nr. crt. Nume i prenume Exerciiu n patru timpi
1 A.C. 9
2 A.I. 12
3 B.I 9
4 B.M.A. 10
5 B.M.C. 10
6 B.R. 11
7 B.C. 10
8 B.M 9
9 B.R. 10
10 C.D.P. 11
11 C.I.V. 8
12 C.M. 9
13 D.E. 10
14 V.I. 10
15 D.C. 11
16 D.A. 11
17 F.M.C. 9
18 H.A.M. 11
19 J.C.6. 9
20 C.I.A. 10
21 M.C.R. 11
37
22 M.E.P. 11
23 P.A. 11
24 P.D.E. 8
25 P.A.M. 9
26 P.C. 8
27 S.E.A. 9
28 S.E.D. 11
29 T.L.S. 11
30 U.T. 11
S se construiasc seria corespunztoare i s se
reprezinte grafic.
Rezolvare.
Vom construi distribuia pe variante a studenilor
Variante Nr. studeni
8 3
9 8
10 7
11 11
12 1
Total 30
Vom reprezenta grafic seria prin histograma prin batoane:
0
1
2
3
4
5
6
7
8
9
10
11
8 9 10 11 12
Scara de reprezentare
1 cm Ox=1 exerciiu
0,5 cm Oy=1 student
38
Aplicaia 2. Se dau urmtoarele date: privind numrul
bieilor i numrul fetelor de la Universitatea Constantin
Brncui din Tg-Jiu ce au ctigat titlul de campion naional.
Anii Nr. biei Nr. fete
2000 5 7
2001 10 6
2002 4 8
S se reprezinte grafic datele prezentate.
Rezolvare. Vom folosi diagrama prin coloane n aflux.
0
1
2
3
4
5
6
7
8
9
10
biei
fete
Aplicaia 3. S se reprezinte grafic distribuia de mai
jos folosind curba frecvenelor cumulate.
Intervale de grupare Nr. studeni Frecvene cumulate
cresctor
1,45-1,54 2 2
1,54-1,63 8 10
1,63-1,72 5 5
1,72-1,81 9 24
1,81-1,90 6 30
Total 30 *
39
Distribuia feelor dup mrimea sriturii de pe loc (m).
Rezolvare. Dup cumularea frecvenelor vom
reprezenta grafic distribuiile:
0
5
10
15
20
25
30
1,45-
1,54
1,63-
1,72
1,81-
1,90
Scara de reprezentare
2 cm Ox=0,09 m
0,5 cm Oy=1 student
40
Capitolul IV
Indicatorii tendinei centrale
Aa cum am vzut n capitolul I, obiectul de studiu al
statisticii l reprezint fenomenele de mas. Caracteristica
principal a fenomenelor de mas este variabilitatea formelor
de manifestare, determinat de un complex de factori
sistematici sau ntmpltori, obiectivi sau subiectivi, eseniali
sau neeseniali.
1. Importana utilizrii indicatorilor tendinei centrale.
Legile statistice acioneaz la nivelul colectivitii, ca
tendin. Este deosebit de important deci, cunoaterea la
nivelul colectivitii supuse observaiei statistice a tendinei, a
ceea ce este esenial, firesc i obiectiv n formele de
manifestare individual a unitilor statistice ce compun
colectivitatea, cunoatere ce se realizeaz prin determinarea
indicatorilor sintetici adecvai.
Indicatorii tendinei centrale se determin ca indicatori
medii sau indicatori de poziie, n funcie de tipul variabilelor
41
de grupare. Dup Zule, condiiile ce trebuie ndeplinite de un
astfel de indicator sunt:
s fie definit obiectiv, independent de dorina
utilizatorului;
s aib o semnificaie concret, accesibil;
s fie simplu i rapid de calculat;
determinarea sa s depind de toate valorile;
individuale nregistrate;
s poat fi folosit la diferite operaii algebrice;
s fie puin sensibil la fluctuaiile de selecie;
n practica statistic indicatorii tendinei centrale nu
satisfac simultan condiiile de mai sus, interpretarea lor
depinznd de capacitatea de nelegere a utilizatorului.
2. Indicatorii medii
Media este expresia sintetic a nivelurilor individuale
ale unei variabile oarecare, concentrat ntr-un singur nivel
reprezentativ, care evideniaz ceea ce este esenial, firesc,
tipic i obiectiv n dezvoltarea unui fenomen.
Media se exprim n uniti concrete de msur, ns
are un caracter abstract, valoarea ei putnd s coincid sau nu
cu valoarea individual a unei variabile numerice urmrite.
42
O condiie esenial pentru reprezentativitatea mediei,
ca msur a tendinei centrale este verificarea omogenitii
colectivitii n funcie de caracteristica urmrit.
Se deosebesc urmtoarele tipuri de medii:
media aritmetic;
media armonic;
media ptratic;
media geometric;
media cronologic;
Fiecare dintre aceste tipuri are dou variante: simpl i
ponderat.
2.1. Media aritmetic
Media aritmetic se folosete atunci cnd variabilitatea
unui fenomen se produce aproximativ n progresie aritmetic,
nregistrnd o tendin linear. Cnd numrul variantelor
caracteristicii este egal cu numrul unitilor statistice supuse
observrii, adic atunci cnd nu se repet nici o variant, se
folosete media aritmetic simpl. Dac ns cel puin una din
variante se repet, vom folosi media aritmetic ponderat.
a) Media aritmetic simpl
Metodologia de calcul a mediei aritmetice are la baz
proprietatea urmtoare: nlocuind n cadrul funciei
43
determinante variantele
i
x cu media lor, nivelul general al
caracteristicii X va rmne neschimbat. Vom avea:
=
= + + + +
n
i
i n
x x x x x
1
3 2 1
....... .......... .......... ..........
x n x x x x = + + + ..... ..........
Dar cum
=
=
n
i
i
x x n
1
, rezult c formula de calcul a
mediei aritmetice simple va fi:
n
x
x
n
i
i
=
=
1
b) Media aritmetic ponderat
Metodologia de calcul este aceeai, cu deosebirea c
fiecare variant
i
x este ponderat cu frecvena corespunztoare
i
f .
Vom avea:
=
= + +
n
i
i i n n
f x f x f x f x
1
2 2 1 1
........
=
= + +
n
i
i n
f x f x f x f x
1
2 1
........
44
Dar cum
=
n
i
i i
f x
1
=
=
n
i
i
f x
1
, rezult c formula de calcul
a mediei aritmetice ponderate este:
=
=
=
n
i
i
n
i
i i
f
f x
x
1
1
Proprietile mediei aritmetice
de verificare a corectitudinii calculului:
max min
x x x < <
Orice valoare n afara acestui interval semnaleaz un calcul
eronat al mediei.
0 ) (
1
=
=
n
i
i
x x - pentru media aritmetic simpl
0 ) (
1
=
=
i
n
i
i
f x x - pentru media aritmetic ponderat
de simplificare a calculului:
Media calculat din variantele caracteristicii, micorate n
prealabil cu o constant a este mai mic dect media real cu
acea constant a, astfel nct:
x
f
f x x
n
i
i
i
n
i
i
<
=
=
1
1
) (
cu a, adic:
45
( ) 1
) (
1
1
a
f
f x x
x
n
i
i
i
n
i
i
+
=
=
Media calculat pe baza variantelor caracteristicii
micorate n prealabil de k ori (k este constant) este mai
mic dect media real de k ori.
x
f
f
k
x
n
i
i
i
n
i
i
<
=
=
1
1
) (
de k ori, adic:
a k
f
f
k
a x
x
n
i
i
i
n
i
i
+
=
=
1
1
) (
Precizri:
- constanta a este de regul varianta caracteristicii cu
frecvena cea mai mare;
- k reprezint mrimea intervalului de variaie
- odat stabilit poziia lui a n cadrul seriei de
distribuie, pentru
k
a x
i
se vor trece valorile 0 n
46
dreptul poziiei lui a , -1, -2, -3, etc., deasupra de
0, 1, 2, 3etc. sub 0.
Metodologia de calcul simplificat a mediei aritmetice se
aplic doar pentru seriile de distribuie cu intervale de variaie
egale.
2. Media armonic
Media armonic, ca indicator al tendinei centrale, se
definete ca valoarea invers a mediei aritmetice a inverselor
valorilor individuale nregistrate. Aplicarea mediei armonice
pentru caracterizarea tendinei centrale are sens numai dac
nsumarea inverselor valorilor individuale este obiectiv.
a) Media armonic simpl
Funcia determinant este tot de tip aditiv, ca i n cazul
mediei aritmetice:
=
= + + +
n
i
i n
x x x x
1
2 1
1 1
..... ..........
1 1
i
x
n
x x x
= + + +
1
..... ..........
1 1
47
Dar cum
x
n
x
n
i
i
=
=1
1
, rezult c formula mediei armonice
simple va fi:
=
=
n
i
i
h
x
n
x
1
1
b) Media armonic ponderat
Vom avea:
i
n
i
i
n
n
f
x
f
x
f
x
f
x
=
= + + +
1
2
2
1
1
1 1
..... ..........
1 1
=
= + + +
n
i
i n
f
x
f
x
f
x
f
x
1
2 1
1 1
..... ..........
1 1
Cum ns
i i
n
i
i
f
x
f
x
1 1
1
=
=
rezult formula mediei armonice
ponderate :
i
n
i
i
n
i
i
h
f
x
f
x
=
=
=
1
1
1
48
Dac se calculeaz pentru acelai set de date att media
aritmetic ct i media armonic, ntotdeauna vom avea relaia:
x x
h
<
3. Media ptratic
n cazul n care fenomenele studiate prezint creteri
aproximativ n progresie exponenial, creterea fiind lent la
nceput i din ce n ce mai pronunat spre sfritul seriei,
pentru caracterizarea tendinei centrale vom folosi media
ptratic.
a) Pentru media ptratic simpl avem:
=
= + + +
n
i
i n x x x x
1
2 2
2
2
1
2
........
2 2 2 2
....... x n x x x = + + +
Cum ns
=
=
n
i
i x x n
1
2 2
, formula mediei ptratice
simple este:
n
x
x
n
i
i
p
=
=
1
2
49
b) Media ptratic ponderat
i
n
i
i
n
n f x f x f x f x
=
= + + +
1
2 2
2
2
2
1
1
2
........
=
= + + +
n
i
i n
f x f x f x f x
1
2 2
2
2
1
2
.......
Din
i
n
i
i
n
i
i
f x f x
= =
=
1
2
1
2
rezult formula mediei ptratice
ponderate:
=
=
=
n
i
i
i
n
i
i
p
f
f x
x
1
1
2
Pentru aceei serie statistic ntotdeauna
p
x x < .
4. Media geometric
n cazul n care fenomenul studiat nregistreaz
modificri aproximativ n progresie geometric, prezentnd
diferene mari ntre variantele caracteristicii la nceputul seriei
i din ce n ce mai mici spre finalul acesteia vom folosi ca
indicator al tendinei centrale media geometric.
Pentru determinarea mediei geometrice funcia folosit
este de tipul produsului.
50
a) Media geometric simpl:
=
=
n
i
i n
x x x x x
1
3 2 1
..........
n
x x x x x = ......
Cum
n
n
i
i
x x =
=1
, rezult formula de calcul a mediei
geometrice simple:
n
n
i
i g
x x
=
=
1
b) Media geometric ponderat
=
=
n
i
i
f
n
f f f f
i n
x x x x x
1
3 2 1 ..........
3 2 1
=
=
n
i
i
n
f
f f f f
x x x x x
1 3 2 1
......
Cum ns
=
=
=
n
i
i
f
f
i
n
i
i
x x
1
1
, rezult c formula de determinare a
mediei geometrice ponderate este:
=
=
n
i
i
i
f
n
i
i
f
g
x x
1
Pentru acelai set de date vom avea ntotdeauna relaia:
p g
x x x < < .
51
5. Media cronologic
Se folosete n mod unic doar pentru seriile cronologice
de momente. n cazul n care intervalele dintre momente sunt
egale, vom folosi media cronologic simpl. Logic, dac
intervalele dintre momente sunt diferite vom folosi media
cronologic ponderat.
Calculul mediei cronologice presupune parcurgerea a
dou etape:
calcularea mediilor mobile ca medii aritmetice simple a
cte doi sau mai muli termeni, n cadrul crora cel
puin un termen se repet
calculul mediei cronologice, simpl sau ponderat,
dup caz.
a) Media cronologic simpl
Fie seria:
Data
i
x
1.01
1
x
1.02
2
x
1.03
3
x
1.04
4
x
52
Etapa I. Calculul mediilor mobile:
2
2 1
1
x x
x
+
= ;
2
3 2
2
x x
x
+
= ;
2
4 3
3
x x
x
+
=
Etapa a II-a Calculul mediei cronologice simple. Formula de
calcul este:
mobile mediilor numarul - ,
1
_
_
k
k
x
x
n
i
k
c
=
=
n cazul de fa avem:
3
2 2 2
3
1 3 3 2 2 1
3
_
2
_
1
_
_
x x x x x x
x x x
x
c
+
+
+
+
+
=
+ +
=
b)Media cronologic ponderat
Fie seria
Data x
0
1.01
1.03
1.05
1.08
1.12
x
1
x
2
x
3
x
4
x
5
53
Etapa I. Calculul mediilor mobile
2
;
2
;
2
;
2
5
_
4
4
_
4 3
3
_
2 1
2
_
2 1
1
_
x x
x
x x
x
x x
x
x x
x
+
=
+
=
+
=
+
=
Etapa II. Calculul mediei cronologice ponderate se
face cu ajutorul formulei:
=
=
=
n
i
k
n
i
k
k
c
t
t x
x
1
1
_
_
n cazul de fa:
11
4 3 2 2
4
_
3
_
2
_
1
_
_
+ + +
=
x x x x
x
c
6.Indicatorii de poziie
Pentru a cunoate tendina central n cazul seriilor de
distribuie este necesar a determina nu numai valorile
individuale ale caracteristicii observate, ci i cunoaterea
formei n care se repartizeaz unitile colectivitii dup
caracteristica respectiv. Indicatorii de poziie ofer informaii
utile pentru caracterizarea tendinei centrale a fenomenului
supus observaiei statistice.
54
6.1.Mediana
Definiie. Mediana este dat de acea valoare a
caracteristicii care mparte seria n 2 pri egale.
Pentru serii simple distingem cazurile:
a)dac seria are numr impar de termeni, mediana este
acea valoare a caracteristicii ce ocup poziia
2
1 + n
n cadrul
seriei ordonate cresctor sau descresctor.
De exemplu: avem urmtorele date privind sritura n
lungime (m) a unei grupe de 9 studeni:
1,90; 1,6; 2,30; 2,40; 2,50; 1,80; 1,85; 1,70; 1,95;
Ordonm cresctor seria:
1,6; 1,70; 1,80; 1,85; 1,90; 1,95; 2,30; 2,40; 2,50;
( ) m 90 , 1 5
2
1 9
2
1
= =
+
=
+
=
e e
M
n
M loc
b)Dac seria are numr par de termeni, mediana este
dat de semisuma termenilor centrali, n seria ordonat
cresctor sau descresctor.
Exemplu: Folosim aceleai date, dar mai adugm o
sritur (un rezultat). Seria ordonat cresctor este:
1,6; 1,70; 1,80; 1,85; 1,90; 1,95; 2,00; 2,30; 2,40; 2,50;
m 05 , 2
2
50 , 2 6 , 1
=
+
=
e
M
55
Pentru serii de distribuie exist dou posibiliti de
determinare a medianei:
a)Calculul algebric.
Formula de calcul este:
unde ,
2
m
m
i
i e
f
k
S
f
l M
|
|
\
|
+ =
l
i
- limita inferioar a intervalului median;
2
1
=
n
i
i
f
-jumtate din unitile statistice;
m
S -suma frecvenelor intervalelor ce preced intervalul
median;
k- mrimea intervalului de variaie;
f
m
-frecvena intervalului median.
b)Determinare grafic.
Se folosete curba frecvenelor cumulate din dreptul lui
2
1
=
n
i
i
f
se duce o paralel la axa Ox. Din punctul de intersecie
al acesteia cu originea se coboar o perpendicular pe Ox.
Punctul de intersecie al acesteia cu abscisa corespunde, cu o
precizie de 100% cu valoarea medianei.
56
6.2.Modulul (Dominanta)
Definiie. Modulul este acea valoare a caracteristicii cu
frecvena cea mai mare.
Exemplu: Dispunem de urmtoarele date privind
numrul flotrilor efectuate de o grup de 10 studeni:
10; 12; 14; 10; 22; 20; 18; 20; 19; 20;
Valoarea modal este: 20 de flotri.
Pentru seriile de distribuie exist de asemenea dou
posibiliti de determinare a valorii modale:
a)Calculul algebric. Formula de calcul este:
k l M
i o
|
|
\
|
+
+ =
2 1
1
, unde
l
i
-limita inferioar a intervalului modal (intervalul cu
frecvena cea mai mare)
1
- frecvena intervalului modal frecvena
intervalului precedent;
2
- frecvena intervalului modal frecvena
intervalului urmtor.
b)Determinarea grafic. Se folosete histograma prin
dreptunghiuri. Se unesc vrfurile coloanei maximale cu
punctele de inciden ale coloanei adiacente. Din intersecia
segmentelor se coboar o perpendicular pe Ox. Punctul de
57
intersecie reprezint n proporie de 100% valoarea moduluilui
(dominantei).
7.Aplicaii
Aplicaia 1. La secia de educaie fizic i sport din
cadrul Universitii Constantin Brncui din Tg-Jiu s-a
nregistrat urmtoarea situaie privind numrul studenilor
nscrii:
Anul
Nr.
studenilor
Anul
1995
1996
1997
1998
1999
35
40
42
45
50
2000
2001
2002
2003
2004
55
60
65
70
80
a)S se precizeze tipul caracteristicii de grupare i tipul seriei.
b)S se determine numrul mediu anual al studenilor nscrii,
justificndu-se tipul de medie ales.
Rezolvare:
a)Caracteristica de grupare-anual- este o caracteristic
statistic de timp, seria prezentat fiind deci o serie cronologic
simpl de intervale de timp.
58
b)Deoarece nivelurile individuale ale irului numrul de
studeni cresc aproximativ cu aceeai valoare, vom folosi
pentru determinarea numrului mediu de studeni media
aritmetic simpl:
2 , 54
10
542
___
0
= = =
n
x
x
i
- numrul studenilor nscrii.
Aplicaia 2. Se dau urmtoarele date privind rezultatele
probei Sritura n lungime de pe loc, biei, de la
specializarea Educaie fizic i sport din cadrul Universitii
Constantin Brncui din Tg-Jiu.
Nr.
crt.
Sritura n lungime de pe
loc (cm)
Nr.
crt.
Sritura n lungime de pe
loc (cm)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
190
210
225
220
210
215
210
215
210
190
210
210
225
230
235
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
260
220
220
215
240
260
200
240
215
210
225
225
220
225
230
59
a)S se determine sritura n lungime de pe loc medie a grupei.
b)S se determine mediana prin:
1)calcul algebric;
2)determinare grafic;
c)S se determine valoarea modal a grupei prin:
1)calcul algebric;
2)determinare grafic;
d)S se reprezinte grafic seria folosind histograma prin
dreptunghiuri.
Rezolvare:
Determinarea mrimii intervalului de grupare (se
folosete formula lui H.A. Sturges):
N
x x
k
lg 322 , 3 1
min max
+
=
n cazul nostru x
max
=260, x
min
=190, N=30, deci vom avea:
cm 14
5
70
5
190 260
= =
= k
Cele 5 intervale de grupare se vor determina astfel:
Se pornete de la valoarea minimal i se adaug succesiv
mrimea intervalului de grupare, determinat anterior. Vom
obine distribuia:
60
Intevale de
grupare
Nr. studeni x
i
x
i
f
i
190-204
204-218
218-232
232-246
246-260
3
15
8
3
1
197
211
225
239
253
591
3165
1800
717
253
Total 30 * 6524
Determinarea lungimii medii a sriturilor se face cu
ajutorul formulei mediei aritmetice ponderate:
cm/student 53 , 217
30
6526
_
= = =
i
i i
f
f x
x
b)Determinarea medianei.
1)Calcul algebric.
( ) cm/student 2 , 215
15
14
3 15 204
2
= + =
|
|
\
|
+ =
m
m
m
i
i e
f
k
S
f
l M
Intervalul median este: (204-218)
2)Determinare grafic.
Vom construi curba frecvenelor cumulate (ogiva).
Intervale Frecvene cumulate
190-204 3
204-218 18
218-232 26
232-246 29
246-260 30
61
0
15
30
190-
204
204-
218
218-
232
232-
246
246-
260
0,5 cm Oy=1 student
1 cm Ox=14 cm
scara de
reprezentare
c)Modulul(Dominanta) M
e
1)Calcul algebric.
cm 84 , 212 14
7 12
12
204
2 1
1
=
|
\
|
+
+ =
|
|
\
|
+
+ =
m i o
k l M
Intervalul modal este intervalul cu frecvena cea mai
mare, deci n cazul nostru 204-218.
2)Determinare grafic.
Vom folosi histograma prin dreptunghiuri: M
o
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
190-
204
204-
218
218-
232
232-
246
246-
260
scara de
reprezentare
0,5 cm Oy=1
student
1 cm Ox=14 cm
d)Histograma prin dreptunghiuri:
62
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
190-204 204-218 218-232 232-246 246-260
Aplicaia 3. n urma inventarierii ntreprinse la dou
depozite A i B ale seciei de Educaie fizic i sport din cadrul
Universitii Constantin Brncui din Tg-Jiu s-au nregistrat
urmtoarele date statistice privind numrul rachetelor de tenis
existnd n gestiunea acestora:
Data A B
1.01. 38 72
1.02. 32 *
1.03. 50 *
1.04. 48 57
1.05. 38 48
1.06. 30 68
1.07. 32 *
1.08. 45 70
a)Precizai tipul caracteristicii de grupare. Datele prezentate
formeaz o serie statistic? Care este tipul ei?
63
b)S se determine numrul mediu de rachete de tennis pentru
fiecare deposit.
Rezolvare.
a)Caracteristica de grupare, data, este o caracteristic
statistic de timp. Datele statistice prezentate formeaz o serie
statistic cronologic de moment, complex, alctuit din dou
serii cronologice simple de momente de timp. (col. 1+col.2 i
col. 1+col.3)
b)Pentru prima serie, deoarece intervalele de momente
sunt egale, tipul de medie folosit va fi : media cronologic
simpl. Determinarea acesteia presupune parcurgerea celor
dou etape :
Calculul mediilor mobile:
5 , 38
2
45 32
; 31
2
32 30
x ; 34
2
30 38
x ; 43
2
38 48
; 49
2
48 50
; 41
2
50 32
; 35
2
32 38
__
1
__
6
__
5
__
4
__
3
__
2
__
1
=
+
=
=
+
= =
+
= =
+
=
=
+
= =
+
= =
+
=
x
x
x x x
Calculul mediei cronologice:
tenis rachete 39 75 , 38
7
5 , 271
7
7
1
__
= = =
= i
i
c
x
x
Pentru ce-a de-a doua serie, intervalele dintre momente
sunt diferite, deci vom folosi media cronologic ponderat.
64
Determinarea ei presupune de asemenea parcurgerea celor
dou etape:
Calculul mediilor mobile:
; 59
2
70 48
58 ; 5 , 52
2
48 57
; 5 , 64
2
57 72
__
4
__
3
__
2
__
1
=
+
=
= =
+
= =
+
=
x
x x x
Calculul mediei cronologice:
60 29 , 60
7
118 58 5 , 52 5 , 193
7
2 1 1 3
__
4
__
3
__
2
__
1
__
=
+ + +
=
+ + +
=
x x x x
x
c
rachete tenis.
65
Capitolul V
Variaia i asimetria
1. Importana msurrii variabilitii valorilor individuale
Pentru a cunoate i a estima corect principalele
tendine ale unei caracteristici este absolut necesar
determinarea domeniului acesteia de variaie. Cu ct
fenomenele au un grad mai mare de complexitate, cu att
variaia (mprtierea) valorilor individuale este mai mare.
Verificarea stabilitii i a reprezentativitii valorilor
nregistrate de indicatorii tendinei centrale este necesar n
fundamentarea deciziilor.
Calcularea i analiza indicatorilor variaiei sau
mprtierea valorilor individuale fa de tendina central
ofer posibilitatea :
a) analiza gradului de omogenitate a datelor din care s-
au determinat indicatorii tendinei centrale i verificarea
reprezentativitii acesteia ;
b) Modul de dispersare a valorilor individuale n
interiorul cmpului de variaie ;
66
c) separarea aciunii factorilor ntmpltori de aciunea
factorilor eseniali.
d)compararea n timp i spaiu a mai multor serii de
distribuie dup caracteristicile independente sau
interdependente.
2.Indicatorii variaiei
Distingem 2 grupe :
1)Indicatori simpli;
2)Indicatori sintetici.
1.)Indicatorii simplii ai variaiei.:
a)Amplitudinea variaiei. Ofer posibilitatea cunoaterii
cmpului de variaie a unui fenomen. Distingem :
a.1.)Amplitudinea absolut (A
a
). Se calculeaz
ca diferena ntre variaia maxim i variaia minim a
caracteristicii :
A
a
=x
max
-x
min
a.2.)Amplitudinea relativ (A
r
). Se determin
raportnd amplitudinea absolut la media caracteristicii
analizate, exprimndu-se n procente :
100
_
=
x
A
A
a
r
67
a.3.)Abaterile individuale absolute(d
a
). Dau
posibilitatea cunoaterii structurii variaiei la nivelul fiecrei
uniti statistice i se calculeaz ca diferena ntre variantele
caracteristicii i media lor :
_
x x d
i a
=
a.4.)Abaterile individuale relative (d
r
). Se
calculeaz ca raport ntre abaterea absolut i medie,
exprimndu-se n procente:
100 100
_
_
_
= =
x
x x
x
d
d
i i
r
2.)Indicatorii sintetici ai variaiei.
a.1.)Abaterea medie linear. Este calculat ca o medie
aritmetic, simpl sau ponderat, a abaterilor absolute ale
variantelor caracteristicii de la media lor, n modul, folosind
una dintre relaiile :
absolute frecvente de serii pentru -
simple serii pentru -
1
1
_
_
1
_
_
=
=
=
=
n
i
i
i
n
i
i
n
i
i
f
f x x
d
n
x x
d
68
100
*
1
_
_
i
n
i
i
f x x
d
\
|
=
2
_
2
Pentru o serie de frecvene :
\
|
=
i
i i
f
f x x
2
_
2
Pentru o serie de frecvene relative:
100
*
2
_
2
\
|
=
i i
f x x
69
Proprietile dispersiei. Deoarece dispersia este
calculat ca o medie aritmetic, rezult c proprietile mediei
aritmetice sunt aplicabile i n cazul dispersiei. Deosebit de
importante sunt cele 2 proprieti care duc la simplificarea
calculului :
1.)Dispersia calculat din abaterile variantelor x
i
de la o
constant a este mai mare dect dispersia real cu ptratul
diferenei dintre medie i constanta a, adic:
( )
( )
(1) x
sau
x cu
2
_
2
2
2
_
2
2
|
\
|
=
|
\
|
>
a
f
f a x
a
f
f a x
i
i i
i
i i
2.)Dispersia calculat din abaterile variantelor x
i
de la
media lor, micorate n prealabil prin mprirea cu o constant
k, este mai mic dect dispersia real, de k ori, adic:
(2)
sau
ori k" " de
2
_
2
2
_
k
f
f
k
x x
f
f
k
x x
i
i
i
i
i
i
|
|
|
\
|
=
<
|
|
|
\
|
70
Din (1) i (2) rezult:
2
_
2 2
|
\
|
|
\
|
=
a x k
f
f
k
a x
i
i
i
Dup stabilirea poziiei a n cadrul seriei, pentru
rapoartele |
\
|
k
a x
i
se vor trece automat 0, n dreptul poziiei
lui a, -1, -2, -3, etc., deasupra i 1, 2, 3, etc., sub zero,
analog formulei de calcul simplificat al mediei ponderate.
a.3.)Abaterea medie ptratic (Abaterea standard). Se
calculeaz ca medie ptratic, simpl sau ponderat, a
abaterilor valorilor individuale de la media lor, dup relaia:
n
x x
i
|
\
|
= =
2
_
2
-pentru serii simple;
\
|
=
i
i i
f
f x x
2
_
-pentru serii de frecvene absolute;
\
|
=
i
i i
f
f x x
*
_
-pentru serii de frecvene relative,
sub form de coeficieni;
71
Vom putea determina intervalul de variaie:
_ _
d x+ -limita superiaoar
_ _
d x -limita inferioar
Intervalul mediu de variaie determinat cu ajutorul
abaterii standard este mai larg dect cel calculat cu ajutorul
abaterii medii lineare, abaterea standard fiind indicatorul
preferat n analiza variaiei fenomenelor sociale.
a.4)Coeficientul de variaie. D posibilitatea comparrii
variaiei valorilor ce nu sunt exprimate n aceeai unitate. Se
calculeaz ca raport ntre abaterea standard i nivelul mediu al
variabilei statistice, exprimndu-se n procente:
100% v 0
100
x
d
sau v 100 v
_
_
_
= =
x
Astfel:
v=0 rezult lips de variaie, valorile sunt egale ntre ele
i egale cu media lor, adic
_
3 2 1
...... x x x x x
n
= = = =
v0, variaia caracteristicii este mic.
v100%, variaia caracteristicii este mare.
72
Intervalul de valori se poate mprii astfel:
0<v % 35 , variaia este mic, media ca indicator al
tendinei centrale este semnificativ, abaterile variantelor x
i
, de
la medie sunt mici, valorile mici graviteaz n jurul mediei,
colectivitatea este omogen, adic e format din uniti ce
aparin aceluiai tip calitativ, gruparea ca metod de
sistematizare este bine fcut.
35%<v50%, variaie relativ mare, ceea ce nseamn
c aspectele prezentate mai sus devin discutabile.
50%<v100%, variaie foarte mare, media nu este
semnificativ, deoarece mascheaz abateri mari ale termenilor,
care sunt poziionai la distane mari unul fa de altul.
Gruparea nu este corect fcut, se recomand mprirea
colectivitii n grupe omogene i determinarea indicatorilor
sintetici pentru fiecare grup.
Coeficientul de variaie poate fi folosit ca test de
verificare a reprezentativitii mediei, distingndu-se cazurile:
0<v17%, media este strict reprezentativ ;
17%<v35%, media este moderat semnificativ;
35%<v50%, media este relativ reprezentativ;
v>50%, media nu este reprezentativ.
73
3.Indicatorii variaiei pentru distribuii
bidimensionale
n cazul distribuiilor bidimensionale, pentru analiza
variaiei caracteristicii secundare se folosete ca indicator
dispersia.
Variabilitatea valorilor individuale este determinat de
aciunea factorilor eseniali (de grupare) i a factorilor
ntmpltori (reziduali) care acioneaz n interiorul fiecrei
grupe.
Deosebim urmtoarele tipuri de dispersie:
a.1.)Dispersia de grup. Se calculeaz ca o medie
aritmetic ponderat a ptratului abaterilor variantelor y
i
de la
media de grup, dup relaia:
unde ,
sau
2
_
2
2
_
2
\
|
=
\
|
=
j
ij
j
ij i j
i
i
i
ij i j
i
f
f y y
f
f y y
74
y
j
variantele caracteristicii secundare y poziionate n
cadrul fiecrei grupe constituit dup caracteristica principal
x.
_
i
y -media valorilor y
j
corespunztoare fiecrei grupe
i,
, , 1
_________
n i = numrul de grupe constituite dup variabila principal
x.
, , 1
_________
n j = numrul de grupe constituite dup variabila secundar
y.
f
ij
-frecvenele corespunztoare variabilelor y
j
din fiecare grup
i ;
f
i
- frecvenele fiecrei grupe i.
=
j
i ij
f f
_
i
j
ij j
j
ij
j
ij j
i
f
f y
f
f y
y
=
Dispersia de grup sintetizeaz influena factorilor
ntmpltori ce determin variaia caracteristicii secundare y n
cadrul fiecrei grupe constituite dup caracteristica principal
x.
75
a.2.)Media dispersiilor de grup. Sintetizeaz influena
factorilor ntmpltori asupra variaiei secundare y la nivelul
colectivitii generale. Se calculeaz ca o medie aritmetic
ponderat a dispersiilor de grup dup relaia:
_
2
2
,
=
i
i
i
i i
f
f
unde f
i
frecvenele corespunztoare grupelor
i.
i
f numrul total de uniti statistice.
a.3.)Dispersia dintre grupe. Sintetizeaz variaia
caracteristicii secundare y determinat de aciunea factorilor
eseniali, la nivelul ntregii colectiviti. Se calculeaz ca o
medie aritmetic ponderat a ptratului abaterilor mediilor de
grup de la media general, dup relaia:
,
2
_
0
2
\
|
=
i
i
i
i i
f
f y y
unde
_
0
y -media caracteristicii
secundare pentru ntreaga colectivitate.
f
i
-frecvenele corespunztoare grupelor i
N f
i
i
=
\
|
=
j
j
j
j j
f
f y y
2
_
0
2
0
Regula de aur a adunrii dispersiilor:
2
__
2 2
0
+ =
De asemenea putem calcula:
-coeficientul de determinaie, se evideniaz ponderea
variaiei caracteristicii secundare determinat de aciunea
factorilor eseniali de grupare n variaia total a caracteristicii:
100
2
0
2
2
=
R
-coeficientul de nedeterminaie, ce evideniaz
problema variaiei caracteristicii secundare determinat de
aciunea factorilor ntmpltori la nivelul ntregii colectiviti:
100 1
2
0
_
2
2
=
R
77
4.Indicatorii variabilei aleatoare a lui Bernoulli
n practica statistic se ntlnesc variabile ale cror
variante sunt antogonice, una fiind alternativ celeilalte. Pentru
prelucrarea i analiza statistic a acestora se folosesc
urmtoarele situaii convenionale:
Variantele
caracteristicii
Frecvene absolute f
i
Frecvene relative
*
i
f
x
1
=1
x
2
=0
Total
f
1
f
2
N
N
f
p
1
=
N
f
q
2
=
p+q=1
Metodologia de calcul a mediei caracteristicii
alternative este aceeai cu cea a mediei aritmetice ponderate, n
formula acesteia introducndu-se elementele specifice
caracteristicii lui Bernoulli.
Deci vom avea:
p
N
f
f f
f
f f
f x f x
f
f x
x
i
i i
= =
+
=
+
+
= =
1
2 1
1
2 1
2 2 1 1
_
Dispersia. n mod analog vom folosi:
78
( ) ( )
=
+
+
=
=
+
|
\
|
+
|
\
|
=
|
\
|
=
2 1
2
2
1
2
2 1
2
2
_
2 1
2
_
1
2
_
2
0 1
f f
f p f p
f f
f x x f x x
f
f x x
i
i
i
i i
( ) ( )
( )
pq
q p
q p pq
q p
q p p q
N
f
p
N
f
q
f f
f
p
f f
f
q
f f
f q o
f f
f p
=
+
+
=
+
+
=
+
=
=
+
+
+
=
+
+
+
=
2 2
2 2 1 2
2 1
2 2
2 1
1 2
2 1
2
2
2 1
1
2
1
1 1
1
Deci:
q p =
2
Abaterea standard:
pq = =
2
5.Indicatorii asimetriei i curtozisului
Analiza statistic a formelor de distribuie a
frecvenelor presupune caracterizarea asimetriei, adic
deplasarea valorilor individuale fa de anumite valori tipice
ale tendinei centrale i a gradului de aplatizarea a curbei
frecvenelor.
Momentele sunt indicatori statistici preioi pentru
analiza asimetriei i a gradului de aplatizare a seriilor de
79
distribuie. Momentele se calculeaz ca medii aritmetice
ponderate ale abaterilor variantelor caracteristicii de la o
anumit valoare, folosit ca baz de comparaie, abaterile
respective fiind luate la puteri diferite.
Deosebim:
a)Momente ordinare:
-pentru serii simple
( )
N
a x
i
n
i
n
=
*
-pentru serii de distribuie
( )
=
i
i
i
i
n
i
n
f
f a x
*
-formula de calcul simplificat:
n
i
i
i
i
n
i
n
k
f
f
k
a x
\
|
=
*
unde n reprezint ordinul momentului.
a, k-constante alese ca i n cazul formulei de calcul simplificat
a mediei aritmetice.
b)Momente centrate:
-pentru serii simple:
80
N
x x
i
n
i
n
\
|
=
_
-pentru serii de distribuie:
\
|
=
i
i
i
i
n
i
n
f
f x x
_
Avem urmtoarele relaii ntre cele 2 tipuri de
momente:
( )
( )
( ) ( )
4
*
1
*
2
2
*
1
*
3
*
1
*
4 4
3
*
1
*
2
*
1
*
3 3
2
*
1
*
2
3 6 4
2 3
+ =
+ =
=
n
Asimetria. Prin asimetrie nelegem abaterea de la
simetrie a seriilor de distribuie, abatere ce poate fi moderat,
genernd distribuii moderat asimetrice sau abtere pronunat,
ntlnit n cazul distribuiilor extrem asimetrice.
Dintre indicatorii folosii n msurarea gradului de
asimetrie a seriilor de distribuie cei mai des utilizai sunt
coeficientul lui Pearson i coeficientul lui Fisher.
Pentru coeficientul lui Pearson avem relaia:
1 P 1
M - x
P
_
0
+
=
Kas
Kas
81
Interpretare
Kas P=0 atunci seria este simetric;
Kas P0 avem serie cu simetrie mic;
Kas P 1 avem asimetrie pronunat;
Kas P>0 avem asimetrie la stnga sau negativ;
Kas P<0 avem asimetrie la dreapta sau pozitiv.
n practic 0,3 P 3 , 0 + Kas indic o asimetrie
moderat.
Pentru coeficientul lui Fisher avem:
3 F 3
x 3
F
0
_
+
|
\
|
=
Kas
M
Kas
Cu ct Kas F0 cu att seria este mai aproape de
simetrie.
Alte metode de caracterizare a simetriei:
Dac:
0
_
M M x
e
= = avem serie simetric;
_
0
x M M
e
< < avem serie asimetric la stnga;
0
_
M M x
e
< < avem serie asimetric la dreapta;
3
=0 avem serie simetric;
82
3
<0 avem serie asimetric la snga;
3
>0 avem serie asimetric la dreapta.
Curtozisul. Reprezentrile grafice ale seriilor de
distribuie de frecvene sunt mai mult sau mai puin aplatizate
comparativ cu graficul distribuiei normale Gauss-Laplace.
Acestea au bolta mai larg sau mai ascuit, n funcie de
gradul de concentrare a frecvenelor n jurul valorilor tipice-
medie, mediana, dominanta.
Rdcinile etimologice ale conceptelor utilizate sunt
cuvintele greceti kurtos=cocoat, platos=larg i lptos=ngust.
Gradul de concentrare a frecvenelor n jurul valorilor tipice
este cunoscut sub numele de exces.
Aplatizarea este msurat cu ajutorul urmtorilor
indicatori:
-coeficientul de boltire, ce se calculeaz ca raport ntre
momentul centrat de ordinul 4 i ptratul momentului centrat
de ordinul 2, dup formula:
( )
2
2
4
2
2
4
2
= =
-curtozisul (excesul) se determin cu ajutorul relaiei:
2
=
2
-3, 3 fiind valoarea coeficientului de boltire
corespunztor repartiiei normale.
83
Vom avea:
2
>3 implic
2
>0 implic distribuie lytecustic (cu
vrf ascuit);
2
=3 implic
2
=0 implic distribuie normal;
2
<3 implic
2
<0 implic distribuie platicustic (cu
vrf plat).
6.Aplicaii
Aplicaia 1. Se dau urmtoarele date privind rezultatele
probei Sritura n lungime de pe loc, biei, de la
specializarea Educaie fizic i sport din cadrul Universitii
Constantin Brncui din Tg-Jiu.
Nr.
crt.
Sritura n lungime de pe
loc (cm)
Nr.
crt.
Sritura n lungime de pe
loc (cm)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
190
210
225
220
210
215
210
215
210
190
210
210
225
230
235
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
260
220
220
215
240
260
200
240
215
210
225
225
220
225
230
84
a)Indicatorii simpli i sintetici;
b)Caracterizai seria d.p.d.v al omogenitii;
c)Calculai coeficientul de asimetrie Pearson i Fisher.
Comentai rezultatele obinute.
Rezolvare.
a) 1.Indicatorii simpli ai variaiei.
1.1.Amplitudinea variaiei:
-absolut: A
a
=x
max
- x
min
=260-190=70 cm
-relativ: % 18 , 32 100
53 , 217
70
100
_
= = =
x
A
A
a
r
1.2.Abaterea variantelor caracteristicii de la media
lor:
-abaterea absolut: .
_
x x d
i a
=
Vom avea:
d
1
=197-217,53=-20,53 cm
d
2
=211-217,53=-6,53 cm
d
3
=225-217,53=7,47 cm
d
4
=239-217,53=21,47 cm
d
5
=253-217,53=35,47 cm
-abterea relativ: . 100
_
=
x
d
d
a
r
Valorile se
determin ca mai sus.
85
2.Indicatorii sintetici ai variaiei:
2.1.Abaterea medie linear:
=
+ + + +
=
=
+ + + +
=
=
cm 63 , 10
30
47 , 35 41 , 64 76 , 59 95 , 97 59 , 61
30
1 47 , 35 3 47 , 21 8 47 , 7 15 53 , 6 3 53 , 20
__
__
i
i i
f
f x x
d
variantele caracteristicii se abat, n medie, cu 63 , 10 cm de la
medie.
Intervalul mediu de variaie se determin astfel:
= + = +
= =
=
a erioar d x
a erioar d x
d x
\
|
=
i
i i
f
f x x
Datele necesare
calculului sunt centralizate n tabelul:
_
x x
i
2
_
|
|
\
|
x x
i
i i
f x x
|
\
|
2
_
-20,53
-6,53
7,47
21,47
35,47
421,48
42,64
55,80
460,96
1258,12
1264,44
639,6
446,4
1382,88
1258,12
Total * 4991,44
86
3.Abaterea medie ptratic (abaterea standard)
89 , 12 38 , 166
2
= = =
Intervalul mediu de variaie calculat pe baza abaterii
standard este:
= + = +
= =
=
a erioar x
a erioar x
x
b)Pentru aprecierea omogenitii vom calcula
coeficientul de variaie:
< = = = % 30 92 , 5 100
53 , 217
89 , 12
100
_
x
v
colectivitatea este
omogen, indicatorii calculai sunt reprezentativi.
b) 1.Coeficientul de asimetrie Pearson:
0 36 , 0
89 , 12
84 , 212 53 , 217
_
> =
o
as
M x
K asimetrie
pozitiv moderat.
2.Coeficientul de asimetrie Fisher.
( )
0 54 , 0
89 , 12
2 , 215 53 , 217 3
_
> =
=
|
\
|
=
e
as
M x
F K
asimetrie pozitiv moderat.
87
Aplicaia 2.
n cadrul operaiunilor de control a calitii produselor
dintr-un lot de 5000 clpari, 250 au fost defeci. S se
determine dispersia i abaterea standard.
Rezolvare.
5 , 0
5000
250
1
= = =
N
f
p
95 , 0
5000
250 5000
=
= q
Determinarea mediei se face cu ajutorul formulei
= = 05 , 0
_
p x lotul controlat conine 5% clpari defecte i
respectiv 95% clpari corespunztori din punct de vedere
calitativ.
Dispersia
0475 , 0 095 , 0 05 , 0
2
= = = pq
Abaterea standard
22 , 0 0475 , 0 = =
Aplicaia 3.
Se dau urmtoarele date privind rezultatele probei
alergarea de vitez 30 m biei, grupa 101, secia de
88
Educaie fizic i sport din cadrul Universitii Constantin
Brncui din Tg-Jiu.
Rezolvare.
Intervale de grupare (secunde) Nr. studeni x
i
x
i
f
i
4,13-4,37
4,37-4,62
4,62-4,90
4,90-5,11
3
17
9
1
4,25
4,493
4,735
4,983
12,75
76,38
42,62
4,98
Total 30 * 136,73
a)S se determine timpul mediu al grupei;
b)S se calculeze mediana i dominanta grupei;
c)S se calculeze amplitudinea, dispersia, coeficientul
de variaie. Interpretare;
d)S se reprezinte grafic seria.
Rezolvare.
a)Determinarea timpului mediu al grupei.
udent secunde/st 56 , 4
30
73 , 136
_
= = =
i
i i
f
f x
x
b)Mediana.
( )
udent secunde/st 55 , 4
17
205 , 0
3 15 37 , 4
2
=
= + =
|
|
\
|
+ =
m
m
m
i
i e
J
K
f
l M
Intervalul median este (4,37-4,62)
Modulul. Intervalul modal este (4,37-4,62)
89
udent secunde/st
53 , 4 25 , 0
8 14
14
37 , 4
2 1
1
=
|
\
|
+
+ =
|
|
\
|
+
+ =
m i o
K l M
c)Amplitudinea variaiei.
-absolut: A
a
=5,11-4,13=0,98 secunde
-relativ: % 49 , 21 100
_
= =
x
A
A
a
r
Disperssia.
028 , 0
2
_
2
=
\
|
=
i
i i
f
f x x
Abaterea standard.
secunde 017
2
= =
Coeficientul de variaie.
< = = = % 30 73 , 3 100
56 , 4
17 , 0
100
_
x
v
colectivitatea este
omogen, media, mediana, dominanta sunt reprezentative.
d)Pentru reprezentarea grafic vom folosi histograma
prin dreptunghiuri:
90
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
4,13 4,37 4,62 4,90 5,11
scara de
reprezentare
0,5 cm Oy=1
student
1 cm Ox=0,25
sec
Aplicatia 4. Se dau urmatoarele date privind lungimea
sriturilor studenilor grupei 202 sport i vrsta acestora.
Analizai importana factorului vrst n variaia lungimii
medii a sriturilor.
Tabel 3. Y-caracteristica secundar (lungimea sriturii), X-
caracteristica principal (vrsta)
Y
X
120-134 134-148 148-162 162-176 176-190 Total
19 1 3 4 - - 8
20 - - 10 7 1 18
21 1 - 2 - 1 4
Total 2 3 16 7 2 30
91
Calculul dispersiilor de grup se face cu ajutorul
formulei :
=
j
ij
j
ij i i
i
f
f y y
2
2
) (
Pentru grupa 1 (19 ani) avem :
cm
f
f y
y
j
ij
j
ij j
25 , 146
8
620 423 127
8
4 155 3 141 1 127
1
=
+ +
=
+ +
= =
j
ij
j
ij i
f
f y y
Pentru grupa 2 ( 20 ani) avem :
cm
f
f y
y
j
ij
j
ij j
162
18
1 183 7 169 10 155
2
=
+ +
= =
lungimea
medie a sriturii grupei 2
77 , 70
18
1 ) 162 183 ( 7 ) 162 169 ( 10 ) 162 155 (
) (
2 2 2
2
2
2
2
=
+ +
=
j
ij
j
ij i
f
f y y
92
Pentru grupa 3 (21 ani ):
cm
f
f y
y
j
ij
j
ij j
155
3
= =
j
ij
j
ij i
f
f y y
Calculul mediei dispersiilor de grup :
04 , 120
2
2
= =
i
i
i
i
i
f
f
Dispersia dintre grupe :
33 , 46
) (
2
0
2
=
i
i
i
i i
f
f y y
cm
f
f y
y
j
j
j
j j
87 , 156
0
= =
j
j
j
j i
f
f y y
Se observ c este verificat regula de aur a adunrii
dispersiilor :
2 2 2
0
+ =
Ponderea factorului esenial de grupare (vrsta) n variaia
total a caracteristicii Y se determin calculnd coeficientul de
determinaie :
% 85 , 27 100
0
2
2
2
= =
R
Ponderea factorilor ntmpltori n variaia total a
caracteristicii va fi :
% 15 , 72 100 1
0
2
2
2
= =
R
Cum
2 2
1 R R > , rezult c vrsta nu este factor
determinant n variaia caracteristicii secundare lungimea
sriturilor.
94
Capitolul VI
Regresia i corelaia statistic
1.Introducere
Fenomenele sociale nu evolueaz independent, ci sunt
n direct legtur cu alte variabile sociale, variabilitatea lor
fiind determinat de aciunea simultan a mai multor factori.
Raporturile de cauzalitate dintre fenomenele sociale pot
fi cuantificate, analizate i interpretate cu ajutorul corelaiei.
Cu ajutorul metodelor statistice specifice putem evidenia
existena raporturilor de cauzalitate dintre fenomene, putem
determina influena fiecrui factor asupra variabilitii globale
a variabilei efect, putem cunoate intensitatea legturilor
cauzale dintre fenomen i putem estima tendinele evolutive ale
corelaiei dintre fenomene. Statistica ofer o serie de metode de
analiz a dependenelor dintre dou sau mai multe fenomene.
Cele mai des uzitate sunt regresia i corelaia. Acestea studiaz
dependena dintre o variabil rezultativ, notat n general cu
95
Y, i una sau mai multe variabile factoriale independente
notate cu X.
Metoda regresiei d posibilitatea cunoaterii formei
analitice a dependenei unei variabile de alte sau alte variabile,
pe cnd corelaia evideniaz gradul, intensitatea cu care o
variabil rezultat este dependent de o alt sau alte variabile
cauz.
2.Clasificarea legturilor statistice.
Legturile statistice se pot clasifica dup mai multe
criterii:
a)dup numrul variabilelor ce alctuiesc cuplul
corelativ avem:
legturi simple, care studiaz dependena dintre o
variabil dependent Y i o singur variabil
independent, factorial x.
Exemplu. Dependena dintre numrul abdomenelor
efectuate i vrsta sportivilor.
legturi multiple, ce studiaz dependena dintre o
variabil rezultativ Y i dou sau mai multe variabile
factoriale x
1,
x
2,
. . ., x
n.
96
Exemplu. Dependena dintre numrul flotrilor i
sexul, vrsta i greutatea sportivilor.
b)Dup semnul legturilor factoriale avem:
legturi directe- cnd variabila factorial x (sau
variabilele factoriale x
1,
x
2,
. . ., x
n
).
Exemplu. Corelaia dintre sritura n nlime i detent.
legturi inverse, cnd variabila rezultativ y se
modific n sens opus modificrii variabilei sau
variabilelor factoriale.
Exemplu. Numrul de flotri i vrsta sportivilor.
c)Dup forma legturilor cauzale deosebim:
legturi lineare n cadrul crora variabila rezultativ y
nregistreaz o tendin linear.
legturi nelineare, n cadrul crora variabilitatea
rezultativ y nregistreaz o tendin curbilinie (
parabolic, exponenial, hiperbolic, etc.)
Cunoaterea tipurilor legturilor statistice este deosebit
de important pentru estimarea tendinelor evolutive ale
fenomenelor efect n strns legtur cu variabilitatea factorilor
determinai.
97
3.Metode elementare de caracterizare a legturilor dintre
variabile.
Principalele metode elementare de analiz a legturilor
dintre variabile sunt: metoda tabelului de corelaie, metoda
grafic, metoda gruprilor i metoda seriilor paralele
independente.
3.1.Metoda tabelului de corelaie
Tabelul de corelaie este tabelul cu dubl intrare folosit
n prezentarea seriilor de distribuie bidimensionale, rolul
variabilei rezultative fiind preluat de caracteristica secunadar
Y, iar cel al variabilei factoriale de caracteristica principal X.
Cu ajutorul acestei metode pot fi reliefate urmtoarele
aspecte:
existena corelaiei este evideniat de modul de
dispunere a frecvenelor f
ij
n cadrul tabelului. Dac
aceste frecvene se concentreaz de-a lungul uneia
dintre diagonalele tabelului nseamn c ntre cele dou
variabile exist corelaie. Dac acestea se dispun haotic
n interiorul tabelului, ntre cele dou variabile nu exist
corelaie.
98
semnul corelaiei, este evideniat de direcia i sensul
deplasrii frecvenelor f
ij
n interiorul tabelului. Dac
acestea se deplaseaz din zona valorilor mici ale
variabilei rezultative Y spre zona valorilor mari pe
msur ce valorile factorialului X cresc, corelaia este
direct. Dac ns frecvenele f
ij
se deplaseaz din zona
valorilor mari ale rezultativei Y spre zona valorilor mici
n timp ce valorile factorialei X cresc, corelaia este
invers.
forma corelaiei. Este dat de forma fiei format de
frecvenele f
ij
.
intensitatea corelaiei. Este evideniat de dimensiunea
fiei frecvenelor f
ij
. Cu ct aceasta este mai ngust cu
att corelaia este mai mare, cu ct fia este mai larg,
cu att intensitatea corelaiei este mai mic. Dac
frecvenele f
ij
se situeaz pe una din diagonalele
tabelului, atunci corelaia este maxim, adic
modificrile variabilei Y sunt determinate exclusiv de
variabila factorial X.
3.2.Metoda grafic.
Presupune folosirea corelogramei n analiza legturii
dintre variabile.
99
Graficul se construiete astfel: pe axa Ox se reprezint
valorile variabilei factoriale X n funcie de scara de
reprezentare aleas, iar pe axa Oy se trec valorile variabilei
rezultative Y. Prin unirea punctelor corespunztoare
coordonatelor xy se obine corelograma.
Cu ajutorul corelogramei se poate reliefa:
a)existena corelaiei. Este evideniat de existena
unghiului format de linia de tendin a corelogramei cu
orizontala. Dac acest unghi are o valoare diferit de 0, atunci
ntre cele dou variabile exist corelaie, dac ns valoarea
acestui unghi este 0, variabilele sunt independente, corelaia
neexistd.
b)sensul corelaiei. Este dat de sensul corelogramei.
Dac punctele xy se dispun pe o corelogram a crei tendin
este ascendent, atunci ntre cele dou variabile exist o
corelaie direct, dac punctele xy se dispun pe o corelogram
descendent, atunci ntre cele dou variabile exist o corelaie
invers.
c)forma corelaiei. Dac oscilaiile corelogramei au
aproximativ aceeai amplitudine, atunci corelaia este linear,
dac amplitudinile acestor oscilaii sunt diferite, sugernd o
schimbare de tendin, atunci corelaia este nelinear, (de tip
parabolic, exponenial, logistic etc.).
100
d)intensitatea corelaiei. Este dat de mrimea
unghiului format de linia de tendin a corelogramei cu
orizontala. Cu ct mrimea acestui unghi este mai mare cu att
corelaia este mai intens. Dac acest unghi este egal cu zero,
atunci ntre cele dou variabile nu exist corelaie.
3.3.Metoda gruprilor
Const n constituirea de grupe omogene n funcie de o
variabil factorial. Pentru fiecare grup astfel constituit se
calculeaz medii pe baza datelor numerice ce caracterizeaz
variabila rezultativ i mrimi relative. Aprecierea existenei i
a formei corelaiei se face prin compararea variabilitii
variabilei factoriale cu indicatorii calculai pentru variabila
rezultativ.
3.4.Metoda seriilor paralel independente
Pe baza datelor numerice ale variabilelor cuplului
corelativ se ordoneaz datele n funcie de caracteristica
factorial Y, cresctor sau descresctor, i se observ modul n
care se aranjeaz valorile rezultativei Y.
Dac variabila factorial X este ordonat cresctor i
variabila rezultativ Y se ordoneaz aproximativ cresctor,
corelaia este direct. Dac variabila Y se ordoneaz
101
aproximativ descresctor, n timp ce variabila X este ordonat
cresctor, corelaia este invers. Dac ns variabila Y nu
nregistreaz o tendin de ordonare, fie cresctoare, fie
descresctoare, n timp ce caracteristica factorial X este
ordonat cresctor, rezult c ntre cele dou variabile nu exist
corelaie.
4.Regresia i corelaia linear simpl
Metodele analitice folosite n aprecierea legturii dintre
variabile sunt regresia i corelaia. Presupunnd c avem un
cuplu corelativ format dintr-o variabil Y i o variabil
factorial X vom avea:
4.1.Regresia linear simpl
Metoda regresiei ofer posibilitatea caracterizrii
legturii de cauzalitate dintre variabile (factoriale i rezultative)
prin intermediul uneia dintre funciile statistico matematice.
n cazul regresiei lineare simple vom folosi o funcie
linear pentru evidenierea legturii dintre cele dou variabile.
Vom avea:
unde ,
i x
bx a Y
i
+ = a i b sunt parametrii de regresie.
102
a-reprezint nivelul funciei de regresie n punctul x=0
(n sens geometric este ordonat la origine). Arat la ce nivel ar
fi ajuns valoarea variabilei rezultative dac toi factorii, mai
puin cel nregistrat, ar fi avut o aciune constant asupra ei.
b-Este numit coeficient de regresie i arat cu ct se
modific, n medie, variabila rezultativ la o modificare cu o
unitate a factorului X. n sens geometric, b reprezint panta
dreptei de regresie. n sens statistic, dac b>0 vom avea
corelaie direct, b<0 corelaie invers, b=0 lips de corelaie.
x
i
-nivelurile variabilei independente (factoriale) X
i
x
Y -nivelurile variabilei dependente (rezultativa) Y
Pentru a determina nivelurile parametrilor a i b i cu
ajutorul lor valorile ajustate ale variabilei Y, se folosete
metoda celor mai mici ptrate. Condiia de minim impus de
aceast metod este:
( ) ( )
i i
i i x i
bx a y Y y
i
min min
2 2
Rezult c:
( )( )
( )( )
=
=
i
i i i
i
i i
x bx a y
bx a y
b
f
a
f
0 2
0 1 2
0
0
103
( )
= + +
= + +
i i
i i
i
i i
i i
i
i
i
x b x a x y
bx a y
0 2 2 2
0 2 2 2
2
+ =
+ =
i i
i
i
i i i
i
i
i
i
x b x a y x
x b na y
2
Pe baza acestui sistem se determin parametrii a i b i
implicit valorile ajustate
i
x
Y .
Regresia simpl linear se folosete atunci cnd avem:
Numr mic de informaii (negrupate) n care se
dau valorile perechii (x
i
,y
i
) sub forma a 2 serii
paralele independente.
Numr mare de informaii.
Sistematizare prin grupare simpl
Dac cuplul corelativ (x
i
,y
i
) are frecvene comune f
i,
vom avea sistemul de ecuaii normale:
+ =
+ =
i i i
i i i i i i i
i i i
i i i i i
f x b f x a f y x
f x b f a f y
2
Dac avem sistematizare prin gruparea combinat (x
i
,
y
i
, f
i
, f
j
, f
ij
), sistemul de ecuaii normale va fi:
104
+ =
+ =
i i i
i i i i
j
ij j i
i j i
i i
i
ij i i
f x b f x a f y x
f x b f a f y
2
4.2.Corelaia linear simpl
Pentru determinarea intensitii corelaiei simple lineare
se folosete coeficientul de corelaie linear al lui Pearson,
coeficient ce se determin ca o medie aritmetic simpl a
produsului abaterilor normale ale valorilor x
i
i y
i
dup
formula:
|
|
|
\
|
|
|
|
\
|
=
y
i
y
i
x
i
ylx
n
y y x x
r
, unde ,
x
_ _
abaterile standard
corespunztoare variabilei rezultative Y i variabilei factoriale
X.
( ) [ ] ( ) [ ]
=
2
2
2
2
/
i i i i
i
i i i i
x y
y y n x x n
y x y x n
r
n practica statistic se folosesc frecvent urmtoarele
formule:
pentru serii de distribuie bidimensionale:
105
( ) [ ] ( ) [ ]
\
|
|
\
|
=
2 2 2 2
y/x
_ _
/
r
sau
j j j j i i i i i i
j i i i ij i i ij
y x
ij i i
x y
f y f y f f x f x f
f y f x f y x f
f
f y y x x
r
r
y/x
[-1,1]
Interpretarea coeficientului Pearson este urmtoarea:
Dac:
r
y/x
>0, legtura este direct;
r
y/x
<0, legtura este invers;
r
y/x
=0, legtur de tip funcional.
Pentru o interpretare ct mai exact, intervalul [-1,1]
poate fi divizat astfel:
0r
y/x
<0,2, legtur foarte slab;
0,2r
y/x
0,5, legtur slab;
0,5 r
y/x
<0,75, legtur de intensitate medie;
0,75 r
y/x
<1, legtur funcional.
Precizare. Coeficientul de corelaie Pearson nu este
indicat n cazul legturilor nelineare, fiind nesemnificativ, n
106
aceste cazuri folosindu-se raportul de corelaie R
y/x
, ca
indicator al legturii dintre variabile. Dac legtura este
linear, putem calcula ambii indicatori, relaia r
y/x
=R
y/x
putndu-se folosi ca test de verificare a linearitii.
5.Regresia i corelaia nelinear simpl
5.1.Regresia nelinear simpl
n cazul regresiei lineare variabilitatea rezultativei Y se
produce n progresie geometric exponenial, etc., tendina
evolutiv a acesteia fiind de tip parabolic, hiperbolic,
exponenial, logaritmic, logistic, etc.
5.1.1.Regresia simpl exponenial
Funcia de regresie este:
unde ,
i
i
x
x
ab Y = a i b parametrii de regresie
b-are caracter de indice mediu i arat modificarea (de
cte ori crete sau scade) variabila rezultativ ca urmare a
modificrii factorialei X.
Logaritmnd ecuaia funciei de regresie vom avea:
b a Y
i
x
log log log + =
Pentru determinarea parametrilor a i b vom folosi
metoda celor mai mici ptrate:
107
( ) ( )
i i
x
i x i
i
i
ab y y y min min
2
2
+ =
+ =
i i
i i
i
i i
i
i
i
i
x b x a y x
x b a u y
b
f
a
f
2
log log log
log log log
0
0
Pe baza sistemului se determin valorile log a i log b,
nivelurile log
i
x
Y , urmnd ca nivelurile estimative
i
x
Y s se
obin prin antilogaritmare.
Interpretare.
Dac:
b1, ntre cele dou variabile exist corelaie;
b=1, variabilele sunt independente;
b>1, corelaia este direct;
b<1, corelaia este invers.
1.2.Regresia simpl parabolic de ordinal 2
Folosirea parabolei de ordin 2 este recomandat n
cazul analizei regresiilor n cadrul crora variabilitatea
rezultativei Y nregistreaz o valoare maxim sau una minim
n zona central, prezentnd unul sau mai multe puncte de
maxim sau de minim ntre valorile extreme.
108
Funcia de regresie este:
,
2
i i x
cx bx a Y
i
+ + = unde a, b, c, x
i
au aceeai
semnificaie ca la modelul linear.
i
x
Y , sunt valorile ajustate.
Pentru determinarea a, b, c se apeleaz la metoda celor
mai mici ptrate. Vom obine sistemul de ecuaii normale :
+ + =
+ + =
+ + =
i
i
i
i
i
i
i
i i
i
i
i
i
i
i
i
i i
i
i
i
i
i
i
x c x b x a y x
x c x b x a y x
x c x b na y
4 3 2 2
3 2
2
Interpretare.
Dac:
b0, exist corelaie ntre variabile;
b>0, corelaia este direct;
b<0, corelaia este invers.
5.1.3.Regresia simpl hiperbolic
Folosirea funciei hiperbolice este recomandat pentru
corelaiile n cadrul crora variabila rezultativ Y nregistreaz
tendine regresive.
109
Funcia de regresie este:
i
x
x
b a Y
i
1
+ = cu aceleai
semnificaii ca cele de mai sus.
Aplicnd metoda celor mai mici ptrate vom obine
sistemul de ecuaii normale:
+ =
+ =
i i i
i
i i
i
i
i
i
i
x
b
x
a
x
y
x
b na y
2
1 1 1
1
5.2.Corelaia nelinear
Pentru determinarea intensitii corelaiei nelineare se
folosete raportul de corelaie. Calcularea raportului de
corelaie presupune descompunerea dispersiei totale a
variabilei rezultative n dispersia valorilor empirice fa de
valorile teoretice calculate cu ajutorul funciei de regresie
i
x
Y i
dispersia valorilor teoretice fa de media valorilor empirice.
Vom avea:
( )
i i
x i x i
Y y y Y y y +
|
\
|
=
|
\
|
_ _
nsumnd i ridicnd la ptrat:
( )
2
2
_
2
_
i i
x i x i
Y y y Y y y +
|
\
|
=
|
\
|
110
Vom avea astfel:
dispersia total:
n
y y
i
y
\
|
=
2
_
2
dispersia sistemic ce msoar variaia datorat
influenei factoriale X:
n
y Y
i
x
x y
\
|
=
2
_
2
/
dispersia rezidual ce msoar variaia neexplicat
( )
n
Y y
i
x i
r y
=
2
2
/
ntre dispersii exist relaia:
2
/
2
/
2
r y x y y
+ =
denumit regula de aur a dispersiilor.
Ponderea influenei factorialei X n variabilitatea
rezultativei Y se determin cu ajutorul coeficientului de
determinaie:
2
2
/ 2
/
y
x y
x y
R
=
Ponderea influenei factorialelor nenregistrate n
modelul de regresie asupra rezultativei Y este dat de
coeficientul de nedeeterminaie
2
2
/ 2
/
y
r y
r y
R
=
111
Dac ,
2
/
2
/ r y x y
R R > atunci variabila factorial este
determinat, indicnd o legtur intens.
1
2
/
2
/
= +
r y x y
R R
( )
\
|
= = = =
2
_
2
2
2
/ 2
/
2
/ /
1 1 1
y y
Y y
R R R
i
x i
y
r y
r y x y x y
i
R
y/x ] 1 , 0 [
Interpretare.
Dac:
1
/
2 2
/
= =
x y y x y
R -legtur funcional ntre cele
dou variabile;
0
/
2 2
/
= =
x y y r y
R -lips de legtur, variabile
independente;
0 0
/
2
/
=
x y x y
R -legtur slab;
0 0
/
2
/
x y x y
R -legtur slab;
1 0
/
2
/
x y r y
R -legtur puternic, intens.
Dac avem ca funcie de regresie o dreapt de ecuaie
i x
bx a Y
i
+ = vom avea:
112
2
2
2
2
2
2
/
1
|
|
|
\
|
|
|
\
|
+
=
|
|
|
\
|
n
y
y
n
y
y x b y a
n
y
y
y x b y a y
R
i
i
i
i
i i
i
i i i
i
i
i
i
i i i
i i i i
x y
n cazul seriilor simple:
( )
( )
=
i
i i
i i
i
i i
ij i i i i
x y
f
f y
f y
f
f y
f y x b f y a
R
2
2
2
/
Pentru distribuii bidimensionale:
( )
( )
+
=
ij
j j
j j
ij
j j
ij j i j j
x y
f
f y
f y
f
f y
f y x b f y a
R
2
2
2
/
n cazul modelului exponenial:
( ) [ ]
\
|
=
2
_
2
2
/
1
y y
ab y
R
i
x
i
x y
i
n cazul modelului parabolic:
113
( ) [ ]
\
|
+ +
=
2
_
2
2
/
1
y y
cx bx a y
R
i
i
i i i
x y
n cazul modelului hiperbolic:
\
|
(
|
|
\
|
+
=
i
i
i
i
i
x y
y y
b
x
a y
R
2
_
2
/
1
1
6.Regresia i corelaia multipl
6.1.Regresia multipl
Regresia multipl poate fi exprimat printr-o funcie
linear sau o funcie curbilinie.
n cazul regresiei lineare multiple o variabil rezultativ
Y este exprimat n funcie de dou sau mai multe variabile
factoriale x
1
, x
2
,, x
n
cu ajutorul funciei lineare:
n n x x x x
x b x b x b a Y
n
+ + + + = ...
2 2 1 1 ,..., , ,
3 2 1
Pentru corelaia hiperbolic vom avea:
n
n x x x x
x
b
x
b
x
b a Y
n
1
...
1 1
2
2
1
1 ,..., , ,
3 2 1
+ + + + =
Pentru corelaia parabolic:
114
2 2
2 2 2 2
2
1 1 1 1 ,..., , ,
...
3 2 1
n n n n x x x x
x c x b x c x b x c x b a Y
n
+ + + + + + + =
Pentru corelaia exponenial:
n
n
x
n
x x x
x x x x
b b b ab Y ...
3 2 1
3 2 1
3 2 1 ,..., , ,
=
6.2.1.Regresia multipl linear
Modelul linear este:
, ...
2 2 1 1 ,..., ,
2 1
n n x x x
x b x b x b a Y
n
+ + + + =
unde:
a este parametrul funciei de regresie ce arat influena
factorilor nenregistrai n model, presupui a avea o aciune
constant;
b
1
,b
2
,,b
n
coeficienii de regresie ce arat modificarea
variabilei Y (rezultativa), cnd una dintre factoriale se modific
cu o unitate.
Pentru a determina parametrii a i b
1
,b
2
,,b
n
vom apela
la metoda celor mai mici ptrate:
( )
i
x i
i
Y y min
2
deci vom avea:
( )
i
n n i
x b x b x b a y min ...
2
2 2 1 1
115
+ + + + =
+ + + =
+ + + =
+ + + + =
2
2 2 1 1
1 1
1
2
1 1
2 2 1
2
1
...
.. .......... .......... .......... .......... .......... .......... ..........
...
.......... .......... .......... .......... .......... .......... ..........
...
...
0
.. ..........
0
0
0
n n n n n n n
n i n i i i i
n n i i i
n n i i
n
x b x x b x x b x a y x
x x b x x b x a x y
x x b x b x a x y
x b x b x b na y
b
f
b
f
b
f
a
f
Determinnd parametrii de regresie vom putea afla
valorile ajustate .
i
x
Y
Interpretare.
Dac:
b
1
,b
2
,,b
n
>0, legtura dintre variabile este direct ;
b
1
,b
2
,,b
n
<0, legtura dintre variabile este invers ;
b
1
,b
2
,,b
n
=0, nu exist legtur ntre variabile.
Modelul bifactorial. Este un caz particular al regresiei
multiple lineare, cuplu corelativ cuprinznd o variabil Y i
dou factoriale X
1
, X
2
.
Folosind metoda celor mai mici ptrate vom avea
sistemul de ecuaii normale:
116
+ + =
+ + =
+ + =
2
2 2 2 1 1 2 1 2
2 1 2
2
1 1 1 1 1
2 2 1 1
x b x x b x a y x
x x b x b x a y x
x b x b na y
i
6.2.Corelaie multipl
Pentru determinarea intensitii corelaiei multiple se
folosete raportul de corelaie multipl:
( )
______
/
2
_
2
.... ,
, /
n 1, i ,
] 1 , 0 [
1 ...
2 1
2 1
= >
\
|
= =
i
k
n
x y
i
x x x i
x x x y
R R
R
y y
Y y
R R
Dac ridicm la ptrat coeficientul de corelaie multipl
obinem coeficientul de determinaie multipl, ce exprim
ponderea influenei simultane a factorialelor incluse n model
asupra variabilei rezultative.
1-R
2
-coeficientul de nedeterminaie. Arat ponderea
influenei simultane a celorlali factori neindui n model.
Fie x
1
, x
2
dou variabile factoriale independente. Avem:
2
/
2
/
2
, /
2 1 2 1
x y x y x x y
R R R + =
Dar cum pentru legturi lineare:
117
2
/
2
/ , /
2
/
2
/
2
, /
2
/
2
/ , / / /
2 1 2 1 2 1 2 1
2 1 2 1
x y x y x x y x y x y x x y
x y x y x x y x y x y
r r R r r R
r r R r R
+ = + =
+ = =
Cum ns, n practic variabilele factoriale sunt de cele
mai multe ori independente, vom folosi formula:
2
/
/ / /
2
/
2
/
/
2 1
2 1 2 1 2 1
2 , 1
1
2
x x
x x x y x y x y x y
x x y
r
r r r r r
R
+
=
7.Corelaia parial
Pentru determinarea intensitii legturii cauzale dintre
variabila rezultativ Y i o singur variabil factorial X, cu
excluderea influenei celorlalte factoriale se folosete corelaia
parial. Pentru aceasta se folosesc coeficienii de corelaie
parial care, pentru un cuplu corelativ cu trei variabile se
calculeaz cu ajutorul formulelor:
pentru corelaia parial dintre Y i X
1
:
2
/
2
/
/ / /
, /
2 1 2
2 1 2 1
2 1
1 1
x x x y
x x x y x y
x x y
r r
r r r
r
=
pentru corelaia parial dintre Y i X
2
:
2
/
2
/
2 / / /
, /
2 1 1
1 2 2
1 2
1 1
x x x y
x x x y x y
x x y
r r
r r r
r
=
118
8.Corelaia rangurilor
Coeficientul de corelaie a rangurilor se utilizeaz
pentru analiza legturilor statistice ntre variabile calitative,
pentru analiza legturilor statistice dintre dou variabile
cantitative pentru care nu se cunosc date suficiente pentru a se
stabili forma legturii, sau pentru analiza corelaiei dintre o
variabil cantitativ i una calitativ. Valorile variabilelor sunt
nlocuite cu numerele de ordine (rangurile) acestora, ordonate
cresctor sau descresctor. Prin rang se nelege locul pe care l
ocup valorile x
i
sau y
i
n cadrul irurilor din care acestea fac
parte, ordonate cresctor sau descresctor.
Pentru calculul coeficientului de corelaie a rangurilor
se folosesc formulele lui Spearman i Kendall.
8.1.Coeficientul de corelaie a rangurilor Spearman
Se calculeaz cu ajutorul formulei:
n n
d
C
i
S
=
3
2
6
1 ,
unde:
d
i
-este diferena de rang (numr de ordine) ntre
variabilele corelate pentru aceeai unitate statistic.
n-numrul perechilor corelative.
119
] 1 , 1 [
s
c , c
s
are aceeai semnificaie cu cea a coeficientului
lui Pearson.
8.2.Coeficientul de corelaie a rangurilor Kendall
Se calculeaz cu ajutorul formulei:
( )
( )
=
i
i i K
Q P S
n n
S
C : iar , unde ,
1
2
P
i
-numrul rangurilor superioare rangului curent pentru
variabila dependent;
Q
i
-numrul rangurilor inferioare rangului curent pentru
variabila dependent.
] 1 , 1 [
K
C
Coeficientul de corelaie a rangurilor Kendall are
aceeai semnificaie cu cea a coeficientului de corelaie simplo
linear Pearson. Dac pentru aceleai date se calculeaz ambii
coeficieni vom avea totdeauna:
C
K
< C
S
n analiza corelaiei rangurilor se poate utiliza
corelograma rangurilor. Modul de construcie al acesteia este:
pe axa Ox se vor trece valorile rangurilor variabilei
factoriale;
pe axa Oy se trec trece valorile rangurilor variabilei
rezultative;
120
din dreptul diviziunilor de pe axa Ox se ridic
perpendiculare, iar din dreptul diviziunilor de pe axa
Oy se duc paralele la Ox, obinndu-se o reea dubl
uniform constituit din n
2
ptrele ;
diagonalele reelei sintetizeaz corelaia, direct sau
invers-maxim.
corelograma empiric se obine prin unirea punctelor
din reea corespunztoare x
i
y
i
din cele dou iruri de
ranguri.
Corelograma rangurilor evideniaz sensul i nivelul
estimativ al intensitii corelaiei.
9.Aplicaii
Aplicaia 1. Se dau urmtoarele date:
Grupa 101 102 103 104 105 106 107 108 109 110
Achiz.
Echip.
Sportiv
2 3 5 7 8 9 11 13 16 20
Niv.
Total
cheltuieli
(mld. lei)
15 13 12 11 5 6 7 9 14 15
Carcaterizai dependena dintre cele dou variabile.
121
Rezolvare.
Din reprezentarea grafic a datelor se observ c
legtura dintre cele dou variabile este cel mai bine aproximat
cu ajutorul funciei parabolice:
2
i i x
cx bx a Y
i
+ + =
Datele necesare calculului sunt prezentate n tabelul
urmtor:
x
i
y
i
x
i
2
x
i
3
x
i
y
i
x
i
2
y
i
x
i
4
2 15 4 8 30 60 16
3 13 9 27 39 117 81
5 12 25 125 60 300 625
7 11 49 343 77 539 2401
8 5 64 512 40 320 4096
9 6 81 729 54 486 6561
11 7 121 1331 77 847 14641
13 9 169 2197 117 1521 28561
16 14 256 4096 224 3584 65536
20 15 400 8000 300 6000 160000
T 94 107 1178 17368 1018 13774 282518
Determinarea parametrilor a, b, c se realizeaz cu
ajutorul metodei celor mai mici ptrate. Vom obine sistemul:
+ + =
+ + =
+ + =
i
i
i
i
i
i
i
i i
i
i
i
i
i
i
i
i i
i
i
i
i
i
i
x c x b x a y x
x c x b x a y x
x c x b na y
4 3 2 2
3 2
2
122
+ + =
+ + =
+ + =
c b a
c b a
c b a
282518 17358 1178 13774
17358 1178 94 1018
1178 94 10 107
Soluia sistemului este:
a=17,83 , b=-1.90, c=0,09
Deci vom avea :
2
2
09 , 0 90 , 1 83 , 17
i i i i x
x x cx bx a Y
i
+ = + + =
Pentru caracterizarea tipului de legtur dintre cele
dou variabile, se folosete raportul de corelaie :
( )
\
|
=
2
_
2
/
1
y y
Y y
R
i
x i
x y
i
7 , 10
10
107
__
= = =
n
y
y
i
miliarde lei, este nivelul mediu al
cheltuielilor pe ntreprindere.
( )
77 , 0 1
2
_
2
/
=
|
\
|
y y
Y y
R
i
x i
x y
i
ceea ce indic o legtur ntre
cele dou variabile.
Aplicaia 2.Se dau urmtoarele date:
Valorile factorialei X 20 30 40 50 60
Valorile rezultativei Y 90 80 100 120 110
123
Determinai i interpretai coeficientul de corelaie a
rangurilor Spearman i coeficientul rangurilor Kendall.
Rezolvare.
n tabelul urmtor sunt sistematizate datele necesare
calculului.
X Y R
x
R
y
d
i
= R
x
- R
y
d
i
2
P Q S=P-Q
20 90 1 2 -1 1 3 1 2
30 80 2 1 1 1 3 0 3
40 100 3 3 0 0 2 0 2
50 120 4 5 -1 1 0 1 -1
60 110 5 4 1 1 0 0 0
* * * * *
= 4
2
i
d
* * 6
Coeficientul Sperman.
( )
0 8 , 0
1 25 5
4 6
1
6
1
3
2
> =
=
n n
d
C
i
S
, deci corelaia este
direct i de intensitate mare.
Coeficientul lui Kendall.
( )
0 6 , 0
20
12
1
2
> = =
=
n n
S
C
K
, cu aceeai interpretare ca a
coeficientului Spearman.
Aplicaia 3. Se dau datele:
Coeficientul de corelaie linear (R): 0,957;
124
Dispersia pentru variabila factorial: 224,1009;
Abaterea standard pentru variabila rezultativ: 1598,12;
Determinai, interpretai i alegei rezultatul corect care
vizeaz coeficientul de corelaie linear (b):
a. -45,5; b. 102,233; c. 0,4; d. -67
Rezolvare.
0 164 , 102
97 , 14
12 , 1598 957 , 0
> =
= =
y
x
r
b
=
t
t e
f
f f
unde:
f
e
= frecvena real;
f
t
=frecvena teoretic, care se calculeaz dup
stabilirea gradelor de libertate (notate cu f), ce arat numrul
frecvenelor teoretice care trebuie calculate:
f=(r-1)(c-1)
r=numrul rndurilor
c=numrul coloanelor
n cazul nostru f=(2-1)(3-1)=2
Deci, vom calcula frecvena teoretic a 2 celule,
celelalte valori determinndu-le n funcie de acestea.
128
n cazul nostru calculm f
t
pentru celula 1 i 2 cu
formula
general
f
total
a coloan total nd a r total
t
=
15
105
45 35
f
: avem 2 celula
24
105
45 56
f
: avem 1 celula
2
1
t
t
=
=
=
=
Pentru
Pentru
Se trec aceste frecvene n tabel, ntre paranteze,
urmnd s calculm celelalte frecvene astfel:
Pentru celula 3:
ft
1
+ ft
2
+ ft
3
=45 (reprezint totalul sportivilor de categoria I)
24+ 15+ ft
3
=45, astfel ft
3
=45-24-15=9
Pentru celula 4:
ft
1
+ ft
4
=56 (reprezint totalul sportivilor din centrul A)
24+ft
4
=56, astfel ft
4
=56-24=32
Pentru celula 5:
ft
2
+ ft
5
=35 (reprezint totalul sportivilor din centrul B)
15+ft
5
=35, astfel ft
5
=35-15=20
Pentru celula 6:
129
ft
3
+ ft
6
=21 (reprezint totalul sportivilor din centrul C)
9+ft
6
=21, astfel ft
6
=21-9=11
Rzultatele adunrii frecvenelor empirice i frecvenelor
teoretice coincid, lucru normal.
Observm c avem calculate toate datele din formula
(1).
Astfel:
( ) ( ) ( ) ( ) ( )
( ) ( )
7 , 4 ~
20
25
32
1
15
25
24
64
12
12 - 12
20
20 - 15
32
32 - 33
9
9 - 9
15
15 - 20
24
24 - 16
2 2
2 2 2 2 2
2
+ + + = + +
+ + + =
=
t
t e
f
f f