Suport Teoretic Proiect - Partea I

I.
Prelucrarea datelor statistice
1. Gruparea datelor
Prin grupare înțelegem separarea colectivității pe grupe omogene. O grupă este

considerată statistic omogenă, dacă unitățile din aceeași clasă sau subclasă prezintă variații
minime fie ca nivel de dezvoltare, fie ca formă de manifestare. În statistică, această variație
minimă este considerată rezultatul influenței factorilor aleatori.
Gruparea statistică se regăsește în toate domeniile și uneori poate sa aibă caracter oficial
și permanent, întâlnindu-se astfel în publicațiile statistice.
Metoda grupării este considerată ca metodă de bază a cercetării statistice și este utilizată
pentru trecerea de la o masă amorfă de date individuale diferite la o omogenizare a acestora.
Gruparea datelor statistice este o operațiune de sistematizare a prezentării materialului

statistic obținut prin observare care constă în separarea colectivității cercetate în grupe omogene
de unități după variația uneia sau mai multor caracteristici din programul observării.
Realizarea unei grupări utile pentru îndeplinirea scopului cercetării statistice impune cu
necesitate să fie respectate urmatoarele condiții:
- alegerea caracteristicii sau caracteristicilor care vor sta la baza efectuarii operațiunii de
grupare în stransă legatură cu obiectivele de cunoaștere și respectiv cu particularitățile sau
specificul colectivității supuse cercetarii. Cea mai potrivită caracteristică de grupare este aceea
care este în stransă interdependență cu esența fenomenului studiat și permite identificarea
tipurilor calitative care există în cadrul colectivității;
- în cazul caracteristicilor de grupare numerice se stabilește sau se calculează mărimea
intervalului de grupare și respectiv numărul de grupe care vor fi constituite, astfel incât să se
obțină cea mai bună formă de distribuire a unitaților statistice pe grupe;
- toate operațiunile de natură metodologică, implicate cu efectuarea unei grupări a datelor
statistice, trebuie sa fie subordonate atingerii obiectivelor grupării, și anume:
a - cunoașterea structurii colectivității statistice și respectiv a tipurilor calitative existente
în colectivitate la un anumit moment sau într-o anumită perioadă de timp,
b - cunoașterea modificarilor de natură structurală, care s-au produs de la un segment de
timp la altul,
c - identificarea unor posibile corelații care se formează între caracteristicile utilizate la
grupare, forma și direcția acestor corelații și, într-o anumită masura, obținerea unei informații
orientative privind intensitatea corelației.
După conținutul caracteristicii de grupare, putem întâlni:
a) grupări cronologice – caracteristica acestei grupări este o variabilă de timp
(ex. gruparea interprinderilor comerciale după anul înființării).
b) grupări teritoriale – acestea sunt utilizate pentru separarea unităților
colectivității în grupe omogene după un criteriu de spațiu.
c) grupările atributive – acestea se utilizează pentru toate caracteristicile
care au alcătuit programul observării ; se împart în caracteristici calitative (clasificări) și
cantitative (numerice). Grupările pot fi simple sau combinate. Cele simple se obțin
atunci când utilizăm o singură caracteristică de grupare, iar cele combinate, când se folosesc
împreună mai multe caracteristici de grupare. Se va recurge la grupări simple pentru toate
variabilele cuprinse în programul observării și al grupării combinate pentru interpretarea
interdependenței statistice dintre fenomene. Gruparea combinată presupune să avem minim două
caracteristici de grupare și alegerea ordinii de grupare pe baza relației de interdependență dintre
variabile. Grupările combinate se pot efectua nu numai pentru variabile numerice, ci și pentru
cele calitative. Astfel, clasificările se utilizează deobicei sub formă de grupări combinate, care să
includă pe lângă variabila calitativă și o altă variabilă numerică interdependentă. În concluzie,
metoda grupării este strict necesară pentru caracterizarea statistică a fenomenelor, ea aplicându-
se în raport cu scopul cercetării și funcției sale de cunoaștere.
Efectuarea unei grupări a datelor statistice, după o caracteristică exprimată numeric,

implică parcurgerea unor etape de lucru, după cum urmează:
1 - se calculează amplitudinea variației, respectiv se cuantifică diferența dintre valoarea
cea mai mare a caracteristicii și valoarea cea mai mica, A = x max - xmin
2 - în funcție de mărimea amplitudinii variației, se stabilește numarul de grupe în care va fi

împartită colectivitatea. In aceasta etapă de lucru se optează, de regulă, pentru constituirea unui
număr mai mare de grupe comparativ cu numărul care se presupune că este necesar pentru a
cunoaște structura și respectiv tipurile calitative existente în colectivitate. Această operațiune este
legată în mod strict de logica persoanei care realizează gruparea;
k  1 + 3,322 log n
unde n – numărul de valori
3 - se calculează mărimea (lungimea) intervalului de grupare prin raportarea amplitudinii
variației la numarul de grupe convenit a fi constituite. Dacă se consideră necesar, pentru a
calcula marimea intervalului, se poate folosi formula propusă de Sturges,
x max −x min xmax −x min

a= =
k 1+3,322 log n
4 - se scriu intervalele de grupare astfel:

[xmin xmin+a)
[xmin+a xmin+2a)
.....................................................
[xmin + (k — 1).a xmin + k a)
Limitele intervalelor vor avea același grad de precizie ca și datele grupate (același număr
de zecimale), primul interval începe chiar de la valoarea minima.
5 - se repartizează unitatile statistice pe intervalele de grupare stabilite. Aceasta este o

etapă intermediară de lucru care oferă o primă forma de sistematizare a materialului statistic pe
grupe și în continuare, să permită efectuarea unei regrupari prin asocierea a două sau mai multor
intervale de grupare;
6 - se procedează la efectuarea unor regrupari, eventual în mai multe variante, pentru a
avea posibilitatea formularii celei mai bune decizii de alegere a gruparii care oferă soluția
considerată optimă, în vederea caracterizarii colectivitatii statistice cercetate sau pentru
efectuarea unor prelucrari ulterioare. Regruparea poate fi efectuată fie pe intervale de mărimi
egale fie pe intervale de mărimi neegale după cum se consideră că acestea raspund mai bine
scopului propus.
Numãrul datelor care aparţin unei grupe (clase) se numeşte frecvenţã absolutã a
clasei iar raportul dintre frecvenţa absolutã şi numãrul total de valori poartã denumirea de
frecvenţã relativã.
Dacã frecvenţa absolutã a grupei (clasei) j este n j , atunci frecvenţa relativã a
acestei grupe (clase) va fi : fj = nj / n , iar pentru toate clasele vom avea :
nj = n ; fj = 1
De multe ori frecvenţele relative se exprimã procentual şi, în acest caz vom avea:
fj = ( nj / n ) 100 [%] ; fj = 100 [%]

Fiind dat un numãr real oarecare x , dacã n x reprezintã numãrul valorilor de sondaj
ale variabilei studiate X care sunt mai mici sau egale cu X , iar n este volumul eşantionului,
atunci funcţia empiricã de repartiţie F*(x) , va fi datã de relaţia :
F*( x ) = nx / n , x  IR
În cazul grupãrii datelor pe clase, notând cu x j centrele claselor, funcţia empiricã
de repartiţie va fi datã de relaţia :
F*( x ) =
Pentru a evidenţia configuraţia datelor de sondaj, repartiţiile acestora pot fi
reprezentate şi cu ajutorul unor grafice, dintre care utilizate în mod curent sunt: histograma şi
poligonul frecvenţelor.
În cazul histogramei într-un sistem rectangular de axe sunt trecute valorile
frecvenţelor pe axa ordonatelor şi valorile limitelor claselor pe axa absciselor, diagrama obţinutã
fiind sub forma unor dreptunghiuri ale cãror înãlţimi reprezintã frecvenţele claselor.
Având trasatã histograma, poligonul frecvenţelor se poate obţine prin unirea
mijloacelor laturilor superioare ale dreptunghiurilor.
Funcţia de repartiţie empiricã se reprezintã grafic înscriind pe una din axele de
coordonate valorile frecvenţelor relative cumulate, iar pe cealaltã axã valorile limitelor
superioare ale intervalelor de grupare, obţinându-se o diagramă.
Exemplu
Nr Vârsta Media ani Salariu
crt școală februarie 2020
1 F 25 8,42 3850
2 F 27 9,25 3186
3 F 26 7,25 3196
4 M 27 9,00 6153
5 M 29 6,36 2542
6 F 26 8,64 3167
7 F 37 7,67 4239
8 F 29 6,65 3185
9 M 35 7,69 3185
10 M 44 7,64 3218
11 M 28 8,34 3591
12 M 27 9,12 3185
13 M 37 8,36 3218
14 M 51 6,12 2972
15 M 30 9,54 5429
16 M 33 8,60 5618
17 M 28 9,32 4239
18 M 32 8,21 2358
19 M 37 8,45 3218
20 F 39 8,41 3158
21 M 31 9,83 6153
22 M 28 9,91 3185
23 M 25 7,45 4239
24 F 37 8,91 3942
25 F 41 8,48 4239
26 M 38 9,32 3218
27 M 50 8,85 2972
28 F 46 6,75 3218
29 F 26 9,54 2972
30 F 29 8,36 6153
31 M 31 8,35 2972
32 M 30 9,12 3548
33 M 27 8,41 3698
34 F 26 8,45 4521
35 F 30 9,32 4698
36 M 29 9 4526
37 M 28 7,56 5618
38 F 31 7,45 4239
39 F 33 8,85 3196
40 M 32 9,12 6153
41 M 45 7,54 3548
42 M 26 7,69 5618
43 M 23 8,91 4569
44 F 24 6,75 5412
45 M 30 8,35 3698
Prelucrare primară
Nr. crt Variabile statistice Modalitati de manifestare Intervalul de manifestare

1 sex 2 categorii F, M
2 vârsta 21 variante [23, 51]
3 media 30 variante [7,12; 9,91]
4 salariul 23 variante [2358; 6153]
Gruparea funcție de sex:

Grupa Număr
Feminin 17
Masculin 28
Total 45
Gruparea funcție de vârstă:

A= 51-23 = 28
k  1 + 3,322 log n = 6,48  7
x max −x min 51−23

a= = =4
7 7
grupa/clasa numar
studenți (ni)
[23 - 27) 9
[27 - 31) 16
[31 - 35) 7
[35 – 39) 6
[39 – 43) 2
[43 – 47) 3
[47 – 51] 2
Gruparea funcție de salariu:

A= 6153-2358 = 3795
k  1 + 3,322 log n = 6,48  7
x max−x min 6153−2358

i= = =542
7 7
grupa numar
studenți
[2358 - 2900) 2
[2900 – 3442) 18
[3442 – 3984) 7
[3984 – 4526) 6
[4526 – 5068) 3
[5068 – 5610) 2
[5610 - 6153] 7
Gruparea combinată
- Intre o caracteristică nenumerică (sex) și o caracteristică numerică (salariul)
Salariul
2358 - 2900 – 3442 – 3984 – 4526 – 5068 – 5610 -
2900 3442 3984 4526 5068 5610 6153
fete 0 8 2 4 1 1 1
băieți 2 10 5 2 2 1 6
Total 2 18 7 6 3 2 7
- Intre o caracteristică nenumerică (sex) și o caracteristică numerică (vârsta)

Vârsta
23 - 27 27-31 31-35 35-39 39-43 43-47 47-51
fete 6 4 2 2 2 1 0
băieți 3 12 5 4 0 2 2
Total 9 16 7 6 2 3 2
- Intre două caracteristici caracteristici numerice (vârsta și salariul)

Vârsta
Salariul 23 - 27 27-31 31-35 35-39 39-43 43-47 47-51
[2358 - 0 1 1 0 0 0 0
2900)
[2900 – 3 4 2 4 1 2 2
3442)
[3442 – 1 4 0 1 0 1 0
3984)
[3984 – 2 1 1 1 1 0 0
4526)
[4526 – 1 2 0 0 0 0 0
5068)
[5068 – 1 1 0 0 0 0 0
5610)
[5610 - 1 3 3 0 0 0 0
6153]
Total 9 16 7 6 2 3 2
Frecvența absolută și frecvența relativă
 Gruparea funcție de sex:

Număr
Grupa ni fi Fx
Feminin 17 0,38 0,38
Masculin 28 0,62 1
Total 45 1
 Gruparea funcție de vârstă:

grupa număr
studenți, ni fi Fx
[23 - 27) 9 0,20 0,20
[27 - 31) 16 0,36 0,56
[31 - 35) 7 0,16 0,71
[35 – 39) 6 0,13 0,84
[39 – 43) 2 0,04 0,89
[43 – 47) 3 0,07 0,96
[47 – 51] 2 0,04 1,00
Total 45
 Gruparea funcție de salariu:

grupa numar
studenți, ni fi Fx
[2358 - 2900) 2 0,04 0,04
[2900 – 3442) 18 0,40 0,44
[3442 – 3984) 7 0,16 0,60
[3984 – 4526) 6 0,13 0,73
[4526 – 5068) 3 0,07 0,80
[5068 – 5610) 2 0,04 0,84
[5610 - 6153] 7 0,16 1,00
Total 45
2. Reprezentarea grafică a datelor statistice
Metoda grafică este utilizată în teoria și practica statistică atât pentru prezentarea unor
date statistice, cât și ca instrument de analiză și interpretare a fenomenelor studiate. Astfel,
analiza și generalizarea rezultatelor presupune de cele mai multe ori utilizarea reprezentărilor
grafice. Într-o accepție generală, graficele constau în exprimarea datelor statistice din tabele prin
linii sau puncte, figuri geometrice, hărți, simboluri și alte mijloace specifice. Reprezentările
grafice se întâlnesc în aproape toate sectoarele de activitate. Acestea se explică și prin faptul că
graficele au calitatea de a prezenta într-o formă simplă, atrăgătoare și sugestivă trăsăturile
esențiale ale fenomenelor în condiții determinate de spațiu și timp.
În statistica social-economică, graficele au următoarele scopuri:
o interpretarea vizuală a raportului de mărime dintre doi sau mai mulți indicatori
statistici;
o interpretarea densității de repartiție a frecvențelor fenomenelor înregistrate într-o
cercetare statistică concretă;
o interpretarea structurii și mutațiilor de structură, privite în dinamică sau pe plan
teritorial;
o interpretarea formelor de realizare a interdependențelor dintre două sau mai multe
variabile statistice;
o interpretarea tendințelor de dezvoltare a fenomenelor studiate în dinamică pentru
etapa dată;
o popularizarea datelor statistice cu privire la gradul de dezvoltare a fenomenelor
considerate în dinamică sau teritorial.
Reprezentările grafice sunt utilizate în statistica social-economică fie ca o metodă de
prezentare a rezultatelor cercetărilor statistice, fie ca mijloc de alegere a metodelor și procedeelor
de calcul statistic, diferențiate în raport cu particularitățile de manifestare a fenomenelor studiate.
Realizarea corectă a unui grafic statistic presupune cunoașterea și utilizarea
corespunzătoare a următoarelor elemente : titlul graficului, rețeaua graficului, scara de
reprezentare, notele explicative inclusiv legenda și sursa informațiilor utilizate.
a) Titlul graficului trebuie să fie scurt, clar, concis și să corespundă cu titlul tabelului
statistic. În titlu se sugerează ce relații trebuie interpretate vizual pe baza graficului respectiv.
b) Rețeaua graficului are rol de a ușura identificarea în plan a punctelor care reprezintă
mărimile variabilelor reprezentate pe grafic. Aceasta este formată din linii paralele orizontale,
verticale, oblice, cercuri concentrice și sectoare de cerc.
c) Scara de reprezentare se alege ținând cont de ordinul de mărime al indicatoarelor de
reprezentat, de gradul și forma de variație dintre ei și scopul urmărit.
d) Notele explicative și legendele se utilizează pentru a interpreta corect graficul. Notele
explicative apar atunci când este necesar să se atragă atenția asupra aspectelor metodologice ale
calculării indicatorilor reprezentați sau asupra modului de prezentare a lor în grafic. Aceste note
sunt de două feluri : note generale și note speciale. Legendele reprezintă explicarea concisă a
semnelor convenționale, hașurilor și culorilor utilizate.
e) Sursa de informații a datelor din grafic este obligatorie în toate cazurile, când se
utilizează date reale. Este trecută în afara spațiului diagramei și trebuie să cuprindă toate
elementele de identificare a izvorului informației respective.
În concluzie, formele de reprezentare grafică utilizate în statistica social-economică sunt
extrem de numeroase, ceea ce impune alegerea cu discernământ a acelora care sunt mai adecvate
conținutului indicatorilor și pot sugera cu ușurință tendințele de manifestare a fenomenelor
studiate. Reprezentările grafice se utilizează în statistică pentru prezentarea rezultatelor sau ca
mijloc de analiză a formelor de manifestare a fenomenelor, în vederea aplicării diferențiate a
metodelor de calcul statistic.
Exemplu:
Gruparea studenților după sex. Reprezentări grafice
Grupa Număr
Feminin 17
Masculin 28
Total 45
Figura 1. Reprezentare grafică a grupării simple prin coloane
30
25
20
Număr studenți
15
10
0
Feminin Masculin
Figura 2. Reprezentare grafică a grupării simple prin benzi/bare

Masculin
Feminin
0 5 10 15 20 25 30
NUMĂR
STUDENȚI
Gruparea studenților funcție de vârstă. Reprezentări grafice
grupa numar
studenți
23 - 27 9
27 - 31 16
31 - 35 7
35 – 39 6
39 – 43 2
43 – 47 3
47 – 51 2
Figura 3. Histograma
Histograma
18
16
Număr studenți
14
12
10
8
6
4
2
0
23 - 27 27 - 31 31 - 35 35 – 39 39 – 43 43 – 47 47 – 51
Figura 4. Poligonul frecvențelor

Poligonul frecvențelor
18
16
14
Frcvența absolută
12
10
8
6
4
2
0
23 - 27 27 - 31 31 - 35 35 – 39 39 – 43 43 – 47 47 – 51
Figura 5. Frecvența relativă
0.40
0.35
0.30
Frecvența relativă
0.25
0.20
0.15
0.10
0.05
0.00
23 - 27 27 - 31 31 - 35 35 – 39 – 43 – 47 –
39 43 47 51
Figura 5a. Frecvența relativă
0.40
0.35
0.30
Frecvența relativă
0.25
0.20
0.15
0.10
0.05
0.00
23 - 27 27 - 31 31 - 35 35 – 39 39 – 43 43 – 47 47 – 51
Figura 6. Frecvența cumulată

1.20
1.00
0.80
0.60
0.40
0.20
0.00
23 27 27 31 31 35 35 39 39 43 43 47 47 51
Figura 7. Grafic de structură
Feminin
Masculin
3. Valori tipice de sondaj
În vederea studierii unei variabile aleatoare sau pentru compararea mai multor
variabile aleatoare este necesarã caracterizarea mulţimii valorilor acestora cu ajutorul unor
mãrimi numerice reprezentative, numite valori tipice. Dintre acestea valoarea medie, mediana şi
valoarea mod sunt mai des folosite pentru evidenţierea tendinţei centrale de grupare, iar
dispersia, abaterea medie pãtraticã , coeficientul de variaţie, momentele de ordin superior, sunt
folosite pentru descrierea împrãştierii şi reprezentãrilor grafice ale repartiţiilor.
3.1. Valoarea medie a unei variabile aleatoare X , notatã M(X) este definitã dupã
cum urmeazã:
- M( X ) =
unde: - xi – valoarea variabilei
- pi –probabilitatea de apariție a variabilei
Dacã x1 , x2 , ... , xn sunt valorile individuale obţinute în urma examinãrii

elementelor dintr-un eşantion de volum n atunci media aritmeticã de sondaj este definitã de
relaţia, [3] :
Dacă valorile de sondaj sunt grupate într-un număr de k clase se utilizează relaţia :
unde: ni - frecvenţa absolutã corespunzãtoare valorii xi ( sau xi’ );

fi - frecvenţa relativã corespunzãtoare valorii xi ( sau xi’ );
xi’ - valoarea centralã a clasei i;
xi - valorile individuale ale v.a.;
k - numãrul de clase.
3.2. Cuantila de ordinul  este definitã drept valoarea x a v.a. X pentru care
F( x ) = P( X < x ) = 
Cuantila de ordinul 1/2 se numeşte medianã (Me) şi deci :
P( X < Me ) = P( X > Me ) = 1/2
În cazul unei v.a. discrete X , notând cu { xi } mulţimea ordonatã a valorilor sale,
mediana poate coincide cu valoarea centralã şi, în acest caz, Me este unicã şi bine definitã, sau
poate fi cuprinsã într-un interval [ xk , x k +1 ] care poartã denumirea de interval median.
În cazul valorilor ordonate relaţiile de calcul sunt :

Me* = x[(n + 2 ) / 2 ] dacã n este impar
Me* = [ xn / 2 + x(n + 1 ) / 2 ] / 2 dacã n este par
unde: - n - volumul eşantionului;
Pentru valorile grupate într-un numãr de k clase, mediana se obţine prin
interpolarea liniarã a frecvenţelor în intervalul median:
Me* = xi-me + ( n / 2 - nc-me ) a / ni-me
unde: - xi-me este limita inferioarã a intervalului median;
- ni - me - frecvenţa absolutã corespunzãtoare intervalului median;
- n =  ni - frecvenţa cumulatã pe întreaga repartiţie;
- nc - me = - frecvenţa cumulatã pânã la intervalul median;

- a - amplitudinea claselor.
3.3. Valoarea mod (Mo) este acea valoare a v.a. X care este cea mai probabilã.
Dacã v.a. X este discretã, Mo corespunde valorii cu cea mai mare probabilitate,
iar dacã v.a. X este continuã, Mo corespunde valorii pentru care densitatea de probabilitate este
maximã.
Repartiţia care are douã sau mai multe maxime se numeşte plurimodalã.
3.4. Momentul de ordinul r (Mr) al unei v.a. X reprezintã media variabilei x r şi

este definitã de:
- Mr = M( Xr ) = dacã v.a. X este discretã

Media unei v.a. este momentul de ordinul 1 : M1 = M( X )
Dacã datele de sondaj sunt grupate în clase de amplitudini egale atunci folosim relaţia :
Mr =
unde: - ni - frecvenţa absolutã corespunzãtoare valorii xi;
- xi’ - valoarea centralã a clasei i;
- n - frevcenţa cumulatã pe întreaga repartiţie.
3.5. Momentul centrat de ordinul r ( r ) reprezintã momentul de ordinul r al

abaterii [ X - M( X ) ] , adicã :
r = M [ X - M( X )]r
În cazul datelor de sondaj grupate în clase de amplitudini egale, avem relaţia:
r =
unde: - ni - frecvenţa absolutã corespunzãtoare valorii xi;
- xi’ - valoarea centralã a clasei i;
- n - frevcenţa cumulatã pe întreaga repartiţie;
- - media aritmeticã de sondaj.
3.6. Dispersia [D2( X ) ; 2 ] unei v.a. X reprezintã momentul centrat de ordinul 2 adicã
media pãtratului abaterii [ X - M( X )]
- D2 ( X ) =
În cazul folosirii dispersiei de sondaj ca estimaţie a dispersiei pentru întrega populaţie din
care a fost extras eşantionul, atunci trebuie utilizatã relaţia corectatã:
s2 =
În cazul valorilor de sondaj grupate într-un numãr de k clase cu amplitudini egale, având
în vedere transformarea :
xi* = (xi’ - C ) / a
se obţine :
unde: - a - amplitudinea claselor;
- xi’ - valoarea centralã a clasei i ;
- C - valoare constantã pentru care obişnuit se alege valoarea centralã a clasei cu
frecvenţa maximã;
- ni - frecvenţa absolutã corespunzãtoare valorii xi;
- n - frevcenţa cumulatã pe întreaga repartiţie;
- - media aritmeticã de sondaj.
3.7. Abaterea medie pãtraticã [ D(X)] , sau abaterea standard a unei v.a. este
definitã ca rãdãcina pãtratã a dispersiei variabilei :
______ ___
D( X ) =  D ( X ) =  2 = 
2
Spre deosebire de dispersie, abaterea medie pãtraticã se exprimã în aceleaşi unitãţi

de mãsurã ca şi v.a .X.
3.8. Coeficientul de variaţie ( V ) al unei v.a. X este definit de relaţia :
şi este folosit mai ales sub forma:
100 [%]
3.9. Coeficientul de asimetrie ( 1 ), folosit ca indicator al gradului de asimetrie al unei

repartiţii este definit prin relaţia :
În general, asimetria unei repartiţii este pozitivã sau negativã dupã cum 3 este
pozitiv sau negativ.
Pentru o repartiţie simetricã 1 = 0 .
3.10. Coeficientul de boltire ( 2 ) , folosit ca indicator al gradului de înclinaţie al

pantei unei curbe a densitãţii de repartiţie unimodale , în vecinãtatea valorii mod , este definit
prin relaţia :
Pentru comparaţie se foloseşte de obicei curba repartiţiei normale , pentru care 2

= 3.
Dacã 2 < 3 , repartiţia se numeşte platicurticã şi curba este mai turtitã spre vârf
dacât curba repartiţiei normale, care este o curbã simetricã ( fig. 8) .
Dacã 2 > 3 , repartiţia se numeşte leptocurticã şi curba este mai ascuţitã spre
vârf decât curba normalã.
3.11. Excesul ( E ) , definit prin relaţia :

E = 2 - 3
este un indicator pentru aprecierea boltirii unei repartiţii faţã de repartiţia normalã.
Exemplu de calcul
grupa numar valoare , 2 2 3 xi’- x 2 3

ni ∙ ( x i−x ) ni ∙ ( x i−x )
studenți, central a
ni ∙ x i |x ,i| | |
ni x ,i | |
ni x ,i
, ,
ni clasei
xi’
23 - 27 9 25 1457 625 5625 140625 -7,37 488,85 -3602,84
27 - 31 16 29 1457 841 13456 390224 -3,37 181,71 -612,36
31 - 35 7 33 1457 1089 7623 251559 0,63 2,78 1,75
35 – 39 6 37 1457 1369 8214 303918 4,63 128,62 595,52
39 – 43 2 41 1457 1681 3362 137842 8,63 148,95 1285,47
43 – 47 3 45 1457 2025 6075 273375 12,63 478,55 6044,10
47 – 51 2 49 1457 2401 4802 235298 16,63 553,11 9198,28
Total 45 1457 49157 1732841 1982,58 12909,91
4 ¿ ¿ ¿
grupa ni ∙ ( x i−x ) xi ni* x i 2 ni* x i
,
23 - 27 26552,93 -1 9 -9
27 - 31 2063,66 0 0 0
31 - 35 1,10 1 7 7
35 – 39 2757,24 2 24 12
39 – 43 11093,61 3 18 6
43 – 47 76336,92 4 48 12
47 – 51 152967,4 5 50 10
3
Total 271772,9 158 38
2
1. Valoarea medie
k
1
x= ∑ ni ∙ x ,i
n i=1
1
x= ∙1457=32 ,37
45
2. Cuantila de ordinul 2, (mediana)
Me = xi-me + ( n / 2 - nc-me ) a / ni-me
intervalul median 27-31, deci xi-me = 27

n=45
nc-me = 9
a=4
ni-me=16
4
Me = 27+(22,5-9)∙ = 30,37
16
3. Valoarea mod (Mo)
Mo=29 – centrul clasei cu frecvența maximă
4. Momentul de ordinul r (Mr)
Mr =
Momentul de ordin 2
k
1 ,2 1
M2 = ∙ ∑ ni|x i| = ∙ 49157=1092,38
n i=1 45
Momentul de ordin 3
k
1 ,3 1
M3 = ∙ ∑ ni|x i| = ∙ 1732841=38507,58
n i=1 45
5. Momentul centrat de ordinul r ( r )
r =
Momentul centrat de ordin 2

k
1 1
μ2= ∙ ∑ n i ( x ,i−x ) = ∙1982,58=44,05
2
n i=1 45

k
1 1
μ3= ∙ ∑ ni ( x ,i− x ) = ∙ 12909 , 91=286,88
3
n i=1 45
k
1 1
μ4 = ∙ ∑ ni ( x ,i−x ) = ∙ 271772 , 92=6039,39
4
n i=1 45
6. Dispersia
xi* = (xi’ - C ) / a
C= 29 – centrul clasei cu frecvența maximă
S2=
16
44 (158−
1444
45 ) =45 , 78
7. Abaterea medie pãtraticã [ D(X)] , sau abaterea standard
______ ___
D( X ) =  D ( X ) =  2 = 
2
D( X ) = √ 45 , 78=6 ,76
8. Coeficientul de variaţie ( CV ) al unei v.a. X este definit de relaţia :

C 100
6 ,76
CV= 100=20 , 88 %
32, 37
9. Coeficientul de asimetrie ( 1 )
2
286 , 88
β 1= 3
=0 , 85
45 , 78
10. Coeficientul de boltire ( 2 )
6039 ,39
β 2= 2
=2, 88
45 ,78
11. Excesul ( E )
E = 2 – 3
E = - 0,12

Suport Teoretic Proiect - Partea I

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Suport Teoretic Proiect - Partea I

Încărcat de

Drepturi de autor:

Formate disponibile

I.

Prelucrarea datelor statistice

Prin grupare înțelegem separarea colectivității pe grupe omogene. O grupă este

Gruparea datelor statistice este o operațiune de sistematizare a prezentării materialului

Efectuarea unei grupări a datelor statistice, după o caracteristică exprimată numeric,

2 - în funcție de mărimea amplitudinii variației, se stabilește numarul de grupe în care va fi

x max −x min xmax −x min

4 - se scriu intervalele de grupare astfel:

5 - se repartizează unitatile statistice pe intervalele de grupare stabilite. Aceasta este o

fj = ( nj / n ) 100 [%] ; fj = 100 [%]

Nr. crt Variabile statistice Modalitati de manifestare Intervalul de manifestare

Gruparea funcție de sex:

Gruparea funcție de vârstă:

x max −x min 51−23

Gruparea funcție de salariu:

x max−x min 6153−2358

- Intre o caracteristică nenumerică (sex) și o caracteristică numerică (vârsta)

- Intre două caracteristici caracteristici numerice (vârsta și salariul)

 Gruparea funcție de sex:

 Gruparea funcție de vârstă:

 Gruparea funcție de salariu:

2. Reprezentarea grafică a datelor statistice

Figura 1. Reprezentare grafică a grupării simple prin coloane

Figura 2. Reprezentare grafică a grupării simple prin benzi/bare

Gruparea studenților funcție de vârstă. Reprezentări grafice

Figura 4. Poligonul frecvențelor

Figura 5. Frecvența relativă

Figura 6. Frecvența cumulată

Figura 7. Grafic de structură

3. Valori tipice de sondaj

Dacã x1 , x2 , ... , xn sunt valorile individuale obţinute în urma examinãrii

unde: ni - frecvenţa absolutã corespunzãtoare valorii xi ( sau xi’ );

În cazul valorilor ordonate relaţiile de calcul sunt :

- nc - me = - frecvenţa cumulatã pânã la intervalul median;

3.4. Momentul de ordinul r (Mr) al unei v.a. X reprezintã media variabilei x r şi

- Mr = M( Xr ) = dacã v.a. X este discretã

3.5. Momentul centrat de ordinul r ( r ) reprezintã momentul de ordinul r al

Spre deosebire de dispersie, abaterea medie pãtraticã se exprimã în aceleaşi unitãţi

3.8. Coeficientul de variaţie ( V ) al unei v.a. X este definit de relaţia :

şi este folosit mai ales sub forma:

3.9. Coeficientul de asimetrie ( 1 ), folosit ca indicator al gradului de asimetrie al unei

3.10. Coeficientul de boltire ( 2 ) , folosit ca indicator al gradului de înclinaţie al

Pentru comparaţie se foloseşte de obicei curba repartiţiei normale , pentru care 2

3.11. Excesul ( E ) , definit prin relaţia :

grupa numar valoare , 2 2 3 xi’- x 2 3

Me = xi-me + ( n / 2 - nc-me ) a / ni-me

intervalul median 27-31, deci xi-me = 27

Momentul centrat de ordin 2

Momentul centrat de ordin 3

8. Coeficientul de variaţie ( CV ) al unei v.a. X este definit de relaţia :

10. Coeficientul de boltire ( 2 )

S-ar putea să vă placă și