Documente Academic
Documente Profesional
Documente Cultură
1. Gruparea datelor
nj = n ; fj = 1
De multe ori frecvenţele relative se exprimã procentual şi, în acest caz vom avea:
F*( x ) =
Pentru a evidenţia configuraţia datelor de sondaj, repartiţiile acestora pot fi
reprezentate şi cu ajutorul unor grafice, dintre care utilizate în mod curent sunt: histograma şi
poligonul frecvenţelor.
În cazul histogramei într-un sistem rectangular de axe sunt trecute valorile
frecvenţelor pe axa ordonatelor şi valorile limitelor claselor pe axa absciselor, diagrama obţinutã
fiind sub forma unor dreptunghiuri ale cãror înãlţimi reprezintã frecvenţele claselor.
Având trasatã histograma, poligonul frecvenţelor se poate obţine prin unirea
mijloacelor laturilor superioare ale dreptunghiurilor.
Funcţia de repartiţie empiricã se reprezintã grafic înscriind pe una din axele de
coordonate valorile frecvenţelor relative cumulate, iar pe cealaltã axã valorile limitelor
superioare ale intervalelor de grupare, obţinându-se o diagramă.
Exemplu
Nr Vârsta Media ani Salariu
crt școală februarie 2020
1 F 25 8,42 3850
2 F 27 9,25 3186
3 F 26 7,25 3196
4 M 27 9,00 6153
5 M 29 6,36 2542
6 F 26 8,64 3167
7 F 37 7,67 4239
8 F 29 6,65 3185
9 M 35 7,69 3185
10 M 44 7,64 3218
11 M 28 8,34 3591
12 M 27 9,12 3185
13 M 37 8,36 3218
14 M 51 6,12 2972
15 M 30 9,54 5429
16 M 33 8,60 5618
17 M 28 9,32 4239
18 M 32 8,21 2358
19 M 37 8,45 3218
20 F 39 8,41 3158
21 M 31 9,83 6153
22 M 28 9,91 3185
23 M 25 7,45 4239
24 F 37 8,91 3942
25 F 41 8,48 4239
26 M 38 9,32 3218
27 M 50 8,85 2972
28 F 46 6,75 3218
29 F 26 9,54 2972
30 F 29 8,36 6153
31 M 31 8,35 2972
32 M 30 9,12 3548
33 M 27 8,41 3698
34 F 26 8,45 4521
35 F 30 9,32 4698
36 M 29 9 4526
37 M 28 7,56 5618
38 F 31 7,45 4239
39 F 33 8,85 3196
40 M 32 9,12 6153
41 M 45 7,54 3548
42 M 26 7,69 5618
43 M 23 8,91 4569
44 F 24 6,75 5412
45 M 30 8,35 3698
Prelucrare primară
grupa/clasa numar
studenți (ni)
[23 - 27) 9
[27 - 31) 16
[31 - 35) 7
[35 – 39) 6
[39 – 43) 2
[43 – 47) 3
[47 – 51] 2
grupa numar
studenți
[2358 - 2900) 2
[2900 – 3442) 18
[3442 – 3984) 7
[3984 – 4526) 6
[4526 – 5068) 3
[5068 – 5610) 2
[5610 - 6153] 7
Gruparea combinată
- Intre o caracteristică nenumerică (sex) și o caracteristică numerică (salariul)
Salariul
2358 - 2900 – 3442 – 3984 – 4526 – 5068 – 5610 -
2900 3442 3984 4526 5068 5610 6153
fete 0 8 2 4 1 1 1
băieți 2 10 5 2 2 1 6
Total 2 18 7 6 3 2 7
Metoda grafică este utilizată în teoria și practica statistică atât pentru prezentarea unor
date statistice, cât și ca instrument de analiză și interpretare a fenomenelor studiate. Astfel,
analiza și generalizarea rezultatelor presupune de cele mai multe ori utilizarea reprezentărilor
grafice. Într-o accepție generală, graficele constau în exprimarea datelor statistice din tabele prin
linii sau puncte, figuri geometrice, hărți, simboluri și alte mijloace specifice. Reprezentările
grafice se întâlnesc în aproape toate sectoarele de activitate. Acestea se explică și prin faptul că
graficele au calitatea de a prezenta într-o formă simplă, atrăgătoare și sugestivă trăsăturile
esențiale ale fenomenelor în condiții determinate de spațiu și timp.
În statistica social-economică, graficele au următoarele scopuri:
o interpretarea vizuală a raportului de mărime dintre doi sau mai mulți indicatori
statistici;
o interpretarea densității de repartiție a frecvențelor fenomenelor înregistrate într-o
cercetare statistică concretă;
o interpretarea structurii și mutațiilor de structură, privite în dinamică sau pe plan
teritorial;
o interpretarea formelor de realizare a interdependențelor dintre două sau mai multe
variabile statistice;
o interpretarea tendințelor de dezvoltare a fenomenelor studiate în dinamică pentru
etapa dată;
o popularizarea datelor statistice cu privire la gradul de dezvoltare a fenomenelor
considerate în dinamică sau teritorial.
Reprezentările grafice sunt utilizate în statistica social-economică fie ca o metodă de
prezentare a rezultatelor cercetărilor statistice, fie ca mijloc de alegere a metodelor și procedeelor
de calcul statistic, diferențiate în raport cu particularitățile de manifestare a fenomenelor studiate.
Realizarea corectă a unui grafic statistic presupune cunoașterea și utilizarea
corespunzătoare a următoarelor elemente : titlul graficului, rețeaua graficului, scara de
reprezentare, notele explicative inclusiv legenda și sursa informațiilor utilizate.
a) Titlul graficului trebuie să fie scurt, clar, concis și să corespundă cu titlul tabelului
statistic. În titlu se sugerează ce relații trebuie interpretate vizual pe baza graficului respectiv.
b) Rețeaua graficului are rol de a ușura identificarea în plan a punctelor care reprezintă
mărimile variabilelor reprezentate pe grafic. Aceasta este formată din linii paralele orizontale,
verticale, oblice, cercuri concentrice și sectoare de cerc.
c) Scara de reprezentare se alege ținând cont de ordinul de mărime al indicatoarelor de
reprezentat, de gradul și forma de variație dintre ei și scopul urmărit.
d) Notele explicative și legendele se utilizează pentru a interpreta corect graficul. Notele
explicative apar atunci când este necesar să se atragă atenția asupra aspectelor metodologice ale
calculării indicatorilor reprezentați sau asupra modului de prezentare a lor în grafic. Aceste note
sunt de două feluri : note generale și note speciale. Legendele reprezintă explicarea concisă a
semnelor convenționale, hașurilor și culorilor utilizate.
e) Sursa de informații a datelor din grafic este obligatorie în toate cazurile, când se
utilizează date reale. Este trecută în afara spațiului diagramei și trebuie să cuprindă toate
elementele de identificare a izvorului informației respective.
În concluzie, formele de reprezentare grafică utilizate în statistica social-economică sunt
extrem de numeroase, ceea ce impune alegerea cu discernământ a acelora care sunt mai adecvate
conținutului indicatorilor și pot sugera cu ușurință tendințele de manifestare a fenomenelor
studiate. Reprezentările grafice se utilizează în statistică pentru prezentarea rezultatelor sau ca
mijloc de analiză a formelor de manifestare a fenomenelor, în vederea aplicării diferențiate a
metodelor de calcul statistic.
Exemplu:
Gruparea studenților după sex. Reprezentări grafice
Grupa Număr
Feminin 17
Masculin 28
Total 45
30
25
20
Număr studenți
15
10
0
Feminin Masculin
Feminin
0 5 10 15 20 25 30
NUMĂR
STUDENȚI
grupa numar
studenți
23 - 27 9
27 - 31 16
31 - 35 7
35 – 39 6
39 – 43 2
43 – 47 3
47 – 51 2
Figura 3. Histograma
Histograma
18
16
Număr studenți
14
12
10
8
6
4
2
0
23 - 27 27 - 31 31 - 35 35 – 39 39 – 43 43 – 47 47 – 51
Frcvența absolută
12
10
8
6
4
2
0
23 - 27 27 - 31 31 - 35 35 – 39 39 – 43 43 – 47 47 – 51
0.40
0.35
0.30
Frecvența relativă
0.25
0.20
0.15
0.10
0.05
0.00
23 - 27 27 - 31 31 - 35 35 – 39 – 43 – 47 –
39 43 47 51
Figura 5a. Frecvența relativă
0.40
0.35
0.30
Frecvența relativă
0.25
0.20
0.15
0.10
0.05
0.00
23 - 27 27 - 31 31 - 35 35 – 39 39 – 43 43 – 47 47 – 51
1.00
0.80
0.60
0.40
0.20
0.00
23 27 27 31 31 35 35 39 39 43 43 47 47 51
Feminin
Masculin
În vederea studierii unei variabile aleatoare sau pentru compararea mai multor
variabile aleatoare este necesarã caracterizarea mulţimii valorilor acestora cu ajutorul unor
mãrimi numerice reprezentative, numite valori tipice. Dintre acestea valoarea medie, mediana şi
valoarea mod sunt mai des folosite pentru evidenţierea tendinţei centrale de grupare, iar
dispersia, abaterea medie pãtraticã , coeficientul de variaţie, momentele de ordin superior, sunt
folosite pentru descrierea împrãştierii şi reprezentãrilor grafice ale repartiţiilor.
3.1. Valoarea medie a unei variabile aleatoare X , notatã M(X) este definitã dupã
cum urmeazã:
- M( X ) =
unde: - xi – valoarea variabilei
- pi –probabilitatea de apariție a variabilei
3.2. Cuantila de ordinul este definitã drept valoarea x a v.a. X pentru care
F( x ) = P( X < x ) =
Cuantila de ordinul 1/2 se numeşte medianã (Me) şi deci :
P( X < Me ) = P( X > Me ) = 1/2
În cazul unei v.a. discrete X , notând cu { xi } mulţimea ordonatã a valorilor sale,
mediana poate coincide cu valoarea centralã şi, în acest caz, Me este unicã şi bine definitã, sau
poate fi cuprinsã într-un interval [ xk , x k +1 ] care poartã denumirea de interval median.
3.3. Valoarea mod (Mo) este acea valoare a v.a. X care este cea mai probabilã.
Dacã v.a. X este discretã, Mo corespunde valorii cu cea mai mare probabilitate,
iar dacã v.a. X este continuã, Mo corespunde valorii pentru care densitatea de probabilitate este
maximã.
Repartiţia care are douã sau mai multe maxime se numeşte plurimodalã.
Mr =
unde: - ni - frecvenţa absolutã corespunzãtoare valorii xi;
- xi’ - valoarea centralã a clasei i;
- n - frevcenţa cumulatã pe întreaga repartiţie.
r =
unde: - ni - frecvenţa absolutã corespunzãtoare valorii xi;
- xi’ - valoarea centralã a clasei i;
- n - frevcenţa cumulatã pe întreaga repartiţie;
- - media aritmeticã de sondaj.
3.6. Dispersia [D2( X ) ; 2 ] unei v.a. X reprezintã momentul centrat de ordinul 2 adicã
media pãtratului abaterii [ X - M( X )]
- D2 ( X ) =
În cazul folosirii dispersiei de sondaj ca estimaţie a dispersiei pentru întrega populaţie din
care a fost extras eşantionul, atunci trebuie utilizatã relaţia corectatã:
s2 =
În cazul valorilor de sondaj grupate într-un numãr de k clase cu amplitudini egale, având
în vedere transformarea :
xi* = (xi’ - C ) / a
se obţine :
unde: - a - amplitudinea claselor;
- xi’ - valoarea centralã a clasei i ;
- C - valoare constantã pentru care obişnuit se alege valoarea centralã a clasei cu
frecvenţa maximã;
- ni - frecvenţa absolutã corespunzãtoare valorii xi;
- n - frevcenţa cumulatã pe întreaga repartiţie;
- - media aritmeticã de sondaj.
3.7. Abaterea medie pãtraticã [ D(X)] , sau abaterea standard a unei v.a. este
definitã ca rãdãcina pãtratã a dispersiei variabilei :
______ ___
D( X ) = D ( X ) = 2 =
2
100 [%]
În general, asimetria unei repartiţii este pozitivã sau negativã dupã cum 3 este
pozitiv sau negativ.
Pentru o repartiţie simetricã 1 = 0 .
ni clasei
xi’
23 - 27 9 25 1457 625 5625 140625 -7,37 488,85 -3602,84
27 - 31 16 29 1457 841 13456 390224 -3,37 181,71 -612,36
31 - 35 7 33 1457 1089 7623 251559 0,63 2,78 1,75
35 – 39 6 37 1457 1369 8214 303918 4,63 128,62 595,52
39 – 43 2 41 1457 1681 3362 137842 8,63 148,95 1285,47
43 – 47 3 45 1457 2025 6075 273375 12,63 478,55 6044,10
47 – 51 2 49 1457 2401 4802 235298 16,63 553,11 9198,28
Total 45 1457 49157 1732841 1982,58 12909,91
4 ¿ ¿ ¿
grupa ni ∙ ( x i−x ) xi ni* x i 2 ni* x i
,
23 - 27 26552,93 -1 9 -9
27 - 31 2063,66 0 0 0
31 - 35 1,10 1 7 7
35 – 39 2757,24 2 24 12
39 – 43 11093,61 3 18 6
43 – 47 76336,92 4 48 12
47 – 51 152967,4 5 50 10
3
Total 271772,9 158 38
2
1. Valoarea medie
k
1
x= ∑ ni ∙ x ,i
n i=1
1
x= ∙1457=32 ,37
45
2. Cuantila de ordinul 2, (mediana)
Mr =
Momentul de ordin 2
k
1 ,2 1
M2 = ∙ ∑ ni|x i| = ∙ 49157=1092,38
n i=1 45
Momentul de ordin 3
k
1 ,3 1
M3 = ∙ ∑ ni|x i| = ∙ 1732841=38507,58
n i=1 45
5. Momentul centrat de ordinul r ( r )
r =
n i=1 45
n i=1 45
Momentul centrat de ordin 4
k
1 1
μ4 = ∙ ∑ ni ( x ,i−x ) = ∙ 271772 , 92=6039,39
4
n i=1 45
6. Dispersia
xi* = (xi’ - C ) / a
C= 29 – centrul clasei cu frecvența maximă
S2=
16
44 (158−
1444
45 ) =45 , 78
7. Abaterea medie pãtraticã [ D(X)] , sau abaterea standard
______ ___
D( X ) = D ( X ) = 2 =
2
D( X ) = √ 45 , 78=6 ,76
2
286 , 88
β 1= 3
=0 , 85
45 , 78
6039 ,39
β 2= 2
=2, 88
45 ,78
11. Excesul ( E )
E = 2 – 3
E = - 0,12