Sunteți pe pagina 1din 38

8

CARACTERISTICI (VARIABILE) STATISTICE



1. Individ, populaie statistic i eantion

Noiunile statistice elementare sunt cele de:
- individ (statistic) i
- populaie (statistic).
Indivizii (statistici) sunt entiti elementare purttoare de NSUIRI:
- una e COMUN i exprim natura nsi a entitilor respective, - atributul prin care
entitile sunt i desemnate ca atare (Ex.: oameni, grupuri umane, ri, familii,
aruncri ale zarului, extrageri ale unui numr de bile dintr-o urn, msurtori, cu
un anumit instrument, ale unei nsuiri fizice, trageri la int cu o arm etc.);
- celelalte nsuiri sunt VARIABILE, adic au forme de manifestare diferite, la nivelul
entitilor diferite, i tocmai studierea lor reclam instrumentele statistice.
(Ex. indivizii umani difer dup aspecte fizice, psihologice sau sociale, familiile
dup numr de membri, venit global, dotrile gospodriei, etc.)
Idee: sociologia vizeaz, n principal, aspecte sociale, psihologia, cele psihologice.
POPULAIA STATISTIC: reprezint mulimea indivizilor de aceeai natur, care sunt
obiectul unei investigaii de tip statistic.
Idee: Indivizii statistici i populaiile statistice NU se refer doar la oameni ci i la:
- obiecte i mulimi de obiecte (piese fabricate n serie)
- aciuni umane (aruncarea zarului, msurarea repetat a unui obiect, tragerea la int)
NUMRUL INDIVIZILOR ce formeaz mulimea statistic poate fi foarte diferit.
Tehnicile statistice se aplic, de obicei, populaiilor mari, pentru ca:
- modul de manifestare al nsuirilor studiate s fie relevant pentru populaie
- modificare a Nr. de indivizi s nu produc schimbri eseniale ale structurii de
ansamblu (salariaii dintr-un birou: venit, vechime n munc, nivel de studii)
Corrado Gini: STATISTICA e o metod de studiere a fenomenelor colective sau de mas.
Fenomene colective desemneaz:
- fenomene ce rezult din agregarea unei multitudini de manifestri individuale
- Nu fenomene ce rezult din interaciuni umane, care pot avea loc i n grupuri mici
Numrul mare e necesar:
1) pentru a se putea aplica rezultatele teoriei probabilitilor:
- aspecte empirice ale fenomenelor se leag de modele matematice (legi probabilistice)
- se poate trece de la noiunea de frecven relativ la cea de probabilitate.
2) pentru a se putea forma gruprile multiple de entiti, cu scopul de a se controla
simultan ct mai muli factori (fenomenele sociale, au, simultan mai multe cauze)
Obs. Totui, n calcule statistice, VOLUMUL populaiei intervine rareori ca o valoare minim.
Relevana, expresivitatea i, uneori, chiar nelesul mrimii calculate sunt afectate negativ
de o dimensiune prea redus a populaiei.
Doar prelucrrile statistice cele mai simple sunt posibile pe populaii de mici dimensiuni.
9
VOLUMUL POPULAIEI trebuie s fie cu att mai ridicat:
- cu ct intrm n analize statistice mai sofisticate,
- cu ct implicm simultan n analize mai multe nsuiri ale indivizilor
Dimensiunea populaiei poate fi:
- dat de la bun nceput (judeele rii, ntreprinderile dintr-o localitate, etc.)
- determinat dup nevoile studiului (Nr. de trageri la int cu o arm)
Idee: dac populaia este dat de la bun nceput, i e de mici dimensiuni, ne vom
limita la instrumente statistice simple. Dac e mare, putem face analize i pe sub-
populaii, putem folosi modaliti sofisticate de analiz.
Studiul populaiilor mari ridic probleme practice, de culegere i prelucrare a informaiei.
Procedurile de selecie bazate pe teoria probabilitilor rezolv aceste dificulti:
- informaia este culeas doar de la o submulime de indivizi - numit eantion
- concluziile sunt generalizabile la ntreaga populaie.
Cercetrile pot fi:
- exhaustive dac datele sunt culese de la ntreaga populaie
- selective daca datele sunt culese dintr-un eantion.
Implicaia distinciei asupra instrumentelor statistice folosite are dou dimensiuni.
- formulele de calcul pentru indicatorii statistici pot diferi uor n cazul eantionrii
- Se aplic teste de semnificaie pentru a estima eroarea produs prin calcularea unei
valori n cadrul unui eantion, n loc s o facem pe ntreaga populaie.
Obs.: teste de semnificaie mbrac forme diferite dup cum este vorba de eantioane
mari sau de eantioane mici (sub 30 de indivizi). Populaiile trebuie s fie mereu MARI.
Reprezentativitatea eantionului de volum dat nu depinde de mrimea populaiei.
Obs.: problematica semnificaiei statistice apare numai n cazul cercetrilor selective.



2. Caracteristici calitative i cantitative

Idee: numai diversitatea formelor de manifestare a unei nsuiri i confer acesteia un
interes din partea cercettorului.
Dac toate obiectele ar fi identice, dup o nsuire, aceasta n-ar mai reclama analiza:
- modului n care se manifest unii sau alii i, mai ales,
- motivului pentru care unii se manifest ntr-un fel i alii n alt fel.
Idee: Cu ct o caracteristic mbrac forme mai diverse, cu att ea capt o valoare de
cunoatere mai ridicat, ceteris paribus.
Exist 4 forme sub care pot fi surprinse manifestrile nsuirilor unitilor statistice.
Aceste forme sunt cunoscute n domeniul sociologiei, sub numele de scale.
Idee: Expresia scale de msur (SUA) utilizeaz abuziv termenul de msur atunci
cnd se aplic tuturor genurilor de scale.
10
1. SCALA NOMINAL: prin denumiri (nume) se marcheaz strile unei caracteristici.
(Ex.: pentru caracteristica sex, strile sunt masculin i feminin, pentru
caracteristica stare civil, strile sunt necstorit, cstorit, divorat, vduv, etc.)
Aplicarea unei scale nominale la o mulime de indivizi nsemn o clasificare a acestora,
n sensul c fiecare treapt a scalei determin o clas sau o categorie de indivizi.
Ex. Caracteristici care sunt evaluate pe scale nominale:
CARACTERISTICA INDIVIZII CLASELE SCALEI
STAREA CIVIL PERSOANE
NECSTORIT
CSTORIT
VDUV
DIVORAT
OCUPAIA PERSOANE
OCUPATE
AGRICULTOR
MUNCITOR
LUCRTOR N SERVICII
INTELECTUAL
FUNCIONAR
ALT OCUPAIE
AEZAREA RILOR
PE CONTINENTE
RILE LUMII
ASIA
AFRICA
AMERICA
EUROPA
AUSTRALIA I OCEANIA
OPIUNEA POLITIC PERSOANE
SUPUSE UNEI
ANCHETE
PARTIDUL A
PARTIDUL B
PARTIDUL C
PARTIDUL D
ALT PARTID
NU ARE

Rezultatul aplicrii unei scale nominale la o populaie statistic l constituie o
caracteristic nominal sau (SUA) o variabil nominal.
CONDIIA FUNDAMENTAL cerut scalei nominale pentru a genera o variabil statistic:
- este cerina elementar a oricrei clasificri
- fiecare individ statistic s poat fi ncadrat n una i numai una dintre clase
2. SCALA ORDINAL presupune n plus fa de cea nominal, o relaie de ordine
ntre elementele scalei (clase, categorii) n sensul matematic al termenului.
Notnd cu litere mari clasele scalei i cu semnul < relaia de ordine proprietile
relaiei de ordine sunt urmtoarele:
a) Oricare ar fi dou elemente ale scalei, A i B, vom avea A<B sau B<A.
b) ntre dou elemente diferite ale scalei, A i B, nu pot exista simultan relaiile A < B
i B <A. n cazul n care s-ar ntmpla aa ceva, elementele ar trebui s coincid.
c) Dac A < B i B < C, atunci A < C. E cunoscuta proprietate de tranzitivitate a
relaiei de ordine.
11
Ex.: variantele de rspuns la unele ntrebri ale unui chestionar. Iat cteva exemple:
O ntrebare de opinie: Ce prere avei despre activitatea primarului localitii dvs.?.
Variante :Foarte bun, Bun, Nici bun nici proast, Proast, Foarte proast.
O ntrebare de satisfacie: Suntei mulumit sau nemulumit de serviciul dvs.?.
Variante: Mulumit, i mulumit i nemulumit, Nemulumit.
O ntrebare factual :Ct de des obinuii s mergei la cinematograf?
Variante: Cel puin o dat pe sptmn, Cel puin o dat pe lun, Mai rar, Niciodat.
Caracteristici evaluate pe scala ordinal se pot obine i prin alte mijloace de
investigare, cum este observaia, experimentul, interviul sau analiza documentelor.
Pentru scalele ordinale, simbolurile claselor trebuie s evidenieze ordinea claselor:
- prin folosirea numerelor naturale: 1, 2, 3 n mod direct sau
- prin folosirea numerelor naturale ca indici ai altor simboluri. (A
1
, A
2
, A
3
, etc.)
OBS.: E vorba de numere care desemneaz ordinea elementelor i NU se preteaz la
operaii aritmetice nu pot fi cuprini n indici mai compleci (Ex. 3 aici nseamn AL
TREILEA i nu trei mere sau trei kg)
Caracteristicile statistice ordinale se obin cnd se aplic o scal ordinal unei populaii
statistice sau unui eantion, indivizii repartizndu-se n clasele scalei.
CARACTERISTICILE CALITATIVE sunt constituite din:




3. SCALE DE MSUR (metrice) conduc la caracteristici cantitative (variabile statistice):
- fiecare individ din populaie e caracterizat de o valoare numeric, n funcie de acea
proprietate
- valoarea numeric s-a obinut prin operaia de msurare
- numrul atribuit red intensitatea de manifestare a nsuirii pentru acel individ
Numrul astfel atribuit este un numr cardinal i el.



Valorile obinute pe scale de intervale:
- NU pot fi mprite unele la altele cci rapoartele se modific cu schimbarea originii.
- anumii indicatori statistici nu au sens pentru valori obinute pe scale de intervale.
Obs.: Marea majoritate a indicatorilor statistici sunt utilizabili chiar dac variabila nu
are un zero absolut (utilizeaz diferene ntre valori, nu valori absolute).
Conc.: diferenele dintre valori trebuie s reproduc fidel deosebirile dintre manifestri.
Ex.: Nu conteaz c rspunsul lui Ion e notat cu 10 sau cu 20, ci important este ca
diferena dintre notele lui Ion i Nicolae, comparat cu diferena dintre notele lui
Vasile i Gheorghe, s redea corect deosebirea de pregtire dintre cel dou cupluri.
Idee: scalele de intervale realizeaz exact aceast condiie.
- caracteristicile nominale
- caracteristicile ordinale
distincia dintre clase este de tip calitativ
nu se msoar intensitatea de manifestare a variabilei

Scalele metrice
Scala de intervale valoarea 0 e convenional (Celsius)
Scala de rapoarte 0 natural (scala venitului, anii de munc, etc.)
12
Distincia caracteristici calitative - cantitative duce la diviziunea tehnicilor statistice:
- statistica nonparametric (a caracteristicilor calitative) i
- statistica parametric (a caracteristicilor cantitative).
VARIABIL CATEGORIAL = orice variabil statistic, indiferent de tipul de scal utilizat,
avnd un numr (relativ mic) de categorii.
Acest lucru se ntmpl:
- ntotdeauna cnd folosim scale nominale
- frecvent n cazul scalelor ordinale
- uneori pentru scale metrice (dac valorile sunt puine sau grupate pe cteva intervale).
Obs.: dac scala e metric dar cu puine intervale de grupare:
- intervalele sunt interpretate ca nite categorii
- dispare din analiz ideea de valoare numeric ataat indivizilor statistici i
- rmne n atenie, cel mult, ordinea intervalelor, ca ordine a categoriilor.
Aadar, variabilele categoriale sunt privite drept caracteristici calitative (de vreme ce
nu intereseaz dect categoriile i nu valorile), iar n anumite cazuri sunt echivalate cu
caracteristicile nominale, ntruct nu intereseaz nici ordinea categoriilor.



























13
Distribuii de frecvene

Frecvena indic numrul de indivizi statistici care se gsesc n fiecare clas a
caracteristicii cu un numr relativ mic de categorii (variabil categorial).
Obs.: Nu discutm despre frecvene n cazul unor variabile cum este venitul, dac
acesta este surprins cu precizie maxim, deoarece e puin probabil s avem mai muli
indivizi cu exact acelai venit n populaie (sau eantion).
Frecvenele indivizilor din clasele unei variabile ofer rspunsuri la ntrebri de tipul:
- Ci indivizi sunt brbai, Ci sunt femei?
- Ci sunt dispui s se prezinte la vot i Ci nu
- Ci ctig sub 2 milioane, Ci ctig 2 - 4 milioane i Ci peste 4 milioane
Obs.: Caracteristica venituri, surprins pe intervale de grupare, devine categorial.
Avem o populaie de n indivizi i o caracteristic A, cu clasele A
1
, A
2
A
s

Din cei n indivizi, k
1
sunt plasai n clasa A
1
, k
2
sunt plasai n clasa A
2
, ... k
s
sunt n A
s
n aceste condiii putem realiza o coresponden biunivoc ntre mulimea claselor:
A = {A
1
, A
2
,..., A
s
}
i mulimea frecvenelor:
K = {k
1
, k
2
, ... k
s
}
Corespondena biunivoc desemneaz faptul c fiecrei clase A
i
a unei caracteristici i
se ataeaz o singur frecven k
i
i reciproc (sgeile cu dublu sens din figura 1).
Distribuia de frecvene reprezint mulimea frecvenelor unei caracteristici
(categoriale), privit prin prisma corespondenei cu clasele acelei caracteristici.
















Forma de prezentare a distribuiei de frecven este cea a tabelului cu dou linii
(sau cu dou coloane, dac datele se aez pe vertical):
Clase A
1
A
2
... A
s
Total
Frecvene k
1
k
2
... k
s
n
Oana
Marius
Florin
Mihai
Cristina
Diana
Alexandra
Ion
Maria
Ioana Populaia conine
n = 10
indivizi

Caracteristica este
Apartenena de sex

Clasele sunt:
A1 = sex feminin
A2 = sex masculin
Clasa A
1
(sex feminin)
Clasa A
2
(sex masculin)
k
1
= 6
(6 fete)


k
2
= 4
(4 biei)
Populaia
statistic
Mulimea
frecvenelor
Mulimea
claselor
14
Pentru caracteristicile calitative, simbolurile A
i
, desemneaz starea (exprimat
calitativ) a nsuirii respective.
Tabelul 1. Distribuia femeilor cstorite n 1995, dup starea civil anterioar
cstoriei
Starea civil Necstorit Vduv Divorat Total
Frecvene 134.371 3.232 16.340 153.943
Sursa: Anuarul demografic al Romniei, 1996, p. 295.
n tabelul de mai sus, am reprezentat distribuia de frecven a unei variabile calitative
nominale. n cazul uneia calitative ordinal situaia se prezint analog.
Tabelul 2 Interes al elevilor de liceu pentru postul de radio local
Nivelul interesului Foarte mare Mare Mic Foarte mic Total
Frecvene 120 380 345 155 1000
Exemplu cu date fictive.
Pentru caracteristicile cantitative construirea distribuiilor de frecvene poate
presupune dou situaii diferite:
1) Variabila are un numr mic de valori diferite iar clasele ei vor fi desemnate chiar de
aceste valori, pentru care se vor stabili direct frecvenele
2) Variabila are un numr mare de valori diferite (fiecrui subiect i poate corespunde
alt valoare) i trebuie construite intervale de grupare pentru valorile iniiale.
Distribuia de frecven indic numrul de indivizi din fiecare interval de grupare.
Tabel 3
Situaia 1: Numrul camerelor din locuinele de la bloc
Nr. de camere 1 2 3 4 5 Total
Frecvene 100 480 220 150 50 1000
Situaia 2: Categoriile de vrst ale celor cu drept de vot
Vrsta Sub 25 25-34 35-44 45-54 55-64 65 i peste Total
Frecvene 130 170 185 165 150 200 1000
Exemple cu date fictive.
Situaia 1: avem de-a face cu variabile discrete, care nu pot lua dect anumite valori
Situaia 2: avem de-a face cu variabile continue care pot lua orice valori ntr-un
anumit interval (vrsta poate fi msurat innd cont de momentul precis al naterii).
Construcia distribuiilor de frecven prin gruparea valorilor pe intervale n cazul
variabilele cantitative continue se face pentru a se vedea modul n care sunt distribuii
indivizii pe intervalul n care variabila ia valori.
Obs.: Valorile proprii indivizilor nu sunt uniform repartizate pe intervalul de variaie:
- exist zone unde indivizii sunt mai dei,
- exist zone n care sunt mai rari
- exist zone n care lipsesc aproape total.
15
Pentru nelegerea fenomenului reprodus prin variabila statistic e important de tiut:
- care sunt zonele de concentrare a indivizilor,
- ct de ntinse sunt zonele de concentrare
- ct de puternic e concentrarea,
- cum se succed, din punctul de vedere al concentrrii, diferitele subintervale etc.
Aspectele mai sus menionate sunt i mai evidente dac atam caracteristicii un
grafic, lucru posibil doar dac variabila este categorial (cu intervale de grupare).
Graficul ataat situaiei 2 cu date fictive
185
150
200
130
165 170
0
50
100
150
200
250
vrsta
130 170 185 165 150 200
18-24 25-34 35-44 45-54 55-64 65 i peste

Alegerea numrului de intervale de grupare este foarte important deoarece:
- prea puine intervale NU vor permite distincii ntre situaii foarte diferite
- prea multe intervale vor conduce la frecvene mici, irelevante statistic.
Obs.: Intervalele pot avea lungimi diferite:
- acolo unde densitatea indivizilor este mai mare se pot construi intervale mai scurte
- acolo unde densitatea indivizilor este mai mic se pot construi intervale mai lungi
Exemplu de proast alegere a intervalelor de grupare:
Tabelul 4. Distribuia comunelor din Romnia, dup numrul de locuitori, n 1995
Intervale de mrime Sub 1.000 1.000-1.999 2.000-4.999 5.000-9.999 10.000 i peste Total
Frecvene 44 385 1.662 563 32 2.686
Sursa Anuarul demografic al Romniei, 1996, p. 50.
- numrul de clase este mic
- categoriile extreme conin frecvene foarte reduse (44, respectiv 32)
- clasa din mijloc (2.000-4.999) concentreaz peste 60% din efectivul total
Conc.: alegerea intervalelor NU asigur distribuia echilibrat a indivizilor statistici.
Obs.: adeseori intervalele de la capetele scalei de valori NU sunt nchise deoarece:
- valorile limit sunt evidente (Tabelul 3, Situaia 2) Sub 25 de ani nseamn, de
fapt, 18-24 ani
- variabila poate lua valori foarte diferite (Tabelul 3, Situaia 2) 65 de ani i peste
(e greu de stabilit valoarea maxim)
Idee.: pentru comparaii, ntre date de aceeai natur, e important ca scalele s aib
aceeai form (dac s-ar nchide intervalele extreme comparaia ar fi dificil).
Tot pentru comparabilitatea datelor, scalele pentru surprinderea vrstei sunt
constituite, de obicei, din intervale de cte 5 ani.
16
Exist situaii n care NU e posibil standardizarea scalelor:
- dac variabila i schimb limitele de variaie (salariul, n timp, datorit inflaiei)
- dac sunt utilizate (n ri diferite) uniti diferite de msur (salariul n lei, USD, etc.)
- dac ntr-o cercetare e construit o variabil diferit de cele uzuale, pentru care NU
exist o scal larg utilizat (Ex.: nr. sptmnal de mesaje trimise prin Email)
Pentru variabilele inedite trebuie alese numrul i lungimea intervalelor de grupare.
Formula lui Sturges, pe baza creia se poate calcula lungimea intervalului de grupare:
n
x x
i
lg 322 . 3 1
min max
+

=
& i este lungimea recomandat a intervalului de grupare
& x
max
i x
min
sunt valorile maxime i minime ale variabilei
& lg n reprezint logaritmul n baza 10 din numrul indivizilor statistici.
Obs.: Uneori formula de mai sus este acceptabil, alteori nu.
Ex. pentru un eantion de 1.000 de salariai, cu salarii ntre 2.5 i 10 milioane avem:

000 . 681
11
000 . 500 . 7
1000 lg 322 . 3 1
000 . 500 . 2 000 . 000 . 10
~ ~
+

= i
Situaia apare ca rezonabil (vor fi 11 intervale de grupare)
Numitorul arat numrul intervalelor de grupare, valoare ce depinde doar de n.
- pentru n = 100 rezult 7-8 intervale de grupare;
- pentru n = 1000 rezult n jur de 11;
- pentru n = 10000, rezult 14-15 intervale etc.
Valori sunt acceptabile, numai c formula nu ine seama de dou aspecte:
1. la un volum mare, de peste 1.000.000 de indivizi formula conduce la mai mult de
20 de intervale, deci la un tabel ce se citete greu.
2. Numrul intervalelor depinde numai de n, se ignor complet:
- amplitudinea distribuiei i, mai ales,
- felul cum se distribuie indivizii pe intervalul (a,b).
Idee: O populaie cu volum mai mare dect alta nu pretinde, prin aceasta, s fie
distribuit n mai multe intervale; trebuie s se in seama i de valorile variabilei.











17
4. Frecvene relative. Frecvene cumulate

FRECVENE ABSOLUTE
- indic numrul de indivizi dintr-o categorie a unei variabile
- permit comparaii doar ntre categoriile variabilei
- NU permit comparaii ntre distribuiile aceleiai variabile pentru populaii diferite

2.1.4 POPULAIA PE MEDII, SEXE l VRSTE, LA 1 IULIE 1999, Anuarul statistic al Romniei, 2000
VRSTA
TOTAL URBAN RURAL
AMBELE
SEXE
DIN CARE:
FEMININ
AMBELE
SEXE
DIN CARE:
FEMININ
AMBELE
SEXE
DIN CARE:
FEMININ
Total 22458022 11473493 12302729 6359021 10155293 5114472
0-4 ani 1147065 557951 529308 256900 617757 301051
5-9 ani 1330733 649907 671264 327359 659469 322548
10-14 ani 1737153 851931 1001255 491230 735898 360701
15-19 ani 1701881 834034 1010246 497636 691635 336398
20-24ani 1978835 966158 1121495 559039 857340 407119
25-29ani 1792822 884720 991446 516470 801376 368250
30-34 ani 1698268 836016 1050468 551690 647800 284326
35-39 ani 1335039 663102 868403 456203 466636 206899
40-44ani 1663784 837890 1122014 582067 541770 255823
45-49 ani 1565367 795163 1002974 505529 562393 289634
50-54 ani 1224217 629527 681297 344063 542920 285464
55-59 ani 1118307 590215 544389 283650 573918 306565
60-64 ani 1236759 669934 545789 294816 690970 375118
65-69 ani 1096340 606391 448441 251629 647899 354762
70-74 ani 878928 503159 342964 198962 535964 304197
75-79 ani 570487 351201 214682 137535 355805 213666
80-84 ani 203725 131901 80832 53948 122893 77953
85 ani i peste 178312 114293 75462 50295 102850 63998
Sursa: Anuarul statistic al Romniei, 2000
n tabelul 2.1.4, preluat din Anuarul Statistic al Romniei din anul 2000 avem un
exemplu de prezentare doar a frecvenelor absolute:
- Putem compara frecvenele variabilei vrst definit pe aceeai populaie:
n totalul populaiei Romniei, categoria 0-4 ani (1147065 indivizi) e slab reprezentat.
Numrul de indivizi crete uniform pn la categoria 20-24 de ani (1978835 indivizi),
dup care scade, cu unele fluctuaii, pn la ultima categorie, a celor peste 84 de ani.
- NU putem compara frecvenele variabilei vrst definit pe dou populaii diferite,
de exemplu populaia urban i cea rural.
Populaia total din urban fiind diferit de cea din rural, nu putem spune nimic despre
faptul c pentru o categorie de vrst, n urban se afl mai muli sau mai puini
subieci.
FRECVENE RELATIVE sunt construite pentru a face posibile comparaiile ntre
populaii cu numr diferit de uniti statistice (standardizarea frecvenelor absolute)
Frecvenele relative:
- indic ponderea frecvenei unei categorii n totalul populaiei
- se calculeaz mprind frecvena unei categorii la totalul populaiei i nmulirea
cu o anumit valoare, care indic i modul de exprimare a frecvenelor relative
18
- Frecvenele relative pot fi exprimate n funcie de:
- Valoarea 1 (iau valori ntre 0 i 1) rapoartele se nmulesc cu 1
- Valoarea 100 (iau valori ntre 0 i 100) rapoartele se nmulesc cu 100
- Valoarea 1000 (iau valori ntre 0 i 1000) rapoartele se nmulesc cu 1000
Obs. 1: n funcie de necesiti, valoarea n funcie de care se exprim frecvenele
relative poate fi i 10.000, 1000.000, etc.
- Frecvenele relative la 100 se numesc procente (i se noteaz cu semnul %)
- Frecvenele relative la 1.000 se cheam promile ().
Obs.: semnele % i nlocuiesc cuvintele procente, respectiv promile:
- Este incorect formularea procentul femeilor n populaie este de 51%
- Este corect formularea procentul femeilor n populaie este de 51
- Este absolut greit formularea procentul naterilor n Romnia a fost de 10
Ex. dac n populaia de 5674 de elevi ai unui ora 2432 dintre ei sunt biei, avem:
2432: 5674 x 1 = 0.428 frecvena relativ la unitate a bieilor
x 100 = 42,8 frecvena relativ la 100 (procentul)
x 1000 = 428 frecvena relativ la 1000 (promile)

Frecvenele relative la unitate:
- reprezint proporia indivizilor ce intr ntr-o anumit clas.
- pot fi interpretate i ca nite probabiliti empirice (arat probabilitatea ca, alegnd
la ntmplare un individ din populaie, acesta s aparin uni anumite clasei).
Ex.: Probabilitatea ca alegnd la ntmplare un individ din cei 5674 acesta s fie
biat este de 0.428
FRECVENELE CUMULATE
se calculeaz pentru variabile ordinale sau cantitative, i pot fi frecvene cumulate:
- CRESCTOARE (ascendente)- arat ci indivizi (sau ct la sut, la mie dintre ei) se afl
sub o anumit treapt (valoare)
- DESCRESCTOARE (descendente)- arat ci indivizi (sau ct la sut, la mie dintre ei) se
afl peste o anumit treapt (valoare)
Tabelul 5. Vrsta mamelor la natere, n anul 1995
Intervale
de vrst
10-14
ani
15-19
ani
20-24
ani
25-29
ani
30-34
ani
35-39
ani
40-44
ani
45-49
ani
Total
Frecvene absolute 492 40.337 98.075 67.154 18.947 8.907 2.565 162 236.639
Procente 0,2 17,0 41,4 28,4 8,0 3,8 1,1 0,1 100
Sursa: Anuarul demografic al Romniei, 1996, p. 133.
- n anul 1995 s-au nscut 236.638 de copii, mamele avnd vrste cuprinse ntre 10
i 49 de ani.
- Intervalele de grupare sunt de cte 5 ani.
- Se observ c cei mai muli copii au fost nscui de mame avnd vrste cuprinse
ntre 25 i 29 de ani (98.075 copii, reprezentnd 41,4 la sut din total)
19
Cu datele din tabelul 5, se poate construi tabelul 6, ce conine frecvenele cumulate
absolute i relative (la 100), ascendente i descendente.
Tabelul 6. Frecvenele din tabelul 5 cumulate sub cele dou forme
A. Ascendente
Praguri de vrst
sub 10
ani
sub 15
ani
sub 20
ani
sub 25
ani
sub 30
ani
sub 35
ani
sub 40
ani
sub 45
ani
sub 50
ani
Frecvene cumulate ascendente 0 492 40.829 138.904 206.058 225.005 233.912 236.477 236.639
Procente cumulate ASCENDENTE 0 0,2 17,3 58,7 87,1 95,1 98,8 99,9 100
B. Descendente
Praguri de vrst
10 ani
i peste
15 ani
i peste
20 ani
i peste
25 ani
i peste
30 ani
i peste
35 ani
i peste
40 ani
i peste
45 ani
i peste
50 ani
i peste
Frecvene Cumulate descendente 236.639 236.147 195.810 97.735 30.581 11.634 2.727 162 0
Procente cumulate ASCENDENTE 100 99,8 82,7 41,3 12,9 4,9 1,2 0,1 0

Exemplu de citire pentru frecvenele cumulate ascendente:
- 206.058 din cei 236.639 de copii nscui n 1995 aveau mame cu vrsta sub 30 de ani
- 87,1 la sut dintre copii nscui n 1995 aveau mame cu vrsta sub 30 de ani
Exemplu de citire pentru frecvenele cumulate ascendente:
- 195.810 din cei 236.639 de copii nscui n 1995 aveau mame cu vrsta peste 19 ani
- 82,7 la sut dintre copii nscui n 1995 aveau mame cu vrsta peste 19 ani


5. Grafice ataate distribuiilor de frecvene

Grafice ataate distribuiilor de frecvene au rolul de a face mai uor perceptibile
proprietile acelei distribuii.
Pentru CARACTERISTICILE CALITATIVE se utilizeaz frecvent:
1. divizarea unui ntreg n prile sale componente i prezentarea acestor pri
Grafic ataat Tabelului 2 (Interes al elevilor de liceu pentru postul de radio local)
Nivelul interesului Foarte mare Mare Mic Foarte mic Total
Frecvene 120 380 345 155 1000












120
380
345
155
Foarte mare
Mare
Mic
Foarte mic
20
2. reprezentarea proporional a efectivelor claselor, fr vizualizarea ntregului.













Pentru CARACTERISTICILE CANTITATIVE apar posibiliti n plus de vizualizare
grafic datorit proprietilor lor matematice.
O variabil statistic cantitativ este o funcie care face s corespund fiecrei
valori a variabilei numrul de indivizi care iau respectiva valoare (frecvena absolut)
Situaia 1: Numrul camerelor din locuinele de la bloc
Nr. de camere O camer 2 camere 3 camere 4 camere 5 camere Total
Frecvene 100 480 220 150 50 1000













Graficul ataat situaiei 1 Linia poligonal a frecvenelor
120
380
345
155
0
50
100
150
200
250
300
350
400
Interes pentru postul de
radio local
Foarte mare
Mare
Mic
Foarte mic
O camer
2 camere
3 camere
5 camere
4 camere
100
480
220
50
150
Mulimea valorilor
variabilei
Mulimea frecvenelor
cu care apar valorile variabilei
f definit pe
Ia valori n
50
150
220
480
100
0
100
200
300
400
500
600
1 2 3 4 5
Numr de camere
N
u
m

r

d
e

a
p
a
r
t
a
m
e
n
t
e
Nr. de apartamente n
funcie de nr. de camere
din pe care le conin
21
Obs.1: Dac se lucreaz cu intervale de grupare, pentru a obine o astfel de
reprezentare grafic e nevoie s se atribuie cte o valoare fiecrui interval.
Variabilele cu intervale de grupare pot fi reprezentate grafic i sub forma histogramei:
- sunt folosite dreptunghiuri care au ca baza egal cu lungimea intervalelor
- aria dreptunghiurilor va fi proporional cu frecvenele reprezentate
- bazele dreptunghiurilor pot fi inegale (aria rmne proporional cu frecvena)

0
500000
1000000
1500000
2000000
2500000
0
-
4

a
n
i
1
0
-
1
4

a
n
i
2
0
-
2
4
a
n
i
3
0
-
3
4

a
n
i
4
0
-
4
4
a
n
i
5
0
-
5
4

a
n
i
6
0
-
6
4

a
n
i
7
0
-
7
4

a
n
i
8
0
-
8
4

a
n
i
Column 1

Obs.: pentru un interval dublu ca lungime fa de cea obinuit, nlimea trebuie
redus la jumtate din mrimea frecvenei.

Linia poligonal a frecvenelor:
Este privit ca o form imperfect a unei curbe, care reflect grafic legea teoretic
de distribuie a fenomenului statistic.
Obs. De multe ori, datele empirice nu au o form matematic.




















22

Capitolul 3

INDICATORI Al CARACTERISTICILOR CANTITATIVE

Indicatori: anumite valori ataate variabilelor statistice cantitative prin care se
exprim sintetic informaia coninut n distribuia de frecvene respectiv.
n funcie de tipul de informaie oferit, indicatorii se mpart n dou mari clase:
a) indicatori de poziie (sau de nivel sau ai tendinei centrale);
b) indicatori de dispersie (sau de mprtiere sau de variaie).
La acestea se mai adaug o alt categorie de valori, mai puin utilizate:
c) indicatori ai formei distribuiei.

1. Indicatori de poziie

Indicatorii de poziie redau printr-o singur valoare numeric nivelul general al
valorilor seriei sau ordinul de mrime al acestor valori.

1.1. Media (aritmetic)

Definiie: Media este valoarea care se obine mprind suma valorilor tuturor
indivizilor din populaie la numrul acestora.
Media este acea valoare comun pe care ar trebui s o ia fiecare individ din populaie
astfel nct s se pstreze neschimbat suma valorilor.
Notaia mediei unei variabile se face atand simbolului acesteia o bar superioar.
Astfel, pentru o variabil X, valoarea medie se noteaz frecvent cu x i este dat de
formula:
1
n
i
i
x
x
n
=
=

(1)
Interpretarea din propoziia ce urmeaz definiiei deriv din aceea c formula (1)
este echivalent cu:
1
n
i
i
nx x
=
=

(1)
1

unde primul termen nseamn suma valorilor cnd toate acestea sunt egale cu x
Evident c dac valorile x
i
sunt luate cu frecvenele k
i
, atunci formula (1) devine:
1
s
i i
i
k x
x
n
=
=

(2)
n formula (2), ca i n formula (1), indivizii sunt considerai egali n generarea
valorii medii. (nu este vorba de o medie ponderat).
Media ponderat. Exemplu:
n sistemul de credite transferabile (n universiti), fiecare disciplin are un numr de
credite ce reflect importana acesteia. Astfel, dac un student are de parcurs 5
discipline ntr-un semestru (notate cu A, B, C, D, E), avnd credite diferite (s zicem,
23
4, 5, 6, 7 i respectiv 8, deci n total 30 de credite) i el ia urmtoarele note (tot n
ordinea dat a disciplinelor): 10, 9, 9, 8, 8, atunci:

media simpl va fi
10 2 9 2 8 44
8,80
5 5
x
+ +
= = =


Media ponderat va fi
1
4 10 5 9 6 9 7 8 8 8 259
8, 63
30 30
x
+ + + +
= = =


Proprietile mediei:
(i) Valoarea medie a unei populaii descompuse n s subpopulaii este egal cu
media mediilor din subpopulaii, ponderate cu mrimea fiecrei subpopulaii. Sau:

1
s
i
i
i
k x
x
n
=
=

(3)

unde i x este media grupei i care conine un efectiv de k
i
indivizi.
n cazul din formula (3), x
- este o medie ponderat a valorilor i x considerate ca valori ataate indivizilor
statistici reprezentai de cele s grupuri, dar, n acelai timp,
- este o medie simpl, neponderat, a valorilor indivizilor ce formeaz populaia
iniial, datorit proprietii (i).

Alte proprieti mai importante ale mediei sunt urmtoarele:
(ii) Media este o valoare cuprins n intervalul ale crui capete le constituie
valoarea minim i cea maxim a seriei de valori.
(iii) Media este o mrime exprimat n aceeai unitate de msur n care sunt
exprimate i valorile variabilei respective. Astfel, dac variabila salar se exprim n
lei, i media sa se va exprima n lei etc.
(iv) Suma abaterilor valorilor de la medie este nul. Adic:

( )
1
0
n
i
i
x x
=
=

(4)

Aceasta este o proprietate echivalent cu propoziia de definiie i adesea se ia ea
nsi ca definiie a mediei. Demonstrarea proprietii (iv) este simpl. ntr-adevr:

( )
1
1
n
n
i i
i
i
x x x nx
=
=
=

Dar, conform formulei
1
n
i
i
nx x
=
=

, vom avea
1
0
n
i
i
x nx
=
=

24
(v) Media aritmetic rmne neschimbat dac frecvenele se nmulesc sau se
mpart cu un acelai numr (m).

1 1 2 2 1 1 2 2 1
1 2 1 2
... ...
... ...
s
i i
s s s s i
s s
k x
k x k x k x mk x mk x mk x
x
n k k k mk mk mk
=
+ + + + + +
= = =
+ + + + + +



Proprietatea este evident, cci multiplicnd fiecare frecven cu o valoare m, aceasta
poate fi dat factor comun la numrtorul formulei (2). n acelai timp, multiplicnd
fiecare frecven cu m, se va multiplica i numrul indivizilor cu aceeai valoare, deci
numitorul va deveni nxm, coeficientul m putndu-se deci simplifica.
n contextul acestei proprieti, mai menionm c media aritmetic poate fi scris
cel mai simplu cu ajutorul frecvenelor relative la unitate. mprind fiecare frecven
cu n, ca i numitorul formulei (2), ajungem la:

1 2 1
1 2 1 1 2 2
... ...
s
i i
s i
s s s
k x
k k k
x x x x x p x p x p
n n n n
=
= = + + = + + +

adic:

1
s
i i
i
x p x
=
=

(5)
p
i
reprezint frecvenele relative la unitate

(vi) Dac valorile variabilei X sufer o transformare liniar, atunci media noii
variabile X
1
obinute se regsete prin aceeai transformare. Adic, dac:
x
i
1
= a + bx
i

atunci
1
x a bx = +


Proprietatea se demonstreaz imediat printr-un calcul algebric simplu, pornind de
la formula (1) sau (2).

1
1
1 1 1 1
( )
n n n n
i i i
i i i i
x a bx a b x
x a bx
n n n n
= = = =
+
= = = + = +



Obs.1: valoarea medie poate fi calculat chiar dac nu cunoatem distribuia
caracteristicii, ci numai suma valorilor i numrul de uniti statistice.
Ex.: O ntreprindere are n salariai i ntr-o lun sunt cheltuii S lei pentru salarii
(suma valorilor), atunci, putem spune c salariul mediu este S/n.
Obs.2 n sfrit, s mai remarcm c:
- valoarea medie poate fi o valoare pe care nu o ia nici un individ statistic;
- valoarea medie poate fi fr sens la nivelul indivizilor concrei
Ex.: populaia statistic format din cele 50 de familiile care locuiesc ntr-un imobil.
Distribuia familiilor dup numrul membrilor lor este urmtoarea (tabelul 1):
25
Tabelul 1. Distribuia familiilor dintr-un imobil, dup numrul persoanelor ce le
compun (date fictive)

Nr. persoane 1 2 3 4 5 Total
Nr. familii 5 10 20 12 3 50

Nr. mediu de persoane / familie =
5 1 10 2 20 3 12 4 3 5 128
2, 96
5 10 20 12 3 50
+ + + +
= =
+ + + +


E clar c nu exist i nici nu poate exista o familie format din 2,96 persoane.

Obs.:
- Media este folosit pentru ilustrarea nivelului general al valorilor unei caracteristici
- Uneori semnificaia mediei nu este clar neleas
- Uneori media NU reprezint valoarea mijlocie sau tipic a seriei

1. Nu reprezint neaprat valoarea tipic
n exemplul anterior 2,96 membri per familie nu reprezint valoarea tipic
2. Nu e neaprat valoarea mijlocie
Ex.: ntr-un grup de munc sunt 5 persoane de vrste: 25, 26, 27, 28 i 44 ani.
Suma valorilor este 150 ani i deci vrsta medie n grup va fi de 150/5 = 30 de ani.
Valoarea nu este mijlocie, cci ea desparte seria de valori n dou pri extrem de
inegale: patru n stnga ei i doar una n dreapta.

Idee:
- Este o exagerare s accepi calcularea mediei doar n situaii n care valorile sunt
omogene (i n care media este valoare mijlocie)
- Este important s se neleag clar semnificaia mediei i s fie utilizat n limitele
ce corespund acestei semnificaii

Obs.:
- Media, ca orice indicator, nu reflect dect o parte din informaia surprins n
caracteristic
- Cu ct populaia este mai omogen, cu att media va reproduce mai mult din
aceast informaie
- La limit, dac toi indivizii iau aceeai valoare, aceasta va fi chiar media i
informaia este complet
- Situaiile reale sunt departe de acest caz-limit (i prin aceasta sunt interesante)
- n situaiile reale trebuie calculai i ali indicatori



26
1.2. Mediana

Individul median reprezint unitatea statistic care se afl la mijlocul seriei valorilor
variabilei ordonat cresctor sau descresctor.
Mediana, notat Me, reprezint valoarea pe care o ia individul median.

Obs.:
- Un individ median exist, propriu-zis, doar atunci cnd n (total populaie) este un
numr impar [nainte i dup el sunt (n-1)/2 indivizi]
- Dac n este par, vom considera un individ median virtual, plasat ntre unitatea de
rang n/2 i cea de rang n/2 + 1 (i acordm ca valoare media aritmetic a valorilor
celor dou uniti care-l ncadreaz).

Lucrurile se complic dac exist mai muli indivizi care iau aceleai valori.
Aceast situaie, la rndul su, are dou forme diferite:
A) cnd frecvenele corespund unor valori univoce (nr. de persoane / gospodrie)
B) cnd frecvenele corespund unor intervale de valori (vrsta pe intervale)

Situaia A)
Cazul 1
Dac n este impar, va exista un individ median care se va gsi sub acea valoare
pentru care frecvena cumulat ascendent depete 50 % din efectivul populaiei.
Iar acea valoare va fi valoarea median.

Tabelul 2. Distribuia familiilor dintr-un imobil, dup numrul persoanelor ce le
compun (date fictive)

Nr. persoane / familie 1 2 3 4 5 Total
Nr. familii 5 10 20 12 4 51
Nr. persoane / familie Max. 1 Max. 2 Max. 3 Max. 4 Max. 5
Frecvene cumulate 5 15 35 47 51

51x50%=25,5
Individul median se afl printre familiile cu 3 persoane iar valoarea median este 3

Cazul 2
Dac n este par, atunci indivizii de rang n/2 i n/2 + 1 pot fie s ia o aceeai valoare i
atunci aceasta este chiar mediana, fie s ia dou valori diferite i consecutive, x
i
i
x
i+1
, luate cu frecvenele k
i
, respectiv k
i+1
i atunci mediana va fi:

1 1
1
i i i i
i i
k x k x
Me
k k
+ +
+
+
=
+
(6)
adic media celor dou valori, luate cu frecvenele respective.
27
Exemplu pentru situaia cnd indivizii de rang n/2 i n/2 + 1 iau o aceeai valoare:

Tabelul 3. Distribuia familiilor dintr-un imobil, dup numrul persoanelor ce le
compun (date fictive)

Nr. persoane / familie 1 2 3 4 5 Total
Nr. familii 5 10 20 12 3 50
Nr. persoane / familie Max. 1 Max. 2 Max. 3 Max. 4 Max. 5
Frecvene cumulate 5 15 35 47 50

Familiile cu rangul 50/2 i 50/2 +1 se afl ambele printre cele care au 3 membri n
familie, aa c valoarea median va fi 3

Exemplu pentru situaia cnd indivizii de rang n/2 i n/2 + 1 iau valori diferite:

Tab. 4. Distribuia familiilor dintr-un imobil, dup numrul persoanelor ce le compun

Nr. persoane / familie 1 2 3 4 5 Total
Nr. familii 5 10 10 20 5 50
Nr. persoane / familie Max. 1 Max. 2 Max. 3 Max. 4 Max. 5
Frecvene cumulate 5 15 25 45 50

Rangul n/2 corespunde familiilor cu 3 persoane iar rangul n/2 + 1 corespunde
familiilor cu 4 persoane.

1 1
1
10 3 20 4 110
3, 66
10 20 30
i i i i
i i
k x k x
Me
k k
+ +
+
+ +
= = = =
+ +


Situaia B) intervale de grupare a valorilor

Trebuie cutat valoarea median atunci cnd se cunoate intervalul median, adic
intervalul pe care se gsete individul median (real sau virtual).
Cu alte cuvinte, trebuie aleas o metod de a determina o valoare din intervalul
respectiv care s fie atribuit individului median.

Tabelul 5. Distribuia femeilor cstorite n 1995, avnd starea civil anterioar
divorat n funcie de vrsta la cstorie

Vrsta 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60 -88 Total
frecvene 253 2.269 4.411 2.655 2.516 1.857 1.133 541 361 344 16.340
Vrsta
Sub
20 ani
Sub
25 ani
Sub
30 ani
Sub
35 ani
Sub
40 ani
Sub
45 ani
Sub
50 ani
Sub
55 ani
Sub
60 ani
Sub
89 ani

Frecvene
cumulate
253 2.522 6.933 9.588 12.104 13.961 15.094 15.635 15.996 16.340

Sursa: Anuarul demografic al Romniei, 1996, p. 295.
28
Efectivul total fiind un numr cu so, 16.340, vom avea un individ median virtual,
cuprins ntre cel cu rangul 8.170 i 8.171, s zicem al 8.170,5-lea.
Acest individ se va gsi n intervalul 30-34 de ani, dat fiind c pn la 29 de ani
(inclusiv 29) se cstoresc 6.933 de femei divorate i pn la 34 de ani, 9.588.
Vom presupune c cele 2.655 persoane se distribuie uniform pe acest interval.
Pentru a afla rangul individului nostru virtual n rndul celor 2.655 din intervalul
median, vom face diferena:

8170,5 - 6933 = 1237,5.

n continuare, aplicm regula de trei simpl:
dac la 2655 persoane corespund 5 ani de vrst,
atunci la 1237,5 corespund X ani.

Deci
1237, 5 5
2, 33
2655
x

= =


Adugnd X = 2,33 ani valorii de la captul din stnga al intervalului, adic 30 ani,
vom obine valoarea median, 32,33 ani.


1.3. Modul

Modul sau valoarea modal, notat Mo, reprezint valoarea luat cu cea mai mare
frecven.
Interpretare: aceasta este valoarea ce caracterizeaz individul tipic al populaiei.
Obs.: Indicatorul are sens doar dac aceleai valori ale variabilei sunt luate de mai
muli indivizi (putem calcula frecvene).

Tabelul 6. Distribuia familiilor dintr-un imobil, dup numrul persoanelor ce le
compun (date fictive)

Nr. persoane 1 2 3 4 5 Total
Nr. familii 5 10 20 12 3 50

Ex.: n tabelul 6 observm c cele mai multe familii, 20, din imobil sunt formate din
trei persoane.
Valoarea modal este 3 sau familia tipic n acel bloc este cea de trei persoane.
Pe grafice, valoarea modal corespunde punctului de maxim al liniei poligonale.
Pentru variabilele continue, despre mod se poate vorbi doar dac vom construi
intervale de valori.
n acest caz, este recomandabil ca lucrurile s se opreasc la gsirea intervalului
modal, adic a intervalului cu cea mai ridicat frecven.
29
A merge aici mai departe, la a determina o valoare modal, pentru distribuii
empirice, ni se pare, n multe cazuri, un lucru foarte riscant.

Tabelul 7. Distribuia femeilor cstorite n 1995, avnd starea civil anterioar
divorat n funcie de vrsta la cstorie

Vrsta 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60 -88 Total
frecvene 253 2.269 4.411 2.655 2.516 1.857 1.133 541 361 344 16.340
Vrsta
Sub
20 ani
Sub
25 ani
Sub
30 ani
Sub
35 ani
Sub
40 ani
Sub
45 ani
Sub
50 ani
Sub
55 ani
Sub
60 ani
Sub
89 ani

Frecvene
cumulate
253 2.522 6.933 9.588 12.104 13.961 15.094 15.635 15.996 16.340

Pentru distribuia din tabelul 7 intervalul modal este cel dat de limitele 25-29 ani.

Pentru o eventual poziionare a valorii modale pe acest interval, se poate apela la
frecvenele din intervalele alturate (din stnga i din dreapta celui modal).
Astfel, notnd cu k
i
frecvena intervalului modal, cu k
i-1
i k
i+1
frecvenele intervalelor
premodal i postmodal, cu x
i
valoarea inferioar a intervalului modal i cu d
i

lungimea acestuia, o formul de calculare a valorii modale este urmtoarea:

1
1 1
( ) ( )
i i
i i
i i i i
k k
Mo x d
k k k k

= +
+
(7)

- Pentru datele din tabelul 2, mrimile din formula (7) sunt:
x
i
= 25 ani, d
i
= 5 ani k
i
= 4.411, k
i-1
= 2.269 i k
i+1
, = 2.655, ceea ce conduce la
valoarea:
Mo = 27,75 ani.

Obs.: valoarea calculat este artificial deoarece:
- semnificaia valorii modale este aceea de valoare tipic, cea mai frecvent.
- n cazurile reale, cnd valorile sunt discrete, nu se poate vorbi de o valoare modal

Semnificaia valorii modale - ca valoare tipic - este cu att mai proeminent cu ct
frecvena corespunztoare valorii respective (sau intervalului) este mai clar detaat
de a celorlalte valori din vecintate.

Distribuii plurimodale,
- nu e vorba de dou valori (intervale) cu aceeai frecven maxim, ci
- valoarea modal poate fi - i este de fapt - privit ca aceea a unui maxim relativ,
adic cu cea mai mare frecven n zona respectiv a valorilor
Intuitiv, distribuiile plurimodale sunt cele ale cror grafice au mai multe vrfuri
sau cocoae, chiar dac acestea nu sunt de aceeai nlime.
OBS Pentru distribuiile de frecvene unimodale simetrice, media, mediana i
modul coincid
30
n msura n care apar asimetrii, aceste valori se difereniaz una n raport cu alta:
Astfel, dac frecvena mare este deplasat spre stnga, vom avea urmtoarea ordonare
a valorilor: Mo < Me < x
Dac frecvena mare este deplasat spre dreapta, ordinea se inverseaz.
Manualele clasice de statistic indic o relaie aproximativ dintre cele trei valori,
valabil pentru distribuii moderat asimetrice:
Mo = Me-3 ( x -Me) (8)

Formula (8) spune c mediana se afl ntre mod i medie, fiind la o treime din
distan fa de medie i la dou treimi de mod. Cititorul poate memora cu uurin
aceast relaie ne nva Yule i Kendall (1969, p. 137) dac observm c
media, mediana i modul se afl n aceeai ordine (sau n ordine invers), la fel ca n
dicionar, i c mediana este mai aproape de medie, tot ca n dicionar.
Aa cum se va putea vedea mai jos, valorile celor trei indicatori ai tendinei
centrale sunt folosite pentru construirea parametrilor care redau forma distribuiei, n
spe aspectele privind oblicitatea.




























31
2. Indicatori de dispersie

Indicatorii de dispersie:
- aduc informaii n plus despre caracteristici pe lng indicatorii de poziie.
- urmresc s msoare gradul de mprtiere a indivizilor n cadrul seriei de valori pe
care acetia le iau.
Indicatorii de dispersie caracterizeaz o populaie statistic din punctul de vedere
al omogenitii / eterogenitii, n raport cu o variabil dat.
Dac variabila reflect anumite ierarhii socialmente recunoscute sau valorizate
ntre indivizii statistici (ex.: valori mai mari sunt considerate ca fiind mai bune sau
preferabile celor mai mici, cum e cazul salariilor, de pild), indicatorii de dispersie
reflect gradul de inegalitate ntre indivizi, n raport cu factorul social tradus n
caracteristic.
n modelele explicative, indicatorilor de dispersie li se atribuie semnificaia de a
reproduce gradul de nedeterminare, de variabilitate al unui fenomen.
Or, explicaia, cel puin din punct de vedere statistic, nseamn:
- reducerea acestei nedeterminri sau variabiliti, adic
- sporirea posibilitii de a prezice starea unui fenomen.

ntr-adevr un fenomen este tradus ntr-o caracteristic de tip statistic, care, la rndul
ei este exprimat printr-un indicator de poziie (s spunem media).
A afirma c media notelor la matematic ntr-o clas de elevi este 8,50 nseamn a
afla ceva despre nivelul de cunotine n domeniu al colarilor n cauz.
Dispersia notelor din care rezult aceast valoare medie va indica:
- msura n care valoarea individual este reprodus prin cea de grup sau
- calitatea prediciei situaiei indivizilor prin mrimea la nivelul colectiv.
Dac n analiz se introduce o variabil nou, cu rol explicativ pentru cea iniial,
atunci, presupunnd cunoscut poziia indivizilor dup aceast caracteristic zis
independent, se va reduce nedeterminarea situaiei lor dup variabila de baz, n
msura n care ntre cei doi factori exist o legtur.
Altfel spus, indicatorul de dispersie va pune n eviden ct din nedeterminarea
variabilei cercetate se poate reduce prin introducerea n modelul explicativ a unei noi
variabile.


2. 1. Amplitudinea

Amplitudinea reprezint ntinderea scalei de valori a caracteristicii.
Ex.: dac media 8,5 a notelor rezult dintr-un calcul n care valorile individuale sunt
cuprinse ntre notele:
- 7 i 9, atunci vom spune c dispersia este mai redus (clasa e mai omogen)
- 3 i 10 atunci vom spune c dispersia este mai ridicat (clas mai eterogen)
Indicatorul de dispersie astfel folosit poart denumirea de amplitudine, notat cu A, i
se calculeaz, ca diferen ntre cea mai mare i cea mai mic valoare:
A = x
max
- x
min
.
32
Deficiena fundamental a acestui indicator: valoarea sa este determinat doar de
dou dintre valorile variabilei, cele extreme.
Aceasta nseamn c se pot ntmpla cazuri de genul:
a) valorile maxim i respectiv minim, pentru dou caracteristici, pot fi aceleai, -
dar distribuia indivizilor pe scala respectiv de valori este diferit;
b) exist o valoare maxim i / sau una minim care se abat (se abate) foarte mult de
la seria celorlalte valori.
n primul caz e clar c trebuie reflectat, n indicatorul de dispersie, i mprtierea
indivizilor pe setul celorlalte valori, aflate ntre cea minim i cea maxim.
n al doilea caz se sugereaz existena unor valori foarte ndeprtate de marea
mas, numite n statistic valori aberante
Cuvntul aberant:
- Nu nseamn c e imposibil s apar un astfel de caz i c ar fi vorba de o eroare de
msurare (dei nu este exclus i aceast posibilitate),
- nseamn c e vorba de cazuri cu totul atipice, puine la numr, i care nu ar trebui
considerate ca reflectnd situaia populaiei.
Ali indicatori de dispersie au fost construii pentru reducerea sau chiar a
eliminarea neajunsurilor sugerate fie de situaia (a), fie de cea de la punctul (b).
Pentru eliminarea valorilor aberante s-a construit abaterea intercuartil.

2.2. Abaterea intercuartil

Cuartilele sunt valorile care corespund indivizilor statistici aflai pe acele poziii
n ierarhia format pornind de la cel cu valoarea cea mai mic la cel cu valoarea cea
mai mare care mpart mulimea indivizilor n patru pri egale.
Vom avea deci trei valori cuartile, notate Q
1
, Q
2
, Q
3
, astfel nct pe intervalele de
valori: (x
min
, Q
1
), (Q
1
, Q
2
), (Q
2,
Q
3
) i (Q
3
, x
max
) s avem cte un sfert din efectivul
populaiei.
Evident c cea de a doua cuartil Q
2
este tocmai mediana.
Se definete abaterea intercuartil sau abaterea cuartil diferena:
I = Q
3
- Q
l
(9)
n anumite situaii se regsete folosit valoarea njumtit (semi-intercuartila):

(Q
3
-Q
1
)/2

sau o valoare relativ, obinut prin mprirea cu mediana (abaterea intercuartil
relativ):
2
1 3
Q
Q Q


sau:

2
1 3
2Q
Q Q

33
Un exemplu pentru ilustrarea calculului acestor indicatori este prezentat n tabelul 3,
unde am imaginat rezultatele obinute pe un lot de 1.000 de persoane la un test
construit cu valori ntregi de la 1 la 10.

Tabelul 3. Distribuia dup rezultatele la un test (date fictive)
Valori 1 2 3 4 5 6 7 8 9 10 Total
Frecvene 17 38 89 123 186 205 164 111 49 18 1000
Frecv. cumulate 17 55 144 267 453 658 822 933 982 1000

Amplitudinea este 10 l = 9.
Prima cuartil, delimitnd primii 250 de indivizi este 4 (sub 5 sunt 267 indivizi)
Mediana este 6 (sub 6 sunt 453 i sub 7, 658)
A treia cuartil este 7, valoare pn la care se plaseaz 822 de indivizi, deci i al 750-lea.
Aadar:
Q
1
= 4
Q
2
= Me = 6
Q
3
= 7
I= Q
3
- Q
1
= 7 4 = 3
I
rel
=
2
1 3
Q
Q Q
= 3/6

Se pot construi i alte valori care mpart populaia n subgrupe de efective egale:
- Decilele, n numr de 9, genereaz 10 intervale de frecvene egale, ntre prima i
ultima decil aflndu-se 80% din efectiv.
- Cu ajutorul centilelor se obin 100 de intervale, fiecare coninnd un procent din
efectivul populaiei.
Noiunile acestea se pot generaliza: cuantilele, sunt valori care mpart efectivul total
al populaiei ntr-un numr oarecare de pri egale.
Obs.:
- Ca indicatori de mprtiere, decilele sau centilele sunt rar folosite
- n exprimarea altor aspecte statistice se face apel frecvent la decile i centile
Ex.: se calculeaz venitul mediu al primilor 10% (cei mai bogai) i al ultimilor 10%
(cei mai sraci) i se compar cele dou valori (prin scdere sau mprire).

Idee: Abaterea intercuartil:
- evit neajunsurile amplitudinii (influena valorilor extreme)
- introduce alte neajunsuri (nu e luat n calcul jumtate din populaie)
Obs.: Chiar dac se lucreaz cu valori mai fine (cu decilele, de ex.), problema
rmne, dei sunt eliminate mai puine elemente ale populaiei.
Efortul statisticienilor s-a ndreptat spre gsirea unor indicatori care s in seama:
- de toate valorile i
- de frecvenele cu care sunt luate valorile (dac e cazul)
34
Ideea: S se calculeze diferenele nu numai pentru dou valori (ca n cazul
amplitudinii sau abaterii inter-cuartil) ci lund n calcul toate valorile:
a) se vor lua n considerare abaterile (diferenele) ntre toate perechile de valori.
b) se va alege o valoare fix fa de care se calculeaz abaterile valorilor variabilei

Indicatorul obinut prin prima procedur este mai rar folosit i l vom meniona
doar pentru a ilustra aceast modalitate de construcie. Este vorba de indicele lui Gini.


2.3. I ndicele lui Gini
Indicele este media aritmetic a diferenelor dintre toate perechile de valori, diferene
luate n valoare absolut. O form a indicelui de mprtiere al lui Gini, G, este:

G=
j i
n n
x x
n
i
n
j
j i
=

= =
,
) 1 (
1 1
dac fiecare individ ia valori diferite (10)
sau
G=
j i
n n
k k x x
s
i
s
j
j i j i
=

= =
) 1 (
1 1
dac mai muli indivizi iau aceleai valori (10)'

S este numrul valorilor variabilei, n cel de al doilea caz.
Singura restricie pentru indici este de a nu fi egali ceea ce nseamn c apar ca
diferene i |x
i
x
j
| i |x
j
x
i
|, termeni evident egali.
Dac dispare condiia ca i s fie diferit de j, atunci se numr i diferenele |x
i
x
i
|,
care sunt evident nule, iar numrul termenilor devine n
2
, mrindu-se numitorul.
Se ajunge deci la o alt valoare G', ceva mai mic dect G:

G' =
2
1 1
n
x x
n
i
n
j
j i

= =

(11)

Pentru a ilustra modul de calcul al indicatorului G, s lum un caz foarte simplu.
ntr-o sesiune, un student are 5 examene, pe care le trece cu notele: 5, 6, 7, 9, 10;
atunci termenii de la numrtorul lui G vor fi n numr de 5x4=20:

| 56|, | 57|, | 59|, |510|
| 65|, | 67|, | 69|, |610|
| 75|, | 76|, | 79|, |710|
| 95|, | 96|, | 97|, |910|
|105|, |106|, |107|, |109|

Deci numrtorul va fi suma:
1+2+4+5+1+1+3+4+2+1 +2+3+4+3+2+1+5+4+3+1=52
35
G = 52:20 = 2,6.

Aceast valoare arat c diferena medie ntre dou valori diferite este de 2 6 uniti.

Indicele G se obine dac numrm i cele 5 cazuri de zero |5-5|, |6-6|, |7-7|,
|9-9| i |10-10|, ajungnd ca aceeai sum de 52 s o mprim la 25:
G' = 52:25 = 2,08.
Dac alegem un prag de referin din care scdem valorile pe care le iau indivizii,
avem dou variante, dup modul n care se elimin semnul diferenelor:
- prin utilizarea modulului (vorbim de abateri simple)
- prin ridicare la ptrat. (vorbim de abateri ptratice)
Indicatorii la care se ajunge sunt interpretai tot ca medie a abaterilor.


2.4. Abaterea medie

Fie a pragul de referin, care poate s fie sau nu una dintre valorile seriei, poate s se
gseasc n intervalul de valori ori n afara lui. Mrimea Am(a) dat de formula:

Am(a) =
n
a x
n
i
i

=

1
dac fiecare individ ia valori diferite (12)
sau
Am(a) =
n
a x k
s
i
i i

=

1
dac mai muli indivizi iau aceleai valori (12)'
se numete abaterea medie de la a. (S e numrul valorilor variabilei n cazul II).

Dac n locul lui a se trece:
- media, atunci se obine abaterea medie de la medie.
E cea mai utilizat mrime de acest tip i se numete pur i simplu abaterea medie
- mediana, se ajunge la abaterea medie de la median.
Cea mai mic abatere medie se obine dac n locul lui a se aeaz mediana.

n exemplul celor 5 note la examen, invocat mai sus, mediana este nota 7 i abaterile
de la ea vor fi:

|5-7|=2, |6-7|=1, |7-7|=0, |9-7|=2, |10-7|=3
deci
Am(Me) = (2+1+0+2+3):5 = 8:5 = 1,6.
Media celor 5 note va fi 7,4 i, prin urmare, abaterea medie de la medie sau pur i
simplu abaterea medie este:

Am = (2,4+1,4+0,4+1,6+2,6):5 = 8,4:5 = 1,68 note, valoare superioar celei
obinute cu mediana.
36
2.5. Abaterea standard

Calculul abaterii medii ptratice de la o valoare a (arbitrar aleas) presupune:
- ridicarea la ptrat a diferenelor dintre valorile individuale i mrimea constant, a
- nsumarea ptratelor respectivelor diferene
- raportarea sumei obinute la numrul cazurilor observate, adic la n
- extragerea radicalului din valoarea anterioar (pentru a pstra unitatea de msur)
Abaterea medie ptratic de la a, notat S(a), va fi dat de formula:

S(a)=
n
a x
n
i
i

=

1
2
) (
dac fiecare individ ia valori diferite (13)
sau
S(a)=
n
a x k
s
i
i i

=

1
2
) (
dac mai muli indivizi iau aceleai valori (13)'
S este numrul valorilor variabilei, n cel de al doilea caz.

Obs.:
- Pentru o caracteristic dat, mrimea S(a) depinde de valorile lui a
- Cea mai mic abatere medie ptratic este cea fa de medie
Abaterea medie ptratic fa de medie se numete abatere standard (notat )

=
n
x
n
i
i

=

1
2
) x (
dac fiecare individ ia valori diferite (14)
sau
=
n
x x k
s
i
i i
=

1
2
) (
dac mai muli indivizi iau aceleai valori (14)'
S este numrul valorilor variabilei, n cel de al doilea caz.

Alte denumiri utilizate n literatura de specialitate pentru abaterea standard:
- deviaie standard (traducere din englez pentru standard deviation)
- ecart tip (traducere din francez a lui cart-type) sau, pur i simplu,
- dispersie (nu e indicat pentru c vizeaz orice indicator al mprtierii valorilor)
Variana (notat
2
), ptratul indicatorului abatere standard,
- este deosebit de des folosit n modelele statistice
- deine avantaje datorit proprietilor algebrice ce rezult din renunarea la radical
Variana poate fi interpretat ca grad de nedeterminare al variabilei, cantitate de
informaie care trebuie explicat (eventual prin intermediul altei variabile).
37
Relaia dintre abaterea standard i o abatere medie ptratic oarecare poate fi scris
foarte simplu, folosind ptratele acestor mrimi:
S
2
=
2
+ d
2
(15)
unde d este diferena dintre valoarea a, folosit n calculul lui S, i media, folosit n
calculul lui :

x a d =

Din formula (15) se vede imediat c:
- S este totdeauna mai mare dect ,
- singurul caz cnd S = fiind acela n care valoarea a coincide cu media.

S reinem dou proprieti simple ale abaterii standard:
a) Dac valorile variabilei se nmulesc cu o constant, b, atunci i abaterea
standard se multiplic cu aceeai valoare.. Deci, printr-o transformare de genul:
y =bx
se obine o variabil y cu o abatere standard:

y
=b
x

b) Dac la valorile variabilei se adun (scade) o aceeai valoare, abaterea standard
nu se modific. Deci, o transformare:
y = x + b
duce la o nou variabil, Y, cu aceeai dispersie ca X.

Calculm abaterea standard, folosind datele din tabelul 1 (distribuia familiilor
dintr-un imobil dup numrul de persoane, cu o medie de 2,96 persoane pe familie)

x
i

(nr. persoane
per familie)
k
i

(Frecvena)
x x
i


(x
i
- 2,96)
( )
2
x x
i


(x
i
- 2,96)
2

k
i
( )
2
x x
i


k
i
(x
i
- 2,96)
2

1 (x
1
) 5 (k
1
) -1,96 3,84 19,21
2 (x
2
) 10 (k
2
) -,96 ,92 9,22
3 (x
3
20 (k
3
) ,04 ,00 0,03
4 (x
4
) 12 (k
4
) 1,04 1,08 12,98
5 (x
5
) 3 (k
5
) 2,04 4,16 12,48
Total 50 53,92

2
=
( )
2
1
x x k
i
n
i
i

=
/ n =
( )
2 5
1
96 , 2

=
i
i
i
x k
/ 50 =
=(19,21+9,22+0,03+12,98+12,48)/50 = 53,92/ 50 = 1,08

i apoi, scond radicalul, se obine valoarea aproximativ a indicatorului:
=1,04.
Prin urmare, abaterea medie ptratic de la dimensiunea medie a familiei din
blocul respectiv este de aproximativ o persoan.
38
2.6. Teorema de descompunere a varianei

S presupunem c populaia este divizat n s grupuri, astfel nct s avem:

- mediile n cadrul fiecrui grup:
s
x x x ... ,
2 1

- varianele n cadrul fiecrui grup :
1
2
,

2
2


s
2

- efectivele grupurilor: n
1
, n
2
n
s

Varianele n cadrul grupurilor sunt abaterile medii ptratice de la media grupului
respectiv:

i
2
=
i
n
j
i
j
n
x
i

=

1
2
) x (
, pentru i = 1, 2 s

Grupul 1 Grupul 2 Grupul i Grupul s
n
1
= numr subieci
1
x = media grupului

1
2
= variana n grup
n
2
= numr subieci
2
x = media grupului

2
2
= variana n grup
n
i
= numr subieci
i
x = media grupului

i
2
= variana n grup
n
s
= numr subieci
s
x = media grupului

s
2
= variana n grup

Valoarea medie a ntregii populaii se poate scrie n funcie mediile per grupuri i
numrul de indivizi din fiecare grup:

x = (n
1
1
x + n
2
2
x + n
i
i
x + n
s
s
x )/n
Unde n= n
1
+ n
2
+ n
i
+ n
s

Obs.: n fiecare din cele s grupuri exist o valoare medie (
1
x ,
2
x ,
j
x ,
s
x ) iar
medie global e x ; putem calcula variana mediilor grupurilor n raport cu cea global:

Variana inter-grupal
( )
n
x x n
s
j
j
j
x

=

=
1
2
2
o (17)

Se poate calcula o medie a varianelor din cadrul fiecrui grup, notat o , numit
varian intra-grupal (medie), i dat, evident, de formula:

Variana intra-grupal
2
o =
n
n
s
j
j j

=1
2
o
(18)

Cu aceste notaii, teorema de descompunere a varianei se scrie:

2
2
2
x
o o o + =

Adic variana total se descompune n suma dintre:
- variana intra-grupal i
- variana inter-grupal.
39
Relum exemplul celor 50 de familii dintr-un imobil (cu media 2,96 persoane per
familie i variana total
2
=1,08 ) i s presupunem c le grupm n dou categorii:
- 30 de familii muncitoreti (n
1
)
- 20 de alte familii (n
2
)

Tabelul 1 Distribuia familiilor muncitoreti
dintr-un imobil, dup numrul persoanelor ce le compun (date fictive)

Nr. persoane (valorile variabilei) 1 2 3 4 5 Total
Nr. familii (frecvena cu care sunt luate valorile) 1 4 12 10 3 n
1
=30

Tabelul 1 . Distribuia familiilor non-muncitoreti
dintr-un imobil, dup numrul persoanelor ce le compun (date fictive)

Nr. persoane (valorile variabilei) 1 2 3 4 5 Total
Nr. familii (frecvena cu care sunt luate valorile) 4 6 8 2 0 n
2
= 20

Fcnd calculul mediei i al varianei pentru fiecare din cele dou grupuri (tabele),
obinem:
- pentru grupul familiilor muncitoreti:
1 x
= (1x1+4x2+12x3+10x4+3x5)/30 = 3,33

1
2
= [1(1-3,33)
2
+ 4(2-3,33)
2
+ 12(3-3,33)
2
+ 10(4-3,33)
2
+ 3(5-3,33)
2
]/30 = 0,89


- pentru grupul format din celelalte familii:
2 x
= (4x1+6x2+8x3+2x4+0x5)/20 = 2,40

2
2
= [4(1-2,40)
2
+ 6(2-2,40)
2
+ 8(3-2,40)
2
+ 2(4-2,40)
2
+ 0(5-2,40)
2
]/20 = 0,84

Se vede c cele dou categorii de familii:
- difer net prin numrul de membri
- au dispersii foarte apropiate

Analiznd separat cele dou subpopulaii, obinem o dispersie medie (adic o
nedeterminare a situaiei) care e mai mic dect cea calculat pe ansamblul grupului.
Variana intra-grupal
2
o =
n
n
s
j
j j

=1
2
o
= (n
1

1
2
+ n
2

2
2
)/n = (30x0,89+20x0,84)/50 =0,87
Variana inter-grupal
( )
n
x x n
s
j
j
j
x

=

=
1
2
2
o =[n
1
( 1 x - x )
2
+ n
2
( 2 x - x )
2
]/n=
=[30(3,33-2,96)
2
+20(2,4-2,96)
2
]/50=0,21

Deci, din variana total de 1,08:
- 0,87 e varian intragrupal, (gradul de nedeterminare n medie, la nivel de grupuri),
- 0,21 este pus pe seama variaiei mediilor celor dou grupuri alese

Variana inter-grup se consider a fi explicat prin analiza la nivel de grupuri,
grupuri care pot fi interpretate drept clasele unei alte variabile, cu funcie predictiv
sau explicativ (se poate anticipa mai exact nr. de persoane dac tim tipul familiei).
40
2.7. Coeficientul de variaie

Valoarea indicatorului abatere standard semnific o msur a gradului:
- de eterogenitate, diversitate a populaie n funcie de o anumit variabil
- de inegalitate ntre indivizii din populaie (dac e vorba de venit, ani de coal, etc.)

Obs.: Putem face comparaii directe ntre dou valori ale abaterii standard doar dac:
- Este vorba de aceeai variabil definit pe dou populaii
- Dac unitatea de msur a variabilei este aceeai
- Dac valorile medii ale variabilelor sunt apropiate
Ex.: Putem compara abaterile standard ale numrului de persoane per familie din
dou blocuri diferite dac valorile mediilor sunt apropiate
Nu putem compara abaterile standard ale veniturilor exprimate pentru un grup n lei i
pentru cellalt n euro (valoarea abaterii standard depinde de unitatea de msur)
Chiar dac unitatea de msur e aceeai (ctigul exprimat n lei noi), nu putem
compara abaterile standard pentru veniturile agricultorilor i cele ale patronilor

Venitul agricultorilor exprimat n milioane lei vechi (date fictive)

Venit milioane lei vechi 1 2 3 4 5 Total
Nr. de subieci (frecvene) 5 10 20 12 3 50

Media agricultori =
5 1 10 2 20 3 12 4 3 5 128
2, 96
5 10 20 12 3 50
+ + + +
= =
+ + + +

= | | 50 / 2,96) - (5 3 2,96) - (4 12 2,96) - (3 20 2,96) - (2 10 2,96) - 5(1
2 2 2 2 2
+ + + + 1,04

Venitul mediu al agricultorilor e 2,96 milioane iar abaterea standard =1,04 milioane

Venitul patronilor exprimat n milioane lei vechi (date fictive)

Venit milioane lei vechi 10 20 30 40 50 Total
Nr. de subieci (frecvene) 5 10 20 12 3 50

Media patroni =
3 12 20 10 5
50 3 40 12 30 20 20 10 10 5
+ + + +
+ + + +
= 10x2,96 = 29,6
= | | 50 / 29,6) - (50 3 29,6) - (40 12 29,6) - (30 20 29,6) - (20 10 29,6) - 5(10
2 2 2 2 2
+ + + + =
=10 | | 50 / 2,96) - (5 3 2,96) - (4 12 2,96) - (3 20 2,96) - (2 10 2,96) - 5(1
2 2 2 2 2
+ + + + = 10,4

Venitul mediu al patronilor este 29,6 milioane i abaterea standard =10,4 milioane

Nu putem spune prin comparaie direct c agricultorii sunt o populaie de 10 ori mai
omogen dect cea a patronilor:
- Mrirea de 10 ori a veniturilor duce la o medie i abatere standard de 10 ori mai mare
- Inegalitile dintre categoriile extreme existente interiorul fiecrui grup sunt aceleai
- (3x5 milioane)/5x1 milion = 3 raportul pentru agricultori
- (3x50 milioane)/5x10 milion = 3 raportul pentru patroni
41
Pentru a se nltura aceste dificulti de comparaie, s-a propus (Pearson) un
indicator numit coeficient de variaie, notat cu v, i dat de formula:

x
v
x
x
o
= (20)

Prin mprirea abaterii standard la medie se nltur:
- unitatea de msur,
- diferena n nivelul valorilor

Obs.: Formula (20) nu este aplicabil dect n cazul variabilelor msurate pe scala
de rapoarte, cu origine zero natural (venit, numr de ani de coal, nr. copii/familie)

O prob psihologic pentru msurarea unei aptitudini nu are un zero natural;
rezultatele depind de modul n care au fost cotai itemii.
- 4. total de acord, 3. parial de acord, 2. parial dezacord, 1. total dezacord
- 3. total de acord, 2. parial de acord, 1. parial dezacord, 0. total dezacord

Dac se opereaz cu 5 itemi, pe acelai tip de scal, scorurile itemilor urmnd a fi
nsumate, scorul global poate varia:
- ntre 5 i 20, n primul caz
- ntre 0 i 15, n al doilea caz

Valorile
ntre 5 i 20
x
i

Valorile
ntre 0 i 15
y
i

Frecvene
k
i

x
i
k
i
y
i
k
i
k
i
(x
i
-12,843)
2
k
i
(y
i
-7,874)
2

5 0 25 125 0 1537,82 1550,0
6 1 34 204 34 1592,11 1606,6
7 2 44 308 88 1502,19 1518,2
8 3 50 400 150 1172,73 1187,8
9 4 70 630 280 1033,81 1050,6
10 5 83 830 415 670,86 685,6
11 6 96 1056 576 326,08 337,1
12 7 134 1608 938 95,23 102,4
13 8 156 2028 1248 3,85 2,5
14 9 187 2618 1683 250,33 237,1
15 10 139 2085 1390 646,72 628,3
16 11 108 1728 1188 1076,40 1055,4
17 12 67 1139 804 1157,80 1140,6
18 13 52 936 676 1382,92 1366,3
19 14 30 570 420 1137,26 1125,8
20 15 21 420 315 1075,68 1066,4
Total 1296 16685 10205 14661,79 14660,7
Med. x
i
= 16645/1296= 12,874
Med. y
i
= 10205/1296=7,874 (media a sczut cu exact 5 puncte, diferena dintre scale)
Abaterea standard, n ambele cazuri, este 96 14661,7/12 =3,36 puncte
Coeficientul de variaie va diferi: v
x
= 3,36/12,843 = 0,261
v
y
= 3,36/7,874 = 0,427
42
n concluzie, schimbarea originii scalei:
- las diferenele dintre valori nemodificate i abaterea standard rmne constant
- media se modific dac toate valorile cresc sau scad cu aceeai valoare
- raportul din formula coeficientului de variaie se schimb

Obs.: Modificnd originea astfel nct media s devin 0, coeficientul de variaie nu
are sens

Chiar i pentru variabile cu scale de rapoarte formula trebuie utilizat cu pruden n
comparaii.
Formal este posibil ca acest coeficient de variaie s se calculeze:
- pentru o populaie A, fa de o variabil precum salariul i,
- pentru alta, B, dup, s spunem, numrul de ani de coal
i s se compare cele dou valori.
Totui este forat s afirmm c:
- populaia A este mai omogen (eterogen), n privina salariului,
- dect B, n privina numrul de ani de coal

Coeficientul de variaie arat ce fraciune din medie corespunde unei abateri standard.

De pild, pentru cele dou submulimi de familii muncitoreti i non-muncitoreti
care au aproximativ aceeai abatere standard, vom obine:

v
1
= 28 , 0
33 , 3
89 , 0
= (familii muncitoreti)

v
2
= 38 , 0
40 , 2
84 , 0
= (familii non-muncitoreti)

Deci grupul familiilor nonmuncitoreti apare mai eterogen dect cel al familiilor
muncitoreti, dei abaterea standard indica o situaie invers sau, n orice caz, de
foarte mare apropiere a grupurilor.














43
3. Indicatori ai formei distribuiei

Problema este aceea de a compara forma distribuiei de frecven cu legea normal


















Diatribuie simetric. Media, mediana i modul sunt toate egale cu 3






















Distribuia este alungit spre dreapta (Modul = 1, mediana = 2 iar media este 2,3)
Numr de persoane per familie
5,0 4,0 3,0 2,0 1,0
Numr de persoane per familie
F
r
e
c
v
e
n
t

30
20
10
0
Std. Dev = 1,11
Mean = 3,0
N = 50,00
5
10
20
10
5
Numr de persoane per familie
5,0 4,0 3,0 2,0 1,0
Distributie alungit spre dreapta
F
r
e
q
u
e
n
c
y
20
10
0
Std. Dev = 1,33
Mean = 2,3
N = 50,00
5 5
10
12
18
44






















Distribuie alungit spre stnga (Modul = 5, mediana = 4 iar media este 3,7)

Comparaia const n a stabili:
1. gradul de obilicitate adic msura n care distribuia se abate de la cazul-limit al
simetriei n jurul valorilor centrale (pentru distribuia normal media, mediana i
modul coincid),
2. gradul de boltire, adic msura n care distribuia este mai plat sau mai boltit,
comparativ cu o distribuie normal avnd aceeai abatere standard

3. 1. I ndicatori de oblicitate

Prima categorie de indicatori ai oblicitii (skewness) folosesc modul de aezare a
indicatorilor de poziie unul fa de cellalt
Indicatorul lui Pearson exprim oblicitatea innd cont de ordinea dintre medie i mod:

Oblicitatea =
o
Mo x
(21)

Valoarea indicatorului:
- Este nul pentru distribuiile simetrice,
- Este pozitiv pentru curbele alungite spre dreapta i
- Este negativ pentru curbele alungite spre stnga.
Numr de persoane per familie
5,0 4,0 3,0 2,0 1,0
Distributie alungit spre stnga
F
r
e
q
u
e
n
c
y
20
10
0
Std. Dev = 1,38
Mean = 3,7
N = 50,00
18
15
6
5
6
45
Obs.: Se mparte la abaterea standard pentru a elimina influena unitilor de msur a
variabilei (care este aceeai i pentru medie i mod).

O alt formul a oblicitii, cu aceeai semnificaie, este urmtoarea:

Oblicitatea =
( )
o
Me x 3
(22)

n statistica matematic se calculeaz oblicitatea curbelor de distribuie cu ajutorul
momentelor centrate de ordinul trei. Acest indicator se preia de obicei i n
programele statistice pe calculator.

Momentele centrate de ordinul m reprezint medii ale abaterilor valorilor
variabilei de la media acesteia, ridicate la puterea m.

n general, momentul centrat de ordinul m este mrimea:

( )
n
x x
m
n
i
i
m

=

=
1


sau, cu frecvene:

( )
n
x x k
m
s
i
i i
m

=

=
1


Momentul centrat de ordinul 1 este ntotdeauna nul (rezult din definiia mediei)
Momentul centrat de ordinul 2 este tocmai variana
Momentul de ordinul 3 indic oblicitatea i, pentru ca valorile sale s fie
standardizate, se divide cu abaterea standard ridicat la cub.
Deci formula clasic pentru oblicitate este:

Oblicitatea =
( )
3
3
1
o n
x x
n
i
i

=



3.2. lndicatori ai boltirii
Boltirea (kurtosis, n englez) vrea s exprime, nlimea cocoaei curbei,
comparativ cu cea normal. Se vorbete astfel de distribuii:
- leptocurtice (cu cocoaa nalt) i
- platicurtice (mai aplatizate).
Indicatorul se obine cu ajutorul momentului centrat de ordinul patru, cu formula:

Boltirea =
( )
3
4
4
1

=
o n
x x
n
i
i


Valorile pozitive indic situaia distribuiilor leptocurtice (cocoa nalt)
Valorile negative indic situaia distribuiilor platicurtice (mai aplatizate)

S-ar putea să vă placă și