Sunteți pe pagina 1din 241

Cuprins

Prefata

1 Introducere

1.1 Obiectul statisticii . . . . . . . . . . . . . . . . . . . . . . . . .


1.2 Ramuri ale statisticii . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Notiuni de baza folosite ^n statistica . . . . . . . . . . . . . . .

2 Etape ale cercetarii statistice


2.1
2.2
2.3
2.4

Observarea statistica . . . . . . .
Gruparea datelor statistice . . . .
Prelucrarea statistica . . . . . . .
Analiza si interpretarea statistica

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

3 Serii statistice

3.1 Notiuni generale . . . . . . . . . . . . . . . . . . . . . . . . . .


3.2 Serii statistice simple (unidimensionale) sau pentru o caracteristica
3.3 Reprezentari gra ce . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1 Gra ce pentru serii simple atasate caracteristicilor numerice (cantitative) . . . . . . . . . . . . . . . . . . . .
3.3.2 Gra ce pentru serii atasate caracteristicilor calitative
(nominative) . . . . . . . . . . . . . . . . . . . . . . . .

4 Marimi relative

4.1 Forme de prezentare . . . . . . . . . . . . . . . . . . . . . . . .


4.2 Tipuri de marimi relative . . . . . . . . . . . . . . . . . . . . .
3

9
10
12

14
14
15
20
22

23
23
25
28
29
36

46
47
48

5 Marimi medii
5.1
5.2
5.3
5.4

Exemple de medii uzuale . . . . . . . . . . . . . . . . . . . . .


Proprietati generale ale mediilor . . . . . . . . . . . . . . . .
Originea comuna a mediilor . . . . . . . . . . . . . . . . . . .
Principii de alegere a unei medii. Teoria lui Chisini{Boiarski .

.
.
.
.

53
53
58
59
60

6 Indicatori statistici pentru serii unidimensionale cantitative


(numerice)
67
6.1 Indicatori de pozitie . . . . . . . . . . . . . . . .
6.1.1 Media statistica . . . . . . . . . . . . . . .
6.1.2 Momentele initiale . . . . . . . . . . . . .
6.1.3 Modul (dominanta) . . . . . . . . . . . .
6.1.4 Functia empirica (statistica) de repartitie
6.1.5 Cvantile empirice. Mediana . . . . . . . .
6.1.6 Calculul medianei . . . . . . . . . . . . .
6.2 Indicatori ai variatiei si ai ^mprastierii . . . . . .
6.2.1 Indicatorii simpli ai variatiei . . . . . . .
6.2.2 Indicatorii sintetici ai variatiei. . . . . . .
6.3 Eliminarea valorilor aberante. Testul lui Grubbs
6.4 Momente centrate . . . . . . . . . . . . . . . . .
6.5 Indicatori pentru asimetrie . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

68
68
68
69
71
75
76
80
80
82
87
89
90

7 Indicatori numerici pentru serii statistice calitative (nominative)


96
8 Serii statistice duble. Distributii empirice bidimensionale.
Tabele de corelatie
102

8.1 Notiuni generale . . . . . . . . . . . . . . . . . . . . . . . . . . 102


8.2 Serii cu ambele caracteristici numerice . . . . . . . . . . . . . . 104
4

8.3 Reprezentari gra ce ale seriilor duble cu doua caracteristici numerice (X Y ) . . . . . . . . . . . . . . . . . . . . . . . . . . . .


8.4 Indicatori numerici pentru serii duble cu caracteristici cantitative si frecvente . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.1 Medii de grupe. Dispersii de grupe . . . . . . . . . . . .
8.4.2 Momente initiale pentru perechea de variabile (X Y ) . .
8.4.3 Momente centrate. Corelatia. Coe cientul de corelatie .
8.4.4 Proprietati si interpretari ale coe cientului de corelatie .
8.5 Serii numerice paralele . . . . . . . . . . . . . . . . . . . . . . .
8.5.1 Coe cientul de corelatie liniara . . . . . . . . . . . . . .
8.5.2 Coe cientul lui Kendall (prin comparatia rangurilor) . .
8.5.3 Coe cientul Spearman (prin comparatia rangurilor) . .
8.5.4 Coe cientul lui Fechner . . . . . . . . . . . . . . . . . .
8.6 Serii numerice multiple . . . . . . . . . . . . . . . . . . . . . . .
8.6.1 Corelatia partiala pentru serii cu frecvente . . . . . . . .
8.6.2 Coe cientul Kendall pentru legaturi multiple . . . . . .
8.7 Serii duble din care cel putin una este calitativa (nominativa) .
8.7.1 Serii mixte . . . . . . . . . . . . . . . . . . . . . . . . .
8.7.2 Serii duble cu ambele caracteristici nominative . . . . .

9 Regresii. Legatura cu corelatia


9.1
9.2
9.3
9.4

Punerea problemei, etape pentru gasirea unei regresii .


Regresia liniara . . . . . . . . . . . . . . . . . . . . . .
Regresii curbilinii . . . . . . . . . . . . . . . . . . . . .
Regresii multiple (Functii de mai multe variabile) . . .

10 Elemente de teoria selectiei. Statistica inferentiala

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

106
110
112
119
120
122
125
125
127
128
130
133
133
134
136
136
138

145

147
149
154
158

165

10.1 Esantion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165


10.2 Problema centrala ^n teoria selectiei . . . . . . . . . . . . . . . 175
5

10.2.1 Legi de probabilitate, discrete uzuale .


10.2.2 Legi de probabilitate continue . . . . .
10.3 Metode de estimare a parametrilor . . . . . .
10.3.1 Metoda verosimilitatii maxime . . . .
10.3.2 Metoda momentelor (1891, Pearson) .
10.3.3 Metoda intervalelor de ^ncredere . . .
10.4 Teste de veri care a ipotezelor statistice . . .
10.4.1 Generalitati. Tipuri de teste . . . . .
10.4.2 Etapele unui test . . . . . . . . . . . .
10.4.3 Exemple de teste uzuale . . . . . . . .
10.4.4 Probleme rezolvate . . . . . . . . . . .
Anexe

Bibliogra e

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

176
181
192
197
200
202
208
208
209
212
224

242

Prefata
Statistica teoretica este ^n prezent folosita de multi specialisti, din cele
mai variate domenii, dar ^n special de economisti. Din dorinta unor autori de
a prezenta un material exhaustiv se pierd ideile principale si expunerea devine
^nc^lcita. Pentru a evita acest lucru, unele metode prea elementare nu au fost
a
prezentate, iar structura cartii a fost facuta dupa cele doua criterii principale:
{ Ordinul seriei: serii simple, serii duble, serii multiple
{ Tipul caracteristicii: caracteristici cantitative (numerice), caracteristici
calitative (nominative).
La sf^rsit este prezentat un capitol cu elemente de statistica matematica,
a
stiut ind faptul, ca statistica teoretica, descriptiva, c^stiga ^n valoare, cu c^t
a
a
^mprumuta mai multe elemente si metode din statistica matematica, care la
r^ndul ei se bazeaza pe teoria probabilitatilor. Pentru a deveni specialist ^n
a
statistica economica, mai trebuie ca cititorul sa completeze cunostintele din
acest manual cu notiuni despre indicatorii statistici economici, care, am considerat ca sunt usor de ^nteles si se gasesc ^n orice tratat de statistica economica.
^n material, am evitat prezentarea prea amanuntita a tabelelor, necesare
I
pentru organizarea calculelor, efectuate manual, pentru diferiti indicatori mai
complicati, pentru simplul motiv ca^n prezent toate calculele se fac automat, cu
calculatorul, prin intermediul unor programe performante. Din acelasi motiv,
al existentei unor softuri moderne bune, metodele statistice elementare pierd
teren ^n fata celor mai elaborate si e ciente precum si a statisticii matematice,
pentru ca acum nimeni nu se mai teme de calcule complicate si de volum mare,
7

acestea ind facute automat de calculator. Gra cele sunt executate, de asemenea, automat, rapid, color, ind foarte sugestive.
Cartea se adreseaza ^n primul r^nd studentilor de la pro lurile de Stiinte
a
Economice de la I.D. sau zi, dar poate studiata si de alti specialisti care folosesc statistica. Tuturor le recomand ca dupa parcurgerea materialului sa faca
apel la cunostintele de informatica pentru a studia macar un program (soft)
specializat ^n statistica.

Capitolul 1

Introducere
1.1 Obiectul statisticii
Statistica este stiinta care studiaza fenomenele si procesele din natura si
societate, relatiile dintre fenomenele economice si sociale, legaturile cantitative,
dar si pe cele calitative.
Denumirea de statistica a aparut pentru prima oara ^n limba germana
(Statistik) si deriva de la cuv^ntul latin "Status" care se traduce prin "stare de
a
lucruri". Termenul de statistica a fost introdus ^n secolul 18 de profesorul Gott ed Achenwall (1719{1772) de la Universitatea din Gottingen. Obiectul initial
al statisticii era descrierea situatiei generale a unui stat, evidenta rezervelor si
a resurselor sale. Cu timpul sfera de cuprindere a statisticii s-a largit ^n special
la studiul fenomenelor economice sociale, biologice precum si ^n tehnica.
Bazele cercetarii statistice au fost puse fara ^ndoiala de scoala engleza,
cu o contributie esentiala din partea scolii universitare germane. Amintim
pe William Petty (1623{1687). John Grount (parintele demogra ei), astronomul Halley si Hemann Couring (1606{1682). Mentionam numele c^torva
a
dintre ^ntemeietorii statisticii moderne, care au produs o mutatie esentiala
^n conceptia generala despre obiectul statisticii: Francis Galton (1822{1911)
biolog si antropolog, ^ntemeietor ^n 1901 al revistei "Biometrika", apoi pe
marele antropolog si psiholog Karl Pearson (1857{1936) si pe cel considerat
9

cel mai mare dintre toti Ronald Fisher (1890{1962) biolog si cercetator la o
statiune agrobiologica, dovedesc ca statistica este un instrument de lucru vital ^n domenii foarte variate: biologie, psihologie, stiinte sociale, economie si
tehnica.
^n opinia marilor statisticieni moderni englezi Yule si Kendall datele
I
statistice din diferite sectoare ale activitatii umane presupun utilizarea si a
unor metode speciale numite metode statistice care se preocupa cu prelucrarea si analizarea unui tip special de informatie, viz^nd ^n nal detinerea
a
unor concluzii utile.

1.2 Ramuri ale statisticii


Prin obiectul si metoda sa statistica este o stiinta unitara. ^n timp s-au
I
cristalizat c^teva directii dintre care amintim:
a
1. Statistica matematica, este str^ns legata de teoria probabilitatilor
a
apel^nd ^ncontinuu la metode si rezultate teoretice din acest domeniu.
a
Are patru capitole importante.
a) Teoria selectiei (sau statistica inferentiala) este capitolul principal, cel
mai productiv si e cient. Pe baza unui numar mic de date culese de la o
parte a populatiei (deci cu efort mic)cu o prelucrare ^nalta, bazata pe un
aparat matematic so sticat, obtine concluzii pertinente asupra ^ntregii
populatii.
b) Teoria estimatiei care se refera la estimarea c^t mai corecta a parametrilor
a
legilor de probabilitate teoretice care modeleaza fenomenele naturale, economice, sociale, etc.
c) Teoria intervalelor de ^ncredere.
d) Teste de veri care a ipotezelor statistice, care valideaza sau nu anumite
10

rezultate, etapa extrem de utila ^n luarea deciziilor.


Statistica matematica concepe si furnizeaza indicatori si metode de
studiu foarte performante necesare celorlalte ramuri ale statisticii.
2. Statistica teoretica fundamenteaza metodologic fazele cunoasterii
statistice ^n general (observare, prelucrare, transmitere, analiza) si elaboreaza
procedee de calcul al diferitilor indicatori (marimi relative, marimi medii si
indicatori statistici) cu ajutorul carora opereaza orice alta ramura a statisticii.
Este str^ns legata de statistica matematica. ^n acest volum vom descrie ^n
a
I
special acest tip de statistica fac^nd ^nsa referiri si la celelalte.
a
3. Statistica economica studiaza fenomene economice si procesele
economico-sociale de masa din cadrul economiei nationale, legaturile dintre
agentii economici, dintre sarcinile acesteia mentionam:
{ cunoasterea dezvoltarii economiei nationale si a societatii ^n general
{ statistica obiectivelor si directiilor dezvoltarii viitoare
{ elaborarea programului de dezvoltare curenta si viitoare
{ fundamentarea masurilor decizionale
{ urmarirea ^ndeplinirii obiectivelor stabilite ^mbunatatirea sistemului de
indicatori, rationalizarea documentelor de evidenta si circuitul acestora.
Ca principale ramuri ale statisticii economice amintim: Statistica
macroeconomica, Statistica afacerilor, a industriei, a agriculturii, constructiilor,
transporturilor si telecomunicatiilor, circulatia marfurilor, etc.
4. Statistica o ciala (publica "Anuarul Statistic") are ca subramuri
statistica demogra ca, a culturii, statistica sanitara, judiciara, fara a neglija
^nsa si date economice generale la nivelul statului.
Aceste tipuri de statistici se deosebesc ^n general prin speci cul colectarii
11

datelor, modul de grupare si comunicarea rezultatelor. Metodele de prelucrare


sunt ^nsa ^n mare parte asemanatoare.

1.3 Notiuni de baza folosite ^n statistica


1. Populatie statistica sau colectivitate este formata din totalitatea

elementelor sau faptelor de acelasi fel av^nd trasaturi comune care formeaza
a
obiectul cercetarii.
Aceasta colectivitate are un caracter obiectiv, concret si nit care trebuie delimitata, de nita clar ^n timp, spatiu sau actiune.
Populatia statistica poate formata din persoane, obiecte, evenimente,
agenti economici, idei, opinii, operatii economice.
2. Unitatea statistica: este elementul din care se compune populatia.
El poate simplu (indivizibil) sau complex ca rezultat al unei grupari.
Numarul de indivizi ai populatiei se numeste cel mai adesea volumul
populatiei si ^l vom nota cu N .
3. Caracteristica statistica (variabila statistica) este una din
trasaturile comune proprii tuturor unitatilor populatiei.
Exemplu: La o multime de indivizi putem distinge mai multe caracteristici: ^natimea, masa, numarul de copii, tipul comportamental, starea nanciara, starea de sanatate exprimata prin cuvinte sau valori numerice ale
analizelor medicale etc.
Caracteristicile se pot clasi ca dupa mai multe criterii, dintre care modul
de exprimare este cel esential (natura caracteristicii):
{ Dupa modul de obtinere:
- primare
- derivate.
{ Dupa continut:
12

- caracteristici de timp (cronologice)


- caracteristici de spatiu
- caracteristici atributive.
{ Dupa modul de exprimare (natura) cele atributive pot :
a) cantitative (numerice, masurabile) care la r^ndul lor pot :
a
- continue, daca pot lua orice valoare din domeniul de variatie
(^naltimea, masa, cont bancar)
- discrete, daca iau doar anumite valori, cel mai des ^ntregi
(numar de copii, numar de intrari, de actionari).
b) calitative (nominative): nu pot exprimate numeric ci prin nume:
culoarea ochilor, tipul comportamental, sectoare economice, etc.

4. Indicatorul statistic reprezinta expresia numerica cu un continut

real si forma speci ca de exprimare. ^n general se exprima prin relatii mateI


matice dar poate avea si de nitii date prin cuvinte.
5. Date statistice sunt marimi obtinute prin observare, experiente,
masurare. Datele sunt purtatoare de informatie, care este mesajul datelor,
adica continutul speci c al acestora.

Observatii
{ Caracteristicile de timp (seriile cronologice) sunt de fapt masurabile
si deci pot ^ncadrate la cele cantitative, totusi cei mai multi statisticieni le
trateaza separat, timpul ind o caracteristica prea importanta. Modul de lucru
este ^nsa perfect analog cu cel al caracteristicilor cantitative.
{ ^n mod analog caracteristicile spatiale, care se refera cel mai adesea la
I
repartitia ^n teritoriu, sunt de tip calitativ, regiunile ind nominative si deci
nemasurabile.
13

Capitolul 2

Etape ale cercetarii statistice


2.1 Observarea statistica
Observarea statistica cuprinde culegerea datelor individuale. Se poate
extinde asupra ^ntregii populatii (observare totala) sau numai asupra unei
parti numita esantion (sondaj sau selectie). Modul cum este ales esantionul
constituie un studiu special ^n teoria selectiei. El trebuie sa e uniform,
aleator, reprezentativ. Uneori sunt necesare instrumente speciale cum ar
formularele, instructiunile, metodologia care permit culegerea de c^t mai
a
multe informatii cu un volum de munca c^t mai mic.
a
Cresterea cantitatii de date statistice asigura ^n prima faza o crestere a
cantitatii de informatie apoi c^nd volumul de date este su cient de mare se
a
produce o saturare a informatiei aduse, asa ^nc^t nu mai sunt necesare date
a
noi.
A continua sa mai colectam date noi ^ntr-un astfel de moment ^nseamna
sa facem eforturi inutile.
^n ultimul timp pentru colectarea si stocarea datelor se utilizeaza
I
instrumente perfectionate legate de tehnica electronica de calcul, softuri
speciale care conduc la construirea unor baze de date performante.

14

2.2 Gruparea datelor statistice


Vom da ^n continuare doar c^teva principii generale de centralizare, grua
pare si stocare a datelor urm^nd sa vedem concret modul de lucru cu serii
a
statistice.
Gruparea este o metoda de baza ^n prelucrarea primara a datelor, prin
care elementele colectivitatii se ^mpart ^n clase omogene dupa varietatea uneia
sau mai multor caracteristici. Notiunile de baza utilizate la aceasta operatie
sunt: caracteristica de grupare, variatia, amplitudinea, omogenitatea.
Caracteristica de grupare este ^nsusirea care separa elementele
populatiei statistice ^n clase sau grupe omogene (asemanatoare).
Variatia reprezinta proprietatea caracteristicilor statistice de a
^nregistra mai multe valori (^n cazul celor numerice) sau mai multe forme de
manifestare (^n cazul caracteristicilor calitative).
Amplitudinea variatiei { este diferenta dintre valoarea maxima si
minima referitoare la plaja de variatie a tuturor valorilor individuale a unei
caracteristici.
Grupa omogena { statistic ^nseamna clasa de elemente ^n care variatia
este minima.

Tipuri de grupe statistice:


a) Dupa numarul caracteristicilor folosite pot simple sau combinate (bivariate sau chiar cu mai multe caracteristici):
{ Grupari simple { repartizarea membrilor colectivitatii pe clase
^n functie de variatia unei singure caracteristici, mention^nd si
a
frecventa corespunzatoare ecarei grupe
{ Grupari combinate se obtin daca separarea datelor se face cel putin
dupa doua caracteristici. Se separa mai ^nt^i elementele populatiei
a
15

pe grupe dupa prima caracteristica apoi ecare grupa dupa cea de-a
doua caracteristica. Se poate obtine astfel un tabel cu subdimensiuni, sau se pot aranja datele sub forma de matrice. ^n acest caz la
I
intersectia unei linii corespunzatoare unei grupe de la prima caracteristica cu o coloana de la a doua caracteristica se va putea trece
frecventa absoluta nij adica numarul de unitati (indivizi) care se
^ncadreaza ^n grupa i dupa prima caracteristica si grupa j dupa a
doua.
b) Dupa continutul caracteristicii:
{ grupari cronologice { datele se separa dupa o caracteristica de timp
{ grupari spatiale
{ grupari dupa o caracteristica atributiva { datele se separa dupa
trasaturile speci ce unitatilor.
c) Dupa forma de exprimare a caracteristicilor atributive:
{ grupari dupa o caracteristica calitativa (sau nominativa) (exemplu:
ramuri ale economiei nationale, tipuri de ocupatii, etc.)
{ grupari dupa caracteristici exprimate numeric grupari cantitative
(exemplu: ^naltimea, masa, productia, etc.).
Caracteristicile numerice se preteaza la:
{ grupari pe variante (cu valori discrete). se aplica daca caracteristica
este discreta (numar de copii, note la o examinare)sau numarul valorilor
este redus asa ca ecare valoare reprezinta o grupa
{ grupari pe intervale se folosesc daca caracteristica este continua (masa,
^naltime, etc.) sau c^nd gradul de variatie al caracteristicii este prea mare,
a
adica retinerea datelor pe variante distincte ar conduce la un numar prea
mare de clase (exemplu: gruparea salariatilor dupa marimea veniturilor).
16

Pentru grupare este necesar sa alegem c^t mai convenabil, pentru scopul
a
urmarit, marimea intervalelor de grupare si a numarului de grupe.
Observatie. Daca intervalele de grupare sunt mari, volumul de calcule este
mai mic dar se pierd informatii si din netea concluziei si reciproc.
Intervalele de grupare pot egale sau diferite ca marime. C^nd sunt
a
egale calculele ulterioare sunt mai simple. Intervalele de lungimi diferite se
folosesc mai rar si numai daca avem o problema speciala care impune acest
lucru. De exemplu daca numarul de indivizi din anumite grupe e prea mare
si dorim divizarea acestor grupe pentru un studiu mai n, sau reciproc daca
anumite grupe au numar prea mic de elemente pentru simpli care se comaseaza
obtin^nd intervale mai mari.
a
Exemplu. Evolutia cronologica a publicatiilor economice
Periaoda
Numar publicatii
^nainte de 1700
3
1700{1800
10
1800{1900
15
1900{1950
30
1950{1980
300
1980{2000
500
2000{2002
1500
ar o ^mpartire ce urmareste o serie cronologica ^n care frecventa publicatiilor
creste exponential si este deci necesara utilizarea grupelor de marimi diferite.
Observatie. Prin grupare se pierd informatii relative la datele initiale ^n
schimb se c^stiga o privire de ansamblu asupra lor si o prelucrare ulterioara
a
mai usoara.

17

Formarea grupelor
1. Se determina cea mai mica valoare a caracteristicii studiate xmin
si cea mai mare xmax , stabilind totodata plaja de variatie a acesteia, adica
amplitudinea totala
A = xmax ; xmin
2. Se divide plaja de variatie ^ntr-un numar stabilit de grupe cu aceeasi
amplitudine (dimensiune) sau, mai rar, diferita.
Numarul de grupe r se poate alege subiectiv, recomandabil ^ntre 5 si 20,
sau folosind formula lui H.A.Sturges

r = 1 + 3 322 lg N
unde N este cardinalul populatiei sau volumul populatiei (numarul total al
subiectilor studiati).
^n cazul grupelor egale rezulta h marimea intervalului de grupare
I

h= A
r

3. ^n nal se determina numarul de unitati (elementele, indivizii) care


I
apartin ecarei grupe, adica frecventa absoluta corespunzatoare ni .
Exemple de grupari:
1.
Salariul lunar (mii lei) Numar salariati
2000{3000
3
3000{4000
8
4000{5000
11
5000{6000
20
6000{7000
24
7000{8000
18
8000{9000
10
9000{10000
4
18

2.

Numar piese produse Numar unitatilor


81{90
2
91{100
4
101{110
5
111{120
8
121{130
11
131{140
7
141{150
4
151{ si peste
1

1. ^n tabelul 1 6000 7000) de exemplu, se numeste interval de grupare.


I
^n cazul ^n care caracteristica este continua, intervalele se considera deschise
I
^ntr-una din parti (de exemplu la dreapta) atunci amplitudinea grupei este

h = ag = ls ; li
unde:

ls = limita superioara (de exemplu: 7000)


li = limita inferioara (de exemplu: 6000)
h = ag = 7000 ; 6000 = 1000

Valoarea centrala a grupei (valoarea medie) se calculeaza ca medie aritmetica a capetelor

xi(med) = ls + li = 7000 + 6000 = 6500


2
2
Pe de alta parte amplitudinea totala este

A = 10000 ; 2000 = 8000


h = ag = A = 8000 = 1000
r
8
19

unde r = 8 este numarul grupelor.


2. ^n tabelul doi avem o caracteristica discreta "numarul de piese proI
duse" si intervalele au fost luate ^nchise. Fie intervalul 121 ; 130]. Atunci
li = 121 este limita inferioara
ls = 130 este limita superioara
h = ag = (130 ; 121) + 1 = 10 este amplitudinea grupei. ^n acest caz se
I
adauga unu indca capetele sunt socotite "inclusiv".
A = (160 ; 81) + 1 = 80 este amplitudinea totala.
Pe de alta parte
h = A = 80 = 10
r 8

8 = numarul de grupe,
Observatie. Pentru ca ultimul interval nu avea margine superioara ( ind
teoretic de lungime in nita), la calcule acesta se alege prin conventie ^n asa fel
ca ultimul interval sa e de lungime egala cu celelalte. La fel s-ar procedat
si cu prima limita inferioara daca primul interval ar fost mentionat ca "sub
90 piese".

2.3 Prelucrarea statistica


Prelucrarea statistica este etapa cea mai importanta si mai elaborata.
Vom da o extindere mare^n acest volum etapei de prelucrare. Ca efect esential a
prelucrarii datelor este cresterea puternica a cantitatii de informatie acumulate
initial prin datele culese. Se realizeaza prin mai multe operatii ca:
{ centralizarea (sistematizarea) si gruparea datelor individuale
{ stocarea pe diferite suporturi: se, discuri optice din calculatoare, etc.,
formarea de baze de date performante
{ eliminarea datelor aberante, se poate face si automat pe baza de programe
incluse ^n softurile de baza
20

{ calculul sistemului de indicatori statistici care trebuie selectati ^n vederea


scopului urmarit
{ prezentarea rezultatelor prin tabele, gra ce, serii.
^n aplicatiile actuale ale statisticii se utilizeaza masiv tehnica moderna
I
de calcul, cu diferite programe specializate mai mult sau mai putin pe statistica.
Amintim c^teva dintre acestea, unele din ele execut^nd automat operatiile ce
a
a
vor descrise ^n continuare.
1. SPSS { este programul (softul) cel mai perfectionat si executa toate
operatiile indicate de statistica teoretica, de la cea descriptiva p^na la cala
culele cele mai so sticate ale statisticii matematice, chiar si pentru un volum
mare de date. Necesita cunostinte bune de informatica.
2. SAS { Statistical Analysis Sistem este un pachet de soft care da posibilitatea sistematizarii si prelucrarii unui volum de date su cient de mare.
EXCEL { cuprinde programe de calcul pentru functii matematice si expresii statistice. Cele pentru statistica permit calculul marimilor medii, a
coe cientilor de corelatie, regresie si a testelor de semni catii.
Se pot genera tabele oric^t de complicate fac^nd calcule automat cu
a
a
datele cuprinse ^n acestea, se pot realiza diferite forme de reprezentari gra ce.
TURBOSTATS { permite compararea diferitelor repartitii de frecvente cu
cea normala si realizarea de teste de semni catie si reprezentari gra ce.
MYSTAT { permite prelucrarea usoara a unor statistici descriptive aplicarea
testelor de veri care a ipotezelor statistice Z , T , 2 precum si calcularea regresiei, a corelatiei pe baza datelor obtinute prin sondaj.
QSB+ { permite realizarea de previziuni pe serii de timp, programarea dinamica, liniara, metoda drumului critic, metoda lanturilor Markov, etc.
QMA (Quality Management Analist) realizeaza statistici descriptive pentru
numar mic de observatii (p^na la 100). Este cel mai simplu program cu care se
a
poate calcula mediana, modul, abaterea medie patratica diverse cvantile. Mai
21

poate realiza compararea repartitiei datelor de prelucrat cu repartitia normala


adica ne da gradul de normalitate a seriei.

2.4 Analiza si interpretarea statistica


{ presupune compararea rezultatelor obtinute
{ formularea concluziilor asupra ^ntregii cercetari
{ utilizarea unor teste de veri care statistica
{ elaborarea unor prognoze statistice.

Observatie. Aceasta etapa este speci ca ecarui domeniu de activitate ^n care

se foloseste statistica. Necesita multa experienta ^n domeniul respectiv pentru


a evita capcanele ce pot aparea la interpretarea rezultatelor.

22

Capitolul 3

Serii statistice
3.1 Notiuni generale
Seriile statistice sunt formate dintr-o ^nsiruire simpla, sau grupata, mai
putin sau mai mult ordonata, a datelor culese.
^n principiu clasi carea acestora se face dupa tipul caracteristicilor la
I
care se refera. Vom avea astfel:
1) Serii statistice de timp (prezinta variatia unei caracteristici ^n timp) care
pot :
{ dinamice de intervale
{ dinamice de momente.
2) Serii statistice de spatiu.
3) Serii statistice atributive:
{ numerice sau cantitative (se refera la o caracteristica numerica)
{ nominative sau calitative.
4) Dupa numarul caracteristicilor studiate simultan avem:
{ serii statistice simple { contin date pentru o caracteristica
{ serii statistice duble { contin date pentru doua caracteristici
23

{ serii statistice multiple { contin date pentru mai multe caracteristici.


Cele duble si multiple se mai numesc ^n literatura de specialitate si vectori statistici.
Observatii. 1. Majoritatea statisticienilor studiaza seriile cronologice si cele
de spatiu ca ind cazuri speciale.
De fapt seriile cronologice se pot ^ncadra foarte bine ^n cele numerice
(masurabile), deoarece timpul este o marime continua, masurabila si orice interval de timp poate ^mpartit pe grupe.
Analog, seriile de spatiu se pot ^ncadra la categoria nominative, deoarece
"zonele" ^n general nu pot ordonate ele primind un numar sau eventual un
cod.
2. Caracteristicile cantitative am vazut ca pot continue (ca masa,
^naltimea, contul, etc.) sau discrete (numarul de copii, numarul de piese fabricate, numarul de operatii la o banca, etc.).
Deoarece datele culese sunt ^n numar nit ele sunt ^ntotdeauna discrete,
deci seriile statistice atasate sunt cu valori discrete. Daca numarul de date
discrete este ^nsa prea mare atunci se impune gruparea acestora pe intervale,
operatie pe care am tratat-o anterior.
^n continuare vom structura studiul seriilor statistice doar dupa criteriile
I
3 si 4.

24

3.2 Serii statistice simple (unidimensionale) sau


pentru o caracteristica
Fie o colectie de date asupra unei populatii cuprinsa ^ntr-un sier (tabel)
ca cel de mai jos:
^naltimea Masa Numar Cont Stare : : :
Nr.
Numele /
I
crt.
codul
copii ^n lei civila
1.
Avram Ion
x1
m1
y1
c1
s1 : : :
2. Banciu Gheorghe
x2
m2
y2
c2
s2 : : :
.
..
..
..
..
..
..
.
.
.
.
.
.
.
.
N. Vladoiu Victor
xN
mN
yN
cN
sN : : :
Fiecare coloana corespunde unei caracteristici a indivizilor, caracteristica
care poate de diverse tipuri dupa cum am aratat mai sus.

Caracteristici cantitative (masurabile) numerice


Sirul de date corespunzator unei caracteristici care reprezinta datele primare se poate organiza prin scrierea o singura data a valorilor ce se repeta
mention^nd frecventa de aparitie a acelei valori, adica frecventa absoluta,
a
e grup^nd datele pe intervale, ^n special pentru caracteristicile continue cu
a
mentionarea corespunzatoare a frecventei.
^n acest fel vom avea pentru o caracteristica:
I
a) x1 x2 : : : xN { serie simpla neprelucrata
Valori x1 x2 : : : xr
tablou de repartitie
Frecventa n1 n2 : : : nr
(distributie) pentru
seria simpla
absoluta
Prin serie statistica se ^ntelege si o corespondenta ^ntre valorile caracteristicei si frecventele de aparitie a acestora (frecvente absolute). Frecvent
b)

25

acest tablou se numeste si repartitie sau distributie statistica. Denumirea


de repartitie este sugestiva deoarece se refera la repartitia frecventelor absolute ni pe valorile xi luate de caracteristica studiata.
Suma frecventelor absolute reprezinta numarul total de indivizi (unitati,
elemente) a populatiei si se numeste volumul populatiei sau cardinalul
populatiei
r
X
N = ni :
i=1

Raportul dintre o frecventa absoluta ni si volumul populatiei se numeste

frecventa relativa fi

Evident

n
fi = ni = Xi
r
N
ni
i=1

r
X
i=1

X
ni
fi = X = 1
ni

Repartitiile statistice se pot scrie evident si cu frecventele relative


Valori x1 x2 : : : xr
Frecventa f1 f2 : : : fr
Daca datele sunt grupate pe intervale vom avea:
Valori
Frecventa absoluta

a1 a2 ]
n1

sau

a2 a3 ] : : :
n2
:::

ar ar+1]
nr

Valori
a1 a2 ] a2 a3 ] : : : ar ar+1]
Frecventa relativa
f1
f2
:::
fr
Vezi exemplele precedente.
Uneori vom avea interesul, ca seria din forma cu intervale sa e scrisa cu
valori discrete. Atunci ^n locul ecarui interval ai ai+1 ] se va pune valoarea
sa centrala xi = ai +2ai+1 ca reprezentant al grupei.
26

Caracteristici calitative (nominative). Serii atasate


^n practica se ^nt^lnesc destul de des si caracteristici calitative studiul
I
a
acestora ind ^n general foarte di cil datorita imposibilitatii compararii numerice a datelor. Foarte importante pentru aceste caracteristici vor gra cele
atasate.
Ca exemplu de caracteristici calitative putem mentiona:
{ sectoare economice: industrie, agricultura, transporturi, cercetare,
^nvatam^nt, sanatate, etc. cu ponderile lor
a
{ repartizarea pe meserii a unei populatii: intelectuali, muncitori, liberi
profesionisti, etc.
{ tipuri comportamentale: sanguin, coleric, egmatic, melancolic, care au
o anumita pondere (frecventa) la o populatie data.
Forma de prezentare a acestora este data de tabele, ca cel de mai jos:
A B C D E F
Numele grupei
Frecventa absoluta n1 n2 n3 n4 n5 n6
sau cu frecventa relativa
Numele grupei A B C D E F
Frecventa relativa f1 f2 f3 f4 f5 f6

ni = N

fi = ni
X N
fi = 1

Observatie. Grupele pot asezate ^n tabel ^n orice ordine ele neput^nd


a

comparate (^ntre ele nu exista o relatie de ordine).


Exemple. 1. Repartitia investitorilor ^n anul 2002 pe ramuri turistice este

27

data de datele de mai jos:


A.
B.
C.
D.
E.

Turism montan (cabane)


Turism marin (hoteluri)
Agroturism rural
Transporturi ^n turism
Agentii turistice

30%
40%
10%
15%
5%

Tipul A
B
C
D E
F 30% 40% 10% 15% 5%
2. Ultimul sondaj de opinie indica pentru candidatii la presedintie
urmatoarele valori:
B
C D
Numele candidatului A
Frecventa relativa 40% 35% 15% 5%

3.3 Reprezentari gra ce


Gra cele reprezinta un mijloc de prezentare intuitiva a datelor statistice
cu ajutorul liniilor, punctelor, gurilor geometrice, sau a unor guri simbolice,
a hartilor.
Au urmatoarele avantaje:
{ ^nlesnesc compararea si memorarea datelor statistice
{ ilustreaza dinamica fenomenelor economice
{ constituie un mijloc esential de popularitate a datelor.
Orice gra c trebuie sa contina explicatii asupra scarii respective asupra
gurilor folosite cuprinse ^ntr-o legenda c^t mai simpla si sugestiva.
a

28

3.3.1 Gra ce pentru serii simple atasate caracteristicilor


numerice (cantitative)
a) Histograma se construieste pe doua axe de coordonate rectangu-

lare. Pe axa x{lor (orizontala) se reprezinta intervalele egale succesive, corespunzatoare grupelor de valori (^n cazul grupelor egale). Pe ecare interval
se construiesc dreptunghiuri av^nd ^naltimea proportionala cu frecventa (aba
soluta sau relativa) corespunzatoare ecarei grupe. Evident si aria acestor
dreptunghiuri este proportionala cu frecventa corespunzatoare ecarei grupe.
Observatie. Dreptunghiurile sunt lipite unele de altele si ordinea lor este bine
determinata (nu poate schimbata).

Fig.1

Observatie. Unitatea de masura pe ecare din axe se va alege ^n asa fel ca

desenul sa se ^nscrie pe un spatiu rezonabil.


Exemplu. Gruparea salariatilor de la U.L.B.S. ^n anul 2002 pe v^rste este
a

29

data ^n tabelul urmator.


Grupa de v^rsta Numar de salariati
a
20{30 ani
60
31{40 ani
150
41{50 ani
200
51{60 ani
100
61{70 ani
30
Total
540

Fig.2

b) La seriile statistice cu grupe de marimi inegale pentru a asigura o

intuitie c^t mai buna se va urmari, ^n histograma, principiul ca ariile dreptuna


ghiurilor, sa e proportionale cu frecventele si nu cu ^naltimile (lucru care este
asigurat automat la serii cu intervale egale). Acest lucru este ilustrat ^n tabelul
urmator ^n care se vede si modul de calcul al ^naltimilor dreptunghiurilor. Pe
axa orizontala se vor desena intervale succesive, de lungime proportionala cu
marimea grupelor.
Exemplu. Repartitia unitatilor economice din industria extractiva dupa
30

numarul de salariati este ^n anul 2002 data de tabelul de mai jos:


Numar de
salariati

300{500
501{700
701{1000
1001{2000
2001{3500
3501{5000
Total

Numar de Lungimea Raport de Frecventa


unitati
intervalului marime
redusa
economice
ni
li
ri = l li
hi = ni
r

2
6
12
25
15
11
70
X
N = ni

200
200
300
1000
1500
1500

min

1
1
1,5
5
7,5
7,5

2
6
8
5
2
1,75

^naltimea dreptunghiului va proportionala cu hi = ni .


I
r
i

Fig.3

Observatii. 1. Ariile dreptunghiurilor sunt evident proportionale cu


frecventele ni

Ai = li hi = li ni = li nil lmin = lmin ni


ri
i
2. La histograma este esential ca dreptunghiurile sunt lipite si asezate
^ntr-o ordine de nita de succesiunea intervalelor. La seriile nominative vom
^nt^lni, de asemenea, dreptunghiuri sau patrate care pot ^nsa aranjate oricum
a

31

datorita faptului ca variantele nominative A B C : : : ale caracteristicii nu se


pot ordona.
c) Poligonul frecventelor este linia poligonala ce se ataseaza unei serii
cu valori discrete de forma

Valori numerice x1 x2 x3 : : : xp
Frecvente
n1 n2 n3 : : : np
unde valorile numerice xi sunt ordonate crescator.
Mod de reprezentare: Pe axa orizontala a unui sistem cartezian rectangular x0y se reprezinta valorile xi , ^n dreptul ecareia se ridica o ordonata yi
proportionala cu frecventa absoluta corespunzatoare ni (sau relativa fi ), apoi
se unesc v^rfurile de sus ale acestor ordonate obtin^nd o linie poligonala numita
a
a
"poligonul frecventelor".

Fig.4
Legatura cu histograma: Pentru ca o serie statistica pe intervale poate
transformata ^n serie cu valori discrete, ecarui interval ai ai+1 ] corespunz^ndu-i mijlocul acestuia xi = ai +2ai+1 , din histograma se poate obtine
a
poligonul frecventelor prin unirea mijloacelor laturilor superioare ale dreptun-

32

ghiurilor. Pentru exemplul de mai sus avem:


Grupe de v^rsta Mijlocul xi Numar salariati
a
20{30
25
60
31{40
35
150
41{50
45
200
51{60
55
100
61{70
65
30
Total
540

Fig.5

d) Reprezentarea gra ca a seriilor cronologice (dinamice)

Seriile cronologice reprezinta un caz particular de serie numerica


care poate prezentata e pe intervale de timp e pe momente discrete.
Particularitatea consta ^n faptul ca multimea valorilor este timpul care evident
este masurabil si ordonat. Gra cele unor astfel de serii vor evident de tip
histograma sau poligon al frecventelor, doar ca va primi un nume particular
cronograma sau historiograma.

Exemple.

1. Dinamica evolutiei agentilor economici ^ntr-o provincie.


33

Perioada Sec. Sec. Sec. Sec. Sec. Sec.


XV XVI XVII XVIII XIX XX
Frecventa 5
18
36
97
210 1600
Pe linia frecventelor poate aparea si volumul de productie ^n tone sau
volumul de marfuri transportate ^n total ^n diferite perioade de timp.
2. Evidenta populatiei din municipiul Cluj-Napoca cu ocazia recensamintelor:
Anii Mii / venituri
1930
100
1948
118
1956
153
1966
185
1977
266
1985
309
1989
317
Anuarul statistic al Rom^niei, 1990
a
Datorita importantei marimii "timp" majoritatea autorilor trateaza separat seriile cronologice unde doar limbajul si terminologia difera, metodele de
lucru ind similare cu cele folosite pentru orice serie atasata unei caracteristici
numerice. Evident caracteristica "timp" este una masurabila, adica numerica.

34

Fig.6

Observatie. Cele doua gra ce histograma si poligonul frecventelor au o

importanta foarte mare ^n statistica inferentiala sau ^n statistica matematica


deoarece sugereaza trendul fenomenului aleator, adica legea de probabilitate teoretica pe care o urmeaza caracteristica masurabila cercetata. Aceste gra ce constituie un punct de plecare pentru gasirea acestei legi, problema centrala ^n statistica matematica. Evident ca aceasta lege se gaseste cu oarecare aproximatie
tin^nd cont ca se utilizeaza date statistice experimentale care la r^ndul lor sunt
a
a
aproximative. Importanta acestei probleme consta ^n faptul ca dupa gasirea
legii de probabilitate ce guverneaza fenomenul economic urmarit (chiar aproximativ) se poate utiliza aparatul matematic al teoriei probabilitatilor, extrem de
perfectionat, pentru a face estimari ale evolutiei fenomenului (caracteristicii),
prognoze economice.
Gra cele ce vor urma pentru serii statistice asociate caracteristicilor calitative nu au aceasta aplicatie importanta. Rolul lor este doar de a da o imagine
intuitiva, simpla, de ansamblu asupra variatiei frecventei pe categorii nominative A B C : : :.

35

3.3.2 Gra ce pentru serii atasate caracteristicilor calitative (nominative)


a) Cercul de structura. Pe un disc se reprezinta sectoare a caror unghi

la centru este proportional cu frecventa relativa a ecarei categorii. Unghiul la


centru i se determina prin regula de 3 simpla sau prin relatia
i = 360

fi

unde fi este frecventa relativa a categoriei i.


Vom relua exemplul cu investitiile ^n turism
E
Sectoare din turism A B C D
Frecventa relativa 0,3 0,4 0,1 0,15 0,05
rezulta:

1
2
3
4
5

=0 3
=0 4
=0 1
= 0 15
= 0 05

360
360
360
360
360

Total

Fig.7
36

= 108
= 144
= 36
= 54
= 18
360

b) Dreptunghiul de structura este format din mai multe f^sii alipite


a

care au ariile proportionale cu frecventele (absolute sau relative) sau chiar


cu valorile numerice ale investitiilor. Pentru ca latimea dreptunghiului este
constanta vom mai calcula cu regula de 3 simple doar ^naltimea f^siilor.
a

Fig.8
Se obisnuieste ca f^siile sa e hasurate sau colorate diferit pentru ca dea
senul sa e mai sugestiv.
^naltimea totala a dreptunghiului corespunde procentului de 100%.
I

c) Diagrama prin coloane (benzi)

Se reprezinta pe un sistem cartezian dreptunghiuri de latime egala av^nd


a
^naltimea proportionala cu frecventa sau cu valoarea absoluta a ecarei categorii A B C D E .
Ordinea benzilor este arbitrara, deoarece categoriile A B C D E , nu se
pot ordona.

37

Fig.9
Se recomanda ca^ntre dreptunghiuri sa se lase un spatiu pentru a sublinia
deosebirea dintre diagrama prin coloane si histograma cu care nu are legatura.
^n plus spatiile dintre coloane pot folosite pentru a introduce acolo un set de
I
dreptunghiuri reprezent^nd situatia repartitiei dupa un alt criteriu, de exemplu
a
timp.
Vom relua exemplul cu investitia din turism exprimate ^n procente din
suma total alocata pentru doi ani consecutivi. Vom avea datele din tabelul de
mai jos:
Sectorul
Anul
2001
2002

25% 45% 20% 5% 5%


30% 40% 10% 15% 5%

Vom obtine o diagrama cu coloane compusa (mixta) care prezinta intuitiv repartitia investitiilor pe sectoare dar simultan si evolutia acesteia ^n
timp.
38

Fig.10

Observatie. Dreptunghiurile se pot aseza si oriyontal ^n sistemul cartezian


c^nd gra cul se mai numeste si (diagrama cu benzi).
a
d) Diagrama cu guri geometrice (patrate, cercuri, dreptunghiuri).
Se utilizeaza tot pentru caracteristicile nominative ^n vederea reprezentarii

unor indicatori de volum sau pentru reprezentarea structurii colectivitatii.


Exemplu. Presupunem ca ^n problema investitiilor ^n turism au fost investite
^n total 200 miliarde lei repartizate pe cele cinci sectoare conform tabelului
Sectoare
A
B
C
D E
cota %
30% 40% 10% 15% 5%
miliarde lei 60 80 20 30 10
Se alege o scara, de exemplu, 1cm2 = 10miliarde. Vom calcula laturile
patratelor astfel ca ariile patratelor sa e proportionale cu sumele alocate,

39

respectiv frecventele corespunzatoare sectorului

A = 60md ! 6cm2
B = 80md ! 8cm2
C = 20md ! 2cm2
D = 30md ! 3cm2
E = 10md ! 1cm2

p
;! la = 6 2 45cm
p
;! lb = 8 = 2 82cm
p
;! lc = 2 = 1 41cm
p
;! lc = 3 = 1 73cm
p
;! le = 1 = 1cm

Rezulta reprezentarea cu patrate. ^n interior se pot trece sumele absolute


I
sau cotele procentuale.

Fig.11
Diagrama cu cercuri. ^n locul patratelor se pot utiliza discuri a caror
I
arie sa e proportionala cu sumele investite sau cotele procentuale. Razele
cercurilor se calculeaza cu relatia

Ri = Si
unde Si sunt sumele alocate. Se alege, de exemplu, raza de 1 cm pentru 10
miliarde de lei.

40

Fig.12
Pentru ca nu conteaza ordinea de prezentare a categoriilor A B C : : :
uneori cercurile sau patratelor se suprapun cele mai mici apar^nd ^n interiorul
a
celor mai mari

Fig.13

e) Reprezentarea gra ca cu ajutorul hartilor.

Este folosita ^n special pentru seriile de spatiu care se ^nscriu de fapt tot
^n categoria celor nominative (care nu pot ordonate).
{ Cartogramele sunt gra ce intuitive care ne arata variatia unei caracteristici sau fenomen statistic pe un anumit teritoriu, construit cu ajutorul unei
harti. Ele se construiesc utiliz^nd hasuri sau culori care sunt explicate ^ntr-o
a
legenda alaturata.
Exemple de astfel de caracteristici ar nivelul umiditatii, al gradului
de rasp^ndire a unei boli, al productiei etc. Pentru a marca intenstitatea
a
fenomenului ^n diferite zone (frecventa acestuia) se pot utiliza de asemenea guri geometrice: cercuri, patrate de dimensiuni diferite, proportionale cu volumul absolut al marimii (sau frecventa).
Frecvent sunt utilizate guri naturale sau simboluri ca: spice de gr^u,
a
41

sonde, pesti, principiul proportionalitatii cu frecventa ind realizat prin


numarul de guri ce sunt desenate ^ntr-o zona sau alta. Aceste gra ce sunt
simple, sugestive si din aceste motive extrem de populare.
Observatii. 1. Gra cele pentru serii nominative (calitative) descrise mai
sus desi au forme diferite sunt ^n principiu identice. Formele variate ^n care
apar se datoresc faptului ca aceste serii nu se preteaza la preluare numerica si
prezentarea gra ca intuitiva reprezinta aspectul principial al studiului.
2. Daca doua gra ce unul pentru o serie numerica, respectiv altul pentru
o serie nominativa au ^nt^mplator forme asemanatoare, de exemplu cu drepa
tunghiuri trebuie subliniat faptul ca ele sunt esential diferite.
De exemplu histograma este esential diferita de diagrama cu coloane ^n
ceea ce priveste interpretarea, citirea desenului si respectiv concluziile ce se pot
extrage.

^ntrebari de control si aplicatii


I
1. Ce tipuri de discipline statistice cunoasteti? Ce rol au? Ce legaturi exista
^ntre ele.
2. Care este obiectul statisticii teoretice si care sunt principalele probleme
care se pun.
3. C^te tipuri de caracteristici exista, cum se deosebesc?
a
4. Speci cati care din urmatoarele caracteristici sunt calitative (nominative)
si care sunt cantitative (numerice), respectiv continue sau discrete:
{ salariul muncitorilor dintr-o rma
{ numarul de salariati din ^ntreprinderile din judet
{ facultatile din Universitate
{ candidatii la functia de presedinte
42

{ notele studentilor din anul II


{ volumul zic al v^nzarilor lunare de zahar ^ntr-o unitate comerciala
a
{ produsul brut de benzina premium la toate ra nariile ^n anul 2001
{ repartitia studentilor din Facultatea de Stiinte Economice pe tipuri
comportamentale.
5. La B.C.R. un functionar a notat succesiunea operatiilor nanciare pentru
sapte din cei mai deli clienti numerotati cu 1{7 si a obtinut seria:
3, 7, 4, 3, 1, 5, 6, 2, 7, 4, 7, 2, 5, 4, 2, 1, 2, 7, 3, 7, 4, 2, 4, 3, 4, 6, 1, 7, 3,
4, 2, 4, 3, 7, 5, 6, 2, 4, 1, 3, 2, 2, 4, 7.
a) grupati datele obtin^nd seria corespunzatoare cu frecvente. Ce fel
a
de serie este?
b) reprezentati gra c seria. Ce fel de gra c se obtine?
Indicatie. Numele clientilor poate notat cu A B C D : : : sau cu
un cod 1 2 3 : : : 7.
Raspuns.

1 2 3 4 5 6 7
Cod client
Frecventa operatiilor 4 9 7 10 3 4 8
Seria putea scrisa si
Cod client
A B C D E F G
Frecventa absoluta 4 9 7 10 3 4 8
a operatiilor
Se recomanda o diagrama cu coloane pentru serii nominative.
6. La o rma au fost c^ntariti 100 de purcei. Au fost obtinute datele din
a

43

tabelul alaturat:
Masa (kg) 30{40 40{50 50{60 60{70 70{80
Numar
20
25
35
15
5
purcei
Sa se reprezinte gra c aceasta serie prin doua gra ce ^nrudite.
Raspuns. Masa purceilor este o caracteristica cantitativa. Seria se poate
reprezenta cu o histograma sau cu poligonul frecventelor daca se calculeaza mijloacele intervalelor de masa.
7. La un sondaj de opinie sau determinat frecventele din tabelul de mai jos
pentru cei patru candidati la functia de director al unei unitati economice:
Numele candidatilor A
B
C
D
Frecventa
40% 35% 10% 15%
Sa se reprezinte cel putin 3 gra ce diferite pentru aceasta serie.
Raspuns. Se vor utiliza gra ce pentru caracteristici nominative: cercul
de structura, dreptunghiul de structura, diagrama cu coloane, sau cea cu
benzi.
8. Grupati datele de mai jos, ce reprezinta ^ncasarile a 40 de agenti de

44

asigurari ^n luna mai a.c., exprimate ^n mii lei


1.234
3.920
13.490
9.124
12.431
14.318
16.421
1.450
3.542
11.486

7.329
17.421
5.830
2.739
13.940
15.550
12.480
6.180
9.431
19.467

5.160
10.850
4.530
7.930
12.648
6.850
18.130
17.200
2.330
1.180

18.500
4.220
5.960
6.221
13.800
12.500
19.400
14.220
7.300
6.450

Reprezentati apoi gra c seria obtinuta. Comentarii asupra caracteristicii, seriei si gra cului.
Raspuns. Se recomanda gruparea ^n 4, sau 5 grupe. Se obtine o serie cantitativa, continua, organizata pe grupe. Se poate reprezenta ca
histograma, eventual poligon al frecventelor.

45

Capitolul 4

Marimi relative
Marimile relative sau indicatorii relativi se obtin ca rezultat al compararii
a doua marimi statistice compatibile.
Compararea se poate face prin diferenta sau raport.
^n ambele cazuri intervin doi termeni: un termen pentru comparat si
I
celalalt ca baza pentru comparatie.
Ca diferenta comparatia nu se poate face dec^t ^ntre termeni de acelasi
a
fel, exprimati ^n aceiasi unitate de masura, rezultatul exprim^ndu-se ^n aceleasi
a
unitati ca si datele comparate. Acest indicator statistic ne indica cu c^te unitati
a
difera (^n marime absoluta) termenul comparat fata de cel considerat ca baza
de comparatie.
^n cazul comparatiei sub forma de raport, termenii trebuie sa veri ce
I
anumite conditii:
{ ^ntre ei sa existe o legatura logica de corespondenta de cauzalitate
{ sa e compatibili (ca sfera de cuprindere, metodologie de cuprindere)
{ baza de comparatie trebuie aleasa astfel ca indicatorul obtinut sa aiba
semni catie.

46

4.1 Forme de prezentare


Indicatorul obtinut ca raport este ^n general un numar rational obtinut
prin ^mpartire. Pentru a obtine un numar sugestiv usor de manevrat si de
memorat, raportul se ^nmulteste cu o putere a lui 10 convenabil aleasa
comparat
r = termen de de baza 10k
termen
a) k = 0 raport simplu
Exemplu r1 = valoare EURO = 0 9
valoare Dolar

student promovat
r2 = numar de total de istudenti i = 65 = 0 8125
numar
80

b) k = 2 rezultatul se da ^n procente, stiind ca

1
100

= 1%

r1 = 0 9 102 % = 90%
r2 = 0 8125 102% = 81 25%
c) k = 3 rezultatul se obtine ^n promile

1
1000

= 10 =00

15
r3 = numar de bolnavi de boala A = 960 =
numar de indivizi consultati
= 0 015625 = 15 6250=00 promile
1:425
r4 = numar de cadre universitare = 1:235:600 =
numar de locuitori ^n judet
= 0 0011532 = 1 15320=00
d) k = 4 rezultatul se obtine ^n prodecimile

r4 = 11 532 prodecimile:
k = 5 { ^n procentimile, etc.

47

Daca termenii comparati prin raport au aceiasi natura, adica aceiasi


unitate de masura, raportul va adimensional, daca termenii sunt de natura
diferita unitatea de masura rezultata va compusa. De exemplu ca la viteza
v = s unitatea de masura va m/s sau km/ora.
t

Exemple.

Venit net mediu pe locuitor


venit net total
= numar de locuitori = 150 $=locuitor
Raport de variatie a veniturilor
venit
30 mil
= venit pe anul 2002 = 20 mil = 1 5 fara dimensiune
pe anul 2001
care se poate exprima ca raport simplu, ^n procente 150%, promile, etc.

4.2 Tipuri de marimi relative


Marimi relative de structura (pondere, cota parte)
Exprima raportul dintre un grup de elemente (o parte a populatiei)
fata de toata populatia. Denumirile sunt sugestive si sunt de tipul: pondere,
frecventa relativa, cota parte, indicatorul ind adimensional. Se exprima ca
numar rational simplu, ^n procente promile, etc.
Formula generala de calcul este:
R = ^parte sau r = ^parte 100%
ntreg
ntreg
Exemplul cel mai elocvent este calcularea frecventelor relative plec^nd
a
de la cele absolute.
Fie seria
Valori
x1 x2 : : : xp
Frecventa absoluta n1 n2 : : : np
48

p
X
i=1

ni = N

atunci

n
fi = Xi = ni
p
N
ni
i=1
p
X

evident

i=1

fi = 1:

Marimi relative de comparare (coordonare)


a) Se utilizeaza c^nd dorim sa comparam ponderile, frecventele a doua
a
grupe ale aceleiasi populatii.
Coe cientul de comparare este reversibil, ordinea ^n care se face raportul
ne ind esentiala
f
n
ki = fi sau ki = ni
c

ni sau fi ind frecventa absoluta respectiv relativa corespunzatoare grupei i,


iar nc si fc a grupei cu care se compara.
Fie seria cu rezultatele studentilor anului I Finante{Banci

Valori nete 1{4 5{6 7{8 9{10


Numar note 10 25 35
30
Frecventa 0,1 0,25 0,35 0,3
Numar note
30
k3 = Numar studentifoarte bune i = 10 = 3 sau ki = 0 3 = 3
nepromovat
01
Numar note su cient
k2 = Numar studenti nepromovati = 35 = 3 5
10
Numar note de trecere = 90 = 9
kt = Numar note sub cinci 10
b) Se pot compara si frecventele relative corespunzatoare unor grupe din
serii diferite.
Fie seria cu rezultatele notelor studentilor anului II Finante{Banci
Valori nota
1{4 5{6 7{8 9{10
Frecventa relativa 0,2 0,3 0,35 0,15
49

sau reciproc

r1 2 = 0 1 = 0 5
02
02
r2 1 = 0 1 = 2

Concluzii. Procentul de studenti nepromovati din anul II este dublu fata de


cel din anul I.

Marimi relative de intensitate


Se obtin prin raportarea a doi indicatori absoluti de natura diferita care
au legatura ^ntre ei.
Sunt marimi derivate de tip cantitativ si au caracter reversibil.
Cele mai cunoscute exemple de marimi relative de intensitate sunt densitatea populatiei raportate la 1 ha de teren agricol, productia industriala de
un anumit tip pe cap de salariat din domeniul respectiv, productia la 1000 lei
fonduri xe, etc.
Modul de calcul se face prin raportarea a doua valori corespunzatoare
luate de la doua caracteristici diferite X si Y .
Caracteristica
X
Y
Indicator de
intensitate direct
Indicator de
intensitate reciproc

Zone, judete
A
Numar locuitori x1
Suprafata agricola y1
v = nr.locuitori x1

ha

y1

x2
y2
x2
y2

ha
ci = loc

y1
x1

y2
x2

x3
y3
x2
y3

x4
y4
x4
y4

y3
x3

y4
x4

Daca foloseam caracteristica spatiu si timp pe diferite trasee obtinem


ca raport ^ntre ele viteza (intensitatea deplasarii pe diferite portiuni
A B C D : : :). Alteori obtinem densitatea, sau pretul unitar ca raport ^ntre
cantitatile de marfa v^ndute si valoarea ^ncasata ^n diferite magazine, etc.
a
50

Marimi relative ale dinamicii


Se aplica^n general pe serii cronologice la care marimea relativa dinamica
caracterizeaza modi carea relativa a seriei cronologice.
Formula de calcul

kd = xxprezent 100%:
trecut

^n functie de baza de comparatie cele mai frecvente cazuri sunt:


I
a) Cu baza xa care re ecta modi carea fenomenului ^n timp analizat fata
de perioada anterioara xa

x
kdi = x i 100%
0

unde:

xi = valoarea indicatorului ^n perioada curenta


x0 = valoarea indicatorului ^n perioada de baza.

b) Marimi relative cu baza ^n lant: care re ecta variatia fenomenului economice fata de perioada imediat anterioara

kdli = xxi 100%


i;1

Exemplu.
Trimestrul

Bene cii
mil.lei

I
II
III
IV

2,5
5
6
9

Marimi relative
de dinamica
cu baza xa
^n %
100
200
240
360
51

Marimi relative
de dinamica
^n lant
^n %
{
200
120
150

Marimi relative ale planului


Se utilizeaza ^n analiza fenomenelor economice care se desfasoara planicat si sunt indicatori economici esentiali. Sunt doi indicatori de baza:
a) marimi relative la sarcini de plan

kpl=0 = xpl 100%


x
0

xpl = valoare plani cata


x0 = valoare realizata ^n perioada de baza.
b) marimi relative ale ^ndeplinirii planului

x
kr=pl = x r 100%
pl

xr = valoare realizata
xpl = valoare plani cata.

Marimile relative ale planului se reprezinta gra c prin diagrama cu


coloane.

52

Capitolul 5

Marimi medii
5.1 Exemple de medii uzuale
^n acest paragraf vom trece ^n revista cele mai uzuale medii, proprietatile
I
lor comune, o metoda generala de obtinere a acestora si precizarea aplicatiilor.
Media este un numar care rezumeaza ansamblul valorilor unei variabile,
calculat prin intermediul unei functii de aceste valori.
Vom considera ^n continuare o serie de valori x1 , x2 , : : :, xN numite si
termenii mediei.
1. Media aritmetica este cea mai cunoscuta si utilizata.
a) Simpla:

1
ma = N

N
X
i=1

xi

b) Ponderata: Daca unii termeni se repeta adica avem seria cu frecvente


absolute
Valori
x1 x2 : : : xp
Frecventa absoluta n1 n2 : : : np
media aritmetica devine

p
1 Xx n
map = N
i i
i=1

53

p
X
i=1

np = N

Daca seria este data cu frecvente relative

x1 x2 x3 : : : xp
Valori
Frecventa relativa f1 f2 f3 : : : fp

fi = ni
N
0 fi 1
p
X
i=1

atunci

map =

p
X
i=1

fi = 1

xi fi

aceasta expresie, ^n conditiile precizate mai sus, se mai numeste si


combinatie liniara convexa.
c) Forme folosite pentru simpli carea calculelor.
{ Media aritmetica calculata din valorile caracteristice xi micsorate
cu o constanta "b" este mai mica dec^t media initiala cu constanta "b".
a
Adica
p
X
ma (xi ; b) = (xi ; b)fi =
i=1

p
X

p
X

xi fi ;b fi = ma (xi ) ; b
i=1{z } |=1 }
i {z
|
ma
1
{ Media aritmetica calculata din xi micsorata prin ^mpartire la o
=

constanta k este mai mica dec^t media initiala de k ori.


a

p
p
h i X
1X
1
ma xi = xi fi = k xi fi = k ma (xi )
k
i=1 k
i=1

Daca se ^nmultesc frecventele absolute cu o constanta "c" aleasa


arbitrar, media nu se schimba.
p
X

xi (cni )

ma = i=1
p
X
i=1

(cni )
54

6c

n
X

xi ni

i=1
n
X

6c

i=1

ni

Media aritmetica are aplicatii ^n foarte multe domenii.


^n primul r^nd ^n statistica la calcularea celui mai folosit indicaI
a
tor "media statistica", ^n mecanica la calculul centrelor de greutate, ^n
chimie la studiul solutiilor, aliajelor, etc.
Observatie. Frecventele absolute ni sau cele relative fi ^n de nirea mediilor au rol de ponderi.
^n cazul seriilor ce au distributia de frecvente constanta pe intervale
I
se ia ^n calcul centrul intervalelor
xi = ai +2ai+1 :

2. Media armonica. ^n continuare vom considera cele trei tipuri de


I

serii simple, cu frecventa absolute sau cu frecvente relative, cu aceleasi notatii


si observatii.
a) Simpla este data de relatia

N
mh = 1 1 N
N
1 =X1
x1 + x2 + : : : + xN
i=1 xi
b) Ponderata

N
1
mhp = X = X
p
p
n1
fi
i=1 x1
i=1 xi

Aplicatii. Media armonica se foloseste la calculul nivelului mediu

al unei caracteristici derivate, cu caracter de marime relativa ca pret


unitar mediu, densitate medie, viteza medie, etc.

3. Media geometrica. Se poate utiliza doar daca distributia statis-

tica are toti termenii pozitivi. Se mai numeste si "medie de ritm" pentru ca se
utilizeaza c^nd fenomenul supus cercetarii ^nregistreaza un ritm de modi care
a
^ncetinit chiar daca volumul absolut al modi carii este mare.
55

Media geometrica scoate ^n evidenta in uenta valorilor mici ale caracteristicii. Din acest motiv se utilizeaza si ^n electrotehnica pentru studiul
curentilor de intensitate foarte mica. De asemenea, se mai foloseste pentru
calculul indicelui mediu de evolutie a unui fenoment economic.
a) Forma simpla este
b) Forma ponderata

p
mg = N x1 x2 : : : xN
mgp =

xn1 xn2 : : : xnp


p
1 2

cu frecventele absolute ca ponderi, sau

np
n2
n1
mgp = x1N x2N : : : xpN = xf1 xf2 : : : xfp
p
1
2

forma care are frecventele relative ca ponderi.

4. Media patratica.
a) ^n forma simpla este
I

v N
u X
u
mp = t 1 x2
i
N i=1

Se observa ca este radacina patrata dintr-o medie aritmetica a


patratelor.
Se utilizeaza ^n special la calcularea unei medii a abaterilor de la
medie a erorilor care sunt si cu semn pozitiv si negativ. Ridicarea la
patrat a termenilor are rolul de a distruge semnul deviatiilor, altfel acestea s-ar reduce ^ntre ele si media urmarita nu ar mai avea sens, ar total
denaturata. Dupa efectuarea mediei aritmetice a patratelor este binevenita extragerea unui radical de ordinul doi pentru a reveni la dimensiunea (unitatea de masura) a termenilor xi cu care s-a facut media. Altfel
utilizarea mediei abaterilor devine imposibila. Are aplicatii ^n statistica
la construirea unor indicatori ai ^mprastierii (abaterea standard) si ^n
tehnica la studiul erorilor.
56

b) ^n forma ponderata avem doua variante, ca de obicei, cu frecvente (ponI


deri) absolute ni
v p
u1 X
u
x2 n
m =t
pp

N i=1 i i

sau cu frecvente relative

vp
uX
p
X 2 !1=2
u 2
mpp = t xi fi =
xi fi
i=1

i=1

Observatie. Media patratica scoate ^n evidenta in uenta valorilor mari ale


caracteristicii.

5. Media de ordinul . Se calculeaza analog cu cea patratica doar ca

valorile xi vor la puterea si indicele radicalului tot .


a) ^n forma simpla
I

v p
u1 X
u
m = t N xi
i=1

b) ^n forma ponderata
I

v p
vp
!1=
u1 X
uX
p
u
u p
t
t xi fi = X xi fi
m p = N xi ni =
i=1

Cazuri particulare.

i=1

i=1

Daca
= ;1
=1
=2
=3

se obtine media armonica


media aritmetica
media patratica
media cubica, etc.

Media cubica este utilizata ^n statistica pentru construirea unor indicatori ai gradului de asimetrie a unei distributii fata de valoarea medie (valoarea
centrala).
Gradul de asimetrie poate subliniat doar de o medie de ordin impar,
57

cea mai potrivita ind cea de ordinul 3, adica media cubica. Ea ampli ca
puternic rolul abaterilor mari.

5.2 Proprietati generale ale mediilor


^n cele ce urmeaza vom considera ponderile ca ind pozitive pentru ca
I
cel mai des vom utiliza ca ponderi frecventele absolute ni respectiv cele relative
fi .
Vom nota cu a = min xi si cu A = max xi unde xi sunt termenii mediei.
i
i
1. Toate mediile, e ca sunt simple sau ponderate, sunt interne, adica
cuprinse ^n intervalul a A] indiferent de termenii xi si ponderile ni sau fi
pozitive. Demonstratia este simpla si identica pentru toate mediile. O vom
ilustra pe media aritmetica, de exemplu, la care vom alege forma cu ponderi
relative, fi :

a = a (f1 + f2 + : : : + fp} x1 f1 + x2 f2{z : : : + xp fp A (f1 + :{z: + fp} = A


)
+
|
{z
|
} | : )
1

map

Minoram prin ^nlocuirea tuturor termenilor xi cu a si majoram prin


^nlocuirea acestora cu A.
2. Prin variatia convenabila a ponderilor, orice medie poate lua orice
valoare din intervalul ^nchis a A].
3. ^ntre mediile enumerate mai sus exista urmatoarele relatii de ordine
I

a mh mg ma mp mc m

unde 3
, cu conditia ca sa aiba aceiasi termeni si aceleasi ponderi.
^n expresiile de mai sus: mh = medie armonica mg = medie geometrica
I
ma = medie aritmetica mp = medie patratica mc = medie cubica m =
media de ordinul .
Pentru a demonstra aceste inegalitati se pot folosi inegalitatile lui
58

Jensen, pe care le dam mai jos.

Teorema 5.2.1 Fie fi ponderi care veri ca relatiile:

8
> 0 fi 1
< n
> X fi = 1
:
i=1

atunci daca g este o functie convexa are loc inegalitatea

n
X
i=1

xi fi

! X
n
i=1

fi g(xi )

iar daca g este o functie concava are loc inegalitatea inversa, adica:

n
X
i=1

xi fi

! X
n
i=1

fi g(xi )

5.3 Originea comuna a mediilor


De nitie. Fie ' : R ! R o functie bijectiva, deci inversabila si X o serie

statistica atasata unei caracteristici, exprimate e cu frecvente absolute e cu


frecvente relative.
Valori
Frecventa
absoluta

x1 x2 : : : xp

Valori
Frecventa
relativa

n1 n2 : : : np

x1 x2 : : : xp
f1 f2 : : : fp

Se numeste medie indusa de functia ', numarul m' calculat cu relatia:


;1

m' = '

" X
1 p

;1

"X
p

N i=1 ni '(xi ) = ' i=1 fi '(xi )


Pentru expresii particulare ale functiei ' vom obtine toate mediile cunos-

cute mai sus, dar si altele noi, utile ^n diferite probleme, pe care le putem
produce ^n functie de tipul problemei.
59

Exemple:
1) pentru '(x) = x se obtine media aritmetica.
^ntr-adevar
I
1
mx = ma = N

p
X
i=1

ni xi =

p
X
i=1

fi xi

1
2) pentru '(x) = x se obtine media armonica

3) pentru '(x) = x2 se obtine media patratica


4) pentru '(x) = x se obtine media de ordinul
5) pentru '(x) = ln x se obtine media geometrica.
Demonstratie pentru
'(x) = ln x.
Folosind proprietatile functiei ln x vom avea succesiv

mg = mln x = exp

"X
p

"X
p
i=1

fi ln xi =

#
p
p
fi = exp ln Y xfi = Y xfi = xf1 xf2 : : : xfp
= exp
ln xi
p
1 2
i
i
i=1
i=1
i=1

adica media geometrica ponderata exprimata ^n frecvente relative.

5.4 Principii de alegere a unei medii. Teoria lui


Chisini{Boiarski
Mediile de diferite ordine pe care le-am, descris mai ^nainte nu se
aplica la ^nt^mplare ^n toate problemele concrete. Astfel, ^ntr-o problema este
a
necesar sa se foloseasca media aritmetica, ^n alta, media armonica, etc.
Pentru rezolvarea acestei probleme ne vom folosi de urmatoarele
de nitii care formeaza principiul lui Chisini si Boiarski, doi statisticieni care
60

au anuntat-o prima data.

De nitia 5.4.1 Se numeste functie determinanta asociata colectivitatii C , relativ la o caracteristica X a acesteia, acea proprietate care ram^ne neschima
bata, oricare ar variatiile posibile ale valorilor x1 , x2 : : :, xp ale variabilei X
de nita pe C .

De nitia 5.4.2 Se numeste valoare medie asociata variabilei (caracteristicii)

X , dupa functia sa determinanta, acea valoare mX care prin substitutia xi =


mX (i = 1 2 : : : p) nu modi ca functia determinanta.

Observatie. Din de nitia 5.4.1 rezulta ca functia determinanta este o functie

de p variabile x1 x2 : : : xp adica F = F (x1 x2 : : : xp ). Din de nitia a doua


rezulta procedeul practic de a determina media dupa xarea functiei determinante.
Procedeu practic de determinare a mediei.

a) Se xeaza functia determinata Y = F (x1 x2 : : : xp ) atasata caracteristicii studiate asa ca sa veri ce de nitia 5.4.1
b) Determinarea mediei prin rezolvarea ecuatiei

F (x1 x2 : : : xp ) = F (m m m : : : m)
unde "m" este media cautata.

Exemple.
1. Se amesteca p solutii de sare av^nd concentratiile respectiv c1 c2 : : : cp .
a
Solutiile au masele S1 S2 : : : Sp . Sa se determine o formula naturala,
potrivita, pentru calcularea concentratiei medii a amestecului cm .
Rezolvare. Functia determinanta va avea ca variabile concentratiile
c1 c2 : : : cp si este construita pe principiul ca sarea din amestecul nal
61

este formata prin ^nsumarea cantitatilor de sare pura si cu care contribuie


ecare solutie Si . Adica cantitatea de sare ^nainte si dupa amestec nu se
schimba. Avem

F (c1 c2 : : : cp ) = s1 + s2 + : : : + sp = c1 S1 + c2 S2 + : : : + cp Sp
stiind ca si = ci Si , indiferent de modul de exprimare al concentratiei,
simplu, ^n procente sau promile.
Scriind acum ecuatia care ne da media, ^n baza principiului enuntat
de de nitia 5.4.2 avem:

c1 S1 + c2 S2 + : : : + cp Sp = cm S1 + cm S1 + : : : + cm Sp
De unde obtinem:
+ +
1
cm = c1 SS + c2 S2+ : :: :: :+ Scp Sp = c1 f1 + c2 f2 + : : : + cp fp
+S
1

S
unde fi = Xi .
p
i=1

Si

Se observa ca s-a obtinut media aritmetica ponderata ca singura


medie corecta pentru a folosita la calcularea concentratiei medii ^n
probleme de amestec si aliaje. Utilizarea oricarei alte medii ^n aceste
tipuri de probleme este gresita si paguboasa. Desigur media aritmetica
se aplica ^n multe alte situatii, dintre care multe vor de interes pentru
statistica.
2. Un agent economic se aprovizioneaza cu un sortiment de marfa (materie
prima) de la mai multi furnizori ^n cantitati diferite si la preturi unitare
diferite. Doreste sa introduca ^n softul calculatorului sau, o formula de
calcul corecta si naturala pentru calcularea pretului unitar mediu ^n vederea stabilirii ulterioare a altor indicatori economici ca bene ciu, pret
de cost al produsului nit, etc.
62

Rezolvare. Fie Q1 Q2 : : : Qp cantitatile de marfa achizitionate de la p


furnizori diferiti cu preturile unitare p1 p2 : : : pp . Sumele platite sunt
evident Si = Qi pi .
Sa se determine o relatie pentru calcularea pretului unitar mediu.

a) Functia determinanta este data de cantitatea totala de marfa care


ram^ne constanta ^n procesul de achizitie, adica
a

Qt = Q1 + Q2 + : : : + Qp
iar variabilele acestei functii sunt preturile unitare diferite, pentru
care cautam media. Vom avea

F (p1 p2 : : : pp ) = Q1 + Q2 + : : : + Qp = S1 + S2 + : : : + Sp :
p1 p2
pp

b) Din ecuatia F (p1 p2 : : : pp ) = F (pm pm : : : pm ) rezulta


adica

S1 + S2 + : : : + Sp = S1 + S2 + : : : + Sp
p1 p2
pp pm pm
pm
S
pm = S11 + S2 + : : : + Spp
S2
S
p1 + p2 + : : : + pp

care este media armonica ponderata av^nd ca ponderi sumele platite


a
ecarui furnizor Si .
^n problemele de pret mediu, ca ^n exemplul precedent, sinI
gura medie corecta este cea armonica si ^n nici un caz nu poate
folosita alta medie.
Pentru a dovedi acest lucru vom arata ca la aceiasi formula
se putea ajunge si cu un rationament direct
S +S
S
S
pm = Q 1 + Q2 + :: :: :: + Sp = Qtotal = S11 + S2 + : : : + Spp
1
2 + + Qp
total
+ S2 + : : : + S
p p
p
1

daca dorim sa exprimam pretul mediu ^n functie de preturile unitare


particulare.
63

3. Dob^nzile anuale la o banca ^n n ani consecutivi sunt d1 d2 : : : dn (exa


primate ca numere absolute 0 05 = 5%, 0 20 = 20%, : : :).
Sa se determine o relatie cu care sa se poata calcula direct dob^nda
a
medie anuala pe aceiasi perioada, care aplicata de n ori consecutiv ar conduce la aceeasi suma nala.
Rezolvare. Valorile succesive pe ani ale sumelor rezultate sunt:

S1 = S0 + S0 d1 = S0 (1 + d1 )
S2 = S1 + S1 d2 = S1 (1 + d2 )
..
.

Sn = Sn;1 + Sn;1 dn = Sn;1 (1 + dn )


^nmultind relatiile de mai sus obtinem
I

Sn = S0 (1 + d1 )(1 + d2 ) : : : (1 + dn )
Mentionam ca daca di este dob^nda pe anul i atunci 1 + di se
a
numeste indice de crestere (de variatie).
Mai ^nt^i vom determina indicele mediu de crestere (sau ^n general
a
de variatie, de ritm, de dinamica).
a) Functia determinanta este:

F (d1 d2 : : : dn ) = Sn = (1 + d1 )(1 + d2 ) : : : (1 + dn )
S
0

Ea reprezinta indicele total de variatie care trebuie sa e constant la orice variatie a indicilor si egala cu raportul dintre valoarea
nala Sn si cea initialaS0.
b) Pentru a determina indicele ediu vom rezolva ecuatia

F (d1 d2 : : : dn ) = F (dm dm : : : dm )
adica
(1 + d1 )(1 + d2 ) : : : (1 + dn ) = (1 + dm ) : : : (1 + dm )
64

(1 + dm )n = (1 + d1 )(1 + d2 ) : : : (1 + dn )
sau

1 + dm =

p
n

(1 + d1 )(1 + d2 ) : : : (1 + dn )

Rezulta ca indicele mediu de variatie numit si indice mediu


de ritm este media geometrica a indicilor individuali de variatie.
De aici dob^nda medie este:
a

dm = n (1 + d1 )(1 + d2 ) : : : (1 + dn ) ; 1
Astfel de relatii sunt necesare pentru construirea unor softuri
foarte e ciente si rapide.
4. Valoarea v^nzarilor unui agent economic pe sase ani consecutivi este data
a
^n tabelul urmator
Anul
1997
1998
1999
2000
2001
2002

Valoarea
v^nzarii
a
mil.lei
2200
2376
2613,6
3267
3757
3945

Indice de
variatie
anuala
1,08
1,10
1,25
1,15
1,05

Sa se determine indicele mediu anual de variatie Im .


Rezolvare. Conform celor aratate ^n exemplul teoretic precedent se recomanda sa se utilizeze media geometrica si ^n nici un caz alta care ar
conduce la rezultate eronate. Avem 5 intervale de variatie. ^n consecinta
I
Im este:
p
Im = 5 I1 I2 I3 I4 I5
65

adica

Im = 5 1 08 1 10 1 25 1 15 1 05 = 5 1 793 = 1 123

Observatie. Daca la o banca pe cinci ani consecutivi ar fost 8%, 10%,


25%, 15%, 5%, atunci folosind exemplul precedent deducem ca dob^nda medie
a
pe aceiasi perioada este 12 5%.

66

Capitolul 6

Indicatori statistici pentru serii


unidimensionale cantitative
(numerice)
Acesti indicatori aduc informatii suplimentare foarte valoroase asupra
caracteristicii studiate prin utilizarea unor relatii simple. Unele din aceste
relatii sunt legate de mediile studiate ^n capitolul precedent.
Vom utiliza serii numerice discrete ^n cele trei forme cunoscute:
{ simple

x1 x2 : : : xN

N ind volumul populatiei.


{ cu frecvente absolute
Valori
Frecventa
absoluta

x1 x2 : : : xp
n1 n2 : : : np

p
X
i=1

ni = N

{ cu frecvente relative
Valori
Frecventa
relativa

x1 x2 : : : xp
f1 f2 : : : fp
67

p
X
i=1

fi = 1 fi = ni
N

Daca seria este data pe internele

a1 a2 ]

Valori
Frecventa
absoluta

a2 a3 ] : : :

n1

n2

ap ap+1 ]

:::

np

atunci ea va transformata ^n serie cu valori discrete ^nlocuind ecare interval


cu mijlocul lui
xi = ai +2ai+1

6.1 Indicatori de pozitie


6.1.1 Media statistica
Media statistica sau "valoarea medie" X este cel mai important si
usor de calculat indicator
1
X=N

N
X
i=1

1
xi = N

p
X
i=1

ni xi =

p
X
i=1

fi xi

Aici si ^n continuare vom prezenta toate cele trei forme legate ^ntre ele
pentru a familiariza cititorul cu acestea. Media statistica este evident o medie
aritmetica ponderata cu toate proprietatile amintite mai sus.
Pentru indicatori vom utiliza notatiile cele mai uzuale. Aproape toti
indicatorii statistici (empirici) se regasesc si ^n teoria probabilitatilor unde se
folosesc aceleasi litere si aceleasi denumiri, pentru deosebire la statistica vor
avea deasupra o bara.

6.1.2 Momentele initiale


Momentele initiale sunt medii aritmetice ale puterilor valorilor seriei. Au
legatura cu mediile de diferite ordine. Astfel momentul initial de ordinul k are
68

forma:

p
p
N
X
1X
1X
= N xk = N ni xk = fi xk
k
i
i
i
i=1

i=1
i=1
k , unde mk este media de ordinul k .
Se observa usor ca k = m

Cazuri particulare:
p
X

fi = 1 nu se foloseste ind constanta oricare ar seria

a)

0=

b)

1=X

{ media statistica

c)

2 = se

utilizeaza pentru studiul erorilor, abaterilor.

i=1

6.1.3 Modul (dominanta)


Reprezinta acea valoare a caracteristicii care ^nregistreaza frecventa cea
mai mare.
a) ^n cazul seriilor cu valori discrete dominanta este vizibila direct ^n
I
distributie.
Fie seria
Nota
Numar de
studenti

sub 5 6
4

10

7 11 14 10

Dominanta (modul) este nota 8.


b) ^n cazul distributiilor cu valori pe intervale modul se calculeaza cu forI
mula:
M0 = xM0 + h +1
1

unde:
{ xM0 = limita inferioara a intervalului modal, adica a intervalului cu
frecventa cea mai mare
69

{ h = marimea intervalului modal


{ 1 = diferenta dintre frecventa intervalului modal si frecventa intervalului anterior
{ 2 = diferenta dintre frecventa intervalului modal si frecventa intervalului urmator.
Exemplu. Se considera urmatoarea repartitie de frecvente ca urmare a
unei examinari
Puncte Numar studenti
20{30
5
30{40
8
50{60
10
60{70
14
70{80
12
80{90
7
90{100
3
Intervalul modal este 60 ; 70], limita inferioara xM0 = 60, h = 10,
1 = 14 ; 10 = 4, 2 = 14 ; 12 = 2. Valoarea modala este:
4
M0 = 60 + 10 4 + 6 = 64:
Evident totdeauna modul cade ^n interiorul intervalului modal.

Observatii.
1. Exista repartitii care au doua sau mai multe moduri ca maxime locale
ale frecventelor. Acestea se determina dupa procedeul de mai sus doar ca
folosim ca interval modal urmatorul pe care-l ^nt^lnim.
a
2. Pe gra cul sub forma de poligon al frecventelor modurile (daca sunt mai
multe)apar ca maxime relative.
3. Se utilizeaza uneori si valoarea antimodala ca ind valoarea repartitiei
(caracteristicii) care ^nregistreaza cea mai mica frecventa.

70

6.1.4 Functia empirica (statistica) de repartitie


De nitia 6.1.1 Suma frecventelor relative atasate valorilor xi mai mici dec^t
a
o valoare data x se numeste functie empirica de repartitie.

Aceasta functie depinde evident de valoarea aleasa x si o vom nota cu


F N (x). Indicele N arata ca e vorba de o populatie de volum N .
Functia de repartitie este nedescrescatoare si ia valori cuprinse ^n intervalul 0 1]. Este discontinua ^n punctele ale caror abscise sunt valorile xi ale
caracteristicii, dar continua la st^nga.
a
Gra cul este o curba ^n scara pentru serii cu valori discrete si o linie
poligonala ascendenta pentru cele cu valori grupate pe intervale.
a) Pentru seriile cu valori discrete de tipul
Valori
x1 x2
Frecventa
n1 n2
absoluta
Frecventa
f1 f2
relativa
^n baza de nitiei avem:
8
> 0
>

Exemplu.

>X
< i
F N (x) = > fj
> j=1
> 1
:
xi ni

7
8
9
10
11

3
9
4
3
1

: : : xi : : : xp
: : : ni : : : np
: : : fi : : : fp

p
X

ni = N
i=1
fi = ni
p
X N
fi = 1
i=1

daca x x1
daca xi < x xi+1 i = 1 p ; 1
daca x > xp

fi

F (x)

0,15 x 2 (;1 7]
0
0,45
x 2 (7 8] 0,15
0,20 x 2 (9 10] 0,80
0,15 x 2 (10 11] 0,95
0,05 x 2 (11 +1) 1
71

Gra cul

Fig.14

Observatie. Expresia functiei empirice de repartitie este putin diferita de se-

ria frecventelor cumulate crescator care ^n punctul xi aduna toate frecventele


anterioare punctului xi inclusiv pe cea din punctul xi .
Functia empirica de repartitie le cumuleaza doar pe cele anterioare punctului xi si respecta aceeasi conventie ca si functia teoretica de repartitie a probabilitatilor.
Seria frecventelor cumulate crescator pentru exemplul anterior este

xi

7
8
9
10
11

ni

Frecvente
absolute
cumulate
crescator

Frecventa
relativa

3
9
4
3
1

3
12
16
19
20

0,15
0,45
0,20
0,15
0,05

Frecventa
absoluta

ni

72

fi

Frecvente
relative
cumulate
crescator
0,15
0,60
0,80
0,95
1

b) Pentru seriile cu valori grupate pe intervale egale, ^n interiorul ecarui


interval functia empirica de repartitie este aproximata cu o functie de gradul
^nt^i adica cu un segment de dreapta ce uneste punctele extreme.
a
Fie seria
Valori
Frecventa
redusa

a1 a2 ]
f!

a2 a3 ] : : :
f2

:::

ai ai+1 ] : : :
fi

:::

ap;1 ap ]
fp

Atunci ^n baza de nitiei si a conventiei de aproximare de mai sus avem

8
>
> i;1 0
>X
<
F (x) = > fj + (x ;dai )fi
> j=1
>
:
1

daca x a1
daca ai < x ai+1 i = 1 p ; 1
daca x > ap

Cu d am notat lungimea unui interval d = ai+1 ; ai . Daca intervalele nu sunt


egale ^n loc de d se pune di .

Observatii.

1) Functia empirica de repartitie aproximeaza ^ntotdeauna functia teoretica


de probabilitate si de aceea este foarte utila ^n teoria selectiei.
2) Daca se da o serie statistica e cu frecvente absolute e cu frecvente
relative putem determina ^n mod unic functia empirica de repartitie si
reciproc.

73

Exemplu. Fie seria:


Numar de
salariati

ni

Frecventa
relativa
fi = ni
N

20{30

40

0,08

30{40

140

0,28

40{50

200

0,40

50{60

100

0,20

60{70

20

0,04

Grupe de
v^rsta
a

functia
empirica
de repartitie
0 daca x 2 (;1 20]
0 + (x ; 20) 0 08
10
daca x 2 (20 30]
0 08 + (x ; 30) 0 28
10
daca x 2 (30 40]
0 36 + (x ; 40) 0 40
10
daca x 2 (40 50]
0 76 + (x ; 50) 0 20
10
daca x 2 (50 60]
0 96 + (x ; 60) 0 04
10
daca x 2 (60 70]
1 daca x 2 (20 +1)

Gra cul lui F (x) este o linie poligonala ascendenta.

74

F (x)

Fig.15

6.1.5 Cvantile empirice. Mediana


Fie o serie statistica de volum N cu valorile x1 x2 : : : xN .

De nitia 6.1.2 Se numeste cvantila empirica de ordinul p sau p{cvantila a


distributiei statistice, radacina unica a ecuatiei

p 2 (0 1]

F (xp ) = p

unde F (x) este functia empirica de repartitie.

Cu alte cuvinte xp , p{cvantila, reprezinta o valoare numerica situata


^n sirul sau ^ntre valorile distributiei statistice p^na la care s-a acumulat o
a
frecventa relativa egala cu p. Cvantilele au rolul de a diviza totalul frecventelor
^n parti, dupa necesitati.

Cazuri importante uzuale:


a) Pentru p = 1 =) x1=2 = Me se numeste mediana distributiei.
2

Este o valoare a caracteristicii care ^mparte frecventele acesteia ^n doua parti


egale.
75

b) Daca
p = se obtine x1=4 care se numeste cvartilul inferior
p = se obtine x3=4 care se numeste cvartil superior.
Diferenta x3=4 ; x1=4 = q se numeste interval intercuartilic si are rol
^n aprecierea ^mprastierii a jumatate dintre frecvente ^n jurul valorii centrale.
Este vorba de jumatatea din mijloc.
k
c) Pentru p = 10 , k = 1 2 3 : : : 9, se obtin cvantilele xk=10 numite si
decile. Sunt ^n numar de noua si ^mpart gama frecventelor unei serii statistice
^n zece parti egale.
d) Se mai folosesc si cvantilele numite centile, notate xk=100 obtinute
k
pentru p = 100 , k = 1 99.
Decilele si centilele se folosesc de obicei ^n cazul seriilor cu numar mare
de valori.
1
4
3
4

6.1.6 Calculul medianei


Mediana veri ca ecuatia

F (xMe ) = 1
2
a) Pentru seriile cu valori discrete valoarea 1=2 a functiei F (x) va ^ncadrata
astfel:
X 1 X
fj 2 < fj
j<i
j i
De aici rezulta ca trebuie sa luam pe i egal cu rangul cel mai mic
pentru care suma frecventelor relative este mai mare sau egal cu 1 , de
2
aici rezulta ca mediana este Me = xi .
Spre exemplu ^n precedenta tabela cu valori discrete este xMe = 8
pentru ca ^n dreptul lui 8 la frecvente relative cumulate avem 0,6 prima
frecventa mai mare dec^t 0,5.
a
76

b) Pentru serii av^nd valorile grupate pe intervale vom rezolva ecuatia


a

F (xMe ) =

i;1
X

fj + (xMe ; ai )fi = 1
d
2
j =1

De unde obtinem:

Me = xMe = ai +

0 i;1 1
X
d @ 1 ; fj A
2 j=1

fi

Aceasta formula contine pe i ca necunoscuta. El se numeste indicele intervalului meridian, adica intervalul ^n interiorul careia se gaseste
mediana Me. Este primul interval caruia ^i corespunde o frecventa relativa cumulata egala sau mai mare dec^t 1=2.
a
^n aceste conditii avem:
I

ai = limita inferioara a intervalului median


d = lungimea intervalului median
fi = frecventa relativa corespunzatoarea intervalului median
fcaim =
median.

i;1
X
j =1

fj = frecventa relativa cumulata anterioara intervalului

Formula de mai sus poate scrisa si cu frecvente absolute tin^nd


a
cont ca
p
ni N = X n
fi = N
i
i=1

Observatii.

d N ; ncaim
Me = xMe = ai + 2 n
i

1. Pentru calculul cvantilelor se poate utiliza acelasi procedeu ca cel de la


calculul medianei care include rezolvarea ecuatiei de mai sus.

77

Deosebirea este ca se pune alta valoare ^n loc de 1=2 ^n membrul


drept al ecuatiei si se alege alt interval ^n care se cauta cvantila respectiva.
3
{ Pentru cvartile se alege p = 1 , respective 4 .
4

k
{ Pentru decile se alege p = 10 unde k poate 1 2 : : : 9.

2. Mediana sau oricare alta cvantila se poate gasi si printr-o metoda geometrica si anume:
Se duce o paralela cu axa orizontala pe la 1=2 ^n cazul medianei
sau p 2 (0 1) pentru o p{cvantila care taie gra cul functiei empirice de
repartitie (adica linia poligonala ascendenta, vezi gra cul anterior) ^ntrun punct.
Ducem prin acest punct o paralela la axa verticala care taie axa
0x ^n xMe , respectiv xp , adica citim valoarea medianei sau a p{cvantilei.
Analog se poate proceda si ^n teoria probabilitatilor cu functia de repartitie
teoretica pentru gasirea medianei teoretice, etc.

Exemplu. Vom considera seria cu valori pe intervale din exemplul precedent


si ne propunem sa calculam mediana.
Avem:
{ Intervalul median este 40 50]
{ Limita inferioara este ai = 40
{ Lungimea intervalului median d = 10
{ fcaim = 0 9 + 0 28 = 0 36
{ Frecventa corespunzatoare intervalului median fi = 0 4.
^n baza formularii de mai sus avem:
I

Me = 40 + 10(0 5 ; 0 36) = 40 + 10 0 04 14 = 40 + 3 5
04
78

Me = 43 5:
^ntre mod, mediana si valoarea medie (media aritmetica) are loc o egalI
itate aproximativa data de K.Pearson. Se refera la repartitii unimodale

M0 = 3Me ; 2X:

Exercitii propuse
Se dau urmatoarele serii:
1:
V^rsta
a
15{20
25{25
25{30
30-35
35{40
40{45
45{50
50{55
55-60
60{65
65{70
70{75
75{80
80{85
85{90
Total

Frecventa
absoluta
2
38
96
123
132
129
123
110
88
70
46
26
12
4
1
1000

2:
Nota la
statistica
3
4
5
6
7
8
9
10
Total

3:
Numa de
studenti
4
11
21
32
13
9
7
3
100

Masa
^n kg.
40{50
50{60
60{70
70{80
80{90
90{100
100{110
Total

Numar
personal
24
56
110
160
105
35
10
500

1. Sa se calculeze frecventele relative pentru ecare valoare sau interval


2. Sa se reprezinte gra c seriile prin histograma si poligon al frecventelor
(suprapus)
3. Sa se determine functia empirica de repartitie, apoi sa se reprezinte gra c
4. Sa se calculeze, pentru ecare caz ^n parte, valoarea medie (media statistica) X , modul M0 si mediana Me
79

5. Sa se veri ce gradul de realizare (aproximare) ^n identitatea lui Pearson.

6.2 Indicatori ai variatiei si ai ^mprastierii


Daca abaterile valorilor unei caracteristici ^n jurul valorii medii sunt ^n
medie mici, atunci media este reprezentativa, semni cativa, pentru valorile
din care s-a calculat, si putem spune ca abaterile valorilor de la medie pot
explicate pe seama actiunii unor factori ^nt^mplatori. ^n schimb daca variatia
a
I
depaseste un anumit prag rezulta ca intervine cel putin un factor perturbator.
^n studiul variatiei se folosesc doua categorii de indicatori:
I
{ indicatori simpli
{ indicatori sintetici.

6.2.1 Indicatorii simpli ai variatiei


Indicatorii simplii ai variatiei se obtin prin compararea a doi termeni ai
seriei, sau a termenilor seriei cu media lor. Acestia se pot exprima ^n marimi
absolute, cu unitatea de masura a caracteristicii studiata sau ^n marimi relative.
a) Amplitudinea absoluta se exprima ^n unitatea de masura a caracteristicii
A = xmax ; xmin
Daca seria are valorile grupate pe intervale atunci cu xmax notam limita
superioara a ultimului interval si cu xmin limita inferioara a primului interval.
A se mai numeste c^mp de variatie, plaje.
a
b) Amplitudinea relativa a variatiei se exprima de regula ^n procente

A% = A 100% = xmax ; xmin 100%


X
X
80

Se folosesc de obicei la alegerea numarului de grupe. Sunt sensibile la


valorile aberante.
Pentru a evita acest neajuns se folosesc abaterile intercuantilice.
c) Abaterile intercuantilice. Sunt utilizate ^n special la serii statistice mari sau asimetrice sau care sunt plurimodale pentru a obtine informatii
suplimentare ^n anumite portiuni. Dintre acestea cel mai frecvent se utilizeaza
variatia intercuartilica si variatia interdecilica.
Variatia intercuartilica poate facuta ^ntre x1=4 , x1=2 = Me si x3=4 .
La o distributie empirica simetrica avem:

x3=4 ; Me = Me ; x1=2
^n practica se utilizeaza:
I
abaterea intercuartilica Aq

Aq = 1 x3=4 ; x1=4
2
care are aceiasi unitate de masura ca si caracteristica studiata, sau

coe cientul de variatie intercuartilica


x ;x
V q = Aq 100% = 3=4 1=4 100%
Me

2Me

Acest indicator ia valori ^n intervalul (0 ; 100%) si se lucreaza cu el


analog cu coe cientul de variatie.
Observatie. Intervalul intercuantilic (x1=4 x3=4) elimina valorile extreme ale
seriei statistice unde se pot gasi si valori aberante, ^n schimb are dezavantajul
ca se renunta la jumatate din valorile acesteia.
Indicatorii care masoara variatia interdecilica sunt:

abatere interdecilica Ad

x ;x
AD = 9=10 2 1=10
81

coe cientul de variatie interdecilica VD este


AD
VD = Me 100%

Acesta ia valori tot ^ntre (0 ; 100%) si are o interpretare analoaga


cu coe cientul de variatie.
Intervalul interdecilic

ID = x9=10 ; x1=10
elimina in uenta valorilor extreme ale distributiei care uneori contin date
aberante dar prezinta avantajul ca se renunta doar la 20% din valorile
acesteia.

d) Abateri individuale (di ) se calculeaza ca diferenta ^ntre ecare

termen si media acestora

di = xi ; X

e) Abateri individuale absolute


di = jxi ; X j

f) Abateri individuale relative rezulta ca raport dintre abaterile

individuale simple sau absolute si media statistica. Se pot exprima ^n procente

Dri = di = xi ; X
X
X

Abaterile individuale nu ofera o imagine de ansamblu asupra variatiei


valorilor caracteristica ei numai informatiei locale. ^n schimb sunt foarte simple.
I

6.2.2 Indicatorii sintetici ai variatiei.


Indicatorii sintetici ai variatiei se construiesc cu ajutorul unor medii simple sau ponderate a abaterilor simple.
a) Abaterea medie liniara este o medie aritmetica simpla sau ponderata a tuturor abaterilor absolute de la medie.
82

{ Pentru o serie simpla

N
X

d = i=1

jxi ; X j
N

{ Pentru serie cu frecvente absolute sau relative


1
d= N

p
X
i=1

jxi ; X jni =

p
X
i=1

jxi ; X jfi

Abaterea medie liniara se exprima ^n unitatile de masura ale caracteristicii si arata cu c^t se abat ^n medie valorile individuale de la valoarea lor
a
medie.
Un dezavantaj este faptul ca acorda aceeasi importanta tuturor abaterilor individuale, ^n conditiile ^n care abaterile mai mari, in uenteaza ^n mai
mare masura gradul total de variatie. Utilizarea modulului pentru diferente
este obligatorie altfel abaterea medie liniara ar zero

(xi ; X )fi =

X
X
xi fi ;X fi = X ; X = 0
| {z } | {z }
1

b) Dispersia empirica (statistica).

Este data de relatiile:

{ daca seria este simpla


2=

se mai numeste varianta.

N
1 X(x ; X )2
i
N
i=1

{ daca este cu frecvente


2=

p
p
1 X(x ; X )2 n = X(x ; X )2 f
i
i
i
i
N
i=1

i=1

Dispersia se poate exprima si cu ajutorul momentelor initiale


2=

2
2; 1

83

Acest lucru se poate arata usor prin dezvoltarea binomului (xi ; x)2
P
si utilizarea proprietatilor de aditivitate ale sumei precum si a de nitiei
momentelor initiale.
Prin ridicarea la patrat a abaterilor xi ; X se distrug semnele abaterilor
si se acorda un rol real abaterilor mai mari care cresc ^n valoare si pondere.
Dezavantajul dispersiei este ca are unitatile de masura la patrat si nu
permite compararea simpla cu media care are unitatea de masura la puterea
^nt^ia.
a
Acest dezavantaj este ^nlaturat prin aplicarea unui radical indice doi
dispersiei.
c) Abaterea medie patratica sau abaterea standard statistica
sau abaterea tip este radacina patrata din dispersie
{ pentru serii simple

v N
u X
u
= t 1 (xi ; X )2
N i=1

Uneori se foloseste o varianta corijata a acesteia ^n care se pune ^n


locul lui N de la numitor, N ; 1 sau N ; a

v
u
u
1=t

N
X

N ; 1 i=1 (xi ; X )

este mai adecvata la serii cu un numar mic de valori si se arata ca


este o functie de estimatie absolut corecta pentru abaterea standard
teoretica spre deosebire de de mai sus care este doar o functie de
estimatie corecta pentru . Daca N este foarte mare nu are importanta
care se utilizeaza.
1

{ pentru distributia cu frecvente

v p
vp
u1 X
uX
u
u
t
2 ni = t (xi ; X )2 fi :
=
(xi ; X )
N i=1

i=1

84

Abaterea medie patratica si abaterea medie liniara se exprima^n unitatea


de masura ^n care se exprima si caracteristica.
Pentru o aceeasi distributie abaterea medie patratica este ^ntotdeauna
mai mare dec^t abaterea medie liniara
a

>d
^n practica se arata ca d este cam 4=5 din .
I
Abaterea medie patratica spre deosebire de cea liniara evidentiaza
in uenta abaterilor mari si este cel mai valoros si utilizat indicator al
^mprastierii valorilor caracteristicii (seriei) ^n jurul valorii sale medii.
Abaterea standard are totusi dezavantajul ca nu permite compararea
variatiei a doua populatii care se exprima ^n unitati de masura diferite.
d) Coe cientul de variatie. Se mai numeste si coe cientul de omogenitate. Se exprima, de obicei, ^n procente si permite compararea variatiei chiar
si ^ntre populatii diferite.
Se folosesc doua variante
{ coe cientul de variatie liniara

vl = d 100%
X
{ coe cientul de variatie patratica

v p = 100%
X
Evident pentru o aceeasi distributie v l vp .
Coe cientii de variatie iau valori ^ntre 0 si 100% si dau indicatii destul de
semni cative relativ la variatie, omogenitatea colectivitatii, calitatea gruparii
si reprezentativitatea mediei statistice.
Cu c^t coe cientii de variatie se apropie mai mult de zero cu at^t variatia
a
a
85

este mai mica, colectivitatea mai omogena si media mai reprezentativa. Se admite, de regula, ca o serie este omogena daca coe cientii de variatie sunt mai
mici dec^t 35%. Reciproc daca coe cientii de variatie sunt mari, variatia este
a
mare si seria nu este structurata omogen si gradul de semni catie al mediei
este scazut.
Coe cientii de variatie se mai folosesc pe scara larga si la studierea ritmicitatii unei activitati economice.
e) Intervalul mediu de variatie este de nit de urmatoarele limite:
{ cel liniar (X ; d X + d)
{ cel standard (X ; X + ).
Vom ilustra informatiile date de intervalele de variatie simple si largite
pentru o caracteristica, despre care se stie, ca urmeaza legea normala a lui
Gauss, care este perfect simetrica.

Fig.16

x 2 (x1=4 x3=4 ) interval care cumuleaza 50% din totalul frecventei relative
x 2 (X ; X + ) interval care cumuleaza 68 2% din totalul frecventei relative

86

x 2 (X ; 2 X + 2 ) interval care cumuleaza 95 45% din totalul frecventei

relative
x 2 (X ; 3 X + 3 ) interval care cumuleaza 99 97% din totalul frecventei
relative.
Ultimul interval evidentiaza "regula celor trei sigma" care ne spune ca
toate valorile xi luate de o caracteristica repartizata normal (99 97%) trebuie
sa se ^ncadreze pe un interval de lungime 6 , centrat fata de media statistica X
(3 la st^nga, 3 la dreapta lui X ). Acest interval care are foarte mari aplicatii
a
^n parctica, se numeste interval minim de siguranta totala.
Diferite intervale simetrice fata de X sunt foarte utile ^n relatiile economice, permit^nd calcularea factorului de risc.
a
Serie normata (standard). Fie o serie statistica cu valorile xi , cu
media X si abaterea standard .
Putem construi o alta serie av^nd valorile zi calculate cu relatia
a

zi = xi ; X
Aceasta noua serie (repartitie) statistica se numeste serie normata sau
standard.
Evident ca media acestei noi serii Z = 0 si abaterea standard z =
1 lucru care se veri ca usor utiliz^nd de nitiile mediei si abaterii standard.
a
Aceste serii standard sunt utilizate pentru a compara marimi ce provin de la
distributii statistice diferite.

6.3 Eliminarea valorilor aberante. Testul lui


Grubbs
Vom utiliza seria normata atasata unei serii date, pentru a elimina din
seria data, valorile aberante, care s-au strecurat accidental cu ocazia colectarii
87

datelor.
Sa presupunem ca am ordonat crescator valorile caracteristicii studiate:
x1 x2 : : : xi : : : xn;1 xn .
Suspectate de a aberante sunt valorile extreme, adica xi = min xi sau
xn = max xi . Este recomandabil sa se veri ce acest lucru si apoui cele gasite
aberante sa e ^nlaturate. ^n caz ca nu sunt eliminate si vor incluse ^n calcule
I
vor denatura multe din rezultate.
^n special, c^nd avem putine date, in uenta celor aberante este mare pe
I
a
de alta parte nu am dori sa renuntam la ele fara veri care. Vom da^n continuare
o metoda e cienta si simpla de veri care numita: "Testul lui Grubbs".
Etape:
1. Pentru seria data calculam valorile lui X si

2. Construim zn = xn ; X si z1 = X ; x1 corespunzatoare lui xn si x1


3. Alegem un prag de semni catie (numit si prag de risc) mic, cuprins^ntre
0,01 si 0,09. Cel mai des, se alege 0,05. El reprezinta probabilitatea de a
gresi, adica, de a elimina o valoare xi ca ind aberanta c^nd ^n realitate
a
ea este corecta (numita eroare de tipul I) sau reciproc de a admite ca ind
buna o valoare aberanta (eroare de tipul II). Se poate lucra si cu pragul
de ^ncredere 1 ; complementarul pragului de risc . Evident pragul de
^ncredere reprezinta probabilitatea de a lucra corect.
4. Fixam numarul gradelor de libertate

l =n;2
unde n este numarul de valori ale seriei
5. Se citeste ^n tabelul lui Grubbs (vezi anexa) o valoare t l ce corespunde
nivelului de semni catie ales, de exemplu = 0 05 (respectiv pragul
88

de ^ncredere 1 ; = 0 95)si la numarul l de grade de libertate.


Se compara z1 calculat cu valoarea din tabel t l :
a) Daca z1

t l =) x1 se considera aberanta si se elimina

b) Daca z1 < t l =) x1 este corecta si se retine.


Analog se procedeaza cu xn doar ca se compara zn cu t l .
Exista si alte teste pentru veri carea valorilor elaborate. Una ar , de
exemplu, testul Romanovski, care are aceleasi etape ca ^n testul de mai sus
cu deosebirea ca X si sunt calculati fara valoarea x1 suspecta, respectiv xn .
Foloseste alt tabel, asemanator cu cel al lui Grubbs.
Observatie. Daca spre exemplu valoarea x1 a fost eliminata ca aberanta se
poate trece la veri carea lui x2 , urmatoarea ca marime posibil si ea aberanta.
La fel cu xn;1 daca a fost eliminata xn .

6.4 Momente centrate


Sunt indicatori numerici foarte utili construiti pe baza abaterilor de la
valoarea medie X a valorilor seriei. Sunt uzuale urmatoarele notiuni:
xi ; a { abatere de la constanta a a valorilor seriei
xi ; X { abatere de la medie
jxi ; X j { abatere absoluta de la medie.
1. Momentul centrat de ordinul k, are expresia
{ pentru serii simple

N
1X
= N (xi ; X )k
k
i=1

{ pentru serii cu frecvente

p
p
X
1X
= N (xi ; X )k ni = (xi ; X )k fi
k
i=1

i=1

89

Cazuri particulare
k=0

0=

p
X
i=0

fi = 1

nu poate folosit
k=1
p
p
X
X
X
= (xi ; X )fi = xi fi ;X fi = X ; X = 0
0
i
|=1{z }

i=1

k=2

| {z }
1

dispersia empirica

2=

abaterea standard =
3 si 4 intervin la construirea unor coe

2
2

cienti care masoara simetria, respectiv

excesul (boltirea).

6.5 Indicatori pentru asimetrie


Gradul de asimetrie se obtine prin compararea seriei date cu una simetrica cum ar cea obtinuta cu valorile unei caracteristici repartizate normal
(repartitia Gauss).
Vom face ca am^ndoua repartitiile sa aiba aceiasi valoare medie si aceiasi
a
dispersie, cu alte cuvinte vom folosi abaterile normate.
K.Pearson propune ca indicatori pentru asimetrie:
1. asimetria absoluta

as = X ; Mo

2. coe cientul de asimetrie

Cas = X ; Mo
90

Coe cientul Cas ia valori ^ntre ;1 si +1 si are urmatoarea interpretare:


Cas = 0 distributia este simetrica
0 < jCas j 0 3 distributia moderat asimetrica
0 3 < jCas j < 1 distributia puternic asimetrica.
3. Coe cientul Beta este de nit ca valoare medie a seriei normate atasata
seriei date indica:

Y 3 = xi ; X
i

deci

1=

p
X xi ; X 3
fi
i=1

sau

3
3

Asimetria poate vizualizata, de exemplu, pe un gra c cum ar histograma sau poligonul frecventelor

Fig.17
Daca p1 > 0 distributia este asimetrica la dreapta.
Daca p1 < 0 este asimetrica la st^nga.
a
Denumirea "asimetrie la dreapta" vrea sa sublinieze faptul ca suma
diferentelor pozitive xi ; X are pondere mai mare ^n partea dreapta si poligonul
frecventelor are o panta mai lina (descreste mai ^ncet) ^n partea dreapta a modului. Asimetrie la st^nga, invers.
a
Coe cientul de asimetrie Yule (CaY ), masoara asimetria cu
91

ajutorul pozitiei cvantielor si a medianei, daca notam q1 = Me ; x1=4 si


q2 = x3=4 ; Me, atunci
x + x1 ; 2M
;
CaY = q2 + q1 = 3=4 ;=4
q2 q1
x3=4 x1=4
care are urmatoarea interpretare:
CaY < 0 repartitia are asimetrie la dreapta
CaY > 0 repartitia are asimetrie la st^nga
a
CaY = 0 repartitia este simetrica.
Coe cientul Bowlei (CaB) masoara asimetria ^n functie de pozitia
decilelor 1 si 9 fata de mediana
x + x ; 2Me
CaB = d9 ; d1 = 9=10 1=10
d9 + d1
x9=10 ; x1=10
unde d1 = Me ; x1=10 si d9 = x9=10 ; Me.
Acest indicator ia valori tot ^ntre ;1 si 1 si are aceeasi interpretare ca
la CaY .
Coe cientul de boltire (Pearson) arata gradul de aglomerare a
valorilor seriei ^n zona centrala a distributiei lui X . Se exprima cu ajutorul lui
4
2

4
4

;3=

4
2
2

; 3:

Daca
2 > 0 poligonul frecventelor este mai adunat si ^naltat, distributia se zice
leptocurtica
2 = 0 poligonul frecventelor seamana cu legea normala normata data de
2
(x 0 1) = p1 e; x2
2
2 < 0 poligonul frecventelor este mai turtit, distributia se numeste platicurtica.

92

Aplicatii:
1. Fie seria
V^rsta
a

20{30 30{40 40{50 50{60 60{70

Numar de
pacienti

30

36

52

40

70{80
si peste

24

18

Sa se calculeze principalii indicatori statistici: medie, dispersie, abatere


standard, coe cient de asimetrie a lui Pearson.
Vom ilustra modul de organizare a calculelor ^n cazul ^n care acestea se
fac manual
Grupa de
v^rsta
a
(ai ai+1 )
20{30
30{40
40{50
50{60
60{70
70{80
Total

Numar de
pacienti

Centrul
intervalului
xi = ai+12+ai
25
35
45
55
65
75

ni

30
36
52
40
24
18
20

93

Produse

ni xi

750
1260
2340
2200
1560
1350
9460

(tabelul continua pe pagina urmatoare)


Grupa de
v^rsta
a
(ai ai+1 )
20{30
30{40
40{50
50{60
60{70
70{80
Total

xi ; X
-22,3
-12,3
-2,3
7,7
17,7
27,7

1
X=N

2=

Patrate de
diferente
(xi ; X )2
497,29
151,29
5,29
59,29
313,29
767,29

Diferente

N
X
i=1

Produse cu
diferente
(xi ; X )2 ni
14.918,70
5.446,44
275,08
2.371,60
7.518,96
13.811,22
44.342

ni xi = 9460 = 47 3
200

N
1 X(x ; X )2 n = 44:342 = 221 71
i
i
N
200
i=1

2 = 14

89

2. Sa se calculeze X , , 1 coe cientul de asimetrie a lui Pearson pentru


seriile 2 si 3 din capitolul precedent c^t si pentru urmatoarele:
a
Grupe sportivi
dupa v^rsta
a
(ai ai+1 )
18{20
20{22
22-24
24{26
26{28

Numar
sportivi

ni

RaspunsX = 22 8
r
= 227 6 = 1 947
60

6
16
20
14
4
94

3.
Numar de
piese
executate
de un
muncitor
28
31
33
35
38
43
Total

Numar de
muncitori

ni

16
25
20
30
28
21
140

xi ; X (xi ; X )2 (ai ; X )2 ni

-7
-4
-2
0
3
8

49
16
4
0
9
64

784
400
80
0
252
1344
2860

Raspuns. X = 30
= 4 519.
Observatie. Daca se utilizeaza un program specializat de statistica atunci nu
mai sunt necesare aceste tabele, calculele fac^ndu-se automat dupa introducerea
a
corecta a datelor.

95

Capitolul 7

Indicatori numerici pentru serii


statistice calitative (nominative)
^ntr-un capitol anterior am prezentat gra cele speci ce acestor serii,
I
gra ce esential diferite de cele ale seriilor numerice.
Fie o serie calitativa tipica, la care vom nota categoriile cu
A1 A2 A3 : : : An , iar pentru frecvente vom considera pe cele relative
f1 f2 : : : fn astfel ca seria se va prezenta sub forma
Categorii A1 A2 : : : An
Frecventa f1 f2 : : : fn

0 fi
p
X
i=1

fi = 1

Pentru ca aceste serii nu au valori numerice, ci nume, e normal sa nu


putem calcula pentru ele indicatori numerici care sunt foarte utili si usor de
manevrat. Nu se pot de ni media, dispersia, mediana, asimetria, nici macar nu
se poate desprinde un trend din gra cul atasat acestor serii pentru ca pozitia
categoriilor Ai este arbitrara ^n serie. Poate doar modul sa e mentionat,
aceasta ind categoria Ai caruia ^i corespunde frecventa cea mai mare fi =
max fj .
a
a
Vom ^ncerca totusi sa gasim c^tiva indicatori numerici utiliz^nd doar
frecventele fi .

96

1) Coe cientul de variatie absoluta al frecventelor

Va = fmax ; fmin :
2) Coe cientul de variatie medie al frecventelor

Vm = nVa 1
;
unde n este numarul de categorii (pozitii).
3) Coe cientul relativ de uniformitate (^mprastiere) a frecventelor.
^l vom de ni cu ajutorul entropiei introdusa de Shannon pentru variabile
I
aleatoare
n
X
H (f1 f2 : : : fn ) = ; fi log2 fi
i=1

Se stie ca H variaza ^ntre 0 log2 n] adica ^si atinge maximul c^nd toate
a
; 1 1 : : : 1 = log n.
1
frecventele fi sunt egale cu n , H n n
2
n
Propunem ca si coe cient relativ de uniformitate al unei serii calitative numarul
f2 :
Ur = H (f1 log :n : fn ) :
2

Aceasta variaza ^ntre 0 1].


Daca frecventele sunt acumulate puternic pe una sau doua pozitii atunci
Un este mai apropiat de 0. Daca frecventele sunt repartizate mai uniform atunci
Ur este mai mare, chiar apropiat de 1.
Se pot compara doua sau mai multe serii cu ajutorul acestui coe cient
chiar daca au numar diferit de pozitii (categorii).
Exemplu: Fie seriile calitative
Sectoare
Frecventa
relativa

Sectoare
Frecventa
relativa

0,9 0,7 0,2


97

0,5 0,3 0,2

Sectoare
A
B
C
Frecventa
0,33 0,33 0,33
relativa
CEle au gra cele cu coloane:

Fig.18
Aplic^nd formula de mai sus obtinem pentru cele trei serii urmatoarele
a
valori:

Ur (1) = 0 32

Ur (2) = 0 936

Ur (3) = 1

Acest coe cient este util pentru a compara o situatie veche cu una noua
dupa luarea unor masuri economice, ^n vederea ^mbunatatirii unor parametrii
corespunzatori diferitelor sectoare. De exemplu: pierderi, productivitatea
muncii, bene cii, etc.
4. Coe cientul de concordanta (de armonizare, de coincidenta) a doua
serii calitative CCn .
Se pot compara doar serii (doua sau mai multe) care au aceleasi categorii
calitative (sectoare) obtinute ^n doua perioade diferite, ^n doua sondaje, etc.
Fie seriile calitative

0
1 0
1
A1 A2 : : : An A @ B1 B2 : : : Bn A
X@
Y
0
0
0
f1 f2 : : : fn

f1 f2 : : : fn

98

atunci

CCn =

n
X
i=1

fi fi0

Acest indicator poate sa varieze ^ntre 0 si 1.


El trebuie corelat cu coe cientul de uniformizare Un . CCn este semnicativ ^n special daca coe cientul de uniformizare relativa Un este mai mic de
0,5. Avem urmatoarea interpretare:
a) Daca CCn < 0 3 concordanta (coincidenta) ^ntre cele doua serii este
foarte mica
b) Daca 0 3 < CCn < 0 7 avem o concordanta mijlocie
c) Daca CCn > 0 7 concordanta este mare adica exista o stabilitate a
pozitionarii frecventelor ^n cele doua esantioane.
Acest coe cient ad^nceste studiul comparativ al doua serii statistice daca
a
macar una din ele are un coe cient relativ de uniformitate mic.
5. Indicatorul de concentrare numit "Energia informationala

Onicescu"

Se calculeaza dupa relatia:

EI =

n
X
i=1

n
X

fi2

i=1

fi = 1

unde fi sunt frecventele relative corespunzatoare categoriilor seriei calitative.


Energia informationala a unei repartitii poate cuprinsa ^n intervalul
1
a
n 1 . Acest indicator ia valaorea maxima 1, c^nd distributia prezinta o con1 a
centrare maxima (totala), la o singura categorie, iar valoarea minima n c^nd
frecventele relative sunt egal ^mpartite pe toate categoriile. Acest coe cient are
o variatie inversa fata de Ur { coe cientul de uniformizare propus de noi mai
sus.
99

Daca calculam coe cientul EI pentru exemplul de mai sus prezentat si


^n gura 18 obtinem:
EI1 = 0 92 + 0 072 + 0 022 = 0 81 + 0 0049 + 0 0004 = 0 8153.
EI2 = 0 52 + 0 32 + 0 22 = 0 25 + 0 09 + 0 04 = 0 38.
EI3 = 0 332 + 0 332 + 0 332 = 3 0 1089 = 0 32:
Indicatorul EI are inconvenientul ca variaza pe un interval a carui limita
inferioara 1=n depinde de numarul categoriilor (grupelor). Pentru a ^nlatura
acest lucru se foloseste o forma corijata data de relatia
N
X

EIc = i=1

1
fi2 ; n

1
1; n

a carui interval de variatie este 0 1].


Pentru exemplul de mai sus avem:
0
EIc (1) = 0 81530;33 33 = 004853 = 0 724
1;
67
05
EIc (2) = 0 138 ; 03333 = 0 67 = 0 07
;0
0
01
EIc (3) = 0 132 ; 03333 = ;0 67 0:
;0
0

6. Coe cientul de concentrare a lui Corrado Gini


Acesta este asemanator cu EI propus de Onicescu cu deosebirea ca se
mai extrage radacina patrata.

vn
uX
u
CG = t fi2
i=1

n
X
i=1

fi = 1

1
Coe cientul CG ia valori pe intervalul pn 1 .
Si acest coe cient are o forma corijata a carei variatie este independenta

100

de numarul de categorii considerate. Aceasta varianta a fost propusa de Struck.

CS =

vn
uX 1
u f2 ;
u i n
u i=1
t
1
1; n

v n
u X
u
u n fi2 ; 1
u i=1
t
n;1

si are ca domeniu de variatie 0 1]. Apropierea de zero ^nseamna uniformizare


mare, apropierea de 1 ^nseamna concentrare pe o pozitie (polarizare).

101

Capitolul 8

Serii statistice duble. Distributii


empirice bidimensionale. Tabele
de corelatie
8.1 Notiuni generale
^n acest capitol, vom considera colectivitatea statistica C si ne xam
I
asupra a doua caracteristici ale elementelor sale. Le vom studia simultan cu
scopul de a veri ca daca exista legaturi, in uenta reciproca, sau numai ^ntr-un
sens, ^ntre acestea. Studiul este mai complex si necesita toate cunostintele de
p^na acum plus cele ce vor tratate ^n continuare.
a
Fie, de exemplu, 100 de studenti la care urmarim masa si sexul. ^n
I

102

tabelul de mai jos vom avea datele observate.


Sex

Masa
40{50
50{60
60{70
70-80
80{90
Total

Masculin Feminin
0
5
25
20
10
60

10
15
3
2
0
40

Total
10
20
28
22
10
100

^n acest exemplu am urmarit doua caracteristici din care una era cantiI
tativa { masa, iar alta calitativa { sexul.
Putem avea trei combinatii: a) ambele cantitative b)ambele calitative
c) una calitativa si alta cantitativa. ^n capitolele precedente am subliniat marea
I
deosebire a modului de tratare a acestora si di cultatea de a gasi indiactori numerici pentru caracteristicile calitative.
Pentru ^nceput vom trata cazul ^n care ambele caracteristici pe care le
vom nota cu X si respectiv Y sunt numerice si iau valorile X (x1 x2 : : : xr ),
respectiv Y (y1 y2 : : : ys ). Cazul c^nd cel putin una din caracteristici este cala
itativam va tratat ^n mod special separat, ulterior.
Un alt aspect ce merita precizat este modul de prezentare a datelor.
Pentru doua caracteristici cel mai recomandat este cel matricial (masiv cu
doua dimensiuni) pentru trei caracteristici, masiv cu trei dimensiuni (matrice
spatiala), unde elementele au trei indici etc., ^n vederea introducerii datelor ^n
calculator apoi a prelucrarii lor. Este stiut faptul ca ^n calculator se pot introduce date ce au mai multi indici si apoi se pot prelucra foarte usor. Prezentarea
ce va facuta ^n continuare va urmari tocmai acest scop.
Date ce provin de la doua, trei sau chiar patru caracteristici se pot
prezenta pe coala (care are doua dimensiuni), cu ajutorul tabelelor combinate,
103

mult folosite ^n statistica, ^nainte de aparitia calculatorului, ^n vederea prelucrii


manuale.
Exemplul de mai jos poate ^nscris ^ntr-un tabel combinat ^n care sa
mai introducem si a treia sau chiar si a patra caracteristica. Lucrul cu tabelele
combinate devine ^nsa greoi la un moment dat. Aceste observatii le facem doar
pentru a marca echivalenta.
Anul de
studii
I
II
III
IV
Total

Masa
Sex
Total
100
110
90
112
412

40-50

50-60

60-70

70-80

80-90

M F

M F

0
0
0
0
0

10 5
12 6
11 6
15 8
48 25

15 25 3
18 29 5
17 27 4
20 30 6
70 111 18

20 2
24 4
22 2
20 3
86 11

10
12
11
10
53

0
0
0
0
0

^n tabelul de mai sus avem pe orizontala doua caracteristici: masa si


I
sexul, nd un cap de tabel cu doua linii, una subordonata celeilalte si pe verticala a treia caracteristica. Se putea introduce si a patra caracteristica, de
exemplu: ^naltimea sau bursieri si nebursieri, etc. Acest lucru se putea realiza
e lu^nd la capul de tabel o a treia linie sau pe verticala a doua coloana.
a
Totusi spiritul organizarii, stocarii si prelucrarii datelor va trebui sa tina
cont de utilizarea calculatoarelor si deci de teoria bazelor de date asociata
studiului informaticii.

8.2 Serii cu ambele caracteristici numerice


^n continuare vom considera cazul general de prezentare a datelor ce
I
provin de la doua caracteristici numerice cuprinse ^ntr-o asa numita tabela de
104

corelatie.

y1

:::

yi

: : : ys

x1

n11 : : : nij : : : n1s n1

xi

ni1

nij

nis

xr

nr1
n1

nrj
nj

nrs nr
ns N

..
.
..
.

Total

ni

^n acest tabel:
I
x1 x2 : : : xr sunt valorile luate de caracteristica X
y1 y2 : : : ys sunt valorile luate de caracteristica Y .
nij sunt frecventele absolute (numar de indivizi) pentru care caracteristica
X ia valoarea xi si simultan caracteristica Y ia valoarea yj . ^n locul valoriI
lor xi pot aparea si intervale de valori de tipul ai ai+1 ], respectiv ^n locul lui
yi ;! bj bj+1 ].
Pe marginea tabelului jos si la dreapta sunt trecute asa numitele
frecvente marginale sau frecvente de grupa care ^nsumeaza toate
frecventele caracteristicii Y pentru o valoare xa xi a lui X sau grupa ai ai+1 ]
sau invers. Le vom nota cu

ni =

p
X
j =1

nij

sau

nj=

r
X
i=1

nij

Suma tuturor frecventelor din tabel este egala cu N volumul populatiei,


adica avem
r
s
s r
X
X
XX
N = ni = n j =
nij
i=1

j =1

105

j =1 i=1

Un tablou de corelatie ca cel de mai sus poate completat si cu frecvente


relative fij = nij c^nd vom avea relatiile
N a
r
X
i=1

s
X

fij = f j

j =1

fij = fi

X
xi

s r
XX
j =1 i=1

fij = 1

yi
..
.

: : : fij

fi

fj

..
.

8.3 Reprezentari gra ce ale seriilor duble cu


doua caracteristici numerice ( )
X Y

Exemplu. Fie 107.800 piese extrase din productia unei masini pentru care
s-au masurat doua dimensiuni X si Y ^n milimetrii si s-au obtinut datele din
tabela de mai jos (dupa M.H.Ionescu, 6]).

106

107

59,5{61,5
61,5{63,5
63,5{65,5
65,5{67,5
67,5{69,5
69,5{71,5
71,5{73,5
73,5{75,5
75,5{77,5
77,5{79,5
Total

Y
{
50
400
200
{
{
{
{
{
{
650

57 5;
59 5
{
275
775
1000
450
{
{
{
{
{
25500

59 5;
61 5

61 5;
63 5
150
575
2000
3200
2775
675
25
100
{
{
9500

63 5;
65 5
100
50
4150
7300
6550
3825
575
300
{
{
23750

65 5;
67 5
100
500
1725
7875
9500
6100
2475
625
250
{
29150
{
25
825
3350
9325
7750
3450
675
150
200
25750

67 5;
69 5
{
25
125
725
3150
3950
3225
1300
150
50
12700

69 5;
71 5
{
{
{
100
450
1100
700
550
250
100
3250

71 5;
73 5

{
{
{
{
100
200
50
200
{
{
550

73 5;
75 5

350
2400
10000
23750
32300
2360
10500
3750
800
350
107800

Total

Fig.19

a) Poliedrul frecventelor atasat seriei descrisa ^n tabelul de mai sus,

unde valorile lui X si Y sunt date pe intervale se obtine ^n modul urmator:


^n planul X 0Y se reprezinta dreptunghiuri av^nd laturile egale cu dimensiua
nile intervalelor ai ai+1 ] pentru X, respectiv bj bj+1 ] pentru Y , obtin^nd o
a
retea de dreptunghiuri. ^n centrul ecarui dreptunghi se ridica un segment
I
proportional cu frecventa ce se a a ^n tabelul seriei la intersectia liniei i cu
coloana j . Unind extremitatile segmentelor consecutive se obtine o suprafata
poliedrala (vezi gura 19). Ea corespunde poligonului frecventelor din cazul
unidimensional. Toate proprietatile si observatiile de la poligonul frecventelor
se extind si la poliedrul frecventelor. Poliedrul frecventelor are o importanta
mare ^n statistica inferentiala prin faptul ca sugereaza ce lege de probabiltiate modeleaza ansamblul celor doua caracteristici X si Y , luate ^mpreuna. De
exemplu, daca suprafata poliedrala are forma de clopot circular, sau clopot
eliptic (alungit) atunci se propune legea normala a lui Gauss bidimensionala,
ca model probabilistic pentru perechea de caracteristici (X Y ).
108

Fig.20

b) Histograma spatiala este formata din paralelipipede dreptunghice

av^nd ca baza dreptunghiurile din planul X 0Y descrisa mai sus ai ai+1 ]


a
109

bj bj+1 ], iar ^naltimile proportionale cu frecventele nij corespunzatoare (vezi

gura 20). Ca si la histograma plana, la histograma spatiala paralelipipedele


sunt alaturate si pozitia lor nu poate schimbata, astfel ^nc^t ansamblul lor
a
sugereaza legea de probabiltiate. Acest lucru se datoreaza faptului ca marimile
X si Y au fost presupuse numerice (masurabile) si deci ordonate. Cu totul
altfel stau lucrurile la caracteristicile calitative unde se poate alege arbitrar ordinea categoriilor (numelor) caracteristicii, gra cul are mai putine interpretari
si prelucrarea datelor se face cu totul diferit.
^ntre poliedrul frecventelor si histograma spatiala este o mare similI
itudine pentru ca centrul dreptunghiurilor superioare ale paralelipipedelor
este acelasi cu extremitatea superioara a segmentelor ridicate la constructia
poliedrului frecventelor.
c) Nor de puncte. ^n ecare dreptunghi (sau patrat) din planul X 0Y
I
descris mai sus se reprezinta un numar de puncte proportional cu frecventa nij
sau se deseneaza un disc de arie proportionala cu frecventa nij . Raza cercului
cel mai mare se alege ^n asa fel ca discul sa e complet inclus ^n dreptunghi.
Se obtine o zona de culoare mai ^nchisa, alta mai deschisa, alta alba ^nc^t este
a
foarte sugestiva repartitia frecventelor (vezi gura 20).

8.4 Indicatori numerici pentru serii duble cu caracteristici cantitative si frecvente


a) Medii de grupe. Dispersii de grupe. Pentru a de ni aceste

notiuni vom relua tabelul bidimensional

110

111

valori
centrale

xi

lui X

Grupele
.
.
.

Total
unitati
pe grupe
de laY
Medii de
grupa de la Y
Dispersii
de grupa Y

ar ar+1 ] = xr

.
.
.

ai ai+1 ] = xi

a1 a2 ] = x1

:::

:::

:::

:::
:::

:::
:::

X1
(x)

2
1

:::

xr1

ni1

n11

b1 b2 ]
y1

j (x)
2

Xj

nj

nrj

nij

nij

bi bi+1 ]
yj

Grupele lui Y

:::

:::

:::

:::

:::

:::

:::
:::

s (x)
2

Xs

ns

nrj

nis

n1s

bs bs+1 ]
ys

yj valori centrale

(x)

nr

ni

n1

Total
unitati
pe grupe
de la X

Yr

Yi

Y1

Medii
de
grupa
de la X

(y)

r (y)
2

i (y)
2

Dispersii
de
grupa
de la X
2 (y )
1

8.4.1 Medii de grupe. Dispersii de grupe


Medii de grupe. Fie Y i media grupei i de la caracteristica X care se

obtine privind ca o serie unidimensionala valorile lui Y : y1 y2 : : : ys si frecventele


liniei (grupei) i ale caracteristicii X adica
Valorile lui Y
ai ai+1 ]
frecventele grupei i
dupa Y
deci

y1

y2 : : : ys

ni1 ni2 : : : nis

Y i = n1

s
X

i j =1

yj nij

Notam cu Y media totala a caracteristicii Y , adica pentru ^ntreaga colectivitate ea poate obtinuta ^n doua forme:
{ ca medie a mediilor pe grupe, ponderile ind frecventele marginale ale
caracteristicii X (totalurile unitatilor pe grupe dupa caracteristica X )
r
X

ni Y i

= i=1r
X
i=1

ni

r
X

= i=1

ni Y i
N

{ ca medie obisnuita pentru caracteristica Y a carei serie simpla poate


citita ^n tabloul corelativ lu^nd valorile yi de pe prima linie si frecventele
a
marginale de pe ultima (sau frecventele totale ale lui Y )
Valorile lui Y
Frecvente total
pe grupe dupa Y

y1

:::

yi

: : : ys

n q ::: n j ::: n s

112

Avem

s
X

s
X

yj n j

= j=1
s
X
j =1

nj

j =1

yj n j
N

Demonstratia echivalentei. Dupa prima varianta avem:

r
r
s
1 Xn Y = 1 Xn Xy n =
Y=N
i i N
i
j ij
i=1

i=1

j =1

r s
1 XXy n =
=N
j ij

inversam sumele

i=1 j =1

s
r
s
1X X
1X
= N yi nij = N yj n j = Y
j =1

i
|=1{z }

j =1

nj

ce provine din varianta a doua.


Pentru grupele caracteristicii Y vom avea mdii de grupa, ce se calculeaza
analog, dar cu valorile caracteristicii X . Si anume
1
Xj = N
feluri:

i=1

xi nij

Media totala referitoare la caracteristica X se poate si ea calcula ^n doua


s
X

X
sau

r
X

n j Xj

= j=1s
X
j =1
r
X

j =1

nj
xi ni

X = i=1
r
X
i=1

ni

s
1X
= N n j Xj

r
1 Xx n
=N
i i
i=1

113

Ultima varianta se obtine daca din tabelul corelativ extragem variabila


simpla X cu coloana ^nt^ia a valorilor xi si ultima coloana cu frecventele
a
marginale ni sau frecventele totale ale lui X .

2. Dispersiile de grupe.

Dispersia unei grupe ai ai+1 ] de la caracteristica X , se calculeaza pe


baza abaterilor valorilor yi ale caracteristicii Y fata de media acelei grupe Y i .
O vom nota cu 2 (Y ) pentru ca se calculeaza cu valorile variabilei Y , desi grupa
i
ai ai+1 ] tine de caracteristica X .
Vom avea
s
X

2 (Y ) = j =1

(yj ; Y i )2 nij
s
X
j =1

nij

s
X

= j=1

(yi ; Y i )2 nij

ni

ni este volumul grupei ai ai+1 ] ce provine de la caracteristica X .


Analog pentru grupa bj bj+1 ] de volum n j ce provine de la variabila Y .
Vom calcula 2 (X ) dispersia grupei bj bj+1 ] cu ajutorul diferentelor (xi ; X j ).
j
r
X

j (X ) =

i=1

(xi ; X j )2 nij
r
X
i=1

nij

r
X

= i=1

(xi ; X j )2 nij

nj

Mediile si dispersiile de grupa se mai numesc medii si dispersii


conditionate de grupa respectiva.
3. Dispersia dintre grupe se calculeaza pe baza abaterilor (yi ; Y ) a
mediilor de grupa, de la media totala corespunzatoare caracteristicilor respective, de exemplu Y .
Acest indicator masoara in uenta factorului de grupare dupa o relatie
de proportionalitate directa cu frecventele marginale.

114

Dispersia dupa grupele lui X este


r
X

(Y i ; Y )2 ni

i;1
Y=X =
r
X

i=1

ni

i=1

r
1X
= N (Y i ; Y )2 ni

Dispersia dupa grupele lui Y este


r
X

(X i ; X )2 ni

i;1
Y=X =
r
X
i=1

r
1X
= N (X i ; X )2 ni
i=1

ni

4. Media dispersiilor de grupa este calculata ca o medie aritmetica

ponderata a tuturor dispersiilor de grupa, adica


r
X

i (Y )ni
r
1 X (Y )n
i=1
=N
i
i
med (Y ) = X
r
i=1
ni
i=1
2

si analog

r
X

i (X )n j
r
1 X (X )n
i=1
(X ) = X
=N
i
j
med
r
i=1
nj
i=1
2

5. Dispersia totala pentru ecare variabila separat. Pentru ca-

racteristica Y se va calcula pe baza tuturor abaterilor individuale ale valorilor


yi fata de media Y a colectivitatii totale adica (yj ; Y ). Vom avea
s
X

2 (Y ) = j =1

(yi ; Y )2 n j
s
X
j =1

s
1X
= N (yj ; Y )2 n j
j =1

nj

115

analog pentru X

r
X

2 (X ) = i=1

(xi ; X )2 ni
r
X
i=1

r
1X
= N (xj ; X )2 ni
i=1

ni

Acesti indiatori reunesc in uentele tuturor factorilor, care determina


variatia caracteristicilor X si Y .
6. Regula adunarii dispersiilor. Dispersia colectivitatii totale pentru
ecare caracteristica ^n parte este egala cu media dispersiilor de grupa plus
dispersia dintre grupe
2 (X ) = 2

2 (Y ) = 2

med (X ) + X=Y

sau

med (Y ) + Y=X

Folosind dispersiile de nite mai sus se poate de ni indicatorul numit


coe cientul de determinatie, care masoara in uenta factorului de grupare
a caracteristicii X asupra variatiei caracteristicii Y
2
2
RY=X = 2Y=X)
(Y

respectiv reciprocul lui

2
RX=Y = 2X=Y)
(X
Se considera ca factorul de grupare X in uenteaza hotar^tor (semni caa
tiv) variatia caracteristicii Y daca
2
RY=X > 50%

Observatie. Indicatorii de mai sus se pot calcula pentru o serie dubla numai

daca cel putin una din caracteristici este cantitativa (numerica).


Exemplul urmator a fost dat de F.Galton care a efectuat masuratori

116

antropologice asupra unui numar de N=350 persoane, dorind sa vada daca exista vreo legatura^ntre^naltimea persoanelor cercetate si lungimea antebratului
acestora si de ce natura este aceasta legatura. Au fost facute calcule si asupra
ecarei variabile ^n parte trag^nd concluziile si asupra celor doua caracterisa
tici luate separat. ^n tabel dimensiunile sunt date ^n inch (masura de lungime
I
anglo-saxona).
1 inch (deget, tol) 25mm:
Pe marginea tabelului sunt trecute frecventele marginale ni si n j
(frecventele pe grupe) si principali indicatori prezentati mai sus.
Vom utiliza acest tabel si pentru alte notiuni ce vor prezentate mai
departe (vezi tabelul urmator).

117

Fig.21
118

^n continuare vom studia c^tiva indicatori importanti ^ntr-un context


I
a
general, asa numitele momente initiale si momente centrate, care sunt
compatibile doar cu seriile duble ^n care ambele caracteritici sunt numerice
(cantitative). Pentru cazuri particulare ale indicilor vom regasi c^tiva din ina
dicatorii prezentati mai sus.

8.4.2 Momente initiale pentru perechea de variabile


(X

^n cazul distributiilor bidimensionale vom avea momente de diferite orI


dine ^n raport cu ecare dintre variabilele X si Y , precum si momente mixte.
Momentul empiric initial de ordinul h ^n raport cu X si de ordinul k ^n
raport cu Y este dat de relatia
r s
r s
1 X X n xh yk = X X f xh yk
=N
ij i j
ij i j
hk
i=1 j =1

i=1 j =1

Cazuri particulare:
1. k = 0

r s
r
s
1 X X n xh = 1 X x h X n
=N
ij i N
ij
h0
i
i=1 j =1
r
1X

=N

i=1

j =1

j =1

xh ni = h (X )
i

adica momentul initial de ordinul h pentru variabila simpla X .


Este usor sa observam ca valorile variabilei X , x1 x2 : : : xr ^mpreuna cu
frecventele marginale ni de pe ultima coloana a tabelului de corelatie formeaza
o repartitie unidimensionala.
Daca facem pe h = 1 atunci
r
1 Xx n = X
10 = 1 (X ) = N
i i
i=1

119

media totala pentru X .


2. h = 0

s r
1 X X x0 y k n =
=N
0k
i j ij
j =1 i=1

s
r
1X k
1 X kX
= N yj nij = N yj n j = k (Y )
j =1

i=1

moment de ordinul k pentru Y


daca ^n plus k = 1 atunci
01

s
1X
= 1 (Y ) = N yj n j = Y
j =1

media totala pentru Y .


3. Momente de ordinul al doilea
20 = 2 (X )

02

= 2 (Y )

Exista si un moment mixt de ordinul al doilea


r s
1 XXn x y
=N
11
ij i j
i=1 j =1

8.4.3 Momente centrate. Corelatia. Coe cientul de


corelatie
Momentele centrate se de nesc analog cu cele din cazul unei singure

variabile. Astfel momentul empiric (statistic) centrat de ordinul h ^n raport cu


caracteristica X si de ordinul k ^n raport cu Y este
r s
1 X X n (x ; X )h (y ; Y )k =
=N
i
ij i
hk
i=1 j =1
r s
XX
=
fij (xi ; X )h (yj ; Y )k
i=1 j =1

Cazuri particulare importante:

120

1. h = 0, k = 0,

00 = 1 nu

serveste la nimic

h=0 k=1
, 01 = 10 = 0 analog
h=1 k=0
3. k = 0, h0 = h (X ) este momentul centrat de ordinul h pentru caracteristica simpla X

2.

s
r
X
1X
= N (xi ; X )h nij =
h0
i=1

j =1

r
1X
= N (xi ; X )h ni = h (X )
i=1

analog

4. pentru h = 0 avem 0k = k (Y ) momentul centrat simplu de ordinul k


numai pentru Y
s
r
X
1X
= N (yj ; Y )k nij =
0k
j =1

s
1X

=N
5.

j =1

i=1

(yi ; Y )k n j = k (Y )

= 2 (X ) este dispersia empirica a lui X


2
02 = (Y ) este dispersia empirica a lui Y
20

6. Momentul centrat mixt de ordinul al doilea se obtine pentru h = k = 1 si


se numeste corelatia varaibilelor X si Y sau covarianta variabilelor
X si Y
r s
1 X X(x ; X )(y ; Y )n =
i
j
ij
11 = N
=

r s
XX
i=1 j =1

i=1 j =1

(xi ; X )(yj ; Y )fij = C 0 (X Y )

121

^n practica se utilizeaza frecvent un alt indicator numeric obtinut din


I
corelatie prin normare, adica^mpartire cu (X ) si (Y ), abaterile standard pentru X , respectiv pentru Y , care se numeste coe cient statistic de corelatie.
Acesta are expresia:
r(x y) = C(0 (X (Y )) = p 11
X) Y
20 02

8.4.4 Proprietati si interpretari ale coe cientului de


corelatie
Studierea simultana a doua caracteristici a membrilor (unitatilor) unei
populatii, ^nregistrarea datelor ^ntr-un tablou bidimensional, se face special
^n scopul gasirii unor legaturi dintre X si Y . Un tip de legatura este chiar
corelatia, motiv din care, tabloul se numeste tablou corelativ.
O valoare su cient de mare a coe cientului de corelatie indica ca ^ntre
variabilele X si Y exista o legatura, eventual ca, ambele caracteristicii sunt
a
efecte ale unei cauze comune, valoarea coe cientului de corelatie indic^nd intensitatea legaturii. Veri carea acestei legaturi are sens doar daca e vorba de
caracteristici ale elementelor ce fac parte din aceiasi populatie. S-au dat exemple, care de altfel se pot construi usor, ^n care s-au luat doua caracteristici
ce provin de la doua populatii total independente si calcul^nd coe cientul de
a
corelatie, acesta avea o valoare destul de mare, apropiata de unu. Evident acea
valoare este o simpla coincidenta de numere care nu are nici o semni catie.
G.U.Yule introduce chiar expresia "corelatii fara sens" adica corelatii
care nu pot exista. Prin calcule a gasit un coe cient de corelatie foarte mare
de 0,988 ^ntre numarul aparatelor de radio din Anglia ^n perioada 1929{1937
si numarul bolnavilor mintali din aceiasi perioada.
Metodele statistice de analiza bazate pe corelatie si regresie au fost introduse de Francis Galton (1822{1911) si s-au bazat pe cercetari antropologice si studiul ereditatii. Ulterior au adus contributii importante K.Pearson si
122

G.U.Yule ^n corelatia multipla. Spearman si Kendal au adus contributii ^n


corelatia rangurilor, precum si Mosteller si Tukey ^n corelatia robusta.
Intensitatea legaturii dintre doua variabile statistice (doua caracteristici), adica a corelatiei se paote stabili prin:
1. Valoarea numerica a coe cientului de corelatie r(X Y )
2. Gra c prin studierea norului de puncte (vezi gra ce)
1. Studierea valorii numerice
a) Sa observam ca

jr(X Y )j 1 () ;1 r(X Y ) 1
proprietati care s-au obtinut datorita normarii.
Pentru coe cientul de corelatie, ^n practica, se obisnuiesc
urmatoarele interpretari:
{
{
{
{
{

daca r(X Y ) = 0 atunci X si Y se numesc necorelate


daca jr(X Y )j 2 (0 0 3) X si Y se numesc slab corelate
daca jr(X Y )j 2 (0 3 0 7) X , Y se numesc mediu corelate
daca jr(X Y )j 2 (0 7 0 99) X , Y sunt puternic corelate
daca jr(X Y )j = 1 X si Y sunt total corelate.

b) Teorema. Daca X si Y au coe cientul de corelatie egal cu 1


atunci ^ntre ele are loc si o relatie de dependenta liniara

Y = aX + b
numita dupa Galton si regresie liniara (pentru demonstratie vezi
6]).
Observatie. Aceasta teorema este extrem de importanta deoarece
subliniaza relatia dintre corelatie si regresie, cele doua tipuri de
legaturi dintre doua caracteristici.
123

c) Sensul legaturii:
{ daca r(x y) > 0 X si Y se numesc direct corelate
{ daca r(x y) < 0 X si Y se numesc invers corelate.
2. Metoda gra ca se poate ilustra foarte usor pe exemplul dat de Galton si prezentat mai sus, ^n care sunt masurate pentru 350 de persoane
^naltimea si lungimea antebratului. Se observa ca doua colturi ale dreptunghiului interior sunt goale, frecventele absolute grup^ndu-se sub forma
a
unei elipse cu diagonala mare suprapusa peste diagonala dreptunghiului.
Valorile cele mai mari ale frecventelor ind chiar pe diagonala. Forma
norului de puncte ^n cazul reprezentarii gra ce ar chiar aceasta elipsa.
Citind tabloul, tragem concluzia ca nu exista ^n specia umana indivizi foarte mici cu antebrate foarte lungi (coltul st^nga sus) si nici india
vizi foarte ^nalti cu antebrate scurte (vezi coltul dreapta jos), adica aceste
doua elemente ale corpului uman sunt corelate. Evident ambele tipuri
de dimensiuni sunt caracteristici ale speciei de care apartinem, transmise prin ereditate. Adica sunt efecte ale aceleiasi cauze. Coe cientul
de corelatie care masoara cantitativ, exact, intensitatea acestei legaturi
se re ecta si el ^n gra cul numit "nor de puncte" prin forma elipsei si
anume:
{ valoarea lui r(X Y ) apropiata de zero este asociata unui tabel
umplut destul de uniform (cu toate colturile pline)
{ daca r(X Y ) variaza ^ntre 0,3 si 0,7, atunci elipsa ce cuprinde
frecventele sau punctele norului este din ce ^n ce mai subtire
a
{ r(X Y ) > 0 8 elipsa devine si mai subtire asa ca atunci c^nd r(X Y )
se apropie de 1 ea se reduce la o f^sie ^ngusta dreapta, care chiar
a
sugereaza un trend liniar ca legatura dintre X si Y .
124

8.5 Serii numerice paralele


Frecvent ^nt^lnim situatia ^n care datele culese relativ la elementele unei
a
populatii, nu se repeta, sau sunt prea putine si nu este necesara gruparea. ^n
I
acest caz daca dorim sa studiem legaturile dintre doua caracteristici X si Y vom
trece datele ^ntr-un tabel cu doua linii ^n care avem serii paralele corespunz^nd
a
unitatilor populatiei (sau esantionului)
X x1 x2 : : : xi : : : xN
Y y1 y2 : : : yi : : : yN

xi si yj sunt valori ce provin de la elementul i, iar N este volumul populatiei.

^n acest caz se recomanda urmatorii indicatori numerici:


I

8.5.1 Coe cientul de corelatie liniara


Coe cientul de corelatie liniara are cam aceiasi structura ca si coe cientul de corelatie pentru tablou matricial cu frecvente, doar ca e mai simplu
neav^nd frecventele.
a
El poate obtinut si ca o medie aritmetica simpla a produselor abaterilor normate ale celor doua variabile.
Pentru ca valorile abaterilor normate ale celor doua caracteristici sunt

xi ; X

respectiv

avem

1
C l (X Y ) = N

N
X xi ; X
X

i=1

N
X

= i=1

yi ; Y
Y

yi ; Y =

(xi ; X )(yi ; Y )

N X Y

Coe cientul C l (X Y ) de corelatie liniara ia valori ^ntre (;1 +1) ca si


r(X Y ) si se obtine aceiasi interpretare ^n functie de valoarea luata.
125

a) Dupa semn:
{ daca C l (X Y ) este pozitiv legatura dintre variabile este directa,
adica cresc sau descresc ^mpreuna, nu neaparat proportional (liniar)
ci dupa o functie. Acest lucru se obtine pentru ca diferentele pozitive (xi ; X ) si (yj ; Y )^n general se cupleaza, la fel si cele negative
care dau tot produse pozitive. La medie rezultatul iese pozitiv
{ daca C l (X Y ) este negativ ^ntre variabile este legatura inversa.
Valoarea negativa provine din faptul ca diferentele cele mai mari
(xi ;X ) negative se^mperecheaza (se^nmultesc) cu diferente (yi ;Y )
pozitive asa ca majoritatea produselor (xi ; X )(yi ; Y ) rezulta negative si deci media este negativa. Deci ^n general c^nd X creste Y
a
descreste, sau invers.
b) Dupa valoarea absoluta:
{ daca C l (X Y ) este mic apropiat de zero, legatura este slaba
{ daca C l (X Y ) este ^n jurul lui 0,5, legatura este medie
{ daca C l (X Y ) este apropiat de 1, legatura este puternica, ceea ce
indica o variatie aproape proportionala, adica ^ntre X si Y exista o
legatura liniara.
Exemplu: e seriile paralele
Nr.
Vechime
^n munca
Salariu
saptam^nal
a
^n mii lei

10

16

27

16

20

22

18

29

11

860

970

870

910

950

850

930

910

970

870

Prin ^nlocuire ^n formula de mai sus se obtine

Cl (X Y ) = 0 9251
126

care indica o legatura puternica ^ntre X si Y , cu acelasi sens al variatiei acestora. Valoarea mare a coe cientului sugereaza chiar o dependenta functionala
(regresie) liniara ^ntre X si Y aspect pe care ^l vom trata ceva mai departe.

8.5.2 Coe cientul lui Kendall (prin comparatia rangurilor)


Pentru construirea acestui indicator nu se lucreaza cu abateri xi ; X sau
yi ; Y ci se compara direct valorile xi si yi ^n felul urmator:
Se construieste un nou tabel cu doua linii sau coloane ^n care se trec ^n
locul valorilor xi si respectiv yi numarul de ordine (rangul) dupa ce aranjam
crescator una din ele .
Se ordoneaza crescator rangurile dupa variabila X , de exemplu, iar pe
sirul al doilea se trec rangurile acordate pentru cea de-a doua variabila Y aszata
corespunzator elementului de la care provin, adica fara a rupe perechea (xi yi ).
Pentru ecare valoare yi a lui Y se numara valorile, adica rangurile mai mari
ce urmeaza dupa ea numite "ascendente { Ai ", precum si cele mai mici ce
urmeaza dupa ea numite "descendente { Di " pe care le ^nsumam si obtinem
respectiv gradul de concordanta A, si gradul de discordanta D, adica

A=

N
X
i=1

Ai

D=

N
X
i=1

Di

Sa presupunem cazul teoretic ideal ca rangurile lui X si Y s-au asezat


^na ceeasi ordine si anume
X 1 2 3 ::: i ::: N
Y 1 2 3 ::: i ::: N
Aceasta situatie de "concordanta totala" implica un A maxim si un D
minim, adica
Amax = (N ; 1) + (N ; 2) + : : : + 3 + 2 + 1 = N (N2; 1)
127

si

Dmin = 0
Kendall propune urmatorul coe cient:

;D
2(A
K = A A ; D = NAN ; 1) = N (N; D)
(
; 1)
max ; Dmin
2

care are urmatoarele interpretari:

a) Semnul lui K arata sensul legaturii


daca
K > 0 (A > D)
atunci,
^ntre varaibile exista legatura directa, adica aproximativ, cresc sau descresc ^n acelasi sens
daca
K < 0 (A < D)
atunci
^ntre varaibile exista legatura inversa
b) Valoarea absoluta a lui K sugereaza intensitatea legaturii:
C^nd K tinde spre 1 legatura dintre X si Y este mai intensa
a
C^nd K tinde spre zero (adica A si D sunt apropiati) legatura este mai
a
slaba.

8.5.3 Coe cientul Spearman (prin comparatia rangurilor)


Coe cientul Spearman este indus de corelatia simpla liniara
N
X

Cl (x y) = i=1

(xi ; X )(yi ; Y )

N X Y
128

N
X

= v i=1
uX
uN

i=1

(xi ; X )(yi ; Y )

(xi ; X )2

N
X
i=1

(yi ; Y )2

Spearmann observa ca diferentelor (xi ; X ) si (yi ; Y ) li se asociaza


aceleasi ranguri ca si perechilor xi si yi . Introduce notiunea de distanta di
reprezent^nd diferenta dintre rangurile perechilor de valori asociate, adica
a

di = rang (xi ; X ) ; rang (yi ; Y ) = rang xi ; rang yi


Daca prin analogie ^n formula de mai sus ^nlocuim diferenta (xi ; X ) ;
(yi ; Y ) cu di si efectuam calculele se obtine coe cientul propus de Spearmann
6

N
X
i=1

di

S = 1 ; N (N 2 ; 1)
Acesta are aceeasi interpretare ca si cel a lui Kendall si se pot calcula ^n
paralel pe acelasi tabel.
De obicei coe cientul lui Spearmann este mai mare.

Exemplu

Vom considera 10 agenti economici si pentru ecare avem date despre


investitiile ^n reclama si volumul v^nzarilor. Se cere sa se a e daca ^ntre cele
a
doua caracteristici exista legatura, ce sens are si mai ales ce intensitate.
Datele sunt prezentate ^n tabelul de mai jos:. Ele se ordoneaza dupa
prima caracteristica, de exemplu, ^n sensul micsorarii sumei cheltuite. Modul

129

de organizare a calculelor se desprinde din tabelul urmator:


Agentul
economic

A8
A1
A3
A2
A10
A9
A6
A5
A4
A7

Total

Cheltuieli cu
reclama
mil.lei
20,4
13,2
12,0
11,6
9,2
8,8
7,6
6,4
4,4
4,0

d=
Rx ; Ry

1
2
3
4
5
6
7
8
9
10

Valoarea
v^nzarilor
a
mil.lei
1100
960
800
460
360
340
360
380
160
160

1
2
3
4
6
7
6
5
8
8

0
0
0
0
-1
-1
1
3
1
2

Rangurile

d2

A;D

0
0
0
0
1
1
1
9
1
4
17

9
8
7
6
3
2
2
2
0
0
39

0
0
0
0
1
2
1
0
0
0
-4

9
8
7
6
2
0
1
2
0
0
35

Coe cientul lui Kendall devine


2(A
2
70
K = N (N; D) = 10(1035 1) = 10 9 = 7 = 0 7777:
; 1)
;
9
Coe cientul lui Spearman este:
6

N
X

di

6
S = 1 ; N (N 2 ; 1) = 1 ; 10(10217 1) = 1 ; 0 103 = 0 897:
;
i=1

Ambii coe cienti ai rangurilor arata o corelatie de sens pozitiv destul de


mare ^ntre cele doua variabile amintite. Se poate spune ca reclama a in uentat
pozitiv valoarea v^nzarilor. Se observa ca cel al lui Spearman este ceva mai
a
mare.

8.5.4 Coe cientul lui Fechner


Coe cientul lui Fechner numit si coe cientul de concordanta a semnelor,
are rolul de a indica gradul de legatura dintre doua serii paralele.
Pentru calculul acestui coe cient se utilizeaza diferentele dintre valorile
130

succesive

xi+1 = xi+1 ; xi
i = 1 2 : : : N ; 1:
yi+1 = yi+1 ; yi
Coe cientul lui Fechner, F are relatia
F = C ;D = C ;D
C +D N ;1

unde:

C { este numarul perechilor de diferente xi , yi cu semne concordante


D { este numarul perechilor cu semne discordante.
Evident C + D = N ; 1 unde N este numarul unitatilor populatiei.
Interpretarea coe cientului este cea clasica.
a) Semnul indica sensul legaturii:

{ pozitiv = legatura directa


{ negativ = legatura inversa.
b) Valoarea absoluta indica intensitatea legaturii:
{ apropierea de zero = legatura slaba
{ apropiere de unu = legatura puternica.

Exemplu. Zece agenti de asigurari au ^ncheiat ecare un numar de contracte


pentru care la sf^rsitul trimestrului au primit prime. Unul dintre ei doreste sa
a
stie ^n ce grad numarul de contracte a in uentat valoarea primei. Datele sunt
trecute ^n urmatorul tabel.
Alaturi efectuam si calculele conform procedurii amintite. Pentru sim-

131

plitate putem aranja una din variabile ^n ordine crescatoare.


Numa
agent

Numar
contracte
^ncheiate

Valoarea
primei ^n
mil.lei

1
2
3
4
5
6
7
8
9
10

10
11
16
18
20
24
26
30
40
41

1,5
1,3
1,7
1,8
1,9
2
1,8
2
2,8
2,5

xi

yi

xi+1

yi+1 C sau D

1
5
2
2
4
2
4
10
1

-0,2
0,4
0,1
0,1
0,1
-0,2
0,2
0,8
-0,3

D
C
C
C
C
D
C
C
D

6
1
F = C ; D = 10; 31 = 3 = 3 = 0 33 sau 33%
N ;1
; 9

Cele doua variabile se coreleaza slab, adica la premiere s-a tinut cont
prea putin de numarul de contracte.
Exercitiu. Se poate relua exemplul de mai sus, doar ca ^n locul numarului
de contracte sa se treaca valoarea totala a acestora, la ecare agent separat,
pentru a veri ca daca nu cumva acest indicator a in uentat marimea primei.
Propunem urmatoarele sume exprimate ^n milioane lei
Agentul a1 a2 a3 a4 a5 a6 a7 a8 a9
Suma 150 140 170 180 190 200 210 240 220
Raspuns:

;
8
F = 8 + 1 = 10; 11 = 7 = 0 777 =) 77 7%
8 1
; 9
132

8.6 Serii numerice multiple


8.6.1 Corelatia partiala pentru serii cu frecvente
Vom considera ca pentru unitatile unei populatii urmarim simultan mai
multe caracteristici X1 X2 : : : Xs . Pentru studierea mai usoara a acestora se
recomanda de nirea unui asa numit "Coe cient partial de corelatie", care
ne ajuta sa stabilim legatura reala dintre doua fenomene, elimin^nd in uenta
a
celorlalti factori
Vom nota coe cientul de corelatie partiala dintre X1 si X2 cu r12(3:::s) .
^n paranteza se trec indicii variabilelor a caror in uenta vrem sa o eliminam.
I
Coe cientii cu care am mai lucrat de tipul r12 r13 : : : rs;1 s ^i vom
numi coe cienti de corelatie totala.
Se poate arata ca putem calcula coe cientii de corelatie partiala fara sa
izolam ceilalti factori ce pot in uenta cele doua variabile de care ne ocupam.
Acest rezultat deosebit pentru aplicatiile statisticii ^n studiul
fenomenelor colective se datoreaza faptului ca ^ntre coe cientii partiali de
corelatie de diferite ordine exista o relatie de recurenta. Ordinul unui coe cient partial de corelatie este dat de numarul indicilor a ati ^n paranteza.
Astfel, de exemplu, r12(345) este de ordinul trei, coe cientul r12(3) este
de ordinul 1, iar r12 este coe cient total de corelatie, de fapt este de ordinul
zero.
Relatia de recurenta este:

r12(3 4:::s) =

rq :::s;1) ; r1s(34:::s;1) r2s(34:::s;1)


12(34
q
1 ; r2s(34:::s;1) 1 ; r2s(34:::s;1)
1
2

^n acest fel cu ajutorul coe cientilor de ordinul zero pe care-i determinam


I
din tabelele bidimensionale cu frecvente, calculam coe cientii de ordinul 1, cu
ajutorul acestora pe cei de ordinul doi etc.
Exemplu. Pentru trei variabile putem avea coe cientii de corelatie partiala
133

de ordinul 1 care au forma

r12(3) = q r12 ; r13 r23


p
1 ; r2 1 ; r2
13
23

; r12
r13(2) = p r13 2 p r32 2
1 ; 12 1 ; r32
p
r23(1) = p r23 ; r21 r31 2
1 ; r2 1 ; r31
21

Observatie. De obicei coe cientul partial de corelatie de ordinul I pentru X1 si

a
X2 , r12(3) este mai mic dec^t coe cientul total de corelatie referitor la aceleasi
variabile r12
r12(3) < r12

cea ce re ecta mai corect realitatea c^nd se studiaza un ansamblu de variabile,


a
^n acest caz X1 , X2 , X3 .

8.6.2 Coe cientul Kendall pentru legaturi multiple


Este folosit ^n cazul mai multor serii paralele (fara frecvente) pentru
aprecierea simultana a intensitatii legaturii acestora pe baza rangurilor acordate
unitatilor populatiei ^n raport cu variabilele supuse analizei. Acest coe cient
are^n general o valoare informativa destul de mica. Se foloseste mai mult atunci
c^nd se studianza evolutia unui sistem de caracteristici (variabile statistice) ^n
a
timp sau cum ar , ^nainte sau dupa luarea unor masuri.
Sa presupunem ca avem o populatie statistica cu N elemente pentru
care se analizeaza s factori X1 X2 : : : Xs si pentru care se poate constitui

134

urmatorul tabel al rangurilor:


Unitati
statistice

ui

Caracteristici

X1

: : : uj

: : : uN

a11 : : : a1j : : : a1N

..
.

..........................

Xi

ai1 : : : aij : : : aiN

..
.

..........................

Xs

as1 : : : asj : : : asN


S1 : : : Sj : : : SN

Total (suma)

unde aij este rangul unitatilor dj relativ la caracteristica Xi . Kendall considera


ca dispersia maxima a sumei rangurilor Sj se realizeaza ^n cadrul concordantei
totale pentru toate caracteristicile adica.

ai1 < ai2 < : : : < aij < : : : < aiN


oricare ar i.
Coe cientul corelatiei multiple este de nit ca raport al dispersiei efective
a sumei rangurilor si dispersia maxima care este:
2 2
= s (N12; 1)
max
2

adica:

2
(S ) 12 2
(S )
Ks = efectivS ) = s2 (efectiv 1)
2 (
N2 ;
max

Indicatorul ia valori^ntre 0 si 1 si are aceiasi interpretare ca si coe cientul


simplu de corelatie a lui Kendall.

135

8.7 Serii duble din care cel putin una este calitativa (nominativa)
Pentru aceste serii este foarte greu sa se gaseasca indicatori numerici,
singurele numere care apar la acestea ind frecventele. ^n aceste cazuri se
I
foloseste denumirea de tablou de asociere, ^n loc de tablou corelativ.

8.7.1 Serii mixte


Una din cele doua caracteristici este numerica si cealalta calitativa (nominativa).
Fie Y { numerica av^nd valorile y1 y2 : : : ys si X { calitativa av^nd caa
a
tegoriile ABC : : :.
Tabloul de asociere este asemanator cu cel de la doua caracteristici numerice.

A
B
C
.
.
.
Total

y1 : : :

yi : : :

Total pe
grupele
lui X

ys

na1 : : : naj : : : nas


nb1 : : : nbj : : : nbs

Y 1 ::: Y j ::: Y s
na =

si

N=

s
X
j =1

Dispersii
de grupa

Ya
Yb
:::
:::
Y

2 (Y )

na
nb
:::
:::
N

......................
......................

unde

Medii de
grupa

s
X
j =1

naj

y j = na + nb + : : :
136

2 (Y )

:::
:::
2 (Y )

Pentru aceste serii duble, pro t^nd de valorile lui Y , se pot calcula
a
urmatorii indicatori numerici:
{ Media pentru ecare grupa a variabilei X , notate Y a Y b : : :, unde

Ya =

s
X
j =1

naj yj

{ Media totala a acestor grupe Y , ca medie a acestor medii


{ Dispersiile de grupe de la X , notate a (Y ), pentru ca ele se calculeaza
cu valorile yi ale lui Y
{ Dispersiile dintre grupe 2
Y=X
{ Dispersia totala pentru variabila Y ,

2 (Y )

{ Coe cientul de determinatie a lui X asupra lui Y .

Coe cientul de corelatie al lui Pearson. Coe cientul de corelatie


neliniara
Se foloseste mai rar. Utilizeaza dispersia totala 2 (Y ), dispersia dintre
grupe 2 si dispersia medie med (Y ) precum si regula de adunare a disperY=X
siilor despre care am vorbit mai sus
2 (Y ) =

Y=X + 2 (Y )
med

adica variatia totala a lui Y este egala cu variatia datorata in uentei lui X
(variatie explicita) plus variatia datorata altor factori (variatie reziduala).
Pentru masurarea intensitatii legaturii dintre Y si X se tine cont de
ponderea pe care o are primul membru 2 ^n variatia totala a lui Y . Acesta se
Y=X
obtine prin radacina patrata a raportului dintre cele doua, adica a asa numitului
coe cient de determinatie, a caracteristicii X asupra caracteristicii Y despre
137

care am vorbit mai sus

RY=X =

2
Y=X
2 (Y )

2
= 1 ; med (Y )
2 (Y )

Acest indicator este utilizat cel mai des c^nd asociem o caracteristica
a
cantitativa cu una calitativa, de exemplu Y { este cantitativa, X { calitativa,
atunci putem calcula pe RY=X , pentru a stabili o valoare numerica a legaturii
dintre ele. Daca ambele caracteristici X si Y sunt cantitative (numerice) atunci
exista si coe cientul reciproc RY=X care indica in uenta factorului de grupare
a lui Y asupra variatiei lui X .

8.7.2 Serii duble cu ambele caracteristici nominative


Exemple. La un sondaj de opinie au fost chestionate 1000 de persoane pentru

alegerea unui presedinte dintre trei candidati A B C . S-a pus problema daca
sexul alegatorilor are vreo in uenta asupra alegerii candidatilor. Din datele
culese s-a extras urmatorul tabel
Candidat

Sex
Masculin
Feminin
Total

Total

161 198 196


199 207 129
360 405 235

465
535
1000

La un astfel de tabel asezarea ^n tabel este arbitrara, nu exista o ordine,


asa ca repartizarea ^n plan a frecventelor nu ne spune nimic.
Vom pune doar ^ntrebarea daca este vreo legatura ^ntre cele doua caracteristici: adica daca preferinta pentru un anume candidat a fost in uentata de
sexul alegatorilor.
Nici unul din indicatorii prezentati mai sus nu mai pot utilizati aici
neav^nd valori numerice pentru nici una din varaibile. Vom nevoiti sa ne
a
138

descurcam doar cu frecventele nij .


Vom considera tabelul cu frecvente

Y
..
.

xi
..
.

: : : yi : : :
..
.

: : : nij : : : ni
..
.

nj

cu precizarea ca xi si yj nu sunt numere ci categorii ca ^n exemplul de mai sus.

Testul

al lui Pearson

Pearson foloseste ideea ca daca structura frecventelor ^n tabel este aproximativ proportionala pe ansamblu cu structura frecventelor marginale, adica
sa avem:
nij ni
n = N
j

pentru orice i si j , atunci ^ntre cele doua caracteristici nu exista nici o legatura.
Se observa ca daca schimbam pozitia lui xi sau yi ^n careul de mai sus
al frecventelor cu care am facut proportia aceasta nu se schimba.
Pentru studiul unui exemplu concret se construieste un nou tabel cu
frecvente nij , asa zise arti ciale, care asigura independenta totala dintre X si
e
Y , calculate cu ajutorul frecventelor marginale din exemplul dat, dupa relatia

n
nij = ni N j
e

e
^n caz ca se lucreaza cu frecvente relative vom avea fij = fi f j . ExI
presie ce se obtine din precedenta prin ^mpartire cu N . Apoi se construieste
o expresie cu diferente ^ntre frecventele experimentale, concrete si cele "articiale" cu ajutorul careia vom aprecia "departarea" dintre cazul teoretic si cel
139

experiemtnal

e
2 = X X (nij ; nij )
c
nij
e
j =1 i=1
s

Aceasta valoare calculata se compara cu o valoare extrasa dintr-un tabel


a repartitiei teoretice 2 (hi patrat), pe care o citim ^n functie de o probabilitate de eroare , pe care ne-o propunem si numarul corespunzator de grade de
libertate.
Numarul gradelor de libertate este l = (r ; 1)(s ; 1) unde r este numarul
de variante (grupe) ale caracteristicii X si s numarul de varainte ale caracteristicii Y . Numarul numit prag de semni catie sau de risc este mic, de exemplu
0,05 si reprezinta probabilitatea de a gresi.
Desfasurarea testului se face ^n felul urmator:
{ Se emite ipoteza principala (numita si ipoteza nula)

H0 : nij = nij
e
{ Se calculeza 2 cu expresia de mai sus
c
{ Se alege un prag de semni catie , de exemplu = 0 05
{ Se cauta ^n tabelul

valoarea de control

{ Se compara valoarea calculata cu cea din tabel av^nd urmatoarele situatii:


a

{ Daca

l ipoteza H se admite, adica ^ntre cele doua caracte-

ristici nu exista legatura, pot considerate independente pentru ca


frecventele experimentale nu se abat, ^n general, dec^t foarte putin
a
de la cele arti ciale, construite, cu formula de mai sus

{ Daca 2 >
c

l ipoteza nula se respinge si se trege concluzia ca ^ntre

cele doua caracteristici exista legatura si se poate aprecia ca aceasta


este cu at^t mai intensa cu c^t diferenta dintre cele doua valori 2
a
a
c
2 este mai mare
si l
140

Vom aplica acest test pentru exemplul precedent. Avem:

n11 = 465 360 = 167 4


e
1000

s.a.m.d., obtinem tabelul cu frecventele arti ciale nij


e
Candidat

Sex
Masculin
Feminin
Total
calculam

167 46 5% 188 46 5% 109 46 5%


193 53 5% 217 53 5% 126 53 5%
360 100% 405 100% 235 100%

Total
465 46 5%
535 53 5%
1000 100%

3 2
e 2
2 = X X (nij ; nij ) =
c
nij
e
j =1 i=1
(161 ; 167)2 (198 ; 188)2 (106 ; 109)2

+
+
+
167
188
109
; 193)2 + (207 ; 217)2 (129 ; 126)2 =
+ (199 193
217
126
36
9
36
9
= 167 + 100 + 109 + 193 + 100 + 126 = 1 5486:
188
217

Pentru = 0 05 si l = (2 ; 1)(3 ; 1) = 2 din tabelul lui 2 citim


2
0 05 2 = 5 991.
Rezulta ca 2 = 1 5486 este mai mic, ipoteza este acceptata, adica nu
c
exista nici o legatura ^ntre sexul alegatorilor si preferintele pentru candidatii
A B C : : :.

Coe cientul lui Pearson


Se bazeaza pe 2 care a fost calculat cu formula de mai sus.
c
Are forma
s 2
Cp = N +c 2
c

141

Are semni catie si se foloseste ^n special la populatii de volum mic p^na


a
la 30 unitati.
{ Apropierea de zero ^nseamna legatura slaba.
{ Apropierea de unu ^nseamna legatura puternica.
Observatie. Coe cientii studiati ^n acest paragraf pot folositi si la serii
duble numerice, ^nsa aprecierea legaturii este mult prea slaba ^n comparatie cu
coe cientul liniar de corelatie r(X Y ) descris mai sus, sau cu alti coe cienti
descrisi ^n paragraful respectiv.

Coe cientul de asociere a lui Yule


Se utilizeaza atunci c^nd cele doua caracteristici calitative au c^te doua
a
a
variante alternative (sau se pot grupa asa).
Se completeaza un tabel de asociere de forma

X
X1
X2

Total

Coe cientul lui Yule


Interpretarea lui este:

Y1

Y2

Total

a
b
a+b
c
d
c+d
a+c b+d a+b+c+d

YU = ad ; bc
ad + bc

{ apropiere de zero ^nseamna legatura slaba ^ntre X si Y


{ apropiere de 1 ^nseamna legatura mai tare.
Pentru a da o semni catie semnului si deci tipului de legatura ^ntre X si
Y , directa sau inversa, trebuie sa aranjam ^n tabel categoriile X1 , X2 , Y1 , Y2
dupa o logica ce depinde de exemplu.
142

Cazuri extreme:

c
a) Daca a = d =) X si Y sunt independente
b
b) Daca una din cele patru frecvente este zero { se obtine valoarea absoluta
maxima a coe cientului jYU j = 1 sau YU = 1 ceea ce semni ca o asociere
completa: directa sau inversa.

Exemplu. 1. ^n urma sustinerii unui examen la o disciplina tehnica s-au


I

^nregistrat urmatoarele situatii:

Rezultatul
examenului

Sexul

Promovati
Nepromovati
Total

F Total

49 31
11 9
60 40

80
20
100

;
YU = 49 9 ; 31 11 = 441 + 341 = 100 = 0 1278
49 9 + 31 11 441 341 782

indica o legatura slaba ^ntre cele doua caracteristici.


in uenteaza situatia la ^nvatatura.

Adica sexul nu

2.

Rezultatul
examenului

Sexul

Promovati
Nepromovati
Total

Prezenta
mare
la ore
73
2
75

Prezenta
slaba
la ore
7
18
25

Total

;2
YU = 73 18 + 2 7 = 1314 ; 14 = 1300 = 0 9789
73 18
7 1314 + 14 1328
143

80
20
100

Valoarea apropiata de unu a coe cientului arata o legatura directa si


foarte puternica ^ntre prezenta la ore si laboratoare cu rezultatul examenului
adica cu promovabilitatea.
Caracteristicile nominative se ^nt^lnesc cel mai des la Stiintele sociale:
a
psihologie, sociologie, dar destul de des si ^n economie. Studiul acestora trebuie
facut cu mare atentie si cu indicatori potriviti, ^n general greu de de nit.

Aplicatie
^n tabelul urmator se dau valorile si frecventele pentru doua caracterisI
tici numerice ale unei populatii formate din 187 salariati.
Caracteristica X reprezinta masa ^n kg, iar Y perimetrul toracic ^n centimetri.
Y

79{80
81{82
83{84
85{86
87{88
89{90
91{92
96{94

54{57

58{61

62{65

66{69

70{73

74{77

78{81

2
2
2
{
{
{
{
{
6

5
2
5
2
1
{
{
{
15

2
15
15
12
7
4
{
{
55

{
7
15
11
9
6
2
{
50

{
{
6
8
9
9
3
{
37

{
1
2
2
5
6
1
1
20

{
{
1
1
{
1
11
{
4

9
27
46
36
31
26
11
1
187

Sa se calculeze:
1. Frecventele relative si sa se construiasca un nou tabel.
2. Mediile si dispersiile de grupe pentru X si separat pentru Y .
3. Momentele initiale si momentele centrate de ordinul al doilea.
4. Coe ceintul de corelatie r(X Y ) si sa se faca interpretarile corespunzatoare.
144

Capitolul 9

Regresii. Legatura cu corelatia


Regresia statistica este o legatura dintre doua sau mai multe variabile
(caracteristici) statistice numerice, de tip dependenta functionala, adica functie
de variabile statistice.
Se ^nt^lneste de obicei c^nd legatura este de tip cauza{efect.
a
a
Putem avea
regresie simpla daca functia este de o singura variabila independenta
y = f (x). ^n acest caz
I
X { se numeste variabila statistica independenta, care corespunde caracteristicii cauzale sau factoriale
Y { este variabila dependenta care corespunde caracteristicii rezultative
sau efectului.
regresie multipla daca functia este de doua sau mai multe variabile independente
Y = f (X1 X2 : : : Xn )

unde X1 X2 : : : Xn sunt cauze care-l implica pe Y .


Vom aminti un experiment facut de Galton pe la 1820 ^n care
dorea sa vada ce legatura realizeaza ereditatea ^ntre dimensiunile tatilor si
descendentilor (baieti). A ales ^naltimea si a facut masuratori pe un grup de
familii din Scotia unde a selectionat doar familii cu tati ^nalti. Pentru baietii
145

din ecare familie a notat media ^naltimii acestora. A obtinut un tabel cu doua
serii paralele de date, de forma
^naltime tati
x1 x2 : : : xN
I
^naltime medie i y1 y2 : : : yN
I
Dupa reprezentarea gra ca ^ntr-un reper cartezian X 0Y a obtinut un
nor de punte cu trend liniar

Fig.22
Dupa aplicarea unei metode de ajustare liniara a gasit ca punctele se
aseaza ^n jurul unei drepte Y = 0 73X + 2 11. A constatat deci ca din tati
^nalti se obtin i proportional mai ^nalti, dar ^n medie, ^naltimea ilor este mai
mica dec^t a tatilor, panta dreptei gasite e mai mica dec^t a primei bisectoare
a
a
0 73 < 1. Aceasta arata ca procesul foarte elaborat al ereditatii, care tinde
sa conserve caracterele, dimensiunile, mai are si un rol de corijare a dimensiunilor externale, altfel specia ar degenera. Pentru ca ^n acest experiment media
^naltimii ilor a regresat putin fata de media ^naltimii tatilor Galton a numit
dreapta gasita, ca legatura clara ^ntre cele doua serii "regresie liniara".
Termenul de "regresie" s-a patrat^n statistica pentru a desemna notiunea
de functie ^ntre variabile statistice.
Problema gasirii unei regresii se pune doar pentru caracteristici numerice. Vom deosebi doua variante:
146

{ Serii numerice paralele, la care nu avem frecventa si la care corespondenta


^ntre valori se face pe unitati
{ Serii numerice ^n tablou de corelatie.

9.1 Punerea problemei, etape pentru gasirea


unei regresii
1. Convingerea ca ^ntre doua variabile exista o legatura de tip
regresie se obtine daca:
a) La serii paralele, reprezentam gra c perechile (xi yi ) ^ntr-un sistem
cartezian X 0Y si urmarim daca norul de puncte se grupeaza aproximativ
de-a lungul unei f^si (eventual dreapta)
a
b) La serii date cu tablou de corelatie ^n cazul ca s-a calculat coe cientul de
corelatie, acesta este mare, sau vizualizat daca frecventele se grupeaza ^n
tablou ^n vecinatatea imediata a unei linii sub forma unei f^sii ^nguste.
a

2. Propunerea tipului de functie care se apropie cel mai mult de

forma norului de puncte:

{ liniara y = ax + b
{ parabolica y = ax2 + bx + c

b
{ hiperbolica y = a + x

{ exponentiala y = a bx, etc.


Aceasta etapa este di cila si implica mult subiectivism prin faptul ca
propunem functia dintr-un numar mic de functii uzuale si nici nu e sigur ca
nimerim prea bine.
147

Rezulta ca metodele elementare statistice sunt destul de aproximative,


dar au marele avantaj al simplitatii lor.
Exista metode matematice extrem de precise si elaborate care implica
mai multe calcule si utilizarea calculatorului. Aceste metode au deja o larga
rasp^ndire si sunt folosite ^n studii statistice importante. Au la baza asa nua
mitele polinoame de interpolare care pot determinate si care se abat de la
functia teoretica oric^t de putin dorim. Nu vom expune ^n acest manual studiul
a
lor.

3. Determinarea coe cientilor.

Cel mai des se foloseste metoda celor mai mici patrate descrisa de Gauss
^n 1794 la v^rsta de 17 ani.
a
Presupunem ca am propus ca regresie, o functie, de forma Y =
f (X a1 a2 : : : ap ) unde ai sunt parametrii. Ideea lui Gauss este de a minimiza o suma cu patratele diferentelor dintre valorile experimentare (statistice)
date ale lui Y si cele calculate prin functia propusa.
a) Cazul a doua serii paralele (nu avem frecvente), deci
X x1 x2 : : : xN
Y y1 y2 : : : yN
Expresia este:

S (a1 a2 : : : ap ) =

N
X
i=1

yi ; f (xi a1 a2 : : : ap )]2

b) Cele doua serii sunt date sub forma unui tablou de corelatie, ^n care
evident, frecventele diferite de zero sunt grupate pe o f^sie ^ngusta ^n
a
jurul unei linii, altfel nici nu propuneam regresia. Atunci avem:

S (a1 a2 : : : ap ) =

s r
XX
j =1 i=1

148

yj ; f (xi a1 a2 : : : ap )]2 nij

^n acest caz frecventele nij au rol de ponderi. Cele mai mari se vor aseza
I
chiar pe linia de regresie si eventual una doua ^n st^nga si dreapta, mai mici,
a
iar mai departe sunt zero. Pentru ecare valoare yi a lui Y vom avea maximum
3-4 valori xi una cu pondere mai mare si 2, 3 cu ponderi (frecvente) foarte mici.
Se formeaza un fel de medie a lor.
Se poate arata usor ca aceasta functie S (a1 a2 : : : ap ) care depinde de p
variabile a1 a2 : : : ap , parametrii regresiei, are ^ntotdeauna un punct de extrem
si acesta este un minim. De aceea pentru gasirea lui este su cient sa scriem
sistemul format cu derivatele partiale ale lui S pe care le anulam (vezi extreme
pentru functii de mai multe variabile), 5],

@S = 0 @S = 0 : : : @S = 0
@a1
@a2
@ap
0 a0 : : : a0 ) determina ^n nal forma regresiei.
Solutia gasita (a1 2
p

9.2 Regresia liniara


Are forma Y = aX + b si este cel mai des ^nt^lnita.
a
a) ^n cazul seriilor paralele pentru S avem expresia
I

S=
derivam si formam sistemul

8
>
>
>
>
<
>
>
>
:

sau

N
X
i=1

yi ; (axi + b)]2

N
@S = 2 X(y ; ax ; b)(;x ) = 0 j : 2
i
i
i
@a
i=1
N
@S = 2 X(y ; ax ; b)(;1) = 0 j : 2
i
i
@b
i=1

8 X 2 X X
> a xi + b xi = yixi
>
<
> X
> a xi + bN = X yi
:
149

Rezolv^nd sistemul obtinem


a

a=
b=

X
X X
xi yi ; xi yi
X 2 hX i2
xi ;

xi

X X

xi yi xi ; x2 yi
i
X 2 hX i2
N xi ;
xi

Daca ^mpartim ecare fractie si sus si jos cu N 2 se pot exprima


coe cientii a si b cu ajutorul momentelor
1 Xx y ;X Y
i i
a= N
2
2 (x) ; 1 (x)
1 X x y X ; (x)Y
i i
2
b= N
2 (x)
2 (x) ; 1
Se poate arata usor ca dreapta Y = aX + b trece prin punctul (X Y )
numit si centrul de greutate al seriilor.
b) Cazul c^nd seria dubla este data sub forma de tablou de corelatie
a

S=

sau

r s
XX
i=1 j =1

yj ; (axi + b)]2 nij

8 @S XX
> =2
(yj ; axi ; b)(;xi )nij = 0 j : 2
> @a
<
> @S XX
> =2
:
(y ; ax ; b)(;1)n = 0 j : 2
j

@b

ij

8 X 2X
> a xi nij + b X xi X nij = X X xi yj nij j : N
>
> i j
i
j
i j
<
> X X
> a xi nij + b X X nij = X yj X nij
>
j:N
:
i

150

Folosind notatiile pentru momente initiale, dupa ^mpartirea cu N { volumul total al populatiei, obtinem

8
>a
>
<
>
>
:a

20 + b 10
10 + b

11

01

Prin rezolvare obtinem

a=
b=
^n nal
I

Y=

11 ; 10 01
20 ; 2
10

11 10 ; 20 01
20 ; 2
10

11 ; 10 01 X + 11 10 ; 20 01
20 ; 2
20 ; 2
10
10

Scaz^nd din ambii membrii


a

01 = Y

r(x y) = C (x y)

C (x y) =

X Y

vom avea
sau
^n nal

11 ; 01 10

11 ; 01 10 (X ; )
10
20 ; 2
10

Y;

01

Y;

01

= r(x y)2 X Y (X ;

Y;

dar cum
10

avem

si tin^nd cont de
a

10 )

01 = r (x

y) Y (X ;

=X

si

10 )

01 = Y

Y ; Y = r(x y) Y (X ; X )
X

151

Concluzii
1. Regresia liniara trece prin centrul de greutate al celor doua serii format
de cele doua medii (X Y ).
2. Panta dreptei depinde de coe cientul de corelatie si raportul celor doua
abateri standard Y si X .
c) ^n cazul regresiei liniare se poate utiliza si o metoda elementara numita
I
Metoda centrelor de greutate { daca datele sunt sub forma a doua serii
paralele.
A
{ z B {
z 1 x2}| : : xk xk+1}|: : xn
x :
:

X
Y y1 y2 : : : yk

yk+1 : : : yN

{ Se ^mparte norul de puncte ce are un trend liniar ^n doua grupe A si B

Fig.23
{ Se calculeaza coordonatele centrelor de greutate ale celor doua grupe cu

152

mediile aritmetice ale coordonatelor punctelor, adica

8
N
> XB = 1 X xi
>
>
N ; k i=k+1
>
<
B>
N
>
> YB = 1 X yi
:
N ;k

8
k
> X = 1 Xx
> A
>
k i=1 i
>
<
A>
k
>
> YA = 1 X yi
:
k
i=1

i=k+1

{ Se scrie ecuatia dreptei ce trece prin doua puncte A si B , adica

Y ; YA X ; XA
YB ; YA = XB ; XA

sau

Y
Y ; YA = XB ; YA (X ; XA )
;X
B

Exemplu: Se dau urmatoarele serii paralele reprezent^nd legatura dintre doi


a
indicatori economici X = volumul productiei si Y = pretul de cost rezultat.
X 20 30 40 80 130 200
Y 18 16 15 12 10 7
Observ^nd ca norul de puncte corespunzator are un trend liniar, adica
a
Y = aX + b, sa se determine regresia care produce ajustarea liniara a acestor
serii.
Rezolvare: Pentru simpli carea calculelor se organizeaza urmatorul tabel care
este acordat cu formulele amintite mai sus, indicate ^n acest caz.

xi

20
30
40
80
130
200
Total 500

yi

x2
i

xi yi

18 400 360
16 900 480
15 1600 600
12 6400 960
10 16900 1300
7 40000 1400
78 66200 5100
153

^nlocuind datele ^n sistemul ce ne da punctele stationare (^n acest caz minimul)


I
vom obtine:
8
< 66200a+ 500b = 5100
: 500a+ 6b = 78
Rezolv^nd sistemul se gaseste a = ;0 057 si b = 17 755, adica regresia
a
liniara este Y = ;0 057X +17 755. Pe baza acestei regresii se pot face previziuni economice cum ar : Daca volumul productiei creste la 250 unitati atunci
pretul de cost rezultat, prin amortizarea mai rentabila a utilajelor scade la 3,5
unitati
Y = ;0 057 250 + 17 755 = 3 5

9.3 Regresii curbilinii


Sunt cazuri ^n care norul de puncte ce reprezinta doua serii paralele (sau,
frecventele dintr-un tablou de corelatie) are un trend curbiliniu. Cel mai des
se ^nt^lnesc functiile de gradul doi y = ax2 + bx + c, exponentiale y = bax sau
a
b
hiperbolice y = a + x . Utilizarea acestor functii este simpla dar presupune
riscul unor erori datorate ipotezei facute. Numai polinoamele de interpolare
pot ocolii aceste erori dar ele presupun o metodologie mai complicata pe care
nu o tratam ^n acest manual. Pentru documentare se poate cerceta lucrarea
Matematici aplicate, vol.I, P.Blaga, A.Lupas, A.Muresan, vezi 5].
a. Regresia parabolica, are forma y = ax2 + bx + c, unde a b c 2 R
sunt necunoscute.
Daca seriile sunt de forma
X x1 x2 : : : xi : : : xn
Y y1 y2 : : : yi : : : yn
atunci aplic^nd metoda celor mai mici patrate, trebuie minimizata suma
a

S (a b c) =

(ax2 + bxi + c ; yi )2
i
154

Caut^nd minimul se ajunge la sistemul derivatelor partiale de ordinul


a
^nt^i al lui S, adica
a
n
@S = 2 X(ax2 + bx + c ; y )x2 = 0
i
i i
i
@a
i=1
n
@S = 2 X(ax2 + bx + c ; y )x = 0
i
i i
i
@b
i=1
n
@S = 2 X(ax2 + bx + c ; y ) = 0
i
i
i
@c
i=1
care conduce la sistemul liniar cu necunoscutele a b c:

8X 4
> xi a
>X
<
3
> X xi2a
>
: xa
i

+ x3 b + x2 c = x2 yi
P xi2 b + P xi c = P xi y
+ i
i
i i
P x b +nc = P y
+ i
i

Pentru simplitate la sume nu am mai trecut indicii i = 1 n. Acest sistem


poate rezolvat usor, de exemplu, prin regula lui Cramer.
Aplicatie. Fie doua serii paralele care prezinta un trend aproximativ parabolic
X -1 0 1 2 4
Y 0,5 1 2 3 15
Sa se determine regresia parabolica care exprima pe Y ^n functie de X .
Pentru construirea expresiilor din sistem si organizarea calculelor se construieste tabelul urmator:

xi

yi

x2 x3
i
i

x4
i

xi yi

x2 yi
i

-1 0,5 1 -1 1 -0,5 0,5


0 1
0 0 0
0
0
1 2
1 1 1
2
2
2 3
4 8 16
6
12
4 15 16 64 256 60 240
Total 6 21,5 22 72 274 67,5 254,5
155

^nlocuind ^n sistemul liniar descris mai sus obtinem:

8
> 274a+
>
<
> 72a+
> 22a+
:

72b+ 22c = 254 5


22b+ 6c = 67 5
6b+ 5c = 21 5

care are solutia a = 0 856, b = 0 180, c = 0 317.


Regresia parabolica rezultata va Y = 0 856X 2 + 0 180X + 0 317.
b) Regresia exponentiala. Daca trendul gasit are forma exponentiala
adica y = bax, a b > 0, a 6= 1, se recomanda sa se logaritmeze expresia de mai
sus pentru a reveni la cazul liniar, usor de manevrat. Vom avea

Z = lg y = x lg a + lg b
sau

Z =x A+B

unde A = lg a si B = lg b. Se va lucra ca la cazul regresiei liniare doar ca ^n


loc de yi e va folosi zi = lg yi . Sistemul obtinut va liniar

A x2 + B xi =
Xi
P
A xi + B n =

Px z
i i
Pz
i

Dupa determinarea lui A si B se gaseste usor a = 10A si b = 10B .


Aplicatie. Sa presupunem ca ^ncasarile unui agent economic pe primele 6 luni
ale anului sunt cele din tabelul de mai jos
t 1 2 3 4
5
6
I 4,1 4,6 5,8 7,2 15,1 20,5
Reprezentarea gra ca a acestor perechi de valori ne sugereaza un trend
exponential. Facem ipoteza ca I = b at . Logaritmam functia exponentiala si
obtinem liniarizarea Z = B + At, unde Z = lg I , A = lg a si B = lg b. Calculele
156

se ^nscriu ^n urmatorul tabel

ti

Ii

1 4,1
2 4,6
3 5,8
4 7,2
5 15,1
6 20,5
Total 21 57,3

Zi = lg Ii t2
i
0,6178
0,6627
0,7634
0,8573
1,1789
1,3117
5,3918

ti zi

1 0,6178
4 1,3254
9 2,2902
16 3,4292
25 5,8945
36 7,8702
91 21,4273

Sistemul de ecuatii este:

8
< 91A+ 21B =
: 21A+ 6B =

21 4273
5 3972

Solutia sistemului este

A = 0 14087
de unde

B = 0 38815

a = 10A = 1 382 si b = 10B = 2 444

Prin urmare functia exponentiala de ajustare, cautata este

I = 2 444 (1 382)t
Aceasta poate folosita pentru a face previziuni asupra ^ncasarilor si
pot plani cate investitiile pentru lunile urmatoare.
De exemplu pentru luna iulie se preconizeaza ^ncasari ^n valoare de circa

I7 = 2 444 (1 382)7 = 2 444 9 628 = 23 53 u:m:


daca trendul gasit se pastreaza. Acest lucru se petrece cu o anumita probabilitate si care poate determinata cu ajutorul testelor de veri care a ipotezelor
statistice ce vor prezentate ^n capitolul urmator.
157

9.4 Regresii multiple (Functii de mai multe


variabile)
^n fenomenele economice si sociale o caracteristica poate depinde de
I
mai multe caracteristici independente. Daca legatura dintre acestea este foarte
puternica atunci se poate presupune ca ^ntre ele exista o regresie, o dependenta
functionala de mai multe varaibile pe care ne propunem si o gasim cu o anumita
aproximatie, ^n vederea alcatuirii de prognoze economcie.
Vom trata mai ^nt^i un caz mai simplu si anume cel liniar cu doua
a
variabile independente. Calcul^nd coe cientul de corelatie liniar ^ntre variabile
a
Z si X apoi Z si Y , Z si T etc., sa presupunem ca am gasit, de exemplu,
un coe cient mare apropiat ^n valoare absoluta de 1 pentru perechile Z si X ,
respectiv Z si Y si mic apropiat de zero pentu Z si T .
^n acest caz putem lansa ipoteza ca Z este functie (depinde liniar de X
I
si Y ), de forma
Z = aX + bY + c
Coe cientii a si b numiti si coe cienti de regresie arata cu c^t se modi ca Z
a
c^nd X , respectiv Y se modi ca cu o unitate.
a
Sa presupunem ca datele sunt exprimate prin trei serii paralele (adica
fara frecvente)
X x1 x2 : : : xi : : : xn
Y y1 y2 : : : yi : : : yn
Z z1 z2 : : : zi : : : zn
Aplic^nd metoda celor mai mici patrate, trebuie sa gasim a b c asa ca
a
expresia S (a b c) de mai jos sa admita un minim

S (a b c) =

n
X
i=1

(zi ; axi ; byi ; c)2

158

Conditia de minim este data de sistemul:

@S = 0
@b

@S = 0
@a

@S = 0
@c

8 X
> ;2 (zi ; axi ; byi ; c)xi
> X
<
> ;2 X(zi ; axi ; byi ; c)yi
> ;2 (zi ; axi ; byi ; c)
:

adica

Care dupa desfacerea parantezelor devine:

8 X 2
> a xi
> X
<
> a X xi yi
>
:
a

xi

=0
=0
=0

+b xi yi +c xi = xi zi
P
P
P
+b yi2 +c yi = yi zi
P
P
+b yi +c n = zi

Dupa rezolvare gasim parametrii a b c si respectiv forma regresiei.


Observatie. Pentru masurarea intensitatii legaturii dintre variabilele studiate
se obisnuieste sa se utilizeze raportul de corelatie multipla liniara care
are forma:

2
2
);2 z x
R(z=x y) = C (z x) + C (z y1 ; CC((x y)) C (z y) C (x y)
2

unde C (x y) este corelatia simpla liniara dintre X si Y , analog pentru celelalte.


De regula variabilele X si Y sunt independente^ntre ele si din C (x y) = 0
atunci avem pentru raportul de corelatie multipla, forma simpli cata

R(z=x y) = C 2 (z x) + C 2 (z y)
Acest indicator poate avea si forma

v n
u X
u
u
u i=1 (zi ; z(xi yi))2
u
R(z=x y) = u1 ; X
n
u
t
(zi ; Z )2
i=1

159

unde zi sunt valorile experimentale (statistice) din tabel, Z media statistica si


z (xi yi ) valoarea calculata a lui Z prin regresia liniara.
Un caz important de regresie neliniara este aceea de tipul functiilor
putere, adica de forma
b
b
b
Y = aX11 X22 : : : Xnn
care prin logaritmare se reduce usor la forma liniara
log Y = log a + b1 log X1 + : : : + bn log Xn
^n continuare se poate lucra dupa modelul liniar prezentat mai sus.
I
Un exemplu celebru de regresie cu doua variabile independente este acela
a lui Cobb{Douglas, care are forma:
b
b
Y = aX11 X22

Acesta este utilizat mult ^n modelarea cresterii economice. Y reprezinta


variatia produsului nal, X1 un factor de productie de exemplu produsele xe,
X2 alt factor de productie, de exemplu forta de munca. Exponentii b1 si b2
reprezinta coe cientii de elasticitate. Ei reprezinta numarul de procente cu
care creste volumul productiei c^nd factorul de productie respectiv creste cu
a
1%, celalalt factor de productie ram^n^nd neschimbat.
a a

Exercitii rezolvate si propuse


1. O unitate economica realizeaza pe primele 12 luni ale anului pro turi
conform tabelului urmator. Valorile de pe r^ndul II sunt ^n miliarde lei:
a
Luna
Pro t

1
9,6

2
9,2

3
8,2

4
10,3

5
10,2

6
9,6

7
9

8
9,5

9
10,5

10
10,7

11
9

12
10,8

Sa se determine regresia ce leaga aceste doua serii si sa se estimeze protul pe lunile ianuarie si februarie.
160

Rezolvare. Deoarece avem un trend liniar al parametrilor ce reprezinta perechile


de valori consideram ca regresia va liniara adica de forma Y = aX + b.
Organizam calculele ^n urmatorul tabel

xi

yi

1 9,6
2 9,2
3 8,2
4 10,3
5 10,2
6 9,6
7
9
8 9,5
9 10,5
10 11,7
11
9
12 10,8
Total 78 117,5

x2
i

xi yi

1
9,6
4 18,4
9 24,6
16 41,2
25 51,0
36 57,6
49 69,3
64 76,0
81 94,5
100 107,0
121 99,0
144 129,6
650 777,8

^n baza metodei celor mai mici patrate obtinem sistemul liniar


I

8
< 650a+
: 78a+

78b = 777 8
12b = 117 5

care are solutia a = 0 098, b = 9 153. Rezulta ca dreapta de ajustare (de


regresie) este Y = 0 098X + 9 153. Este aproape paralela cu axa 0x.
Folosind aceasta ecuatie estimam pro tul pe lunile ianuarie si februarie
care numerotate ^n continuare sunt a 13-a, respectiv a 14-a.

Yian = 0 098 13 + 9 153 = 10 427 md:lei


Yfeb = 0 098 14 + 9 153 = 10 525 md:lei
161

2. Pentru contractele suplimentare un agent de asigurari a primit ca


premiu valorile din tabelul de mai jos
X 0
5
10 15 20
Y 2,26 2,61 3,36 4,81 7,27
Stiind ca trendul evolutiei premiilor ^n functie de numarul de contracte
suplimentare este parabolic sa se determine:
a) coe cientii regresiei parabolice
b) estimarea premiului pentru 25 de contracte suplimentare
Rezolvare.

a) Regresia are forma Y = aX 2 + bX + c. Pentru simpli care vom aranja


calculele ^n tabelul anexat

xi

0
5
10
15
20
Total 50

yi

2,26
2,61
3,36
4,81
7,27
2031

x2
i

x3
i

x4
i

x1 yi

x2 yi
i

0
0
0
0
0
25 125
625
13,5 65,25
100 1000 10000 33,6
336
225 3375 50625 72,15 1082,25
400 8000 160000 145,4 2908
750 12500 221250 264,2 4391,5

Sistemul obtinut va

8
> 221250a+
>
<
> 12500a+
>
: 750a+

12500b+ 750c = 4391 5


750b+ 50c = 264 2
50b+ 5c = 20 31

care are solutia a = 0 0141, b = ;0 0367, c = 2 3209, adica regresia are


forma
Y = 0 0141 X 2 ; 0 0367 X + 2 3209
162

b) Pentru 25 de contracte se poate estima ca agentul de asigurari poate primi

Y = 0 0141 252 ; 0 0367 25 + 2 3209 = 10 216 mil.lei.


3. La o unitate economica s-a hotar^t ca premierea sa e determinata de
a
numarul de ore suplimentar lucrate precum si de calitatea lucrarii. ^n tabelul
I
de mai jos sunt trecute orele suplimentare si primele obtinute
X 16 27 9 16 20 6 22 18 29 11
Y 860 970 870 910 950 850 930 910 970 870
Trendul ind aproximativ liniar sa se gaseasca regresia corespunzatoare
Y = aX + b.
Organiz^nd calculele ca ^n exemplele precedente si aplic^nd metoda celor
a
a
mai mici patrate se obtine sistemul liniar

8
< 174a+
: 3:528a+

care are solutia


adica regresia este

10b = 9:090
174b = 160:980

a = 5 624

b ; 811 151

Y = 5 624X + 811 151

4. ^nregistr^nd valorile pro tului si ale capitalului x la 10 societati


I
a
comerciale s-au obtinut urmatoarele rezultate (exprimate ^n milioane lei)
Capital
xX
Pro t

180 260 290 320 340 380 420 510

600

650

250 390 420 300 290 600 680 660 1000 960

a. Sa se calculeze coe cientul liniar de corelatie


b. Sa se determine regresia ce leaga pe X de Y
163

c. Sa se estimeze pro tul pentru un capital de 1.000 mill.lei


d. Sa se determine raportul de corelatie.
Rezolvare.

a. Coe cientul liniar de corelatie


X
(xi ; X )(yi ; Y )
= 0 9335
z (y x) =
n
X Y

Concluzie { legatura este directa si puternica ceea ce sugereaza o


regresie liniara ^ntre Y si X . Acest lucru rezulta de altfel si din gra cul
format cu punctele corespunzatoare perechilor de valori (xi yi )
b. ^n ipoteza ca Y = aX + b efectu^nd calculele se obtine ca
I
a

a = 1 68
Regresia este

si

b = ;108 46

Y = 1 68X ; 108 46

a = 1 68 reprezinta panta dreptei si indica faptul ca atunci c^nd fondurile


a
xe cresc cu 1 milion, pro tul creste cu 1,68 milioane lei.

c. Pentru a determina nivelul pro tului la 1000 de milioane, fonduri xe


vom ^nlocui ^n regresie si obtinem

Y = 1 68 1000 ; 108 46 = 1571 54 mil:lei


d. Raportul de corelatie

v X
u
u
u1 ; X(yi ; yc)2 =
R(y x) = t
2
(yi ; Y )

p
p
= 1 ; 85387 79 = 1 ; 0 1288 = 0 8712 = 0 9335
664450

care con rma ca legatura este puternica si directa.


164

Capitolul 10

Elemente de teoria selectiei.


Statistica inferentiala
10.1 Esantion
Exista situatii ^n care cercetarea totala, ^n ^ntregime, a unei colectivitati
statistice este nepractica sau chiar imposibila. Uneori populatia are un volum
prea mare si este total nepractica sau prea costisitoare cercetarea totala. ^n
I
alte cazuri prin cercetare elementul observat se distruge, cum ar veri carea la
rezistenta a unor piese tehnice, timpul de functionare a becurilor, numaratoarea
globulelor rosii din s^nge etc.
a
^n aceste conditii suntem obligati sa cercetam doar o subcolectivitate (o
I
parte) a populatiei numita esantion, selectie sau sondaj. Numarul elementelor
din esantion se numeste volumul esantionului si ^l vom nota cu n < N unde N
este volumul populatiei.
Avantajele selectiei sunt:
{ posibilitatea practica a cercetarii ^n conditii speciale
{ economie de timp, fonduri si personal
{ se pot urmari mai multe aspecte si caracteristici, prin economisirea timpului si a efortului
165

{ poate folosita ca metoda de control a cercetarii totale de mare amploare sau obtinerea unor informatii preliminare (vezi sondaje rapide la
referendumuri).

Etape pentru obtinerea unui esantion:


{ delimitarea populatiei ce va studiata (volumul esantionului)
{ alegerea tipului si procedeului de selectie
{ veri carea omogenitatii colectivitatii
{ inferenta statistica (extinderea rezultatelor).

Reprezentativitatea esantionului.

Pentru ca cercetarea prin selectie sa e e cienta, esantionul trebuie sa


posede o calitate esantionala numita reprezentativitate, care consta ^n capacitatea lui de a reproduce c^t mai del structurile si caracteristicile populatiei
a
din care este extras.
Pentru evaluarea gradului de reprezentativitate se utilizeaza doua
notiuni:
{ eroarea maxima d ce exprima diferenta cea mai mare acceptata ^ntre
o valoare v gasita pe esantion si valoarea corespunzatoare v din toata
colectivitatea relativa la un indicator
{ o marime P , numita nivel de probabilitate sau nivel de ^ncredere,
care arata ce sanse sunt ca eroarea reala comisa atunci c^nd valoarea v
a
{ necunoscuta este aproximata cu v sa nu depaseasca limita d.
Mai precis, dupa determinarea unei valori v pe esantion, de exemplu
medie, dispersie, coe cient de corelatie etc. cu ajutorul erorii d se construieste
un interval (v ; d v + d) ^n interiorul caruia trebuie sa se gaseasca valoarea
cautata v, cu o probabilitate P su cient de mare.
166

Cele doua marimi d si P nu sunt independente. Fiind data una din ele
cealalta poate calculata.
^n consecinta, folosirea expresiei "esantion reprezentativ" este justi cata
I
daca prin aceasta se ^ntelege ca ^n raport cu toate caracteristicile studiate
eroarea d este sub o limita acceptabila, iar marimea P se a a peste un prag
ales, ^n general 95%.
O proprietate esentiala a selectiei este ca sporul de reprezentativitate al
esantionului nu este direct proportional cu volumul lui adica dependenta nu
este liniara. Dimpotriva este data de o curba numita cura de saturare si este
ilustrata mai jos.

Fig.24
Curba arata ca la ^nceput pentru cresteri mici ale volumului esantionului
gradul de reprezentativitate creste rapid ating^nd destul de repede un nivel su a
cient de ridicat. O crestere suplimentara, chiar masiva a volumului esantionului
dupa obtinerea unui nivel ^nalt de reprezentativitate este inutila si pagubitoare.
Aceasta observatie ne arata ca ^n teoria selectiei este su cient si recomandabil
sa se lucreze cu esantioane de volum mic raportate la ^ntreaga colectivitate fapt
care face teoria selectiei at^t de valoroasa ^n aplicatiile statisticii.
a
Conditiile pentru asigurarea unei bune reprezentativitati a unui esantion
167

sunt:
{ selectia unitatilor sa se faca ^n mod obiectiv si aleator cu probabilitate
egala de alegere
{ esantionul sa e su cient de mare. Volumul sau se poate calcula aproximativ pentru a ^ndeplini exigentele impuse
{ includerea unitatilor ^n esantion sa se faca independent de alte unitati.

Procedee de selectie:
{ Selectia aleatoare { este procedeul de baza cel mai folosit. Se face prin
tragere la sorti si exclude orice element subiectiv^n formarea esantionului.
{ Selectia dirijata { are un caracter subiectiv, alegerea unitatilor
esantionului se face de catre persoanele care culeg datele.
{ Selectia mixta { se ^mbina cele doua aspecte, colectivitatea se ^mparte ^n
grupe dupa alegerea cercetatorului ^n functie de o anumita caracteristica
dupa care se extrag la ^nt^mplare (aleator) unitati din ecare grupa.
a

Tehnici de extragere:
{ procedeul tragerii la sorti, pe baza de bile, biletele etc., care reprezinta
unitati din colectivitate. C^nd se poate, se trag chiar unitatile direct. De
a
exemplu piese mici din productia unei masini automate.
Schema de extragere poate :

{ repetata, sau cu bila revenita


{ nerepetata, c^nd bila extrasa nu se mai pune ^n urna.
a
{ procedeul tabelului de numere ^nt^mplatoare. A fost elaborat de Yates
a
si Kendall. Unitatile statistice se numeroteaza si se aseaza la ^nt^mplare
a
^ntr-un tabel apoi se iau cele asezate pe o linie sau pe o coloana care
trebuie sa aiba dimensiunea egala cu volumul esantionului propus.
168

{ Procedeul pasului de numarare.


Unitatile din colectivitate se ordoneaza dupa o caracteristica oarecare neesentiala (ordinea alfabetica, ordinea aparitiei, ordinea intrarii, etc.)
form^nd o lista. Se calculeaza un pas de numarare
a

k = N = volumul colectivitatii
n volumul esantionului
care ^mparte toata colectivitatea ^n grupe de volum egal. Se alege la ^nt^mplare
a
o unitate din prima grupa apoi prin adaugarea succesiva a pasului k la numarul
de ordine din lista gasim urmatoarele n ; 1 unitati ce vor forma esantionul.
Procedeul are un caracter semialeatoriu deoarece doar prima unitate este aleasa
la ^nt^mplare, restul unitatilor intr^nd ^n esantion ^n functie de prima.
a
a
Datorita simplitatii si uniformitatii este des folosit ^n practica.

Erori de selectie.

Prin eroare de selectie se ^ntelege diferenta dintre valoarea indicatorilor


obtinuti ^n urma prelucrarii datelor din esantion si valoarea acelorasi indicatori
obtinuti ^n urma cercetarii ^ntregii populatii.
Erorile pot :
{ de observare (^nregistrare)
{ de prelucrare
{ de reprezentativitate (care sunt speci ce selectiei).
Erorile de ^nregistrare sunt relativ restr^nse, usor de corijat. Ele
a
in uenteaza ^n general putin cercetarea statistica deoarece ^n mod natural se
compenseaza reciproc. Erorile de prelucrare sunt tipice, sunt bine stap^nite si
a
evaluate prin metode matematice.
Erorile de reprezentare, sunt de doua feluri:
{ erori sistematice
169

{ erori ^nt^mplatoare.
a
Erorile sistematice de reprezentativitate se datoreaza nerespectarii principiilor selectiei, adica ecare unitate a colectivitatii sa aiba sanse egale de a
selectata etc. Daca exista astfel de erori rezultatele nale pot avea abateri
importante. Ele se datoreaza comoditatii sau raspunsurilor voit gresite.
Erorile ^nt^mplatoare de reprezentativitatea sunt datorate faptului ca
a
esantionul este prea mic si nu poate reproduce structura colectivitatii. Aceste
erori sunt inevitabile.
Valoarea efectiva a erorilor de reprezentativitate se poate calcula doar
daca avem informatii asupra unor caracteristici relative la colectivitatea totala.
Veri carea se face prin compararea structurii pe diferite selectii cu colectivitatea generala.
Reprezentativitatea se poate veri ca prin coe cientul de reprezentativitate cr% calculat ca raport ^ntre valoarea efectiva de reprezentare r si media
colectivitatii generale X . Daca media generala X este cunoscuta se efectueaza
mai multe selectii succesive si se calculeaza media mediilor de selectie X . ^n
I
acest caz valoarea efectiva de reprezentativitate r se va calcula ca:

r =X ;X

si

cr% = X ; X 100%
X

Cu c^t volumul esantionului n este mai mare cu at^t media de selectia


a
a
va un estimator mai corect al mediei generale.

Tipuri de selectie.

Acestea difera prin^mbunatatirile care se aduc^n scopul reducerii erorilor


de reprezentativitate sau pentru a realiza o precizie c^t mai mare cu efort c^t
a
a
mai mic sau dupa modul ^n care se combina sistemul de organizare, procedeul
folosit la selectie etc.:
{ selectie simpla aleatoare
{ selectie strati cata
170

{ selectie multistadiala (grupala), ^n trepte


{ selectie ^n faza
{ selectie ^n cuiburi.
Selectiile simple aleatoare sunt utilizate pentru colectivitati statistice
negrupate si omogene. Fiecare unitate are sanse egale de a intra ^n esantion.
Formarea esantionului se face prin extrageri pe baza de urna sau lista. Marirea
preciziei se poate face doar prin marirea esantionului.
Selectia strati cata este o metoda de marire a preciziei fara a modi ca
volumul esantionului.
Se aplica dupa ce colectivitatea a fost ^mpartita ^n grupe omogene (straturi) dupa o caracteristica importanta. Apoi este ales la ^nt^mplare un esantion
a
din interiorul ecarui strat, operatie care asigura reprezentarea ecarui strat
^n esantionul total.
Media de selectie se va calcula ca o medie aritmetica ponderata a mediilor
subesantioanelor. Pentru cresterea gradului de reprezentativitate se recomanda
ca volumul subesantioanelor extrase din ecare grupa (strat) sa e proportional
cu volumul grupei, fata de volumul N al ^ntregii colectivitati, adica

ni = Ni
n N
unde:
{ ni = volumul subesantionului
{ Ni = volumul stratului
{ n = volumul total al esantionului
{ N = volumul colectivitatii.
Selectia multistadiala (^n trepte). Colectivitatea este privita ca ind
formata din grupuri, care la r^ndul lor sunt formate din altele mai mici, care
a

171

si ele sunt alcatuite din altele si mai mici si asa mai departe, p^na se ajunge la
a
nivelul individului.
Esantionarea va ^ncepe cu grupurile mai mari , apoi cu urmatoarele,
trec^nd succesiv prin toate nivelurile p^na se ajunge la indivizi izolati.
a
a
^n primul stadiu se alege un numar de grupe mari, apoi din ecare grupa
I
mare un numar de grupe mai mici p^na ^n cele din urma se ajunge sa se obtina
a
un esantion de indivizi. Acest tip de solutii se aplica la colectivitati foarte mari
si care mai sunt si rasp^nditi pe o arie sau perioada foarte mare.
a
Spre exemplu populatia unei tari este grupata pe judete, din primul pas
ar putea alegerea unui esantion de judete. Apoi ^n cadrul judetelor alese se
selecteaza un numar de localitati, ^n cadrul localitatilor, anumite strazi, apoi
gospodarii si ^n sf^rsit indivizi.
a
Alt exemplu ar construirea unui esantion de studenti la nivelul national
(sau de elevi). Avem ^n esantion succesiv: centre universitare, institute de
^nvatam^nt superior, facultati, specializari, ani de studii, grupe de studenti, ^n
a
sf^rsit studenti. Esantionul multistadial se poate obtine doar daca colectivia
tatea are o caracteristica de baza care se poate ierarhiza. Scopul principal al
esantionarii multistadiale ^l constituie reducerea costului si a timpului pentru
culegerea informatiei. Este bine sa precizam ca la volum egal un esantion multistadial este mai putin reprezentativ dec^t unul simplu aleator.
a
Pentru o crestere a reprezentativitatii se poate combina metoda de strati care (grupare) cu cea multistadiala. ^n concluzie aceste metode speciale de
I
esantionare prezinta avantaje care le face sa e foarte utile ^n practica.
Probleme de baza ^n teoria selectiei. Dupa obtinerea esantionului
se trece la studierea unei caracteristici a indivizilor sau chiar la doua. Se vor
^nregistra valorile acestei caracteristici si se vor calcula indicatorii numerici
dupa metodele clasice prezentate ^n capitolele anterioare. Se pune problema ^n
ce masura acesti indicatori estimeaza pe cei corespunzatori ai ^ntregii populatii.
172

Estimarea valorilor medii. Fie X o caracteristica de tip cantitativ

de nita pe o populatie de volum N a carei valoare medie X urmarim sa o


estimam prin studierea unui esantion de volum n. Extrag^nd un esantion oarea
0
care vom obtine o medie X , ^n general diferita de X . Diferenta X 0 ; X va
reprezenta eroarea pe care o comitem c^nd ^n loc sa luam toti cei N indivizi,
a
utilizam doar datele din esantionul de volum n. Aceasta diferenta (eroare) nu
poate cunoscuta daca nu masuram caracteristica pe ^ntreaga populatie, ceea
ce nici nu facem, noi dorim doar sa facem o evaluare a erorii comise.
Sa presupunem ca volumul populatiei N este foarte mare si ca din aceasta
populatie am extras un numar apreciabil de esantioane si pentru ecare am calculat media obtin^nd sirul
a

X 01 X 02 : : : X 0k : : :
Acestea la r^ndul lor formeaza o caracteristica de tip cantitativ pe care
a
0
o notam cu X si o numim distributie de esantioane. Vom da ^n continuare
patru proprietati ale acestei distributii care se pot demonstra utiliz^nd teoria
a
probabilitatilor.
a
1. Media caracteristicii X 0 coincide cu media lui X . Cu alte cuvinte fac^nd
media mediilor tuturor esantioanelor obtinem chiar media caracteristicii
X pentru ^ntreaga colectivitate.
2. ^n cazul esantionarii simple aleatoare repetate (cu returnarea elementului
I
p
extras) avem ca: abaterea standard a variabilei X 0 este de n mai mica
dec^t abaterea standard a variabilei X .
a
Daca notam abaterea standard a lui X 0 cu e care se mai numeste
eroare standard atunci pentru tipul de esantionare mentionat avem:

e = pn
173

3. Distributia valorilor variabilei X 0 urmeaza o curba normala de tip Gauss


care are forma de clopot (vezi paragraful urmator).
4. Abaterea standard a variabilei X ^n populatie este su cient de bine aproximata de abaterea standard a acelei variabile ^ntr-un esantion oarecare.
Practic putem folosi ^n locul lui , care este necunoscuta pe 0 calculata
pe baza valorilor din esantionul utilizat.

Calculul erorii standard pentru alte tehnici de esantionare. ^n


I

cazul esantionarii simple aleatoare nerepetate (fara introducerea ^n urna a elementului extras) formula devine:

rN ; n

e = pn N ; 1

unde:

N = volumul populatiei
n = volumul esantionului.
Deoarece N este mult mai mare ca n valoarea radicalului este apropiata
de 1 si are doar un rol de corijare.
Cazul esantionarii prin strati care. Vom presupune ca populatia
este^mpartita^n s straturi de marime N1 N2 : : : Ns si din ecare strat se alege un
subesantion n1 n2 : : : ns . Daca subesantioanele sunt proportionale cu marimea
straturilor adica avem

ni = Ni
n N

i = 1 2 ::: s

atunci valoarea medie din populatie este corect estimata de marimea:

X0 =
altfel se foloseste formula

X0 =

s
X ni
i=1

X 0i
n

s
X Ni
i=1

174

N Xi

unde X 0i sunt valorile medii ale variabilei pe cele s subesantioane.


Eroarea standard pentru esantioanele strati cate e data de formula:

e=

s
X Ni2

sau ^n cazul proportional

vs
uX n2
u i
e=t
2
i=1

i
N 2 ni

i
ni

vs
uX n
u i
=t
i=1

n2

i:

10.2 Problema centrala ^n teoria selectiei


Pe un esantion urmarim ^n general c^te o caracteristica izolata, unea
ori cuplate c^te doua. Se pune problema gasirii (estimarii) legii de probaa
bilitate teoretice pe care o urmeaza caracteristica studiata. Evident aceasta
lege poate doar aproximata, cu o precizie pe care o putem calcula. Precizia estimarii legii de probabilitate, depinde de mai multi factori, ca de pilda:
marimea esantionului, modul de obtinere a acestuia, metoda folosita pentru
aproximare etc. Dupa gasirea (aproximativa) a legii de probabilitate se poate
utiliza aparatul matematic extrem de perfectionat al teoriei probabilitatilor
pentru a calcula diferiti indicatori numerici, ce se refera la ^ntreaga colectivitate
a ata ^n studiu. Aceasta operatie se numeste de regula inferenta statistica.
Cu ajutorul acestor indicatori si a legii de probabilitate gasite se pot face previziuni economice de mare valoare si se poate preciza si gradul de ^ncredere ^n
ele (probabilitatea cu care le acceptam).

Etape pentru gasirea legii de probabilitate

1. Propunerea clasei din care face parte legea: normala{Gauss, de tip


Student, etc.

2,

2. Estimarea parametrilor ce intra ^n componenta densitatii de probabilitate, care de neste legea.


175

3. Veri carea gradului de precizie a aproximarii parametrilor prin utilizarea


unor teste de veri care specializate.
4. Utilizarea legii pentru calcularea de probabilitati, alcatuirea de prognoze
si luarea unor decizii.
Pentru prima etapa ^n care se face propunerea generala a legii ne putem
folosi de experienta acumulata prin care putem aprecia ca numite fenomene
economice clasice sunt guvernate de legi de probabilitate uzuale.
O alta metoda simpla des folosita este aceea de a reprezenta gra c seria
statistica atasata caracteristicii numerice, sub forma de poligon al frecventelor,
care sugereaza destul de bine genul de curba (familia) din care face parte legea
de probabilitate cautata.
Dam mai jos c^teva din legile de probabilitate cele mai folosite ^n studiul
a
fenomenelor economice.
Apoi ^n paragrafele urmatoare vom dezvolta etapele doi si trei.

10.2.1 Legi de probabilitate, discrete uzuale


Legile discrete sunt acelea care iau doar anumite valori numerice cu
probabilitatile corespunzatoare.
Legea binomiala (Legea lui Bernoulli, sau legea bilei ^ntoarse). Se
^nt^lneste la fenomenele care se repeta identic de un numar de n de ori si
a
la care ne intereseaza un anume rezultat, adica realizarea unui eveniment A,
respectiv a contrariului acestuia A. Se pune problema gasirii probabilitatii ca
evenimentul A sa se realizeze de k ori si A de n ; k ori (k n).
Se arata, ^n teoria probabilitatilor, ca aceasta probabilitate este
k
P (X = k) = Cn pk qn;k

unde p este probabilitatea realizarii evenimentului A la o efectuare a


experientei, iar q = P (A) probabilitatea evenimentului contrar. Evident
176

p + q = 1.

Se numeste lege binomiala deoarece multe calcule se bazeaza pe binomul


lui Newton. Se foloseste foarte mult^n studiul fenomenelor economice, deoarece
^ntre agentii economici, ^n timp, se desfasoara operatii identice, care se repeta
de un numar mare de ori: operatii bancare, de asigurari, livrari de marfuri,
achizitii de materii prime, producerea de bunuri (cu defecte sau fara ), etc. Se
poate utiliza si modelul matematic cu o urna cu bile albe si negre ^n proportie
cunoscuta. Probabilitatea extragerii unei bile albe peste p si a unei bile negre
q. Din urna se extrag n bile pun^nd dupa ecare extragere bila extrasa ^napoi.
a
Probabilitatea de a obtine exact k bile albe, ^n aceste conditii, este data de
k
formula prezentata mai sus: Cn pk qn;k . De aici i se trage si numele de legea
bilei ^ntoarse.
Repartitia de probabilitate atasata este data de tabloul

k
X C k pk qn;k
n
k=0 1 2 ::: n
Se veri ca usor, cu binomul lui Newton, proprietatea de baza a unei
repartitii de probabilitate
n
X
k=0

k
Cn pk qn;k = (p + q)n = 1n = 1

Valoarea medie este


iar abaterea standard

M (X ) = np
D(X ) = = pnpq:

Legea hipergeometrica (Schema bilei ^ntoarse.) Acestei legi i

se poate atasa un model matematic cu o urna ^n care se gasesc a bile albe si b


bile negre.
Din urna se extrag n bile (n a + b) fara a mai pune bila extrasa ^napoi.
177

Probabilitatea de a obtine k bile albe si n ; k bile negre este:


n;k

C
P (X = k) = CaC n b

k = 0 1 2 ::: n

a+b

Veri carea ca este o repartitie de probabilitate adica ca


n k
X Ca Cbn;k

k=0

n
Ca+b = 1

se obtine usor cu ajutorul identitatii


(1 + x)a (1 + x)b = (1 + x)a+b
prin egalarea coe cientilor lui xn din ambii membrii.
Valoarea medie este
n
M (X ) = a +ab

iar dispersia este

D2 (X ) = npq a + b ; n
a+b;1

Daca numarul de bile din urna N = a + b creste foarte mult atunci


cele doua legi practic se identi ca. Adica nu mai are importanta daca se pune
sau nu bile extrasa ^napoi. Acest lucru are semni catie ^n statistica c^nd dea
osebim selectiile de volum mic de cele de volum mare, respectiv populatiile
corespunzatoare. Acest lucru se veri ca matematic prin trecerea la limita c^nd
a
N tinde la in nit. Vom avea
k

a
P = Nlim CC k Cb =
!1

a+b
:b n
:
= Nlim a(a ; 1) : : k!(a ; k + 1) b(b ; 1) : : n(;;)! + k + 1) (a + b)(a + b ; 1)n:!: : (a + b ; n + 1)
!1
( k
^mpartim sus si jos cu N n = (a + b)n si avem:

; a k;1 b ; b ; 1 ; b n;k;1
a ;a 1
n!
N N ; N :;: : N ; ; N N N ; N : : : N ; N
P = k!(n ; k)! Nlim
1
2
;
!1
1 ; N 1 ; N : : : 1 ; nN 1
178

tin^nd cont ca
a

a
a
a+b = N =p

b
b
a+b = N =q

si

p + q = 1, obtinem:
!
k
P (X = k) = k!(nn; k)! pk qn;k = Cn pk qn;k
adica tocmai probabilitatea de la schema bilei ^ntoarse.
Legea evenimentelor rare a lui Poison. Spunem ca variabila X
de tip discret urmeaza legea lui Poison daca are distributia:

X pk )
k ( k=0 1 2 :::
unde

pk ( ) = k! e;

> 0:

Se veri ca usor ca este o repartitie de probabilitate daca utilizam dezvoltarea ^n serie a lui eX si anume
n
x 2 3
ex = 1 + 1! + x + x + : : : + x ! + : : : :
2! 3!
n

Variabila aleatoare de tip Poisson are o in nitate de valori discrete, k =

0 1 2 :::

1
X

k=0

;
;
k! e = e

Valoarea medie este


Dispersia este

1
X

;
0
k! = e e = e = 1
k=0

M (X ) =
D2 (X ) =

Teorema lui Poisson ne da legatura dintre legea binomiala si legea lui


Poisson a evenimentelor rare.
179

Teorema (Poisson). Daca variabila aleatoare X urmeaza legea binomiala,


adica are distributia

X Pk
(n k) k=0 n
k pk q n;k , si daca p = pn astfel ca n pn = > 0 constant,
unde P(n k) = Cn
atunci pentru n ! 1, X urmeaza legea lui Poisson, adica
k

lim P (n k) = k! e;
n!1

Demonstratie. Tin^nd cont ca p = pn = n si ca q = 1 ; p = 1 ; n avem


a

succesiv

n;k

k
lim P (n k) = nlim Cn n
1; n
=
n!1
!1
;k
n
k
::
= nlim k! n(n ; 1) :nk n ; k + 1 1 ; n
1; n =
!1
n
k
:(
= k! nlim n(n ; 1) : :nk n ; k + 1) nlim 1 ; n nlim 1 ; n =
!1
!1
!1
k

= k! 1 1 e; = k! e; :
Observatie. Deoarece n pn = constant, rezulta ca pentru n foarte mare
probabilitatea pn este mica. Deci probabilitatea de aparitie a evenimentului,
caruia i se ataseaza aceasta schema este foarte mica, de unde legea lui Poisson a primit denumirea de lege a evenimentelor rare. Se aplica foarte mult
la utilizarea calculatoarelor, la automate, ^n telefonie, la transporturi aeriene
tranzactii bancare unde probabilitatea aparitiei unei perturbatii, unui accident
este extrem de mica. Probabilitatea realizarii a 2 3 : : : k astfel de accidente
este si mai rara si se calculeaza cu legea mai sus amintita.
Practic se poate face comparatia ^ntre calitatea (adica precizia ^n
functionare) a doua calculatoare, automate, banci dupa asa numitul coe cient
a lui Poisson, atasat. Cu c^t acest coe cient este mai mic cu at^t aparatul
a
a
este mai performant, activitatea economica mai e cienta, etc.
180

10.2.2 Legi de probabilitate continue


Aceste legi pot lua toate valorile de pe un interval sau chiar de pe toata
axa reala.
Legea uniforma are densitatea
8 1
<
pentru x 2 a b]
(x) = : b ; a
0 pentru x 2 R n a b]
1. Sa veri cam ca este o densitate de probabilitate
+
Z1

;1

b
1 Z dx = x b = b ; a = 1
(x)dx = b ; a
b;a a b;a
a

2. Functia de repartitie este

F (x) =

+
Z1

;1

1 Z 1
;a
(t)dt = b ; a b ; a = x ; a
b
b

Mai precis daca tinem cont de toate pozitiile posibile ale lui x avem:

8
> 0
> x;a x<a
<
F (x) = > b ; a x 2 a b)
>
:
1

x b

Fig.25
3. Valoarea medie
+
Z1

1 Z xdx = 1 x2 b = b2 ; a2 = b + a
M (x) = x (x)dx = b ; a
b ; a 2 a 2(b ; a)
2
;1
a
b

181

4. Dispersia

M (X 2) =

+
Z1

x2

;1

D2 (X ) = M (X 2 ) ; M (X )2

b
1 Z x2 dx = x3 b = b3 ; a3
(x)dx = b ; a
3(b ; a) a 3(b ; a)
a

2
2
2
2
D2 (X ) = b + ab + a ; (a + b) = (a ; b)
3
4
12

Aplicatii^n industrie si economie. Erorile determinate de rotunjirile p^na


a
la ^ntregul cel mai apropiat urmeaza distributia uniforma.

Legea normala a lui Gauss

Densitatea de probabilitate a acestei legi este


1 x;m 2
1
x2R
(x m ) = p e; 2 ( )
2
1. Gra c general (al familiei). Scriem tabloul de valori

x ;1
0

00

+
0
+

%
+

m;
+

m
+

% 1= 2

Fig.26
182

m+
-

&
-

i
0

+1
& 0
+ +

Gra cul are forma de clopot, numit si clopotul lui Gauss.


2. Variatia gra cului ^n functie de parametri

Fig.27
3. Caz particular: Legea normala normata (standard) este aceea pentru
care m = 0, = 1, adica are forma
2
(x 0 1) = p1 e; x2
2

Fig.28
Legat de acest caz important de lege normala mentionam functia lui
Laplace
t
Zt
1 Z e; x22 dx
(t) = (x 0 1)dx = p
2 0
0
Proprietati:

1) (0) = 0, (+1) = 1
2
2) este o functie impara adica (;t) = ; (t), 8t 2 R.

183

Functia lui Laplace av^nd un rol extrem de important ^n practica a fost


a
tabelata (vezi anexa).
4. Veri carea ca (x m ) este o densitate de probabilitate:
+
Z1

;1

1
(x m ) = p
2

Z1

+
Z1

x;m
e ( ) dx = p1
2
;1

; y2

;1
2

p
dy = p2 = 1
2

;1

Facem schimbarea de variabila x;m = y, x = y + m, dx = dy.


Am, utilizat o integrala improprie importanta
+
Z1

y2

e; 2 dy = 2

;1

numita integrala lui Poisson.


5. Valoarea medie
+
Z1

+
Z1

1
M (X ) = x (x m )dx = p
2
;1

2
xe; 1 (

x;m )2

dx =

;1

+
Z1m + y y
p e; dy:
=
2
2
2

;1

Facem aceeasi schimbare de variabila ca mai sus


=m

+
Z1

;1

2
p1 e; y2 dy + p
2
2

{z

+
Z1

;1

y2

ye; 2 dy

=m 1+0=m

{z }

ind impara, deci=0


La prima integrala folosim din nou integrala lui Poisson si obtinem 1. La
a doua integrala, functia de sub integrala ind impara si integrarea fac^ndu-se
a
pe un interval simetric fata de origine, rezulta ca este egala cu 0.
6. Dispersia

D2 (X ) =

=1

+
Z1

(x ; m)2

;1

1
(x m )dx = p
2
184

+
Z1

(x ; m)2 e; 2 (

;1

x;m )2

dx

Efectuam aceeasi schimbare de variabila ca mai sus, apoi o integrare prin


parti si obtinem
D(X ) = 2
7. Functia de repartitie

F (x) = P (X < x) =

Zx

Zx

1
(y m )dy = p

;1

2
e; 1 (

y;m )2

dy

;1

facem schimbarea de variabila:

y ; m = t y = t + m dy = dt
si obtinem

F (x) = p1
2

x;m

e; t2 dt
2

;1

Daca utilizam functia lui Laplace amintita mai sus, putem scrie
1
F (x) = 2 +

x;m

^n acces caz probabilitatea ca X sa ia valori pe un interval (a b) este


I

P (a X < b) = F (b) ; F (a) =

b;m ;

a;m

Daca intervalul este simetric fata de valoarea medie, adica b = m + ",


a = m ; " rezulta

P (jX ; mj < ") = P (m ; " < X < m + ") =

" ;

;" = 2

pentru ca functia lui Laplace este impara.


Sa alegem acum " = k , k 2 Z un multiplu de abateri standard
a) Pentru k = 1 avem

P (jX ; mj < ) = 2 (1) = 2 0 3413 = 0 6828


185

"

Interpretare geometrica. ^ntre punctele de in exiune (m ; m + )


I

sub gra cul densitatii de probabilitate se acumuleaza ^ntotdeauna 0 6828 =


68 28% din arie. Daca este mic aceasta arie se repartizeaza pe un interval
mic de lungime 2 .
b) Fie k = 3

P (jX ; mj < 3 ) = P (m ; 3 < X < m + ) = 2 (3) = 0 997


^n practica acest rezultat se cunoaste sub denumirea de regula celor
I
trei sigma si are urmatoarea interpretare:
Pentru orice lege de tip normal, pe un interval de lungime 6 , trei
la st^nga lui m si trei la dreapta lui m, adica (m ; 3 m + 3 ) variabila
a
aleatoare X ^si atinge practic toate valorile (99 7%) care este echivalent cu
evenimentul sigur. Regula se foloseste ^n tehnica la sisteme automate, aviatie,
telefonie, vaccinuri, ^n economie la operatii bancare extrem de importante etc.
Se poate face o comparatie cu un rezultat similar dat de inegalitatea lui
Ceb^sev unde pentru aceiasi probabilitate P (m ; 3 < X < m + ) se obtine
un prag inferior de 0 888 adica 88 8% care este o aproximatie grosiera, de unde
se vede un dezavantaj al acestei inegalitati.
Aplicatie. Abaterile X ale diametrului pieselor fabricate de o masina de
la diametrul proiectat, urmeaza o lege normala pentru care m = 30mm si
= 10mm. Sa se calculeze probabilitatea ca diametrul piesei sa aiba abateri
^ntre 10 si 50mm.
Rezolvare. Din enunt se cere sa calculam

P (10 < X < 50) = P (jx ; 30j < 20) = 2 (2) = 0 9545 = 95 45%

Legea Gamma este caracterizata de densitatea de probabilitate:

8 xa e; x
b
>
<
(x a b) = > ;(a + 1)ba+1
:
0

186

daca x > 0 a 0 b > 0


daca x 0

Este o familie de functii foarte generala

Fig.29
Sa veri cam ca este o densitate de probabilitate:
1) Se observa usor ca (x a b) 0, 8x 2 R
+
+
Z1
Z1 x
a+1
1
2)
(x a b)dx = ;(a + 1)ba+1 xa e; b dx = ;(a + 1)ba+1 = 1
;(a + 1)b
;1
0
Se face schimbarea de variabila x = t, dx = b dt si se utilizeaza expresia
b
functiei Gamma amintita la capitolul analiza matematica, 5].

Valoarea medie
M (X ) =

Z1

;1

x (x a b)dx = ;(a +11)ba+1

Z1
0

b
xa+1 e; x dx =

a+2
= ba+1 ;(a + 2) = b(a + 1);(a + 1) = b(a + 1)
b ;(a + 1)
;(a + 1)

Dispersia se calculeaza cu relatia

D2 (X ) = M (X 2 ) ; M (X )]2 = 2 ;
Dar

2 = b2 (a + 1)(a + 2)

2
1

de unde

D2 (X ) = b2 (a + 1)(a + 2) ; b2 (a + 1)2 = b2 (a + 1)
Utiliz^nd functia Gamma se pot calcula foarte usor momentele initiale
a
a
k de orice ordin si tin^nd cont de relatia de legatura cu cele centrate se pot
187

imediat gasi si momentele centrate k .


Din aceeasi familie cu legea Gamma mai fac parte si alte legi de probabilitate extrem de mult folosite ^n practica economica, motiv pentru care le
vom prezenta, pe scurt, ^n continuare, ele rezult^nd ca si cazuri particulare.
a
Legea 2 are densitatea

8 x n ;1e; x
> ; n x>0 n2N >0
<
(x n ) = > ; n 2 2
: 20
x 0
2 2

Aceasta densitate se poate obtine din legea Gamma prin ^nlocuirea lui

a = n ; 1 si b = 2 2 .
2

Parametrul n se numeste numarul gradelor de libertate denumire


acordata de R.Fisher (1890-1962) biolog si statistician. Valoarea medie este
M (X ) = n 2 , iar dispersia D2 (X ) = 2n 4 . Aceasta lege este mult aplicata ^n
statistica la construirea unor teste de veri care a ipotezelor statistice. A fost
utilizata de antropologul si biologul Karl Pearson (1857-1936) care a construit
si tabele pentru functia de repartitie atasata (vezi anexa).
Legea Weibull are densitatea

8
> m x;u
>
<
(x m x0 u) = > x0 x0
>
:

m;1

;
; xx0u

pentru 0 u x
x0 > 0 m > 0
pentru x < u

si este din clasa Gamma.


Se observa ca functia de repartitie este

8
< 1 ; e; xx;u
F (x) = :
0
0

daca x u 0
daca x < u

Se veri ca usor prin derivare.

Valoarea medie

1
M (X ) = x0 ; m + 1
188

Dispersia

D2 (X ) = x2
0

"

1
2
; m +1 ; ; m +1

2#

Aceasta repartitie se utilizeaza ^n abilitate la studiul defectelor accidentale c^nd acestea se datoreaza fenomenelor de uzura si ^mbatr^nire. Este
a
a
mult utilizata ^n asigurari.
Repartitia Erlang este din aceeasi clasa cu Gamma. Are densitatea:

8 ( k)k
>
<
xk;1 e; kx
(x k) = > ;(k)
:
0

Valoarea medie
Dispersia

pentru x 0 k 1 > 0
pentru x < 0

M (X ) = 1
D2 (X ) = k1 2

Pentru k = 1 se obtine un caz particular des folosit ^n practica numit

repartitia exponential negativa

8
< e; x
(x ) = :
0

pentru x 0 > 0
pentru x < 0

Repartitia exponential negativa se utilizeaza mult ^n abilitate

Fig.30
189

are functia de repartitie

8
< 1 ; e; x
F (x) = :
0

Legea Student

pentru x 0
pentru x < 0

Student este pseudonimul matematicianului englez W.Gosset (18761937). Densitatea are expresia

;
n+1
; n+1
t2 ; 2
2;
1+ n
(t n) = p
t2R
n; n
2
Parametrul n se numeste numarul gradelor de libertate. Legea este
folosita mult ^n statistica la construirea unor teste de veri care a ipotezelor
statistice. Pentru functia de repartitie s-au construit tabele de unde se extrag
-cvantile utile ^n teste (vezi anexa). Gra cul repartitiilor din aceasta familie
este asemanator cu cel al repartitiei normale normate, doar ca este putin mai
turtit.
Una din cele mai importante teoreme limita centrale a rma ca daca
n ! 1 repartitia Student tinde catre repartitia normala normata.
Se veri ca usor utiliz^nd limite de tipul "e" ca
a
2
lim (t n) = p1 e; x2 repartitia normala normata:
n!1
2
Student

Fig.31
^n aplicatiile ^n care se utilizeaza frecvent legea Student, daca n > 30
I
se poate trece la ^nlocuirea acestei legi cu legea normala normata si tabelul
190

corespunzator, care este cel al functiei lui Laplace.


Valoarea medie

M (X ) = 0

n
D2 (X ) = n ; 2 :

Legea Beta are densitatea


8 1
>
<
xa;1 (1 ; x)b;1 pentru x 2 (0 1) a > 0 b > 0
(x a b) = > B (a b)
:
0
pentru x 2 R n (0 1)
unde B (a b) este functia Beta a lui Euler. Se veri ca usor ca este o densitate
de probabilitate.
Forma functiei (x a b) depinde de valorile parametrilor pozitivi a si b.

Observatii.

1. Pentru a ; 1 > 0, b ; 1 > 0 functia se anuleaza pentru x = 0 si x = 1 si


a 1
are un maxim ^n punctul de abscisa a+;;2 din intervalul (0 1).
b
2. Pentru a ; 1 < 0 b ; 1 < 0 functia devine in nita pentru x = 0 descreste p^na la un minim apoi creste devenind in nita pentru x = 1. Are
a
asimptote verticale ^n x = 0 si x = 1.

Fig.32
Valoarea medie este

a
M (X ) = a + b
191

Dispersia este

D2 (X ) = (a + b)2 (ab+ b ; 1)
a
3. Prin operatii elementare si treceri la limita ^n raport cu parametrii a
si b se poate face legatura dintre aceasta repartitie si altele cum ar
repartitia Gamma si repartitia normala. Aceste legaturi ^ntre modelele
probabilistice re ecta de fapt legaturile naturale reale dintre fenomenele
economice.
Recomandam utilizatorului sa studieze din bibliogra a citata si alte legi
de probabilitate, utile ^n practica, specializate pe clase de fenomene economice,
cum ar : legea Snedecor, Fisher, legea dupa triunghi isoscel a lui Simpson,
legea logaritmic normala etc.

10.3 Metode de estimare a parametrilor


S-a vazut ^n paragraful precedent ca aproape toate legile prezentate
depind de 1{3 parametrii adica formeaza familii de functii. Precizarea acestor
parametrii duce la alegerea unei singure functii din familie, functie care descrie
cel mai bine fenomenul studiat. Nu putem niciodata sa gasim valoarea reala,
exacta a parametrilor, dar pe baza datelor de selectie se pot gasi aproximari
destul de bune pentru parametri.

De nitia 10.3.1 Se numeste functie de estimatie pentru parametrul functia


de selectie (statistica)

= (X1 X2 : : : Xn)

care depinde de variabilele de selectie X1 X2 : : : Xn si cu ajutorul careia se


pot obtine date despre .

192

De nitia 10.3.2 Functia de estimatie = (X1 X2 : : : Xn) este o functie


de estimatie absolut corecta (sau nedeplasata) pentru parametrul , daca
satisface conditiile:
(i) M ( ) =
(ii) nlim D2 ( ) = 0
!1

iar valoarea numerica = (x1 x2 : : : xn ) se numeste estimatie absolut


corecta pentru parametrul .
^n de nitia de mai sus si ^n continuare vom nota cu
I
x1 x2 : : : xn , date de selectie obtinute experimental, care sunt valori ale variabilelor corespunzatoare de selectie X1 X2 : : : Xn .

Observatie.

De nitia 10.3.3 O functie de estimatie = (X1 X2 : : : Xn) se numeste

corecta (deplasata) pentru daca are proprietatile:


(i) nlim M ( ) =
!1
(ii) nlim D2 ( ) = .
!1

^n acest caz valoarea numerica


I
= (x1 x2 : : : xn ) se numeste
estimatie corecta (sau deplasata) pentru .

Observatie. Se numeste distorsiune sau deplasare a unui estimator, a unei


functii de estimatie a parametrului , diferenta M ( ) ; . Daca distorsiunea
este nula functia de estimatie se zice nedeplasata.
Exemplul 1. Fie caracteristica X pentru care exista momentul teoretic de
ordinul k
k = M (X k )

si e o selectie de volum n. Se stie ca momentul de selectie (empiric, statistic)


de ordin k este:
n
1 X X k:
k=n
i
i=1

193

Vom arata ca k dat de relatia de mai sus este o functie de selectie absolut
corecta pentru momentul teoretic de ordin k. Vom avea succesiv

n
n
1 X X k = 1 X M (X k ) =
(i) M ( ) = M n
i
i
n i=1
i=1
n
n
1 X M (X k ) = 1 X = n k = :
=n
k
k
n
n
i=1

si

i=1

n
n
1 X X k = 1 X D2 (X k ) =
(ii)
k
i
n i=1 i
n2 i=1
n
2(
2(
1 X
= n2 D2 (xk ) = nDn2X ) = D nX ) ;! 0

D2 (

) = D2

i=1

c^nd n ! 1, adica sunt veri cate ambele conditii din de nitia de mai sus.
a
Caz particular. Media de selectie este un estimator absolut corect pentru
media teoretica pentru ca avem M (X ) = 1 .
Exemplul 2. Momentul centrat de selectie de ordinul doi
2=

n
1 X(X ; X )2
i
n
i=1

este o functie de estimatie doar corecta pentru momentul centrat teoretic


de ordinul doi 2 = D2 (X ) adica pentru dispersia teoretica.
Se arata usor prin tehnici simple de calcul ca:
(i) M ( ) = n ; 1 2 = n ; 1 D2 (X ) ;! D2 (X ) c^nd n ! 1
a
2

n
n
2
(ii) D2 ( 2 ) = (n ;31) 4 ; (n ; 1)(n ; 3) 2 ;! 0 c^nd n ! 1.
a
2
n
n3

Observatie. Daca se considera o alta functie de selectie ca estimatie pentru


dispersia teoretica si anume

2=

n
X

n ; 1 i=1 (xi ; X )
194

sau

n
1 X
= n ; a (xi ; X )2
a
2

i=a

unde a este un ^ntreg pozitiv, atunci aceasta este functie de estimatie absolut corecta pentru dispersia teoretica D2 (X ) = 2.
Pentru a arata acest lucru sa observam ca:
2=

n
n ; 1 2:

Prin urmare se obtine

n
(i) M ( 2 ) = M n ; 1

n
= n ; 1 M ( 2) =

n
= n ; 1 n ; 1 D2 (X ) = D2 (X )
n
n
(ii) D2 ( 2 ) = D2 n ; 1
am aratat mai sus.

n
= n;1

D2 ( 2 ) ;! 0, n ! 1, dupa cum

Pentru abaterea standard care este radacina patrata din dispersie avem
doua functii de selectie dupa cum am mai amintit ^ntr-un paragraf anterior si
anume
v n
u1 X
u
=t
(x ; X )2

n i=1 i

care este functia de estimatie corecta pentru abaterea standard teoretica, si

v
u
u
0=t

n
X

n ; 1 i=1 (xi ; X )

care este functia de estimatie absolut corecta pentru abaterea standard teoretica.
Reamintim ca deosebirea dintre ele ^n aplicatiile practice se manifesta
doar la selectii de volum mic n < 30, c^nd se recomanda utilizarea lui 0 ca
a
functie de estimatie pentru teoretic.
195

De nitia 10.3.4 Se numeste cantitate de informatie (dupa Fisher) a unei


selectii de volum n relativ la parametrul 2 R necunoscut valoarea
In ( ) = nM

"

@ ln f (X )
@

2#

unde f (X ) este legea de probabilitate teoretica pe care dorim sa o a am.

Proprietate. (Inegalitatea lui Rao{Cramer). O functie de selectie absolut corecta (X1 X2 : : : Xn ) pentru parametrul veri ca inegalitatea

D2 ( ) I 1 ) :
n(

De nitia 10.3.5 Functia de estimatie (X1X2 : : : Xn) care este absolut


corecta relativa la parametrul se numeste e cienta, daca realizeaza egalitatea ^n inegalitatea lui Rao{Cramer adica

D2 ( ) = I 1 )
n(
Expresia:

e( ) =

In ( ) D2 ( )
se numeste e cienta functiei de estimatie (X1 X2 : : : Xn ).

Aplicatie. Fie o caracteristica av^nd repartitia data de


a

0
1
X@

p q

1
A

p + q = 1:

Sa veri cam daca media de selectie X este o functie de estimatie e cienta pentru parametrul p 2 (0 1). Se stie ca valoarea medie teoretica
M (X ) = p.
Densitatea de probabilitate poate scrisa ca

f (x p) = px(1 ; p)1;x pentru x = 0 si x = 1


196

Daca

x = 0 =) f (0 p) = 1 ; p
x = 1 =) f (1 p) = p

adica chiar probabilitatea din repartitia lui X .


Pentru a calcula cantitatea de informatie relativa la parametrul p avem
succesiv
ln f (x p) = x ln p + (1 ; x) ln(1 ; p)
@ ln f (x p) = x ; 1 ; x = x ; p
@p
p 1 ; p p(1 ; p)
# "
#
"
@ ln f (x p) 2 = M X ; p 2 =
M
@p
p(1 ; p)
22 2
= pp;(1p; +)p = p(1 1 p)
2
p2
;

deci

In (p) = p(1 n p)
;

Pe de alta parte se poate scrie

D 2 (X ) = D 2

n
1 XX

n k=1

n
2(
1 X
;
= n2 D2 (Xk ) = D nX ) = p(1 n p)
k
k=1

;
Prin urmare se obtine ca D2 (X ) = In 1 (p) deci X este o functie de
estimatie e cienta pentru parametrul p.

10.3.1 Metoda verosimilitatii maxime


Fie X caracteristica cercetata si pentru care am propus functia de probabilitate f (x 1 2 ) care depinde de parametrii necunoscuti 1 si 2 .
Fie variabilele de selectie X1 X2 : : : Xn care sunt independente si
urmeaza aceeasi lege de probabilitate ca si X . Experimental s-au obtinut valorile de selectie x1 x2 : : : xn realizari numerice ale variabilelor Xk de mai sus.
197

Vectorului aleator (X1 X2 : : : Xn ) format din variabile independente ^i


atasam densitatea de probabilitate V (x1 x2 : : : xn 1 2 ) de forma

V (x1 x2 : : : xk

1 2) =

numita functie de verosimilitate.

n
Y

k=1

f (xk

De nitia 10.3.6 Spunem ca functiile de selectie

1 2)

= 1 (X1 X2 : : : Xn ) si
2 = 2 (X1 X2 : : : Xn ) sunt functii de estimatie de verosimilitate maxima pentru
parametrii 1 , respectiv 2 , daca ele realizeaza maximul functiei de verosimilitate.
1

Procedeu de gasire:
1. Se logaritmeaza functia de verosimilitate
ln V (x1 x2 : : : xn

2) =

n
X
k=1

ln f (xk

1 2)

2. Se deriveaza partial expresia de mai sus pentru gasirea punctelor


stationare si deci a maximului

@V
@ 1 =0

@V
@ 2 =0

Sistemul obtinut se numeste sistem de verosimilitate maxima.


3. Prin rezolvarea acestui sistem si veri carea conditiilor de maxim se obtin
functiile de estimatie de verosimilitate maxima
1 = 1 (X1

X2 : : : Xn ) si

= (X1 X2 : : : Xn )

Exemple:
1) Fie o caracteristica care urmeaza legea evenimentelor rare a lui Poisson,
adica
X k k;
> 0 necunoscut
e
k!

198

Avem la dispozitie datele de observatie x1 x2 : : : xn facute asupra


caracteristicii X .
Avem:
x
x = 0 1 2 :::
f (x ) = x! e;
ln f (x ) = x ln ; ln x! ;
@ ln f (x ) = x ; 1

Ecuatia verosimilitatii maxime este:


n
X xk
;1

k=1

de unde

n
X
= 0 =) 1 xk ; n = 0
k=1

n
1X
= n xk
k=1

Rezulta ca

=X

este media de selectie, care este ^n acest caz functia de verosimilitate


maxima. Era de asteptat acest rezultat deoarece valoarea medie teoretica
pentru legea evenimentelor rare e chiar parametrul M (X ) = pe de
alta parte, media de selectie X este o functie de estimatie absolut corecta
pentru valoarea medie teoretica.
2) Sa se determine functiile de estimatie de verosimilitate maxima pentru
parametrii legii normale N (m )
x;m 2
1
2
f (x m ) = p e; 1 ( )
2
Se stie ca m = M (X ) si 2 = D2 (X ).
Rezolvare. Mai ^nt^i logaritmam densitatea de probabilitate.
a
Avem
p
; 2
ln f (x m ) = ; ln 2 ; ln ; (x 2 m)
2
199

de unde

8
>
>
>
>
<
>
>
>
:
sau

8 @ ln f (x m
>
>
@m
<
> @ ln f (x m
>
:
@

) = x;m
2

) = ; 1 + (x ; m)2
3

Prin ^nsumare se obtine sistemul de verosimilitate maxima:


n
n
@ ln V = X @ ln f (Xk m ) = X Xk ; m = 0

@m

k=1

@m

k=1

n n
n
@ ln V = X X @ ln f (Xk m ) = X ; 1 + (Xk ; m)2 = 0
3
@
@
k=1 k=1
k=1

8X
> n (X ; m) = 0
>
> k=1 k
<
>X
>
> ; 2 + (Xk ; m)2] = 0
:

de unde se obtin functiile de verosimilitate maxima

v n
u1 X
u (X ; X )2 = p
=t
k

n
1X
m = n Xk = X

n k=1

k=1

pentru parametrii m si .

10.3.2 Metoda momentelor (1891, Pearson)


Fie caracteristica X studiata av^nd momentele teoretice initiale k . Se
a
stie ca momentele statistice
n
X
= 1 Xk
k

n i=1 i

sunt functii de estimatie absolut corecte pentru k corespunzatori. Metoda


consta ^n construirea unui sistem de ecuatii prin egalarea momentelor teoretice
cu cele statistice de acelasi rang, adica
k= k

k = 1 2 ::: s
200

unde s este numarul parametrilor pe care ^i are densitatea de probabilitate


f (x 1 2 : : : s ), adica

xk f (x

1 2

: : : s )dx = i (X1 X2 : : : Xn)

i=q s

Daca X este caracterizata de o lege de tip discret atunci ^n loc de inteP


grala avem suma .
Exemplu. Fie caracteristica care urmeaza legea gamma de parametrii a si b,
b > 0 necunoscut, iar a > 0 cunoscut. Av^nd la dispozitie datele experimentale
a
x1 x2 : : : xn sa se determine parametrul necunoscut b.
Rezolvare. Vom folosi doar o singura ecuatie data de egalitatea

xf (x b)dx = 1 (x1 x2 : : : xn )

Densitatea de probabilitate a repartitiei gamma este:


8 1
>
< ;(a)ba xa;1e; x daca x > 0
b
f (x a b) = >
:
0
daca x 0
Ecuatia de mai sus devine
1 Z xa e; x dx =
b
;(a)ba
1

Daca ^n integrala facem schimbarea de variabila x = t, dx = b=dt,


b
obtinem
;(a + 1)ba+1 = =) a;(a)b =
1
1
;(a)ba
;(a)
sau
n
1
1 X
b a= 1
b = a = na xi
k=1

^n concluzie functia de estimatie de verosimilitate maxima pentru


I
parametrul b, c^nd a este cunoscut este
a
n
X
b 1
X

na i=1 i
201

10.3.3 Metoda intervalelor de ^ncredere


Fie caracteristica X cercetata despre care stim sau presupunem ca
urmeaza densitatea de probabilitate f (x ), unde este un parametru necunoscut. Se obtin experimental, asupra caracteristicii X , valorile statistice
x1 x2 : : : xn , realizari numerice ale variabilelor statistice X1 X2 : : : Xn independente si care urmeaza aceiasi lege de probabilitate ca si X . Metoda
consta ^n determinarea a doua functii de selectie (numite obisnuit si statistici)
a
1 (X1 X2 : : : Xn ) si 2 (X1 X2 : : : Xk ) astfel ^nc^t

P ( 1 (X ; 1 : : : Xn ) < < 2 (X1 : : : Xn)) = 1 ;


unde 2 (0 1) nu depinde de , este foarte mic si se numeste probabilitate de
risc. Valoarea 1 ; se numeste probabilitate de ^ncredere. ^n general se alege
I
^ntre 0 01 si 0 09, cel mai des se ia 0 05, situatie ^n care 1 ; = 0 95, adica
95%. Intervalul aleator (( )1 (X1 : : : Xn ) 2 (X1 : : : Xn )) se numeste interval
de ^ncredere pentru parametrul .
Procedeul practic de gasire a intervalului de ^ncredere:
{ Se cauta o statistica (functie de selectie) Zn = Zn (X1 : : : Xn ) a carei
lege de probabilitate sa e cunoscuta si care sa nu depinda de parametrul
pe care dorim sa-l aproximam.
{ Folosind datele de selectie x1 x2 : : : xn se determina apoi un interval
numeric (z1 z2) astfel ^nc^t
a

P (z1 < Zn < z2 ) = 1 ;


{ Efectu^nd calcule algebrice asupra dublei inegalitati din paranteza
a
aceasta se transforma p^na c^nd ia forma echivalenta: 1 < < 2 .
a a
Intervalul ( 1 2 ) este unul numeric care depinde de datele de selectie,
adica ( 1 (x1 x2 : : : xn ) 2 (x1 x2 : : : xn ))
202

Observatie. Informatia asupra parametrului este cu at^t mai buna cu c^t


a
a
intervalul ( 1 2 ) este mai mic si probabiltiatea de ^ncredere 1 ; este mai

mare. Practic ^n locul lui se poate lua orice valoare din intervalul ( 1 2 ).
Exemplul 1. Fie legea de probabilitate normala de tip Gauss N (m ) cu
> 0 cunoscut. Sa se gaseasca un interval de ^ncredere pentru media teoretica,
adica pentru parametrul m, daca presupunem ca am ales ca probabilitate de
^ncredere valoarea 1 ; .
Rezolvare. Efectuam o selectie repetata de volum n apoi alegem functia de
selectie (statistica)

;
1
Z = X p m unde X = n
n

n
X
i=1

Xi

despre care se stie ca urmeaza legea normala normata N (0 1) adica nu depinde


de parametrul necunoscut m = M (X ) pe care vrem sa-l aproximam.
Vom determina intervalul numeric (z1 z2) astfel ^nc^t
a

P (z1 < Z < z2 ) = 1 ;


Folosim functia lui Laplace
(x) = p1
2

Zx
0

e; t2 dt
2

care serveste pentru exprimarea functiei de repartitie atasata legii normale,


adica avem
(z2 ) ; (z1 ) = 1 ;
Functia lui Laplace este tabelata (vezi anexa).
Pentru xat, intervalul de ^ncredere de lungime minima se obtine c^nd
a
aceasta este simetric fata de origine, adica z2 = ;z1.
^n acest caz z2 este o 1 ; 2 cvantila: z2 = z1; 2 , care se poate determina
I
din relatia
;z ; ;;z = 1 ;
1; 2
1; 2
203

adica

;z

1; 2

= 1;
2

stiind ca functia lui Laplace este impara (;x) = ; (x).


Fiind determinati z1 si z2 putem scrie:

P ;z1; 2

< X ;m <z
p

1; 2

=1;

sau efectu^nd calcule algebrice simple asupra celor doua inegalitati pentru izoa
larea parametrului m obtinem:

P X ; pn z1; 2 < m < X + pn z1; 2 = 1 ;


De aici se pot citi cele doua functii de selectie (statistici) ce formeaza
intervalul de ^ncredere pentru parametrul m, adica

m1 (X1 X2 : : : Xn ) = X ; pn z1; 2
m2 (X1 X2 : : : Zn) = X + pn z1; 2 :

Variabilele X1 X2 : : : Xn intervin ^n cele doua formule prin intermediul


n
1X
lui X = n Xi , celelalte litere n ind cunoscute, iar z1; 2 a fost extras
i=1
din tabelul lui Laplace.
Observatie. Daca caracteristica X urmeaza o alta lege dec^t cea normala,
a
dar volumul selectiei este su cient de mare (n > 40) si se cunoaste abaterea
p
standard atasata acestei legi = D2 (X ) atunci se poate utiliza tot functia
de selectie
;
Z = Xp m
n

pentru gasirea unui interval de ^ncredere asociat mediei teoretice M (X ), necunoscuta, pe care o notam tot cu m si care poate servi ulterior la aproximarea
unui parametru al legii studiate, de care M (X ) este legat prin operatii algebrice.
Exemplul 2. Se da o caracteristica X ce urmeaza legea normala N (m ) unde

204

ambii parametrii sunt necunoscuti, m = M (X ) si = D2 (X ). Ne propunem


sa construim un interval de ^ncredere pentru media teoretica m = M (X ) cu o
probabilitate de ^ncredere 1 ; data. Se face o selectie de volum n, obtin^nd
a
datele x1 x2 : : : xn .
Rezolvare. Se va utiliza functia de selectie (statistica)
n
X

Xi ; m
X ; m = v n i=1
T=
1

u
n
u 1 X(X ; X )2
t n(n;1)
i
i=1

Aici nu este cunoscut si am folosit pentru el o functie de selectie absolut


corecta, adica:
v
u 1 X
n
u
= t n ; 1 (Xi ; X )2
i=1

Functia de selectie se alege dintr-o lista de astfel de functii uzuale, ^n


asa fel ca ea sa ^ndeplineasca conditiile impuse, prezentate anterior. Se arata
ca aceasta statistica T urmeaza legea lui Student, cu n ; 1 grade de libertate,
asadar o lege care nu depinde de m si nici de . Intervalul de ^ncredere pentru
m va simetric fata de X si va determinat de o cvantila pe care o citim
din tabelul lui Student (vezi anexa) ^n functie de gradul de risc ales si de
numarul gradelor de libertate (n ; 1), cvantila pe care o notam tn;1 1; 2

Fig.33
205

Zona complementara intervalului (t1 t2 ) (cea hasurata), care corespunde


probabilitatii de risc este ^mpartita ^n doua parti egale, simetric asezate fata
de intervalul (t1 t2 ) sau fata de 0Y corespunz^ndu-i ecaruia o arie de 2 .
a
Cvantila (abscisa) tn;1 1; 2 este de fapt solutia ecuatiei

F (tn;1 1; 2 ) = 1 ; 2
unde F este functia de repartitie atasata legii Student. Dupa determinarea
intervalului
;t = ;t
1
n;1 1; 2 t2 = tn;1 1; 2

pentru serie

;
P t1 < X p m < t2 = 1 ;
n

apoi prin calcule algebrice izolam pe m pentru a obtine statisticile m1 si m2


care formeaza intervalul de ^ncredere (m1 m2 ). Avem:

P X ; t1 pn < m < X + t2 pn = 1 ;
de unde rezulta ca:

m1 = X ; tn;1 1; 2 pn
m2 = X + tn;1 1; 2 pn :

Exemplul 3. Intervalul de ^ncredere pentru dispersia teoretica a legii normale.


Se considera o caracteristica X ce urmeaza legea normala N (m ) cu
media si dispersia necunoscute. Se cere sa gasim un interval de^ncredere pentru
dispersia teoretica 2 = D2 (X ).
Rezolvare. Se alege statistica
2
H = (n ; 1)
2

unde

2=

n
X

n ; 1 i=1

n
1X
(Xi ; X )2 si X = n Xi
i=1

206

Se arata ca statistica H urmeaza legea 2 cu n ; 1 grade de libertate.


Vom determina mai ^nt^i un interval pentru care probabiltiatea de ^ncredere
a
este 1 ; , iar cel complementar de risc este asezat simetric fata de el

Fig.34

h1 = hn;1 2 h2 = hn;1 1; 2
Aceaste abscise se determina separat din ecuatiile:

Fn;1 (h2 ) = 1 ; 2

Fn;1 (h1 ) = 2

unde Fn;1 (x) este o functie de repartitie atasata legii 2 cu n ; 1 grade de


libertate. Reamintim ca n este volumul selectiei facute, adica av^nd datele de
a
selectie x1 x2 : : : xn pe care, de asemenea, le utilizam prin introducerea lor ^n
functia de selectie ^n locul variabilelor Xi .
Abscisele (cvantilele) hn;1 2 si hn;1 1; 2 le gasim ^n tabloul anexat cu
valorile functiei Fn;1 , corespunzatoare legii 2 (vezi anexa)
1 Z 2
t
Fm (x) = m ;( m ) t m ;1 e; 2 dt
22 s
x

Dupa determinarea intervalului h1 , h2 avem

P h1 < (n ; 1) < h2 = 1 ;
2

207

x > 0:

sau

2
P (n ; 1) <
h2

< (n ; 1)
h

=1;

^n concluzie s-a obtinut intervalul de ^ncredere (


I
parametrul 2 unde:
2=
1
2
2

n
X

2 2)
1 2

pentru

hn;1 1; 2 i=1 (Xi ; X )

=h 1

n;1

n
X

i=1

(Xi ; X )2

^n aceste relatii mai urmeaza sa introducem datele de selectie


I
x1 x2 : : : xn ^n locul variabilelor Xi pentru obtinerea concreta a marginilor
intervalului de ^ncredere.
Intervalul de ^ncredere pentru abaterea standard teoretica se obtine
prin extragerea radacinii patrate din capetele intervalului de mai sus, adica
( 1 2 ). Orice valoare de pe acest interval poate luata ca aproximatie pentru teoretic, evident cu probabilitatea aleasa (1 ; ).
Metodele de gasire a intervalelor de ^ncredere sunt importante si pentru
faptul ca stau la baza construirii testelor pentru veri carea ipotezelor statistice
ce vor prezentate ^n paragraful urmator.

10.4 Teste de veri care a ipotezelor statistice


10.4.1 Generalitati. Tipuri de teste
Se numeste ipoteza statistica o presupunere relativa la caracteristica X
a unei populatii C , privind legea de probabilitate a lui X , parametrii de care
depinde aceasta lege de probabilitate sau semni catia unei a rmatii sau a unui
indicator statistic.
Metoda prin care o ipoteza statistica ce trebuie veri cata se accepta sau
208

se respinge se numeste test statistic.


^nt^lnim c^teva tipuri de teste:
I a
a
{ test parametric, daca acesta se refera la parametrii de care depinde legea
de probabilitate a caracteristicii X
{ test de concordanta, daca testul se refera la natura legii de probabilitate
(normala, Student, 2 , etc.)
{ test de semni catie, daca se refera la semni catia pe care o are un anumit indicator statistic (adica ce ^ncredere putem acorda valorii obtinute
experimental).

10.4.2 Etapele unui test


1. Formularea ipotezei (simpla sau compusa).
2. Colectarea de date statistice x1 x2 : : : xn referitoare la caracteristica
legata de ipoteza facuta.
3. Fixarea unui prag de semni catie sau prag de risc care e ^n general mic,
cuprins ^ntre 0 01 si 0 09. Cel mai des se alege 0 05. Complementarul
acestuia 1 ; se numeste prag de ^ncredere.
4. Alegerea unei functii de selectie (statistica), dintr-o lista de astfel de
statistici uzuale. Ea trebuie sa ^ndeplineasca c^teva conditii.
a
5. Extragerea dintr-un tabel asociat testului a unei valori (abscise, cvantile),
cu rol de granita, care separa zona de acceptare a ipotezei, de zona de
respingere numita si zona critica.
6. Calcularea valorii functiei de selectie, alese, prin ^nlocuirea datelor de
selectie si luarea deciziei dupa regula:
209

a) daca valoarea calculata se situeaza^n zona critica, respingem ipoteza


facuta
b) daca valoarea calculata cade ^n zona de acceptare, admitem ipoteza.

Observatii asupra etapelor:

1. Ipotezele statistice pot : parametrice, de concordanta sau de


semni catie si ele dau si natura testului.
Dupa alt criteriu putem avea ipoteze: simple sau compuse.
O ipoteza compusa este formata din:
{ ipoteza principala, sau ipoteza nula, notata de obicei cu H0 de unde i se
trage si numele
{ ipoteze secundare, sau alternative sau admisibile, notate cu H1 H2 : : :.
Ipoteza simpla este formata doar din ipoteza nula H0 .
Sa presupunem ^n continuare ca avem un test cu ipoteza compusa din
doua ipoteze: cea principala H0 si una secundara (alternativa) H . ^n functie
I
de forma ipotezei secundare putem avea trei feluri de teste:
a) test simetric sau bilateral: de exemplu ne referim la un parametru m.

H0 : m = m0
H1 : m 6= m1
aici ipoteza secundara este exprimata cu o relatie simetrica.
b) test unilateral st^nga:
a

c) test unilateral dreapta:

H0 : m = m0
H1 : m < m2
H0 : m = m0
H1 : m > m3
210

La ultimele doua tipuri de teste a doua ipoteza se exprima cu ajutorul


unei inegalitati ce creeaza un interval, e pe st^nga, e pe dreapta unei cona
stante care xeaza numele testului.
^n functie de natura ipotezei si legea de probabilitate de care se leaga
I
vom alege functia de selectie de la punctul 4, cum vom vedea ^n exemplele ce
vor urma.
2. Pentru veri carea ipotezei vom avea nevoie de date referitoare la
ipoteza facuta pe care le obtinem prin cercetarea selectiei realizate. Acestea
vor introduse ^n formula ce exprima functia de selectie aleasa.
3. Se alege un prag de risc sau prag de semni catie ^n functie de
precizia cu care dorim sa veri cam ipoteza. Acest prag este ^n general mic
2 (0 01 0 09), dar poate uneori si mai mic. Diferenta p^na la 1 se numeste
a
prag de ^ncredere sau de acceptare a ipotezei.
Pragul de risc reprezinta de fapt probabilitatea de a gresi ^n concluzia
pe care o tragem. Se concep doua feluri de erori:
{ Eroare de tipul I: respingerea unei ipoteze adevarate sau
{ Eroare de tipul II: acceptarea unei ipoteze false.
4. Alegerea functiei de selectie: Functia de selectie este o variabila
aleatoare sau variabila statistica care depinde de X1 X2 : : : Xn numita si variabila de selectie. Aceasta functie de selectie (numita des si statistica) urmeaza
o anumita lege de probabilitate cunoscuta sau care se poate a a, care trebuie
sa e independenta de ipoteza facuta, de exemplu, daca ipoteza se refera la un
parametru atunci aceasta lege nu trebuie sa depinda de parametrul respectiv.
Legea de probabilitate pe care o urmeaza functia de selectie aleasa da
numele testului: Z sau normal, Student, 2 , etc., precum si tabelul cu care
lucram, adica din care extragem cvantila de granita, dintre zona critica si cea
de acceptare.
Acest tabel, de fapt, contine valorile functiei de repartitie atasate legii
211

de probabilitate urmate de statistica aleasa.


Functia de selectie se alege dintr-o lista construita ^n timp, ^n functie de
ipoteza facuta. Pentru o aceiasi ipoteza putem alege c^teva functii de selectie
a
unele mai bune, mai precise care dau valoare mai mare testului, dar av^nd si
a
dezavantaje. Se poate introduce si un criteriu de optim ^n aceasta alegere.
5. ^n functie de pragul de semni catie si uneori si de volumul selectiei
I
n extragem din tabelul cu valorile functiei de repartitie atasata statisticii date
o cvantila (abscisa), uneori doua, care formeaza granita dintre doua regiuni:
{ regiunea critica sau regiunea de respingere a ipotezei si
{ regiunea de acceptare a ipotezei.
Regiunea critica poate situata uneori numai pe o parte a celei de
acceptare, alteori este formata din doua parti, situate de o parte si alta a celei
de acceptare, simetric sau nu. Modul de construire a regiunii critice, ^ntinderea
ei, pozitia ei fata de cea de acceptare, va ilustrata pe c^teva exemple clasice,
a
ce vor prezentate ^n continuare.

10.4.3 Exemple de teste uzuale


Numele testului este dat de legea de probabilitate pe care o urmeaza
statistica aleasa. Vom ^nt^lni asadar, ^n mai multe cazuri la mai multe tipuri
a
de ipoteze, chiar foarte diferite ca enunt, acelasi tip de test.
Exista deci mai multe cazuri ^n care se foloseste testul 2 , testul Student,
testul normal sau Z , Fisher{Snedecor etc.
^n continuare vom trece ^n revista c^teva tipuri de teste mai des ^nt^lnite
I
a
a
^ncerc^nd sa acoperim toate variantele clasi carilor.
a

Exemplu de test de tip Z .

Fie caracteristica X care urmeaza legea normala N (m ) unde m 2 R


este necunoscut, iar > 0 este cunoscut.
212

Ipoteza se face asupra parametrului m si are forma


H0 : m = m0 ipoteza nula (principala)
H1 : m 6= m1 ipoteza alternativa secundara.
Datorita formei ipotezei constatam ca avem un test parametric si simetric (bilateral). Se alege un prag de semni catie 2 (0 1) si se procura datele
de selectie x1 x2 : : : xn ca valori ale variabilelor de selectie X1 X2 : : : Xn .
Vom alege statistica
;
Z = Xp m
n

care urmeaza legea N (0 1), adica ^ndeplineste conditia de baza, de a urma o


lege ce nu depinde de parametrul din ipoteza. Zona critica va simetrica fata
de cea de acceptare (aici z 2 = ;z1; 2 ).

Fig.35
ales putem determina intervalul de acceptare a ipotezei
1; 2 z1; 2 cu ajutorul functiei lui Laplace, ce serveste pentru exprimarea
functiei de repartitie la legea normala normata N (0 1). Avem

;;z

Pentru

P ;z1; 2 z1; 2 =
sau

;z

;;z

1; 2

;z

1; 2

1; 2

= 1;
2

213

=2

z1 ; 2 = 1 ;

Din tabelul functiei lui Laplace obtinem cvantila (abscisa) z1; 2 care
separa cele doua regiuni: de acceptare si de respingere a ipotezei.
Introducem valorile numerice x1 x2 : : : xn obtinute prin observare ^n
expresia functiei de selectie Z si vom avea valoarea calculata.
Concluzie:
a) Daca jZ j < z1; 2 atunci valoarea calculata se situeaza ^n zona de acceptare si admitem ipoteza nula H0 .
b) Daca jZ j z1; 2 respingem ipoteza H0 .

Observatie. ^n exemplul de mai sus ipoteza alternativa H1 este simetrica


I
m = m1 caz ^n care testul se numeste bilateral. Daca ipoteza ar fost de
6

tipul H : m < m2 s-ar obtinut un test de tipul unilateral st^nga, respectiv


a
pentru ipoteza alternativa H1 : m > m3 se obtine un test unilateral dreapta. ^n
I
aceste cazuri zona critica are alt aspect. De exemplu, pentru testul Z unilateral
dreapta, zona critica este ^n ^ntregime la dreapta abscisei (cvantilei) z1; , iar
zona de acceptare este (;1 z1; ). Cvantila z1; se gaseste tot cu functia lui
Laplace din expresia
(z1; ) = 1 ;
2

Fig.36
214

Analog se procedeaza pentru testul unilateral st^nga.


a

Exemplu de test de tip Student

Fie o caracteristica X care urmeaza legea normala N (m ) cu parametrii


p
m = M (X ) si > 0, = D2 (x) necunoscuti. Relativ la parametrul m se
face o ipoteza de forma:
H0 : m = m0 (ipoteza nula)
H1 : m 6= m1 (ipoteza alternativa).
Rezolvare. Avem un test parametric bilateral.
1. Se alege o functie de selectie potrivita cu aceasta ipoteza (atentie ^n
acest caz este si el necunoscut).
Vom alege

T = X ;m = v
p

u
u
t

n
X
i=1

Xi ; m
n
X

n(n ; 1) i=1 (Xi ; X )

Se stie ca aceasta variabila statistica T urmeaza legea Student si ^n


consecinta testul se va numi "de tip Student" si vom utiliza tabela cu valorile
functiei de repartitie asociata repartitiei Student, adica

; +1
; m2;
F (t m) = p
m ; m
2

Zt

;1

2
1+ x
m

+1
; m2

dt

t2R

care are m grade de libertate.


2. Se xeaza pragul de semni catie (de risc) = 0 05.
3. Se efectueaza un sondaj si se retin datele experimentale x1 x2 : : : xn .
De aici rezulta ca vom avea l = n ; 1 grade de libertate.
4. Din tabelul asociat functiei de repartitie de tip Student vom obtine
cvantila tn;1 1; 2 care separa zona de acceptare de cea de respingere a ipotezei.
^n acest caz testul ind simetric, zona critica (de respingere) este simetrica de-o
I
parte si de alta a zonei de acceptare.
215

Fig.37
Sa presupunem ca n = 25, rezulta l = n ; 1 = 24 si = 0 05. Din
tabelul Student (vezi anexa) citim t24 0 975 = 2 064 pentru ca 1 ; 2 = 0 975.
Asadar zona de acceptare este (;2 064 2 064) si de respingere
(;1 ;2 064) (2 064 +1).
5. Introducem datele de selectie^n functia de selectie si sa presupunem ca
am obtinut Tc = 1 789, care apartine intervalului de acceptare. ^n consecinta
I
acceptam ipoteza nula facuta.
Observatie. Si ^n cazul testului Student pentru alta forma a ipotezei am
putut avea test asimetric
a) si anume

H0 : m = m0
H1 : m < m1 unde m1 < m0

9
=

test unilateral st^nga


a

^n acest caz zona critica este ^n ^ntregime ^n partea st^nga.


I
a

216

Fig.38
b) ^n cazul ipotezei

H0 : m = m0
H1 : m > m2 m2 > m0

9
=

test unilateral dreapta

zona critica se a a ^n ^ntregime ^n partea dreapta.

Fig.39

Reamintim ca o cvantila de tipul tn;1 arata ca p^na la abscisa


a
respectiva s-a acumulat sub gra cul densitatii de probabilitate o arie egala cu
.
Daca numarul gradelor de libertate tinde la in nit, ^n baza unei teoreme
217

limitata centrala rezulta ca legea Student converge ^n repartitie catre legea


normala normata N (0 1). Prin urmare, daca volumul n al selectiei este mare
(n > 30) se poate utiliza testul Z pentru veri carea ipotezei enuntate mai sus,
situatie ^n care am utilizat statistica T .

Exemplu de test

pentru dispersie

Fie caracteristica X ce urmeaza legea normala N (m ), unde m 2 R,


p
m = M (X ) si = D2 (x) sunt necunoscute. ^n acest caz vom face o ipoteza
I
asupra dispersiei teoretice:
2
H0 : 2 = 0 ipoteza nula
2
H1 : 2 6= 1 ipoteza alternativa.
Rezolvare.
1. Se face o selectie repetata obtin^nd datele de selectie x1 x2 : : : xn ,
a
care corespund variabilelor statistice X1 X2 : : : Xn , pe care le ^nt^lnim ^n
a
functie de selectie (statistica).
2. Se alege o statistica de forma:

H2 =

(n ; 1)
2

n
1 X(X ; X )2
= 2
i
i=1

si se poate arata ca urmeaza legea 2 cu n ; 1 grade de libertate. De aici deriva


si numele testului.
3. Se alege un prag de semni catie (de risc) .
4. Se consulta tabelul asociat legii 2 de unde trebuie sa extragem doua
cvantile care delimiteaza zona de acceptare, pentru ca testul ind bilateral vom
avea doua zone critice de o parte si cealalta a zonei de acceptare. ^n acest caz
I
cvantilele nu sunt simetrice si trebuie extrase independent din tabel.

218

Fig.40

P h2 ;1 2 < H 2 < h2 ;1 1; 2 = 1 ;
n
n
Concret sa presupunem ca am ales = 0 05 atunci 2 = 0 025 si 1 ; 2 =
0 975, pentru n = 25, rezulta l = n ; 1 = 24 grade de libertate. Din tabelul
functiei de repartitie asociata repartitiei 2 (vezi anexa) citim

h2 0 025 = 12 4 si h2 0 975 = 39 4
24
24
rezulta ca zona de acceptare este (12 4 39 4), iar cea de respingere R ; Zac =
(;1 12 4) (39 4 +1).
Urmeaza calcularea expresiei H 2 prin introducerea valorilor selectate xi
^n locul variabilelor Xi . Daca H 2 calculat apartine zonei de acceptare validam
ipoteza H0 altfel o respingem.
a
Observatii. Si ^n cazul acestui test putem avea test unilateral st^nga, respectiv
dreapta, c^nd zona critica este doar pe st^nga, respectiv pe dreapta, zonei de
a
a
acceptare. ^n aceste cazuri avem doar o singura cvantila de separare a zonelor,
I
mai precis hn;1 ^n cazul "pe st^nga", respectiv hn;1 1; ^n cazul "pe dreapta".
a
Pentru exemplul numeric ales mai sus, cu l = 25 ; 1 = 24 si = 0 05
a) Cazul "pe st^nga" hn;1 = h24 0 05 = 13 8
a

8
< (;1 13 8) zona critica
: (13 8 +1) zona de acceptare
219

b) Cazul "pe dreapta" hn;1 1; = h24 0 95 = 36 41

8
< (;1 36 41) zona de acceptare
: (36 41 +1) zona critica

Testele care lucreaza cu ipoteze asupra parametrilor legii normale m si


se ^nt^lnesc cel mai ales ^n practica. Ele sunt teste parametrice.
a

Testul de concordanta

a lui Pearson

Fie X o caracteristica care are functia de repartitie teoretica F (x 1 2 )


unde 1 si 2 sunt necunoscuti.
Sa presupunem ca am obtinut datele de selectie x1 x2 : : : xN pe care le
grupam ^n n clase ai ai+1 ] cu mijloacele xi , adica avem distributia statistica
(experimentala) a lui X

0
1
a1 a2 ] : : : ai ai+1 ] : : : ar ar+1 ] A
X@
n1

sau

ni

nr

r
X
i=1

nr = N

volumul selectiei

0
1
x1 : : : xi : : : xr A
X@
xi = ai +2ai+1
n1

ni

nr

Folosind datele de selectie si metoda verosimilitatii maxime (de exem0


0
plu) pentru parametrii 1 si 2 vom gasi estimatiile corespunzatoare 1 si 2 .
Se pot folosi si alte metode de estimare a acestor parametri. ^n continI
uare vom face ipoteza statistica pentru caracteristica X

H0 : F = F0 (x

0 0
1 2)

adica: functia de probabilitate (de repartitie) teoretica relativ la caracteristica


0 0
0
0
X este F0 (x 1 2 ) obtinuta prin utilizarea parametrilor 1 si 2 determinati
de noi.
Pentru clasa i, data de intervalul ai ai+1 ], cu mijlocul xi vom determina
probabilitatea ca variabila X sa ia valori cuprinse ^ntre ai si ai+1

p0 = P (ai X < ai+1 ) = F (ai+1 ) ; F (ai )


i
220

F ind acum determinata cu aproximatie prin utilizarea parametrilor

0
1

si

0
2

estimati.
Aceste probabilitati p0 calculate care estimeaza probabilitatile teoretic
i
pi pot veri cate cu ajutorul frecventelor ni obtinute experimental.
Se utilizeaza functia de selectie
r
r
02
02
2 = X (ni ; Npi ) = X (ni ; ni )
H
i=1

Np0
i

i=1

n0
i

unde n0 = N p0 sunt frecvente absolute "teoretice" obtinute ^n urma estimarii.


i
i
Variabila aleatoare corespunzatoare H 2 urmeaza legea de probabilitate
2 cu l = r ; 2 ; 1 = r ; 3 grade de libertate. Aici 2 este numarul parametrilor,
iar r este numarul de grupe. Daca alegem ca probabilitate de risc, se obtine
intervalul de ^ncredere (0 h2 1; ). h2 1; este abscisa ce desparte cele doua
l
l
intervale, de ^ncredere si de risc si care se obtine din tabelul 2 cu valorile
functiei de repartitie pentru l = r ; 3 grade de libertate si ales. Zona critica
se a a ^n ^ntregime la dreapta acestei cvantile h2 1; . Daca valoarea calculata
l
H 2 din relatia de mai sus este mai mica dec^t cvantila h2 1; , admitem ipoteza,
a
l
0 0 ) gasita experimental este semnisi anume ca functia de repartitie F (x 1 2
cativ apropiata de cea teoretica pentru ca valorile lor sunt concordante.

Testul F (de tip Snedecor{Fisher)

Fie doua populatii independenteP1 si P2 la care urmarim aceeasi caracteristica. De exemplu, pot doua selectii din aceiasi populatie P , realizate
independent.
Vom nota cu X 0 caracteristica cercetata din populatia P1 si presupunem
ca urmeaza legea normala N (m1 1 ) si cu X 00 caracteristica similara de la
populatia P2 , care urmeaza legea normala cu N (m2 2 ). Ne intereseaza
legatura dintre dispersiile celor doua legi normale. Vom face ipoteza:
2
2
2
H0 : 1 = 2 ipoteza principala asupra dispersiilor teoretice 1 si
2
2 ale celor doua legi.
2
2
H1 : 1 6= 2 ipoteza alternativa.
221

Se fac doua selectii repetate de volum N1 si N2 din cele doua


populatii obtin^nd datele de selectie x01 x02 : : : x0N1 si x00 x00 : : : x00 2 , unde
a
1 2
N
0
0
0
00
00
00
X1 X2 : : : XN1 si X1 X2 : : : XN2 sunt variabilele statistice corespunzatoare.
Pentru dispersiile statistice vom folosi notatiile
N1
X 0
= N 1; 1 (X1 ; X 0 )2
1
i=1
Vom utiliza statistica
F=
2
1

2=
2
2
1
2
1

N
X
2

00 2
00
N2 ; 1 i=1 (X2 ; X )

2
2
2
2

Se arata ca aceasta statistica urmeaza legea Snedecor{Fisher cu respectiv


m = N1 ; 1 si n = N2 ; 1 grade de libertate.
Functia de repartitie corespunzatoare este:

F (x m n) = m
n

m
2

; + x
; m2 k Z m ;1
;m ; ;n t 2 1 + mt
n
; 2
2
0

+
; m2 n

dt

Pentru un nivel de semni catie ales vom determina doua cvantile


fm n 2 si fm n 1; 2 care determina intervalul de acceptare adica

P fm n 2 < F < fm n 1; 2 = 1 ;
Zona critica (intervalul de respingere a ipotezei) se a a de o parte si de
alta a intervalului de acceptare. Cele doua cvantile se determina din tabelul cu
valorile functiei de repartitie Snedecor{Fisher (vezi anexa) din relatiile:

F fm n 2 = 2 si F fm n 1; 2 = 1 ; 2
Pentru ca are loc relatia:

fm n = f 1
n m 1;
se poate ca unele tabele se construiesc doar pentru valori mari ale lui
(0 95 0 975 0 99 etc:).
222

Urmeaza compararea valorii calculate a lui F cu limitele intervalului de


acceptare, pentru luarea deciziei asupra ipotezei facute.
Testul F de tip Fisher{Snedecor se poate aplica, de exemplu, ca test de
semni catie ^n cazul ^n care dorim sa veri cam daca raportul de corelatie dat
de relatia
s
2
y
2

unde 2 este dispersia dintre grupe si 2 este dispersia totala, calculat pe un


y
esantion este semni cativ.
Acest indicator este semni cativ daca intensitatea legaturii la nivelul
^ntregii populatii este aceeasi sau aproximativ aceeasi cu cea calculata pentru
esantion.
Se emite, de exemplu, o ipoteza
H0 : este nesemni cativ si
H1 : este semni cativ.
Se construieste functia de selectie
2
F = s1
s2
2

unde s2 este estimatia dispersiei ^ntre grupe ^n populatia totala la l1 = m ;


1
1 grade de libertate si s2 este estimatia dispersiei ^n interiorul grupelor ^n
2
populatia totala la l2 = n ; m grade de libertate.
Avem ca
2
2
s2 = n y=x1 si s2 = m ; n
1
2
;
atunci

2
;n 2
F = s1 = m ; 1 1 ;
2
s2 n

Valoarea calculata ^n functie de datele de selectie se compara cu valoarea


tabelara corespunzatoare gradelor de libertate l1 si l2 si gradul de risc ales
(semni catie).
Avem variantele
223

a) Daca Fcalculat < Ftabelar { ipoteza nula se respinge, deci este semni cativ pentru intensitatea legaturii dintre cele doua variabile X si Y , adica
rezultatul se poate extinde la ^ntreaga populatie. ^n acest caz zona critica
I
se a a la st^nga cvantilei obtinute din tabel
a
b) Daca Fcalculat > Ftabelar { ipoteza nula H0 se admite ^n forma formulata,
adica nu este semni cativ pentru legatura dintre cele doua variabile si
indicatorul nu poate extins la nivelul ^ntregii populatii.

10.4.4 Probleme rezolvate


1. Investitiile realizate de 40 de agenti economici ^n anul curent sunt
trecute ^n tabelul de mai jos (^n mil.lei)
Investitii
220 260 300 340 400
Numar agenti 4
6 12 10 8
Sa se veri ce, cu un nivel de semni catie = 0 01 daca media
investitiilor pentru un agent este de 320 mil.lei, stiind ca abaterea standard
= 60 mil.lei.
Raspuns. Abaterea standard ind cunoscuta si volumul selectiei ind 40 > 30
se recomanda folosirea testului Z pentru veri carea ipotezei nule.

H0 : m = M (X ) = 320:
Statistica utilizata este:

;
;
Z = X p m = X p3 320
n

z1; 2

40

Ea urmeaza legea normala normata.


La = 0 01 din tabelul functiei lui Laplace se determina cvantila
= z0 995 astfel ^nc^t (z0 995 ) = 1; = 0 495.
a
2
224

Se gaseste z0 995 = 2 58.


Avem succesiv

1
X=N

r
X
i=1

xi ni =

1
= 40 (220 4 + 260 6 + 300 12 + 340 10 + 400 8) = 316

Z = X ; m = 316 ; 320 = ;4

40
60 = ;0 421
n
40
Deoarece Z = ;0 421 2 (;2 58 2 58) se accepta ipoteza enuntata si
anume ca media investitiilor pe agent poate luata 320 mil.lei.
2. Fiind monitorizat timp de 15 zile un muncitor a obtinut zilnic un
numar de piese dupa cum urmeaza: 300, 425, 450, 375, 420, 390, 460, 275, 385,
410, 325, 395, 415, 325, 380.
Sa se veri ce cu un nivel de semni catie de 0,05 ipoteza care a rma ca
media zilnica este de 400 de piese, indicator necesar pentru xarea normei.
Rezolvare. Se considera ca variabila care da numarul zilnic de piese urmeaza
legea normala N (m ) cu m si necunoscuti. ^n acest caz ipoteza nula este:
I
p

60
p

H0 : m = 400 piese
Deoarece abaterea standard
selectie

nu este cunoscuta vom alege functia de

;
T = Xp m
n

care urmeaza legea Student.


Avem deci un test Student.
Numarul gradelor de libertate l = n ; 1, unde n este numarul de
observatii culese. Din tabelul Student (vezi anexa) se determina cvantila, corespunzatoare numarului de grade de libertate l = 14 si pragul de semni catie
ales = 0 05.
Vom avea
tn;1 1; 2 = t14 0 975 = 2 145
225

Testul ind simetric (bilateral) intervalul de acceptare va si el simetric


fata de origine, adica (;2 145 2 145).
Pentru calcularea statisticii T vom avea succesiv:
n
1X
1
X = n xk = 15 5730 = 382
k=1

v
u
u
=t

n
X

2
n ; 1 k=1(xk ; X ) = 54

;
T = 382p 400 = ;1854 15 = ;1 29
54
15
Deoarece T = ;1 29 2 (;2 145 2 145) rezulta ca ipoteza nula poate acceptata si anume ca media zilnica de 400 piese este corecta si poate acceptata
ca norma standard pentru toti muncitorii care executa aceeasi piesa.
3. Urmarind functionarea unei masini automate timp de 1000 zile s-a
notat numarul de rateuri din ecare zi si s-a obtinut urmatorul tabel
(Monjallon)
Numar de
rateuri pe zi

Numar
de zile

229

325

257

119

50

17

xi

ni

a) Folosind aceste date experimentale sa se gaseasca o aproximatie a valorii


medii de rateuri
b) Se face ipoteza ca legea urmata de respectivul automat ar legea evenimentelor rare a lui Poisson adica probabilitatea de a se realiza k rateuri
^ntr-o zi este data de relatia.
k

P (X = k) = k! e;
Rezolvare.

226

unde M (X ) =

a) Vom calcula media statistica cu relatia

8
8
1 X n x = 1 X n x = 1500 = 1 5
X=N
i i 1000
i i 1000

i=1

i=1

b) Deoarece stim ca parametrul legii teoretice a lui Poisson este chiar


valoarea medie teoretica si de asemenea ca X este o functie de estimatie
absolut corecta pentru M (X ) putem aproxima
= 1 5:
Folosind aceasta valoare putem calcula valorile teoretice aproximative ale probabilitatilor ca automatul sa dea 0 1 2 3 : : : rateuri, prin
utilizarea relatiei date de legea evenimentelor rare de mai sus.
De exemplu pentru k = 0 avem p0 = e;1 5 = 0 2231. De aici rezulta ca
frecventa absoluta calculata teoretic este

n0 = N p0 = 1000 0 2231 = 223 1


e
calcul^nd ^n mod asemanator si celelalte frecvente teoretice ni obtinem tabelul
a
Numar de
rateuri

Frecvente
teoretice
calculate ni
e

223,1

334,7

251

125,5

47,1

14,1

3,5

0,8

0,2

xi

Ipoteza facuta se transcrie prin faptul ca frecventele teoretice ni sunt


aproximate de cele experimentale ni .
e
Vom utiliza testul de concordanta a lui Pearson. E vorba de veri carea
concordantei dintre seria obtinuta experimental si cea obtinuta teoretic ca urmare a ipotezei facute mai sus.
a) Vom utiliza functia de selectie

h2 =

r
X ni ; Np0
i
i=0

Np0
i

227

r
X ni ; ni
e
ni
e
i=0

Aceasta functie de selectie urmeaza legea

2.

b) Alegem pragul de semni catie = 0 05.


c) Pentru calcularea valorii statistice h2 vom organiza calculele ^n urmatorul
tabel:
e 2
i n ; n n ; n 2 (ni ; ni )
e
e
i

0
1
2
3
4
5

5,9
-9,7
6
6,5
2,9
1,4

ni
e

34,81
0,156
44,09
0,281
36
0,143
42,25
0,337
8,41
0,179
1,96
0,105
Total h2 = 1 201

d) Pentru citirea valorii din tabelul lui 2 calculam numarul gradelor de


libertate:
l = r ; 1 ; 1 = r ; 2 = 6 ; 2 = 4:
La pragul de semni catie = 0 05 si 4 grade de libertate din
tabelul 2 gasim h2 0 05 = 9 48.
4
Observatie. Initial am avut 9 clase, dar ultimele trei frecvente prea mici
se grupeaza la pozitia 5, rezult^nd doar 6 clase. Numarul parametrilor este
a
unu. De aici rezulta regula de mai sus a calcularii gradelor de libertate.
e) Concluzie. Valoarea calculata h2 = 1 201 < 9 48 rezulta ca h2 cade ^n
zona de acceptare, astfel ca putem a rma cu o probabilitate de 95% ca
seria experimentala urmeaza o lege de tip Poisson cu parametrul = 1 5.
Aceasta a rmatie ne permite ^n continuare sa utilizam aceasta lege si
pentru alte calcule utiliz^nd ^ntregul aparat matematic cunoscut.
a

228

4. O masina produce o piesa circulara. Piesa se considera buna daca diametrul sau este cuprins ^ntre 249,9 si 250,1 mm. Care este probabilitatea producerii unui rebut de catre masina respectiva ^n ipoteza ca repartitia obtinerii
pieselor urmeaza legea normala a lui Gauss cu media m = 250,02 mm si
abaterea standard 0,05 mm.
Raspuns. Pentru ^nceput vom calcula probabilitatea obtinerii unei piese bune.
^n conditiile enuntate putem scrie:
I
250
250
P (249 9 < d < 250 1) = 250 10;05 02 ; 249 90;05 02 =
= (1 6) ; (;2 4) = (1 6) + (2 4) = 0 4452 + 0 4918 = 0 937
unde ( ) este functia lui Laplace (vezi anexa). ^n concluzie probabilitatea
I
obtinerii unui rebut este

P (r) = 1 ; 0 937 = 0 063


Acest lucru se poate interpreta ca la 1000 de piese produse de aceasta
masina circa 63 vor rebuturi.

Probleme propuse
1. Probabilitatea ca o ola de vaccin sa produca ^mbolnavirea este de
0,008. ^ntre ce limite variaza numarul de ^mbonaviri, cu probabiltiatea de 95%,
I
daca se administreaza 100.000 de doze.
2. Se efectueaza de 10.000 ori o operatie nanciara si de 8.050 de ori s-a
realizat un bene ciu, ^n rest pierdere. Cu un prag de ^ncredere = 0 05 este
plauzibila ipoteza ca probabilitatea obtinerii unui bene ciu la tipul respectiv
de operatie nanciara este de 80%?
Indicatie. valoarea teoretica a frecventei absolute de obtinere a bene ciului
este m = n p = 10000 80% = 8000.
Abaterea standard la schema de tip Bernouli este

= pnpq = 10000 0 8 0 2 = 1600 = 40


229

Avem

8050 ; 8000 < x = 1 ; = 1 ; 0 05 = 0 95


40
P (1 25 < x) = 0 95

Din tabelul lui Laplace avem 2 (x) = 0 96 =) x = 1 96. Av^nd


a
evident 1 25 < 1 96 rezulta ca putem accepta ipoteza facuta.
3. O rma de asigurari a stabilit pentru sase categorii de activitati,
probabiltiatea de accidentare. ^n tabelul de mai jos sunt date activitatile,
I
probabilitatile teoretice de accidentare, numarul de efectuari a acestor activitati
si accidentele efective ^nregistrate.
Tipul
activitatii

Prababiltiatea
teoretica
de accidentare

Numar de
efectuari ale
activitatii

Numar de
accidente
efective

Numar de
accidente
teoretice

A1
A2
A3
A4
A5
A6

0,079
0,083
0,081
0,0123
0,0161
0,02

3118
2933
2822
2671
2446
2261

242
250
230
36
39
47

246

ne

nt

Se poate admite ipoteza ca accidentarea efectiva nu difera semni cativ


de accidentarea teoretica la un prag de 0,05?
Indicatie. Pe baza probabilitatilor teoretice se poate calcula numarul teoretic
de accidente la ecare din activitati, dupa relatia:

nt = N p = 3118 0 079 = 246


Se aplica apoi testul de concordanta a lui Pearson pentru compararea
frecventelor teoretice cu cele statistice.
Observatie. Daca raspunsul este a rmativ rezulta ca rma de asigurari poate
calcula prime de asigurare avantajoase pentru ambele parti { rma si asigurati
si poate face fata concurentei. Primele de asigurare se calculeaza ^n functie de
probabilitatea de accidentare.
230

Anexe
Tabelul lui Grubbs

P
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

0,90

0,95

0,975

0,99

0,1406 0,1412 0,1414 0,1414


1,645 1,698 1,710 1,723
1,791 1,869 1,917 1,955
1,894 1,996 2,067 2,130
1,974 2,093 2,182 2,265
2,041 2,172 2,273 2,374
2,097 2,237 2,349 2,464
2,164 2,294 2,414 2,540
2,190 2,343 2,470 2,606
2,229 2,387 2,519 2,663
2,264 2,426 2,562 2,714
2,297 2,431 2,602 2,759
2,326 2,493 2,638 2,800
2,354 2,523 2,670 2,837
2,380 2,551 2,701 2,871
2,404 2,577 2,728 2,903
2,426 2,600 2,754 2,932
2,447 2,623 2,778 2,959
2,467 2,644 2,801 2,984
2,486 2,664 2,823 3,008
231

Functia lui Laplace (x) = p1


2
x
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
3.6

0
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4772
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4986
0.4990
0.4993
0.4995
0.4997
0.4998
0.4998

1
0040
0438
0832
1217
1591
1950
2291
2611
2910
3186
3437
3665
3869
4049
4207
4345
4463
4564
4649
4719
4778
4826
4864
4896
4920
4931
4955
4966
4075
4982
4987
4991
4993
4995
4997
4998
4998

2
0080
0478
0871
1255
1628
1985
2324
2642
2939
3212
3461
3686
3888
4066
4222
4357
4474
4573
4656
4726
4783
4830
4868
4898
4922
4941
4956
4967
4976
4982
4987
4991
4994
4996
4997
4998
4999

3
0120
0517
0910
1293
1664
2019
2357
2673
2967
3238
3485
3708
3907
4082
4236
4370
4484
4582
4664
4732
4788
4834
4871
4901
4925
4943
4957
4968
4977
4983
4988
4991
4994
4996
4997
4998
4999

Zx
0

e; t2 dt

Sutimi ale lui x


4
5
1060 0199
0557 0596
0948 0987
1331 1368
1700 1736
2054 2088
2389 2422
2703 2734
2995 3023
3264 3289
3508 3531
3729 3749
3925 3944
4099 4115
4251 4265
4382 4394
4495 4505
4591 4599
4671 4678
4738 4744
4793 4793
4838 4842
4875 4878
4904 4906
4927 4929
4945 4946
4959 4960
4969 4970
4977 4978
4984 4986
4988 4989
4992 4992
4994 4994
4996 4996
4997 4997
4998 4998
4999 4999

232

6
0239
0636
1026
1406
1772
2123
2454
2764
3051
3315
3554
3770
3962
4131
4279
4406
4515
4608
4686
4750
4798
4846
4881
4909
4931
4948
4961
4971
4979
4985
4989
4992
4994
4996
4997
4998
4999

7
0279
0675
1064
1443
1808
2157
2486
2794
3078
3340
3577
3790
3980
4147
4292
4418
4525
4616
4693
4756
4803
4850
4884
4911
4932
4949
4962
4972
4980
4985
4989
4992
4995
4996
4997
4998
4999

8
0319
0714
1103
1480
1844
2190
2517
2823
3106
3365
3599
3810
3997
4162
4306
4429
4535
4625
4699
4761
4808
4854
4887
4913
4934
4951
4963
4973
4980
4986
4990
4993
4995
4996
4998
4998
4999

9
0359
0753
1141
1517
1879
2224
2549
2852
3137
3389
3621
3830
4015
4177
4319
4441
4545
4633
4706
4767
4817
4857
4890
4916
4936
4952
4964
4974
4981
4986
4990
4993
4995
4996
4998
4998
4999

Functia lui Kolmogorov K ( ) =


0.34
0.35
0.36
0.37
0.38
0.39
0.40
0.41
0.42
0.43
0.44
0.45
0.46
0.47
0.48
0.49
0.50
0.51
0.52
0.53
0.54
0.55
0.56
0.57
0.58
0.59
0.60
0.61
0.62
0.63
0.64
0.65
0.66
0.67
0.68
0.69
0.70

K( )

0.0001
0.0003
0.0005
0.0008
0.0012
0.0019
0.0028
0.0039
0.0054
0.0073
0.0097
0.0125
0.0160
0.0200
0.0246
0.0300
0.0360
0.0428
0.0503
0.0585
0.0674
0.0771
0.0875
0.0986
0.1103
0.1227
0.1357
0.1492
0.1632
0.1777
0.1926
0.2079
0.2236
0.2395
0.2557
0.2721
0.2887

0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.78
0.79
0.80
0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90
0.91
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1.00
1.01
1.02
1.03
1.04
1.05
1.06
1.07

K( )

0.3054
0.3222
0.3391
0.3559
0.3728
0.3896
0.4063
0.4230
0.4395
0.4558
0.4720
0.4880
0.5038
0.5193
0.5346
0.5497
0.5645
0.5790
0.5933
0.6072
0.6209
0.6312
0.6473
0.6600
0.6725
0.6846
0.6964
0.7079
0.7191
0.7300
0.7405
0.7508
0.7607
0.7704
0.7797
0.7888
0.7976

1
X

k=;1
1.08
1.09
1.10
1.11
1.12
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20
1.21
1.22
1.23
1.24
1.25
1.26
1.27
1.28
1.29
1.30
1.31
1.32
1.33
1.34
1.35
1.36
1.37
1.38
1.39
1.40
1.41
1.42
1.43
1.44

233

(;1)k e;2k
K( )

0.8061
0.8143
0.8222
0.8299
0.8373
0.8445
0.8513
0.8580
0.8644
0.8706
0.8765
0.8822
0.8877
0.8930
0.8981
0.9029
0.9076
0.9121
0.9164
0.9205
0.9245
0.9282
0.9319
0.9353
0.9386
0.9418
0.9448
0.9477
0.9505
0.9531
0.9556
0.9580
0.9603
0.9624
0.9645
0.9665
0.9683

2 2

1.45
1.46
1.47
1.48
1.49
1.50
1.51
1.52
1.53
1.54
1.55
1.56
1.57
1.58
1.59
1.60
1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.80
1.81

K( )

0.9701
0.9718
0.9734
0.9749
0.9764
0.9777
0.9790
0.9803
0.9814
0.9825
0.9836
0.9846
0.9855
0.9864
0.9872
0.9880
0.9887
0.9801
0.9901
0.9907
0.9913
0.9919
0.9924
0.9929
0.9933
0.9938
0.9942
0.9946
0.9949
0.9953
0.9956
0.9959
0.9962
0.9964
0.9967
0.9969
0.9971

Legea lui Student

; +1
; m2;
= Fm (t ) = p
m ; m
2

mn

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
80
120
n > 120

0.75
1.000
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.691
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.681
0.681
0.679
0.677
0.674

0.90
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.306
1.303
1.291
1.289
1.282

Zt
;1

0.95
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.690
1.684
1.671
1.658
1.645

234

2
1+ x
m

0.975
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.030
2.021
2.000
1.980
1.960

+1
; m2

0.99
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.438
2.423
2.390
2.358
2.326

dx

0.995
63657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.724
2.704
2.660
2.617
2.576

Legea

= Fm (h2 ) = m 1; m
22; 2
mn

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
60

0.005
0.000
0.010
0.072
0.207
0.412
0.676
0.989
1.34
1.73
2.16
2.60
3.07
3.57
4.07
4.60
5.14
5.70
6.26
6.84
7.43
8.03
8.64
9.26
9.89
10.5
11.2
11.8
12.5
13.1
13.8
17.2
20.7
35.5

0.01
0.000
0.020
0.115
0.297
0.554
0.872
1.24
1.65
2.09
2.56
3.05
3.57
4.11
4.66
5.23
5.81
6.41
7.01
7.63
8.26
8.90
9.54
10.2
10.9
11.5
12.2
12.9
13.6
14.3
15.0
18.5
22.2
37.5

0.025
0.001
0.051
0.216
0.484
0.831
1.24
1.69
2.18
2.70
3.25
3.82
4.40
5.01
5.63
6.26
6.91
7.56
8.23
8.91
9.59
10.3
11.0
11.7
12.4
13.1
13.8
14.6
15.3
16.0
16.8
20.6
24.4
40.5

0.05
0.004
0.103
0.352
0.711
1.15
1.64
2.17
2.73
3.33
3.94
4.57
5.23
5.89
6.57
7.26
7.96
8.67
9.39
10.1
10.9
11.6
12.3
13.1
13.8
14.6
15.4
16.2
16.9
17.7
18.5
22.5
26.5
43.2

Zh

0.1
0.016
0.211
0.584
1.06
1.61
2.20
2.83
3.49
4.17
4.87
5.58
6.30
7.04
7.79
8.55
9.31
10.08
10.86
11.65
12.44
13.24
14.04
14.85
15.66
16.47
17.29
18.11
18.94
19.77
20.60
24.8
29.1
46.5

235

2
2
x m ;1 e; x dx

0.9
2.71
4.60
6.25
7.78
9.24
10.64
12.02
13.36
14.68
16.99
17.27
18.55
19.81
21.06
22.31
23.54
24.77
25.99
27.20
28.41
29.61
30.81
32.01
33.20
34.38
35.56
36.74
37.92
39.09
40.26
46.1
51.8
74.4

0.95
3.84
5.99
7.81
9.48
11.07
12.59
14.07
15.51
16.92
18.31
19.67
21.03
22.36
23.68
25.00
26.30
27.59
28.87
30.14
31.41
32.67
33.92
35.17
36.41
37.65
38.88
40.11
41.34
42.56
43.77
49.8
55.8
79.1

0.975
5.02
7.38
9.35
11.1
12.8
14.4
16.0
17.5
19.0
20.5
21.9
23.3
24.07
26.1
27.6
28.8
30.2
31.3
32.9
34.2
35.5
36.8
38.1
39.4
40.6
41.9
43.2
44.5
45.7
74.0
53.2
59.3
83.3

0.99
6.63
9.21
11.34
13.28
15.09
16.81
18.47
20.09
21.66
23.21
24.72
26.22
27.69
29.14
30.58
32.00
33.41
34.80
36.19
37.57
38.93
4.29
41.64
42.98
44.31
45.64
46.96
48.28
49.59
50.89
57.3
63.7
88.4

236

2
199:5
800
4999
19:00
39:0
99:00
9:55
16:0
30:84
6:94
10:6
18:00
5:79
8:43
13:27
5:14
7:26
10:91
4:74
6:54
9:55
4:46
6:06
8:65

3
216
864
5403
19:16
39:2
99:17
9:28
15:1
29:46
6:59
9:98
16:69
5:41
7:76
12:06
4:76
6:60
9:78
4:35
5:89
8:45
4:07
5:42
7:59

4
225
900
5625
19:25
39:2
99:25
9:12
15:4
28:71
6:39
9:60
15:98
5:19
7:39
11:39
4:53
6:23
9:15
4:12
5:52
7:85
3:84
5:05
7:01

5
230
922
5764
19:30
39:3
99:30
9:01
14:9
28:24
6:26
9:36
15:52
5:05
7:15
10:97
4:39
5:99
8:75
3:97
5:29
7:45
3:69
4:82
6:63

6
234
937
5859
19:33
39:3
99:33
8:94
14:7
27:91
6:16
9:20
15:21
4:95
6:98
10:67
4:28
5:82
8:47
3:87
5:12
7:19
3:58
4:65
6:37

7
237
948
5930
19:35
39:4
99:35
8:89
14:6
27:7
6:09
9:07
15:0
4:88
6:85
10:5
4:21
5:70
8:26
3:79
4:99
6:99
3:50
4:53
6:18

8
239
957
5981
19:37
39:4
99:36
8:85
14:5
27:49
6:04
8:98
14:80
4:82
6:76
10:27
4:15
5:60
8:10
3:73
4:90
6:84
3:44
4:43
6:03

; + f
; m2 n Z m ;1
;m ; ;n x 2 1 + mx
n
; 2
2
0

1
161:4
648
4052
18:51
38:5
98:49
10:13
17:4
34:12
17:71
12:2
21:20
6:61
10:0
16:26
5:99
8:81
13:74
5:59
8:07
12:2
5:32
7:57
11:26
m
2

0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99

= Fm n (f ) = m
n

nnm

Legea Snedecor{Fisher
+
; m2 n

dx

237
16

15

14

13

12

11

10

nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99

1
5:12
7:21
10:56
4:96
6:94
10:04
4:84
6:72
9:65
4:75
6:55
9:33
4:67
6:41
9:07
4:60
6:30
8:86
4:54
6:20
8:68
4:49
6:12
8:53

2
4:26
5:71
8:02
4:10
5:46
7:56
3:98
5:26
7:20
3:88
5:10
6:93
3:81
4:97
6:70
3:74
4:86
6:51
3:68
4:76
6:36
3:63
4:69
6:23

3
3:86
5:08
6:99
3:71
4:83
6:55
3:59
4:63
6:22
3:49
4:47
5:95
3:41
4:35
5:74
3:34
4:24
5:56
3:29
4:15
5:42
3:24
4:08
5:29

4
3:63
4:72
6:42
3:48
4:47
5:99
3:36
4:28
5:67
3:26
4:12
5:41
3:18
4:00
5:21
3:11
3:89
5:04
3:06
3:80
4:89
3:01
3:73
4:77

5
3:48
4:48
6:06
3:33
4:24
5:64
3:20
4:04
5:32
3:11
3:89
5:06
3:03
3:77
4:86
2:96
3:66
4:70
2:90
3:58
4:56
2:85
3:50
4:44

6
3:37
4:32
5:80
3:22
4:07
5:39
3:09
3:88
5:07
3:00
3:73
4:82
2:92
3:60
4:62
2:85
3:50
4:46
2:79
3:41
4:32
2:74
3:34
4:20

7
3:29
4:20
5:61
3:14
3:95
5:20
3:01
3:76
4:89
2:91
3:61
4:54
2:83
3:48
4:44
2:76
3:38
4:28
2:71
3:29
4:14
2:66
3:22
4:03

8
3:23
4:10
5:47
3:07
3:85
5:06
2:95
3:66
4:74
2:85
3:51
4:50
2:77
3:39
4:30
2:70
3:29
4:14
2:64
3:20
4:00
2:59
3:12
3:89

Legea Snedecor{Fisher (continuare)

238
24

23

22

21

20

19

18

17

nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99

1
4:45
6:04
8:40
4:41
5:98
8:29
4:38
5:92
8:18
4:35
5:87
8:10
4:32
5:83
8:02
4:30
5:79
7:95
4:28
5:75
7:88
4:26
5:72
7:82

2
3:59
4:62
6:11
3:55
4:56
7:01
3:52
4:51
5:93
3:49
4:46
5:85
3:47
4:42
5:78
3:44
4:38
5:72
3:42
4:35
5:66
3:40
4:32
5:61

3
3:20
4:01
5:18
3:16
3:95
5:09
3:13
3:90
5:01
3:10
3:86
4:94
3:07
3:82
4:87
3:05
3:78
4:82
3:03
3:75
4:76
3:01
3:72
4:72

4
2:96
3:66
4:67
2:93
3:61
4:58
2:90
3:56
4:50
2:87
3:51
4:43
2:84
3:48
4:37
2:82
3:44
4:31
2:80
3:41
4:26
2:78
3:38
4:22

5
2:81
3:44
4:34
2:77
3:38
4:25
2:74
3:33
4:17
2:71
3:29
4:10
2:68
3:25
4:04
2:66
3:22
3:99
2:64
3:18
3:94
2:62
3:15
3:90

6
2:70
3:28
4:10
2:66
3:22
4:01
2:63
3:17
3:94
2:60
3:13
3:87
2:57
3:09
3:84
2:55
3:05
3:76
2:53
3:02
3:71
2:51
2:99
3:67

7
2:61
3:16
3:93
2:58
3:10
3:84
2:54
3:05
3:77
2:51
3:01
3:70
2:49
2:97
3:64
2:46
2:93
3:59
2:44
2:90
3:54
2:42
2:87
3:50

8
2:55
3:06
3:79
2:51
3:01
3:71
2:48
2:96
3:63
2:45
2:91
3:56
2:42
2:87
3:51
2:40
2:84
3:45
2:37
2:81
3:41
2:36
2:78
3:36

Legea Snedecor{Fisher (continuare)

239
8

nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99

9
19:4
39:4
99:4
8:81
14:5
27:3
6:00
8:90
14:7
4:77
6:68
10:2
4:10
5:52
7:98
3:68
4:82
6:72
3:39
4:36
5:91

10
19:4
39:4
99:4
8:79
14:4
27:1
5:96
8:84
14:5
4:74
6:62
10:1
4:06
5:46
7:89
3:64
4:76
6:62
3:35
4:30
5:81

11
19:4
39:4
99:4
8:76
14:4
27:1
5:94
8:79
14:4
4:70
6:57
9:96
4:03
5:41
7:79
3:60
4:71
6:54
3:31
4:24
5:73

12
19:4
39:4
99:4
8:74
14:3
27:1
5:91
8:75
14:4
4:68
6:52
9:89
4:00
5:37
7:72
3:57
4:67
6:47
3:28
4:20
5:67

13
19:4
39:4
99:4
8:73
14:3
27:0
5:89
8:72
14:3
4:66
6:49
9:82
3:98
5:33
7:66
3:55
4:63
6:41
3:26
4:16
5:61

14
19:4
39:4
99:4
8:71
14:3
16:9
5:87
8:69
14:2
4:64
6:46
9:77
3:96
5:30
7:60
3:53
4:60
6:36
3:24
4:13
5:56

15
19:4
39:4
99:4
8:70
14:3
26:3
5:86
8:66
14:2
4:62
6:43
9:72
3:94
5:27
7:56
3:51
4:57
6:31
3:22
4:10
5:52

16
19:4
39:4
99:4
8:69
14:2
26:8
5:84
8:64
14:2
4:60
6:41
9:68
3:92
5:25
7:52
3:49
4:54
6:27
3:20
4:08
5:48

Legea Snedecor{Fisher (continuare)

240
16

15

14

13

12

11

10

nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99

1
3:18
4:03
5:35
3:02
3:78
4:94
2:90
3:59
4:63
2:80
3:44
4:39
2:71
3:31
4:19
2:65
3:21
4:03
2:59
3:12
3:89
2:54
3:05
3:78

2
3:14
3:96
5:26
2:98
3:72
4:85
2:85
3:53
4:54
2:75
3:37
4:30
2:67
3:25
4:10
2:60
3:15
3:94
2:54
3:06
3:80
2:49
2:99
3:69

3
3:10
3:91
5:18
2:94
3:66
4:77
2:82
3:47
4:46
2:72
3:32
4:22
2:63
3:20
4:02
2:57
3:09
3:86
2:51
3:01
3:73
2:46
2:93
3:62

4
3:07
3:87
5:11
2:91
3:62
4:71
2:79
3:43
4:40
2:69
3:28
4:16
2:60
3:15
3:96
2:53
3:05
3:80
2:48
2:96
3:67
2:42
2:89
3:55

5
3:05
3:83
5:05
2:89
3:58
4:65
2:76
3:39
4:34
2:66
3:24
4:10
2:58
3:12
3:91
2:51
3:01
3:75
2:45
2:92
3:61
2:40
2:85
3:50

6
3:03
3:80
5:00
2:86
3:55
4:60
2:74
3:36
4:29
2:64
3:21
4:05
2:55
3:08
3:86
2:48
2:98
3:70
2:42
2:89
3:56
2:37
2:82
3:45

7
3:01
3:77
4:96
2:85
3:52
4:56
2:72
3:33
4:25
2:62
3:18
4:01
2:53
3:05
3:82
2:46
2:95
3:66
2:40
2:86
3:52
2:35
2:79
3:41

8
2:99
3:74
4:92
2:83
3:50
4:52
2:70
3:30
4:21
2:60
3:15
3:97
2:51
3:03
3:78
2:44
2:92
3:62
2:38
2:84
3:49
2:33
2:76
3:37

Legea Snedecor{Fisher (continuare)

241
24

23

22

21

20

19

18

17

nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99

1
2:49
2:98
3:68
2:46
2:93
3:60
2:42
2:88
3:52
2:39
2:84
3:46
2:37
2:80
3:40
2:34
2:76
3:35
2:32
2:73
3:30
2:30
2:70
3:26

2
2:45
2:92
3:59
2:41
2:87
3:51
2:38
2:82
3:43
2:35
2:77
3:37
2:32
2:73
3:31
2:30
2:70
3:26
2:27
2:67
3:21
2:25
2:64
3:17

3
2:41
2:87
3:52
2:37
2:81
3:43
2:34
2:76
3:36
2:31
2:72
3:29
2:28
2:68
3:24
2:26
2:65
3:18
2:23
2:62
3:14
2:21
2:59
3:09

4
2:38
2:82
3:46
2:34
2:77
3:37
2:31
2:72
3:30
2:28
2:68
3:23
2:25
2:64
3:17
2:23
2:60
3:12
2:20
2:57
3:07
2:18
2:54
3:03

5
2:35
2:79
3:40
2:31
2:73
3:32
2:28
2:68
3:24
2:25
2:64
3:18
2:22
2:60
3:12
2:20
2:56
3:07
2:18
2:53
3:02
2:15
2:50
2:98

6
2:33
2:75
3:35
2:29
2:70
3:27
2:26
2:65
3:19
2:22
2:60
3:13
2:20
2:56
3:07
2:17
2:53
3:02
2:15
2:50
2:97
2:13
2:47
2:93

7
2:29
2:72
3:31
2:27
2:67
3:23
2:23
2:62
3:15
2:20
2:57
3:09
2:18
2:53
3:03
2:15
2:50
2:98
2:13
2:47
2:93
2:11
2:44
2:89

8
2:27
2:70
3:27
2:25
2:64
3:19
2:21
2:59
3:12
2:19
2:55
3:05
2:16
2:51
2:99
2:13
2:47
2:94
2:11
2:44
2:89
2:09
2:41
2:85

Legea Snedecor{Fisher (continuare)

Bibliogra e
1] Baron R. (coord.). Biji E., Statistica teoretica si economica, Editura Didactica si Pedagogica, Bucuresti, 1996.
2] Bron T., Angheache C., Titan, Statistica, Editura Economica, Bucuresti,
1996.
3] Badita M., Baron T., Korka M., Statistica pentru afaceri, Editura E cient,
Bucuresti, 1998.
4] Biji E., Wagner P., Lilea E., Statistica, Editura Didactica si Pedagogica,
Bucuresti, 1999.
5] Blaga P., Lupas Al., Muresan A., Matematici aplicate, vol.I, Editura Promedia Plus, Cluj{Napoca, 1999.
6] Ionescu M.H., Statistica matematica, Editura Didactica si Pedagogica, Bucuresti, 1962.
7] Jaba E., Statistica, Editura Economica, 1998.
8] Mihoc G., Micu N., Elemente de teoria probabilitatilor si statistica (Proiect
de manual), Editura Didactica si Pedagogica, Bucuresti, 1966.
9] Moineagu C., Negura I., Urseanu V., Statistica, Editura Didactica si Pedagogica, Bucuresti, 1976.
10] Porojan D., Statistica si teoria sondajului, Editura Sansa, Bucuresti, 1993.
11] Rotaru T (coord.) si colectiv, Metode statistice aplicate ^n stiintele sociale,
Editura Polirom, 2000.
242

12] Simion D., Statistica, Editura Universitatii "Lucian Blaga" din Sibiu, 2000.
13] Simion D., Variatie. Corelatie, Editura Universitatii "Lucian Blaga" din
Sibiu, 2000.
14] Stanciu S., Andrei T., Statistica { teorie si aplicatii, Editura All, Bucuresti,
1995.
15] Wagner P., Covachi I., Isaic{Maniu Al., Ionica C., Statistica, Editura Didactica si Pedagogica, Bucuresti, 1997.
16] Wagner P., Topliceanu V., Bazele statisticii, Editura Macarie, T^rgoviste,
a
1999.
17] Yule G.U., Kendall M.G., introducere ^n teoria statistica, Editia XIV revizuita, Editura Stiinti ca, Bucuresti, 1969.
18] ***, Disctionar statistico{economic, Editia a II-a, Directia Centrala de
Statistica, Bucuresti, 1969.

243

S-ar putea să vă placă și