Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
Prefata
1 Introducere
Observarea statistica . . . . . . .
Gruparea datelor statistice . . . .
Prelucrarea statistica . . . . . . .
Analiza si interpretarea statistica
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Serii statistice
4 Marimi relative
9
10
12
14
14
15
20
22
23
23
25
28
29
36
46
47
48
5 Marimi medii
5.1
5.2
5.3
5.4
.
.
.
.
53
53
58
59
60
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
68
68
68
69
71
75
76
80
80
82
87
89
90
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
106
110
112
119
120
122
125
125
127
128
130
133
133
134
136
136
138
145
147
149
154
158
165
Bibliogra e
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
176
181
192
197
200
202
208
208
209
212
224
242
Prefata
Statistica teoretica este ^n prezent folosita de multi specialisti, din cele
mai variate domenii, dar ^n special de economisti. Din dorinta unor autori de
a prezenta un material exhaustiv se pierd ideile principale si expunerea devine
^nc^lcita. Pentru a evita acest lucru, unele metode prea elementare nu au fost
a
prezentate, iar structura cartii a fost facuta dupa cele doua criterii principale:
{ Ordinul seriei: serii simple, serii duble, serii multiple
{ Tipul caracteristicii: caracteristici cantitative (numerice), caracteristici
calitative (nominative).
La sf^rsit este prezentat un capitol cu elemente de statistica matematica,
a
stiut ind faptul, ca statistica teoretica, descriptiva, c^stiga ^n valoare, cu c^t
a
a
^mprumuta mai multe elemente si metode din statistica matematica, care la
r^ndul ei se bazeaza pe teoria probabilitatilor. Pentru a deveni specialist ^n
a
statistica economica, mai trebuie ca cititorul sa completeze cunostintele din
acest manual cu notiuni despre indicatorii statistici economici, care, am considerat ca sunt usor de ^nteles si se gasesc ^n orice tratat de statistica economica.
^n material, am evitat prezentarea prea amanuntita a tabelelor, necesare
I
pentru organizarea calculelor, efectuate manual, pentru diferiti indicatori mai
complicati, pentru simplul motiv ca^n prezent toate calculele se fac automat, cu
calculatorul, prin intermediul unor programe performante. Din acelasi motiv,
al existentei unor softuri moderne bune, metodele statistice elementare pierd
teren ^n fata celor mai elaborate si e ciente precum si a statisticii matematice,
pentru ca acum nimeni nu se mai teme de calcule complicate si de volum mare,
7
acestea ind facute automat de calculator. Gra cele sunt executate, de asemenea, automat, rapid, color, ind foarte sugestive.
Cartea se adreseaza ^n primul r^nd studentilor de la pro lurile de Stiinte
a
Economice de la I.D. sau zi, dar poate studiata si de alti specialisti care folosesc statistica. Tuturor le recomand ca dupa parcurgerea materialului sa faca
apel la cunostintele de informatica pentru a studia macar un program (soft)
specializat ^n statistica.
Capitolul 1
Introducere
1.1 Obiectul statisticii
Statistica este stiinta care studiaza fenomenele si procesele din natura si
societate, relatiile dintre fenomenele economice si sociale, legaturile cantitative,
dar si pe cele calitative.
Denumirea de statistica a aparut pentru prima oara ^n limba germana
(Statistik) si deriva de la cuv^ntul latin "Status" care se traduce prin "stare de
a
lucruri". Termenul de statistica a fost introdus ^n secolul 18 de profesorul Gott ed Achenwall (1719{1772) de la Universitatea din Gottingen. Obiectul initial
al statisticii era descrierea situatiei generale a unui stat, evidenta rezervelor si
a resurselor sale. Cu timpul sfera de cuprindere a statisticii s-a largit ^n special
la studiul fenomenelor economice sociale, biologice precum si ^n tehnica.
Bazele cercetarii statistice au fost puse fara ^ndoiala de scoala engleza,
cu o contributie esentiala din partea scolii universitare germane. Amintim
pe William Petty (1623{1687). John Grount (parintele demogra ei), astronomul Halley si Hemann Couring (1606{1682). Mentionam numele c^torva
a
dintre ^ntemeietorii statisticii moderne, care au produs o mutatie esentiala
^n conceptia generala despre obiectul statisticii: Francis Galton (1822{1911)
biolog si antropolog, ^ntemeietor ^n 1901 al revistei "Biometrika", apoi pe
marele antropolog si psiholog Karl Pearson (1857{1936) si pe cel considerat
9
cel mai mare dintre toti Ronald Fisher (1890{1962) biolog si cercetator la o
statiune agrobiologica, dovedesc ca statistica este un instrument de lucru vital ^n domenii foarte variate: biologie, psihologie, stiinte sociale, economie si
tehnica.
^n opinia marilor statisticieni moderni englezi Yule si Kendall datele
I
statistice din diferite sectoare ale activitatii umane presupun utilizarea si a
unor metode speciale numite metode statistice care se preocupa cu prelucrarea si analizarea unui tip special de informatie, viz^nd ^n nal detinerea
a
unor concluzii utile.
elementelor sau faptelor de acelasi fel av^nd trasaturi comune care formeaza
a
obiectul cercetarii.
Aceasta colectivitate are un caracter obiectiv, concret si nit care trebuie delimitata, de nita clar ^n timp, spatiu sau actiune.
Populatia statistica poate formata din persoane, obiecte, evenimente,
agenti economici, idei, opinii, operatii economice.
2. Unitatea statistica: este elementul din care se compune populatia.
El poate simplu (indivizibil) sau complex ca rezultat al unei grupari.
Numarul de indivizi ai populatiei se numeste cel mai adesea volumul
populatiei si ^l vom nota cu N .
3. Caracteristica statistica (variabila statistica) este una din
trasaturile comune proprii tuturor unitatilor populatiei.
Exemplu: La o multime de indivizi putem distinge mai multe caracteristici: ^natimea, masa, numarul de copii, tipul comportamental, starea nanciara, starea de sanatate exprimata prin cuvinte sau valori numerice ale
analizelor medicale etc.
Caracteristicile se pot clasi ca dupa mai multe criterii, dintre care modul
de exprimare este cel esential (natura caracteristicii):
{ Dupa modul de obtinere:
- primare
- derivate.
{ Dupa continut:
12
Observatii
{ Caracteristicile de timp (seriile cronologice) sunt de fapt masurabile
si deci pot ^ncadrate la cele cantitative, totusi cei mai multi statisticieni le
trateaza separat, timpul ind o caracteristica prea importanta. Modul de lucru
este ^nsa perfect analog cu cel al caracteristicilor cantitative.
{ ^n mod analog caracteristicile spatiale, care se refera cel mai adesea la
I
repartitia ^n teritoriu, sunt de tip calitativ, regiunile ind nominative si deci
nemasurabile.
13
Capitolul 2
14
pe grupe dupa prima caracteristica apoi ecare grupa dupa cea de-a
doua caracteristica. Se poate obtine astfel un tabel cu subdimensiuni, sau se pot aranja datele sub forma de matrice. ^n acest caz la
I
intersectia unei linii corespunzatoare unei grupe de la prima caracteristica cu o coloana de la a doua caracteristica se va putea trece
frecventa absoluta nij adica numarul de unitati (indivizi) care se
^ncadreaza ^n grupa i dupa prima caracteristica si grupa j dupa a
doua.
b) Dupa continutul caracteristicii:
{ grupari cronologice { datele se separa dupa o caracteristica de timp
{ grupari spatiale
{ grupari dupa o caracteristica atributiva { datele se separa dupa
trasaturile speci ce unitatilor.
c) Dupa forma de exprimare a caracteristicilor atributive:
{ grupari dupa o caracteristica calitativa (sau nominativa) (exemplu:
ramuri ale economiei nationale, tipuri de ocupatii, etc.)
{ grupari dupa caracteristici exprimate numeric grupari cantitative
(exemplu: ^naltimea, masa, productia, etc.).
Caracteristicile numerice se preteaza la:
{ grupari pe variante (cu valori discrete). se aplica daca caracteristica
este discreta (numar de copii, note la o examinare)sau numarul valorilor
este redus asa ca ecare valoare reprezinta o grupa
{ grupari pe intervale se folosesc daca caracteristica este continua (masa,
^naltime, etc.) sau c^nd gradul de variatie al caracteristicii este prea mare,
a
adica retinerea datelor pe variante distincte ar conduce la un numar prea
mare de clase (exemplu: gruparea salariatilor dupa marimea veniturilor).
16
Pentru grupare este necesar sa alegem c^t mai convenabil, pentru scopul
a
urmarit, marimea intervalelor de grupare si a numarului de grupe.
Observatie. Daca intervalele de grupare sunt mari, volumul de calcule este
mai mic dar se pierd informatii si din netea concluziei si reciproc.
Intervalele de grupare pot egale sau diferite ca marime. C^nd sunt
a
egale calculele ulterioare sunt mai simple. Intervalele de lungimi diferite se
folosesc mai rar si numai daca avem o problema speciala care impune acest
lucru. De exemplu daca numarul de indivizi din anumite grupe e prea mare
si dorim divizarea acestor grupe pentru un studiu mai n, sau reciproc daca
anumite grupe au numar prea mic de elemente pentru simpli care se comaseaza
obtin^nd intervale mai mari.
a
Exemplu. Evolutia cronologica a publicatiilor economice
Periaoda
Numar publicatii
^nainte de 1700
3
1700{1800
10
1800{1900
15
1900{1950
30
1950{1980
300
1980{2000
500
2000{2002
1500
ar o ^mpartire ce urmareste o serie cronologica ^n care frecventa publicatiilor
creste exponential si este deci necesara utilizarea grupelor de marimi diferite.
Observatie. Prin grupare se pierd informatii relative la datele initiale ^n
schimb se c^stiga o privire de ansamblu asupra lor si o prelucrare ulterioara
a
mai usoara.
17
Formarea grupelor
1. Se determina cea mai mica valoare a caracteristicii studiate xmin
si cea mai mare xmax , stabilind totodata plaja de variatie a acesteia, adica
amplitudinea totala
A = xmax ; xmin
2. Se divide plaja de variatie ^ntr-un numar stabilit de grupe cu aceeasi
amplitudine (dimensiune) sau, mai rar, diferita.
Numarul de grupe r se poate alege subiectiv, recomandabil ^ntre 5 si 20,
sau folosind formula lui H.A.Sturges
r = 1 + 3 322 lg N
unde N este cardinalul populatiei sau volumul populatiei (numarul total al
subiectilor studiati).
^n cazul grupelor egale rezulta h marimea intervalului de grupare
I
h= A
r
2.
h = ag = ls ; li
unde:
8 = numarul de grupe,
Observatie. Pentru ca ultimul interval nu avea margine superioara ( ind
teoretic de lungime in nita), la calcule acesta se alege prin conventie ^n asa fel
ca ultimul interval sa e de lungime egala cu celelalte. La fel s-ar procedat
si cu prima limita inferioara daca primul interval ar fost mentionat ca "sub
90 piese".
22
Capitolul 3
Serii statistice
3.1 Notiuni generale
Seriile statistice sunt formate dintr-o ^nsiruire simpla, sau grupata, mai
putin sau mai mult ordonata, a datelor culese.
^n principiu clasi carea acestora se face dupa tipul caracteristicilor la
I
care se refera. Vom avea astfel:
1) Serii statistice de timp (prezinta variatia unei caracteristici ^n timp) care
pot :
{ dinamice de intervale
{ dinamice de momente.
2) Serii statistice de spatiu.
3) Serii statistice atributive:
{ numerice sau cantitative (se refera la o caracteristica numerica)
{ nominative sau calitative.
4) Dupa numarul caracteristicilor studiate simultan avem:
{ serii statistice simple { contin date pentru o caracteristica
{ serii statistice duble { contin date pentru doua caracteristici
23
24
25
frecventa relativa fi
Evident
n
fi = ni = Xi
r
N
ni
i=1
r
X
i=1
X
ni
fi = X = 1
ni
a1 a2 ]
n1
sau
a2 a3 ] : : :
n2
:::
ar ar+1]
nr
Valori
a1 a2 ] a2 a3 ] : : : ar ar+1]
Frecventa relativa
f1
f2
:::
fr
Vezi exemplele precedente.
Uneori vom avea interesul, ca seria din forma cu intervale sa e scrisa cu
valori discrete. Atunci ^n locul ecarui interval ai ai+1 ] se va pune valoarea
sa centrala xi = ai +2ai+1 ca reprezentant al grupei.
26
ni = N
fi = ni
X N
fi = 1
27
30%
40%
10%
15%
5%
Tipul A
B
C
D E
F 30% 40% 10% 15% 5%
2. Ultimul sondaj de opinie indica pentru candidatii la presedintie
urmatoarele valori:
B
C D
Numele candidatului A
Frecventa relativa 40% 35% 15% 5%
28
lare. Pe axa x{lor (orizontala) se reprezinta intervalele egale succesive, corespunzatoare grupelor de valori (^n cazul grupelor egale). Pe ecare interval
se construiesc dreptunghiuri av^nd ^naltimea proportionala cu frecventa (aba
soluta sau relativa) corespunzatoare ecarei grupe. Evident si aria acestor
dreptunghiuri este proportionala cu frecventa corespunzatoare ecarei grupe.
Observatie. Dreptunghiurile sunt lipite unele de altele si ordinea lor este bine
determinata (nu poate schimbata).
Fig.1
29
Fig.2
300{500
501{700
701{1000
1001{2000
2001{3500
3501{5000
Total
2
6
12
25
15
11
70
X
N = ni
200
200
300
1000
1500
1500
min
1
1
1,5
5
7,5
7,5
2
6
8
5
2
1,75
Fig.3
31
Valori numerice x1 x2 x3 : : : xp
Frecvente
n1 n2 n3 : : : np
unde valorile numerice xi sunt ordonate crescator.
Mod de reprezentare: Pe axa orizontala a unui sistem cartezian rectangular x0y se reprezinta valorile xi , ^n dreptul ecareia se ridica o ordonata yi
proportionala cu frecventa absoluta corespunzatoare ni (sau relativa fi ), apoi
se unesc v^rfurile de sus ale acestor ordonate obtin^nd o linie poligonala numita
a
a
"poligonul frecventelor".
Fig.4
Legatura cu histograma: Pentru ca o serie statistica pe intervale poate
transformata ^n serie cu valori discrete, ecarui interval ai ai+1 ] corespunz^ndu-i mijlocul acestuia xi = ai +2ai+1 , din histograma se poate obtine
a
poligonul frecventelor prin unirea mijloacelor laturilor superioare ale dreptun-
32
Fig.5
Exemple.
34
Fig.6
35
fi
1
2
3
4
5
=0 3
=0 4
=0 1
= 0 15
= 0 05
360
360
360
360
360
Total
Fig.7
36
= 108
= 144
= 36
= 54
= 18
360
Fig.8
Se obisnuieste ca f^siile sa e hasurate sau colorate diferit pentru ca dea
senul sa e mai sugestiv.
^naltimea totala a dreptunghiului corespunde procentului de 100%.
I
37
Fig.9
Se recomanda ca^ntre dreptunghiuri sa se lase un spatiu pentru a sublinia
deosebirea dintre diagrama prin coloane si histograma cu care nu are legatura.
^n plus spatiile dintre coloane pot folosite pentru a introduce acolo un set de
I
dreptunghiuri reprezent^nd situatia repartitiei dupa un alt criteriu, de exemplu
a
timp.
Vom relua exemplul cu investitia din turism exprimate ^n procente din
suma total alocata pentru doi ani consecutivi. Vom avea datele din tabelul de
mai jos:
Sectorul
Anul
2001
2002
Vom obtine o diagrama cu coloane compusa (mixta) care prezinta intuitiv repartitia investitiilor pe sectoare dar simultan si evolutia acesteia ^n
timp.
38
Fig.10
39
A = 60md ! 6cm2
B = 80md ! 8cm2
C = 20md ! 2cm2
D = 30md ! 3cm2
E = 10md ! 1cm2
p
;! la = 6 2 45cm
p
;! lb = 8 = 2 82cm
p
;! lc = 2 = 1 41cm
p
;! lc = 3 = 1 73cm
p
;! le = 1 = 1cm
Fig.11
Diagrama cu cercuri. ^n locul patratelor se pot utiliza discuri a caror
I
arie sa e proportionala cu sumele investite sau cotele procentuale. Razele
cercurilor se calculeaza cu relatia
Ri = Si
unde Si sunt sumele alocate. Se alege, de exemplu, raza de 1 cm pentru 10
miliarde de lei.
40
Fig.12
Pentru ca nu conteaza ordinea de prezentare a categoriilor A B C : : :
uneori cercurile sau patratelor se suprapun cele mai mici apar^nd ^n interiorul
a
celor mai mari
Fig.13
Este folosita ^n special pentru seriile de spatiu care se ^nscriu de fapt tot
^n categoria celor nominative (care nu pot ordonate).
{ Cartogramele sunt gra ce intuitive care ne arata variatia unei caracteristici sau fenomen statistic pe un anumit teritoriu, construit cu ajutorul unei
harti. Ele se construiesc utiliz^nd hasuri sau culori care sunt explicate ^ntr-o
a
legenda alaturata.
Exemple de astfel de caracteristici ar nivelul umiditatii, al gradului
de rasp^ndire a unei boli, al productiei etc. Pentru a marca intenstitatea
a
fenomenului ^n diferite zone (frecventa acestuia) se pot utiliza de asemenea guri geometrice: cercuri, patrate de dimensiuni diferite, proportionale cu volumul absolut al marimii (sau frecventa).
Frecvent sunt utilizate guri naturale sau simboluri ca: spice de gr^u,
a
41
1 2 3 4 5 6 7
Cod client
Frecventa operatiilor 4 9 7 10 3 4 8
Seria putea scrisa si
Cod client
A B C D E F G
Frecventa absoluta 4 9 7 10 3 4 8
a operatiilor
Se recomanda o diagrama cu coloane pentru serii nominative.
6. La o rma au fost c^ntariti 100 de purcei. Au fost obtinute datele din
a
43
tabelul alaturat:
Masa (kg) 30{40 40{50 50{60 60{70 70{80
Numar
20
25
35
15
5
purcei
Sa se reprezinte gra c aceasta serie prin doua gra ce ^nrudite.
Raspuns. Masa purceilor este o caracteristica cantitativa. Seria se poate
reprezenta cu o histograma sau cu poligonul frecventelor daca se calculeaza mijloacele intervalelor de masa.
7. La un sondaj de opinie sau determinat frecventele din tabelul de mai jos
pentru cei patru candidati la functia de director al unei unitati economice:
Numele candidatilor A
B
C
D
Frecventa
40% 35% 10% 15%
Sa se reprezinte cel putin 3 gra ce diferite pentru aceasta serie.
Raspuns. Se vor utiliza gra ce pentru caracteristici nominative: cercul
de structura, dreptunghiul de structura, diagrama cu coloane, sau cea cu
benzi.
8. Grupati datele de mai jos, ce reprezinta ^ncasarile a 40 de agenti de
44
7.329
17.421
5.830
2.739
13.940
15.550
12.480
6.180
9.431
19.467
5.160
10.850
4.530
7.930
12.648
6.850
18.130
17.200
2.330
1.180
18.500
4.220
5.960
6.221
13.800
12.500
19.400
14.220
7.300
6.450
Reprezentati apoi gra c seria obtinuta. Comentarii asupra caracteristicii, seriei si gra cului.
Raspuns. Se recomanda gruparea ^n 4, sau 5 grupe. Se obtine o serie cantitativa, continua, organizata pe grupe. Se poate reprezenta ca
histograma, eventual poligon al frecventelor.
45
Capitolul 4
Marimi relative
Marimile relative sau indicatorii relativi se obtin ca rezultat al compararii
a doua marimi statistice compatibile.
Compararea se poate face prin diferenta sau raport.
^n ambele cazuri intervin doi termeni: un termen pentru comparat si
I
celalalt ca baza pentru comparatie.
Ca diferenta comparatia nu se poate face dec^t ^ntre termeni de acelasi
a
fel, exprimati ^n aceiasi unitate de masura, rezultatul exprim^ndu-se ^n aceleasi
a
unitati ca si datele comparate. Acest indicator statistic ne indica cu c^te unitati
a
difera (^n marime absoluta) termenul comparat fata de cel considerat ca baza
de comparatie.
^n cazul comparatiei sub forma de raport, termenii trebuie sa veri ce
I
anumite conditii:
{ ^ntre ei sa existe o legatura logica de corespondenta de cauzalitate
{ sa e compatibili (ca sfera de cuprindere, metodologie de cuprindere)
{ baza de comparatie trebuie aleasa astfel ca indicatorul obtinut sa aiba
semni catie.
46
student promovat
r2 = numar de total de istudenti i = 65 = 0 8125
numar
80
1
100
= 1%
r1 = 0 9 102 % = 90%
r2 = 0 8125 102% = 81 25%
c) k = 3 rezultatul se obtine ^n promile
1
1000
= 10 =00
15
r3 = numar de bolnavi de boala A = 960 =
numar de indivizi consultati
= 0 015625 = 15 6250=00 promile
1:425
r4 = numar de cadre universitare = 1:235:600 =
numar de locuitori ^n judet
= 0 0011532 = 1 15320=00
d) k = 4 rezultatul se obtine ^n prodecimile
r4 = 11 532 prodecimile:
k = 5 { ^n procentimile, etc.
47
Exemple.
p
X
i=1
ni = N
atunci
n
fi = Xi = ni
p
N
ni
i=1
p
X
evident
i=1
fi = 1:
sau reciproc
r1 2 = 0 1 = 0 5
02
02
r2 1 = 0 1 = 2
Zone, judete
A
Numar locuitori x1
Suprafata agricola y1
v = nr.locuitori x1
ha
y1
x2
y2
x2
y2
ha
ci = loc
y1
x1
y2
x2
x3
y3
x2
y3
x4
y4
x4
y4
y3
x3
y4
x4
kd = xxprezent 100%:
trecut
x
kdi = x i 100%
0
unde:
b) Marimi relative cu baza ^n lant: care re ecta variatia fenomenului economice fata de perioada imediat anterioara
Exemplu.
Trimestrul
Bene cii
mil.lei
I
II
III
IV
2,5
5
6
9
Marimi relative
de dinamica
cu baza xa
^n %
100
200
240
360
51
Marimi relative
de dinamica
^n lant
^n %
{
200
120
150
x
kr=pl = x r 100%
pl
xr = valoare realizata
xpl = valoare plani cata.
52
Capitolul 5
Marimi medii
5.1 Exemple de medii uzuale
^n acest paragraf vom trece ^n revista cele mai uzuale medii, proprietatile
I
lor comune, o metoda generala de obtinere a acestora si precizarea aplicatiilor.
Media este un numar care rezumeaza ansamblul valorilor unei variabile,
calculat prin intermediul unei functii de aceste valori.
Vom considera ^n continuare o serie de valori x1 , x2 , : : :, xN numite si
termenii mediei.
1. Media aritmetica este cea mai cunoscuta si utilizata.
a) Simpla:
1
ma = N
N
X
i=1
xi
p
1 Xx n
map = N
i i
i=1
53
p
X
i=1
np = N
x1 x2 x3 : : : xp
Valori
Frecventa relativa f1 f2 f3 : : : fp
fi = ni
N
0 fi 1
p
X
i=1
atunci
map =
p
X
i=1
fi = 1
xi fi
p
X
p
X
xi fi ;b fi = ma (xi ) ; b
i=1{z } |=1 }
i {z
|
ma
1
{ Media aritmetica calculata din xi micsorata prin ^mpartire la o
=
p
p
h i X
1X
1
ma xi = xi fi = k xi fi = k ma (xi )
k
i=1 k
i=1
xi (cni )
ma = i=1
p
X
i=1
(cni )
54
6c
n
X
xi ni
i=1
n
X
6c
i=1
ni
N
mh = 1 1 N
N
1 =X1
x1 + x2 + : : : + xN
i=1 xi
b) Ponderata
N
1
mhp = X = X
p
p
n1
fi
i=1 x1
i=1 xi
tica are toti termenii pozitivi. Se mai numeste si "medie de ritm" pentru ca se
utilizeaza c^nd fenomenul supus cercetarii ^nregistreaza un ritm de modi care
a
^ncetinit chiar daca volumul absolut al modi carii este mare.
55
Media geometrica scoate ^n evidenta in uenta valorilor mici ale caracteristicii. Din acest motiv se utilizeaza si ^n electrotehnica pentru studiul
curentilor de intensitate foarte mica. De asemenea, se mai foloseste pentru
calculul indicelui mediu de evolutie a unui fenoment economic.
a) Forma simpla este
b) Forma ponderata
p
mg = N x1 x2 : : : xN
mgp =
np
n2
n1
mgp = x1N x2N : : : xpN = xf1 xf2 : : : xfp
p
1
2
4. Media patratica.
a) ^n forma simpla este
I
v N
u X
u
mp = t 1 x2
i
N i=1
N i=1 i i
vp
uX
p
X 2 !1=2
u 2
mpp = t xi fi =
xi fi
i=1
i=1
v p
u1 X
u
m = t N xi
i=1
b) ^n forma ponderata
I
v p
vp
!1=
u1 X
uX
p
u
u p
t
t xi fi = X xi fi
m p = N xi ni =
i=1
Cazuri particulare.
i=1
i=1
Daca
= ;1
=1
=2
=3
Media cubica este utilizata ^n statistica pentru construirea unor indicatori ai gradului de asimetrie a unei distributii fata de valoarea medie (valoarea
centrala).
Gradul de asimetrie poate subliniat doar de o medie de ordin impar,
57
cea mai potrivita ind cea de ordinul 3, adica media cubica. Ea ampli ca
puternic rolul abaterilor mari.
map
a mh mg ma mp mc m
unde 3
, cu conditia ca sa aiba aceiasi termeni si aceleasi ponderi.
^n expresiile de mai sus: mh = medie armonica mg = medie geometrica
I
ma = medie aritmetica mp = medie patratica mc = medie cubica m =
media de ordinul .
Pentru a demonstra aceste inegalitati se pot folosi inegalitatile lui
58
8
> 0 fi 1
< n
> X fi = 1
:
i=1
n
X
i=1
xi fi
! X
n
i=1
fi g(xi )
iar daca g este o functie concava are loc inegalitatea inversa, adica:
n
X
i=1
xi fi
! X
n
i=1
fi g(xi )
x1 x2 : : : xp
Valori
Frecventa
relativa
n1 n2 : : : np
x1 x2 : : : xp
f1 f2 : : : fp
m' = '
" X
1 p
;1
"X
p
cute mai sus, dar si altele noi, utile ^n diferite probleme, pe care le putem
produce ^n functie de tipul problemei.
59
Exemple:
1) pentru '(x) = x se obtine media aritmetica.
^ntr-adevar
I
1
mx = ma = N
p
X
i=1
ni xi =
p
X
i=1
fi xi
1
2) pentru '(x) = x se obtine media armonica
mg = mln x = exp
"X
p
"X
p
i=1
fi ln xi =
#
p
p
fi = exp ln Y xfi = Y xfi = xf1 xf2 : : : xfp
= exp
ln xi
p
1 2
i
i
i=1
i=1
i=1
De nitia 5.4.1 Se numeste functie determinanta asociata colectivitatii C , relativ la o caracteristica X a acesteia, acea proprietate care ram^ne neschima
bata, oricare ar variatiile posibile ale valorilor x1 , x2 : : :, xp ale variabilei X
de nita pe C .
a) Se xeaza functia determinata Y = F (x1 x2 : : : xp ) atasata caracteristicii studiate asa ca sa veri ce de nitia 5.4.1
b) Determinarea mediei prin rezolvarea ecuatiei
F (x1 x2 : : : xp ) = F (m m m : : : m)
unde "m" este media cautata.
Exemple.
1. Se amesteca p solutii de sare av^nd concentratiile respectiv c1 c2 : : : cp .
a
Solutiile au masele S1 S2 : : : Sp . Sa se determine o formula naturala,
potrivita, pentru calcularea concentratiei medii a amestecului cm .
Rezolvare. Functia determinanta va avea ca variabile concentratiile
c1 c2 : : : cp si este construita pe principiul ca sarea din amestecul nal
61
F (c1 c2 : : : cp ) = s1 + s2 + : : : + sp = c1 S1 + c2 S2 + : : : + cp Sp
stiind ca si = ci Si , indiferent de modul de exprimare al concentratiei,
simplu, ^n procente sau promile.
Scriind acum ecuatia care ne da media, ^n baza principiului enuntat
de de nitia 5.4.2 avem:
c1 S1 + c2 S2 + : : : + cp Sp = cm S1 + cm S1 + : : : + cm Sp
De unde obtinem:
+ +
1
cm = c1 SS + c2 S2+ : :: :: :+ Scp Sp = c1 f1 + c2 f2 + : : : + cp fp
+S
1
S
unde fi = Xi .
p
i=1
Si
Qt = Q1 + Q2 + : : : + Qp
iar variabilele acestei functii sunt preturile unitare diferite, pentru
care cautam media. Vom avea
F (p1 p2 : : : pp ) = Q1 + Q2 + : : : + Qp = S1 + S2 + : : : + Sp :
p1 p2
pp
S1 + S2 + : : : + Sp = S1 + S2 + : : : + Sp
p1 p2
pp pm pm
pm
S
pm = S11 + S2 + : : : + Spp
S2
S
p1 + p2 + : : : + pp
S1 = S0 + S0 d1 = S0 (1 + d1 )
S2 = S1 + S1 d2 = S1 (1 + d2 )
..
.
Sn = S0 (1 + d1 )(1 + d2 ) : : : (1 + dn )
Mentionam ca daca di este dob^nda pe anul i atunci 1 + di se
a
numeste indice de crestere (de variatie).
Mai ^nt^i vom determina indicele mediu de crestere (sau ^n general
a
de variatie, de ritm, de dinamica).
a) Functia determinanta este:
F (d1 d2 : : : dn ) = Sn = (1 + d1 )(1 + d2 ) : : : (1 + dn )
S
0
Ea reprezinta indicele total de variatie care trebuie sa e constant la orice variatie a indicilor si egala cu raportul dintre valoarea
nala Sn si cea initialaS0.
b) Pentru a determina indicele ediu vom rezolva ecuatia
F (d1 d2 : : : dn ) = F (dm dm : : : dm )
adica
(1 + d1 )(1 + d2 ) : : : (1 + dn ) = (1 + dm ) : : : (1 + dm )
64
(1 + dm )n = (1 + d1 )(1 + d2 ) : : : (1 + dn )
sau
1 + dm =
p
n
(1 + d1 )(1 + d2 ) : : : (1 + dn )
dm = n (1 + d1 )(1 + d2 ) : : : (1 + dn ) ; 1
Astfel de relatii sunt necesare pentru construirea unor softuri
foarte e ciente si rapide.
4. Valoarea v^nzarilor unui agent economic pe sase ani consecutivi este data
a
^n tabelul urmator
Anul
1997
1998
1999
2000
2001
2002
Valoarea
v^nzarii
a
mil.lei
2200
2376
2613,6
3267
3757
3945
Indice de
variatie
anuala
1,08
1,10
1,25
1,15
1,05
adica
Im = 5 1 08 1 10 1 25 1 15 1 05 = 5 1 793 = 1 123
66
Capitolul 6
x1 x2 : : : xN
x1 x2 : : : xp
n1 n2 : : : np
p
X
i=1
ni = N
{ cu frecvente relative
Valori
Frecventa
relativa
x1 x2 : : : xp
f1 f2 : : : fp
67
p
X
i=1
fi = 1 fi = ni
N
a1 a2 ]
Valori
Frecventa
absoluta
a2 a3 ] : : :
n1
n2
ap ap+1 ]
:::
np
N
X
i=1
1
xi = N
p
X
i=1
ni xi =
p
X
i=1
fi xi
Aici si ^n continuare vom prezenta toate cele trei forme legate ^ntre ele
pentru a familiariza cititorul cu acestea. Media statistica este evident o medie
aritmetica ponderata cu toate proprietatile amintite mai sus.
Pentru indicatori vom utiliza notatiile cele mai uzuale. Aproape toti
indicatorii statistici (empirici) se regasesc si ^n teoria probabilitatilor unde se
folosesc aceleasi litere si aceleasi denumiri, pentru deosebire la statistica vor
avea deasupra o bara.
forma:
p
p
N
X
1X
1X
= N xk = N ni xk = fi xk
k
i
i
i
i=1
i=1
i=1
k , unde mk este media de ordinul k .
Se observa usor ca k = m
Cazuri particulare:
p
X
a)
0=
b)
1=X
{ media statistica
c)
2 = se
i=1
sub 5 6
4
10
7 11 14 10
unde:
{ xM0 = limita inferioara a intervalului modal, adica a intervalului cu
frecventa cea mai mare
69
Observatii.
1. Exista repartitii care au doua sau mai multe moduri ca maxime locale
ale frecventelor. Acestea se determina dupa procedeul de mai sus doar ca
folosim ca interval modal urmatorul pe care-l ^nt^lnim.
a
2. Pe gra cul sub forma de poligon al frecventelor modurile (daca sunt mai
multe)apar ca maxime relative.
3. Se utilizeaza uneori si valoarea antimodala ca ind valoarea repartitiei
(caracteristicii) care ^nregistreaza cea mai mica frecventa.
70
Exemplu.
>X
< i
F N (x) = > fj
> j=1
> 1
:
xi ni
7
8
9
10
11
3
9
4
3
1
: : : xi : : : xp
: : : ni : : : np
: : : fi : : : fp
p
X
ni = N
i=1
fi = ni
p
X N
fi = 1
i=1
daca x x1
daca xi < x xi+1 i = 1 p ; 1
daca x > xp
fi
F (x)
0,15 x 2 (;1 7]
0
0,45
x 2 (7 8] 0,15
0,20 x 2 (9 10] 0,80
0,15 x 2 (10 11] 0,95
0,05 x 2 (11 +1) 1
71
Gra cul
Fig.14
xi
7
8
9
10
11
ni
Frecvente
absolute
cumulate
crescator
Frecventa
relativa
3
9
4
3
1
3
12
16
19
20
0,15
0,45
0,20
0,15
0,05
Frecventa
absoluta
ni
72
fi
Frecvente
relative
cumulate
crescator
0,15
0,60
0,80
0,95
1
a1 a2 ]
f!
a2 a3 ] : : :
f2
:::
ai ai+1 ] : : :
fi
:::
ap;1 ap ]
fp
8
>
> i;1 0
>X
<
F (x) = > fj + (x ;dai )fi
> j=1
>
:
1
daca x a1
daca ai < x ai+1 i = 1 p ; 1
daca x > ap
Observatii.
73
ni
Frecventa
relativa
fi = ni
N
20{30
40
0,08
30{40
140
0,28
40{50
200
0,40
50{60
100
0,20
60{70
20
0,04
Grupe de
v^rsta
a
functia
empirica
de repartitie
0 daca x 2 (;1 20]
0 + (x ; 20) 0 08
10
daca x 2 (20 30]
0 08 + (x ; 30) 0 28
10
daca x 2 (30 40]
0 36 + (x ; 40) 0 40
10
daca x 2 (40 50]
0 76 + (x ; 50) 0 20
10
daca x 2 (50 60]
0 96 + (x ; 60) 0 04
10
daca x 2 (60 70]
1 daca x 2 (20 +1)
74
F (x)
Fig.15
p 2 (0 1]
F (xp ) = p
b) Daca
p = se obtine x1=4 care se numeste cvartilul inferior
p = se obtine x3=4 care se numeste cvartil superior.
Diferenta x3=4 ; x1=4 = q se numeste interval intercuartilic si are rol
^n aprecierea ^mprastierii a jumatate dintre frecvente ^n jurul valorii centrale.
Este vorba de jumatatea din mijloc.
k
c) Pentru p = 10 , k = 1 2 3 : : : 9, se obtin cvantilele xk=10 numite si
decile. Sunt ^n numar de noua si ^mpart gama frecventelor unei serii statistice
^n zece parti egale.
d) Se mai folosesc si cvantilele numite centile, notate xk=100 obtinute
k
pentru p = 100 , k = 1 99.
Decilele si centilele se folosesc de obicei ^n cazul seriilor cu numar mare
de valori.
1
4
3
4
F (xMe ) = 1
2
a) Pentru seriile cu valori discrete valoarea 1=2 a functiei F (x) va ^ncadrata
astfel:
X 1 X
fj 2 < fj
j<i
j i
De aici rezulta ca trebuie sa luam pe i egal cu rangul cel mai mic
pentru care suma frecventelor relative este mai mare sau egal cu 1 , de
2
aici rezulta ca mediana este Me = xi .
Spre exemplu ^n precedenta tabela cu valori discrete este xMe = 8
pentru ca ^n dreptul lui 8 la frecvente relative cumulate avem 0,6 prima
frecventa mai mare dec^t 0,5.
a
76
F (xMe ) =
i;1
X
fj + (xMe ; ai )fi = 1
d
2
j =1
De unde obtinem:
Me = xMe = ai +
0 i;1 1
X
d @ 1 ; fj A
2 j=1
fi
Aceasta formula contine pe i ca necunoscuta. El se numeste indicele intervalului meridian, adica intervalul ^n interiorul careia se gaseste
mediana Me. Este primul interval caruia ^i corespunde o frecventa relativa cumulata egala sau mai mare dec^t 1=2.
a
^n aceste conditii avem:
I
i;1
X
j =1
Observatii.
d N ; ncaim
Me = xMe = ai + 2 n
i
77
k
{ Pentru decile se alege p = 10 unde k poate 1 2 : : : 9.
2. Mediana sau oricare alta cvantila se poate gasi si printr-o metoda geometrica si anume:
Se duce o paralela cu axa orizontala pe la 1=2 ^n cazul medianei
sau p 2 (0 1) pentru o p{cvantila care taie gra cul functiei empirice de
repartitie (adica linia poligonala ascendenta, vezi gra cul anterior) ^ntrun punct.
Ducem prin acest punct o paralela la axa verticala care taie axa
0x ^n xMe , respectiv xp , adica citim valoarea medianei sau a p{cvantilei.
Analog se poate proceda si ^n teoria probabilitatilor cu functia de repartitie
teoretica pentru gasirea medianei teoretice, etc.
Me = 40 + 10(0 5 ; 0 36) = 40 + 10 0 04 14 = 40 + 3 5
04
78
Me = 43 5:
^ntre mod, mediana si valoarea medie (media aritmetica) are loc o egalI
itate aproximativa data de K.Pearson. Se refera la repartitii unimodale
M0 = 3Me ; 2X:
Exercitii propuse
Se dau urmatoarele serii:
1:
V^rsta
a
15{20
25{25
25{30
30-35
35{40
40{45
45{50
50{55
55-60
60{65
65{70
70{75
75{80
80{85
85{90
Total
Frecventa
absoluta
2
38
96
123
132
129
123
110
88
70
46
26
12
4
1
1000
2:
Nota la
statistica
3
4
5
6
7
8
9
10
Total
3:
Numa de
studenti
4
11
21
32
13
9
7
3
100
Masa
^n kg.
40{50
50{60
60{70
70{80
80{90
90{100
100{110
Total
Numar
personal
24
56
110
160
105
35
10
500
x3=4 ; Me = Me ; x1=2
^n practica se utilizeaza:
I
abaterea intercuartilica Aq
Aq = 1 x3=4 ; x1=4
2
care are aceiasi unitate de masura ca si caracteristica studiata, sau
2Me
abatere interdecilica Ad
x ;x
AD = 9=10 2 1=10
81
ID = x9=10 ; x1=10
elimina in uenta valorilor extreme ale distributiei care uneori contin date
aberante dar prezinta avantajul ca se renunta doar la 20% din valorile
acesteia.
di = xi ; X
Dri = di = xi ; X
X
X
N
X
d = i=1
jxi ; X j
N
p
X
i=1
jxi ; X jni =
p
X
i=1
jxi ; X jfi
Abaterea medie liniara se exprima ^n unitatile de masura ale caracteristicii si arata cu c^t se abat ^n medie valorile individuale de la valoarea lor
a
medie.
Un dezavantaj este faptul ca acorda aceeasi importanta tuturor abaterilor individuale, ^n conditiile ^n care abaterile mai mari, in uenteaza ^n mai
mare masura gradul total de variatie. Utilizarea modulului pentru diferente
este obligatorie altfel abaterea medie liniara ar zero
(xi ; X )fi =
X
X
xi fi ;X fi = X ; X = 0
| {z } | {z }
1
N
1 X(x ; X )2
i
N
i=1
p
p
1 X(x ; X )2 n = X(x ; X )2 f
i
i
i
i
N
i=1
i=1
2
2; 1
83
Acest lucru se poate arata usor prin dezvoltarea binomului (xi ; x)2
P
si utilizarea proprietatilor de aditivitate ale sumei precum si a de nitiei
momentelor initiale.
Prin ridicarea la patrat a abaterilor xi ; X se distrug semnele abaterilor
si se acorda un rol real abaterilor mai mari care cresc ^n valoare si pondere.
Dezavantajul dispersiei este ca are unitatile de masura la patrat si nu
permite compararea simpla cu media care are unitatea de masura la puterea
^nt^ia.
a
Acest dezavantaj este ^nlaturat prin aplicarea unui radical indice doi
dispersiei.
c) Abaterea medie patratica sau abaterea standard statistica
sau abaterea tip este radacina patrata din dispersie
{ pentru serii simple
v N
u X
u
= t 1 (xi ; X )2
N i=1
v
u
u
1=t
N
X
N ; 1 i=1 (xi ; X )
v p
vp
u1 X
uX
u
u
t
2 ni = t (xi ; X )2 fi :
=
(xi ; X )
N i=1
i=1
84
>d
^n practica se arata ca d este cam 4=5 din .
I
Abaterea medie patratica spre deosebire de cea liniara evidentiaza
in uenta abaterilor mari si este cel mai valoros si utilizat indicator al
^mprastierii valorilor caracteristicii (seriei) ^n jurul valorii sale medii.
Abaterea standard are totusi dezavantajul ca nu permite compararea
variatiei a doua populatii care se exprima ^n unitati de masura diferite.
d) Coe cientul de variatie. Se mai numeste si coe cientul de omogenitate. Se exprima, de obicei, ^n procente si permite compararea variatiei chiar
si ^ntre populatii diferite.
Se folosesc doua variante
{ coe cientul de variatie liniara
vl = d 100%
X
{ coe cientul de variatie patratica
v p = 100%
X
Evident pentru o aceeasi distributie v l vp .
Coe cientii de variatie iau valori ^ntre 0 si 100% si dau indicatii destul de
semni cative relativ la variatie, omogenitatea colectivitatii, calitatea gruparii
si reprezentativitatea mediei statistice.
Cu c^t coe cientii de variatie se apropie mai mult de zero cu at^t variatia
a
a
85
este mai mica, colectivitatea mai omogena si media mai reprezentativa. Se admite, de regula, ca o serie este omogena daca coe cientii de variatie sunt mai
mici dec^t 35%. Reciproc daca coe cientii de variatie sunt mari, variatia este
a
mare si seria nu este structurata omogen si gradul de semni catie al mediei
este scazut.
Coe cientii de variatie se mai folosesc pe scara larga si la studierea ritmicitatii unei activitati economice.
e) Intervalul mediu de variatie este de nit de urmatoarele limite:
{ cel liniar (X ; d X + d)
{ cel standard (X ; X + ).
Vom ilustra informatiile date de intervalele de variatie simple si largite
pentru o caracteristica, despre care se stie, ca urmeaza legea normala a lui
Gauss, care este perfect simetrica.
Fig.16
x 2 (x1=4 x3=4 ) interval care cumuleaza 50% din totalul frecventei relative
x 2 (X ; X + ) interval care cumuleaza 68 2% din totalul frecventei relative
86
relative
x 2 (X ; 3 X + 3 ) interval care cumuleaza 99 97% din totalul frecventei
relative.
Ultimul interval evidentiaza "regula celor trei sigma" care ne spune ca
toate valorile xi luate de o caracteristica repartizata normal (99 97%) trebuie
sa se ^ncadreze pe un interval de lungime 6 , centrat fata de media statistica X
(3 la st^nga, 3 la dreapta lui X ). Acest interval care are foarte mari aplicatii
a
^n parctica, se numeste interval minim de siguranta totala.
Diferite intervale simetrice fata de X sunt foarte utile ^n relatiile economice, permit^nd calcularea factorului de risc.
a
Serie normata (standard). Fie o serie statistica cu valorile xi , cu
media X si abaterea standard .
Putem construi o alta serie av^nd valorile zi calculate cu relatia
a
zi = xi ; X
Aceasta noua serie (repartitie) statistica se numeste serie normata sau
standard.
Evident ca media acestei noi serii Z = 0 si abaterea standard z =
1 lucru care se veri ca usor utiliz^nd de nitiile mediei si abaterii standard.
a
Aceste serii standard sunt utilizate pentru a compara marimi ce provin de la
distributii statistice diferite.
datelor.
Sa presupunem ca am ordonat crescator valorile caracteristicii studiate:
x1 x2 : : : xi : : : xn;1 xn .
Suspectate de a aberante sunt valorile extreme, adica xi = min xi sau
xn = max xi . Este recomandabil sa se veri ce acest lucru si apoui cele gasite
aberante sa e ^nlaturate. ^n caz ca nu sunt eliminate si vor incluse ^n calcule
I
vor denatura multe din rezultate.
^n special, c^nd avem putine date, in uenta celor aberante este mare pe
I
a
de alta parte nu am dori sa renuntam la ele fara veri care. Vom da^n continuare
o metoda e cienta si simpla de veri care numita: "Testul lui Grubbs".
Etape:
1. Pentru seria data calculam valorile lui X si
l =n;2
unde n este numarul de valori ale seriei
5. Se citeste ^n tabelul lui Grubbs (vezi anexa) o valoare t l ce corespunde
nivelului de semni catie ales, de exemplu = 0 05 (respectiv pragul
88
N
1X
= N (xi ; X )k
k
i=1
p
p
X
1X
= N (xi ; X )k ni = (xi ; X )k fi
k
i=1
i=1
89
Cazuri particulare
k=0
0=
p
X
i=0
fi = 1
nu poate folosit
k=1
p
p
X
X
X
= (xi ; X )fi = xi fi ;X fi = X ; X = 0
0
i
|=1{z }
i=1
k=2
| {z }
1
dispersia empirica
2=
abaterea standard =
3 si 4 intervin la construirea unor coe
2
2
excesul (boltirea).
as = X ; Mo
Cas = X ; Mo
90
Y 3 = xi ; X
i
deci
1=
p
X xi ; X 3
fi
i=1
sau
3
3
Asimetria poate vizualizata, de exemplu, pe un gra c cum ar histograma sau poligonul frecventelor
Fig.17
Daca p1 > 0 distributia este asimetrica la dreapta.
Daca p1 < 0 este asimetrica la st^nga.
a
Denumirea "asimetrie la dreapta" vrea sa sublinieze faptul ca suma
diferentelor pozitive xi ; X are pondere mai mare ^n partea dreapta si poligonul
frecventelor are o panta mai lina (descreste mai ^ncet) ^n partea dreapta a modului. Asimetrie la st^nga, invers.
a
Coe cientul de asimetrie Yule (CaY ), masoara asimetria cu
91
4
4
;3=
4
2
2
; 3:
Daca
2 > 0 poligonul frecventelor este mai adunat si ^naltat, distributia se zice
leptocurtica
2 = 0 poligonul frecventelor seamana cu legea normala normata data de
2
(x 0 1) = p1 e; x2
2
2 < 0 poligonul frecventelor este mai turtit, distributia se numeste platicurtica.
92
Aplicatii:
1. Fie seria
V^rsta
a
Numar de
pacienti
30
36
52
40
70{80
si peste
24
18
Numar de
pacienti
Centrul
intervalului
xi = ai+12+ai
25
35
45
55
65
75
ni
30
36
52
40
24
18
20
93
Produse
ni xi
750
1260
2340
2200
1560
1350
9460
xi ; X
-22,3
-12,3
-2,3
7,7
17,7
27,7
1
X=N
2=
Patrate de
diferente
(xi ; X )2
497,29
151,29
5,29
59,29
313,29
767,29
Diferente
N
X
i=1
Produse cu
diferente
(xi ; X )2 ni
14.918,70
5.446,44
275,08
2.371,60
7.518,96
13.811,22
44.342
ni xi = 9460 = 47 3
200
N
1 X(x ; X )2 n = 44:342 = 221 71
i
i
N
200
i=1
2 = 14
89
Numar
sportivi
ni
RaspunsX = 22 8
r
= 227 6 = 1 947
60
6
16
20
14
4
94
3.
Numar de
piese
executate
de un
muncitor
28
31
33
35
38
43
Total
Numar de
muncitori
ni
16
25
20
30
28
21
140
xi ; X (xi ; X )2 (ai ; X )2 ni
-7
-4
-2
0
3
8
49
16
4
0
9
64
784
400
80
0
252
1344
2860
Raspuns. X = 30
= 4 519.
Observatie. Daca se utilizeaza un program specializat de statistica atunci nu
mai sunt necesare aceste tabele, calculele fac^ndu-se automat dupa introducerea
a
corecta a datelor.
95
Capitolul 7
0 fi
p
X
i=1
fi = 1
96
Va = fmax ; fmin :
2) Coe cientul de variatie medie al frecventelor
Vm = nVa 1
;
unde n este numarul de categorii (pozitii).
3) Coe cientul relativ de uniformitate (^mprastiere) a frecventelor.
^l vom de ni cu ajutorul entropiei introdusa de Shannon pentru variabile
I
aleatoare
n
X
H (f1 f2 : : : fn ) = ; fi log2 fi
i=1
Se stie ca H variaza ^ntre 0 log2 n] adica ^si atinge maximul c^nd toate
a
; 1 1 : : : 1 = log n.
1
frecventele fi sunt egale cu n , H n n
2
n
Propunem ca si coe cient relativ de uniformitate al unei serii calitative numarul
f2 :
Ur = H (f1 log :n : fn ) :
2
Sectoare
Frecventa
relativa
Sectoare
A
B
C
Frecventa
0,33 0,33 0,33
relativa
CEle au gra cele cu coloane:
Fig.18
Aplic^nd formula de mai sus obtinem pentru cele trei serii urmatoarele
a
valori:
Ur (1) = 0 32
Ur (2) = 0 936
Ur (3) = 1
Acest coe cient este util pentru a compara o situatie veche cu una noua
dupa luarea unor masuri economice, ^n vederea ^mbunatatirii unor parametrii
corespunzatori diferitelor sectoare. De exemplu: pierderi, productivitatea
muncii, bene cii, etc.
4. Coe cientul de concordanta (de armonizare, de coincidenta) a doua
serii calitative CCn .
Se pot compara doar serii (doua sau mai multe) care au aceleasi categorii
calitative (sectoare) obtinute ^n doua perioade diferite, ^n doua sondaje, etc.
Fie seriile calitative
0
1 0
1
A1 A2 : : : An A @ B1 B2 : : : Bn A
X@
Y
0
0
0
f1 f2 : : : fn
f1 f2 : : : fn
98
atunci
CCn =
n
X
i=1
fi fi0
Onicescu"
EI =
n
X
i=1
n
X
fi2
i=1
fi = 1
EIc = i=1
1
fi2 ; n
1
1; n
vn
uX
u
CG = t fi2
i=1
n
X
i=1
fi = 1
1
Coe cientul CG ia valori pe intervalul pn 1 .
Si acest coe cient are o forma corijata a carei variatie este independenta
100
CS =
vn
uX 1
u f2 ;
u i n
u i=1
t
1
1; n
v n
u X
u
u n fi2 ; 1
u i=1
t
n;1
101
Capitolul 8
102
Masa
40{50
50{60
60{70
70-80
80{90
Total
Masculin Feminin
0
5
25
20
10
60
10
15
3
2
0
40
Total
10
20
28
22
10
100
^n acest exemplu am urmarit doua caracteristici din care una era cantiI
tativa { masa, iar alta calitativa { sexul.
Putem avea trei combinatii: a) ambele cantitative b)ambele calitative
c) una calitativa si alta cantitativa. ^n capitolele precedente am subliniat marea
I
deosebire a modului de tratare a acestora si di cultatea de a gasi indiactori numerici pentru caracteristicile calitative.
Pentru ^nceput vom trata cazul ^n care ambele caracteristici pe care le
vom nota cu X si respectiv Y sunt numerice si iau valorile X (x1 x2 : : : xr ),
respectiv Y (y1 y2 : : : ys ). Cazul c^nd cel putin una din caracteristici este cala
itativam va tratat ^n mod special separat, ulterior.
Un alt aspect ce merita precizat este modul de prezentare a datelor.
Pentru doua caracteristici cel mai recomandat este cel matricial (masiv cu
doua dimensiuni) pentru trei caracteristici, masiv cu trei dimensiuni (matrice
spatiala), unde elementele au trei indici etc., ^n vederea introducerii datelor ^n
calculator apoi a prelucrarii lor. Este stiut faptul ca ^n calculator se pot introduce date ce au mai multi indici si apoi se pot prelucra foarte usor. Prezentarea
ce va facuta ^n continuare va urmari tocmai acest scop.
Date ce provin de la doua, trei sau chiar patru caracteristici se pot
prezenta pe coala (care are doua dimensiuni), cu ajutorul tabelelor combinate,
103
Masa
Sex
Total
100
110
90
112
412
40-50
50-60
60-70
70-80
80-90
M F
M F
0
0
0
0
0
10 5
12 6
11 6
15 8
48 25
15 25 3
18 29 5
17 27 4
20 30 6
70 111 18
20 2
24 4
22 2
20 3
86 11
10
12
11
10
53
0
0
0
0
0
corelatie.
y1
:::
yi
: : : ys
x1
xi
ni1
nij
nis
xr
nr1
n1
nrj
nj
nrs nr
ns N
..
.
..
.
Total
ni
^n acest tabel:
I
x1 x2 : : : xr sunt valorile luate de caracteristica X
y1 y2 : : : ys sunt valorile luate de caracteristica Y .
nij sunt frecventele absolute (numar de indivizi) pentru care caracteristica
X ia valoarea xi si simultan caracteristica Y ia valoarea yj . ^n locul valoriI
lor xi pot aparea si intervale de valori de tipul ai ai+1 ], respectiv ^n locul lui
yi ;! bj bj+1 ].
Pe marginea tabelului jos si la dreapta sunt trecute asa numitele
frecvente marginale sau frecvente de grupa care ^nsumeaza toate
frecventele caracteristicii Y pentru o valoare xa xi a lui X sau grupa ai ai+1 ]
sau invers. Le vom nota cu
ni =
p
X
j =1
nij
sau
nj=
r
X
i=1
nij
j =1
105
j =1 i=1
s
X
fij = f j
j =1
fij = fi
X
xi
s r
XX
j =1 i=1
fij = 1
yi
..
.
: : : fij
fi
fj
..
.
Exemplu. Fie 107.800 piese extrase din productia unei masini pentru care
s-au masurat doua dimensiuni X si Y ^n milimetrii si s-au obtinut datele din
tabela de mai jos (dupa M.H.Ionescu, 6]).
106
107
59,5{61,5
61,5{63,5
63,5{65,5
65,5{67,5
67,5{69,5
69,5{71,5
71,5{73,5
73,5{75,5
75,5{77,5
77,5{79,5
Total
Y
{
50
400
200
{
{
{
{
{
{
650
57 5;
59 5
{
275
775
1000
450
{
{
{
{
{
25500
59 5;
61 5
61 5;
63 5
150
575
2000
3200
2775
675
25
100
{
{
9500
63 5;
65 5
100
50
4150
7300
6550
3825
575
300
{
{
23750
65 5;
67 5
100
500
1725
7875
9500
6100
2475
625
250
{
29150
{
25
825
3350
9325
7750
3450
675
150
200
25750
67 5;
69 5
{
25
125
725
3150
3950
3225
1300
150
50
12700
69 5;
71 5
{
{
{
100
450
1100
700
550
250
100
3250
71 5;
73 5
{
{
{
{
100
200
50
200
{
{
550
73 5;
75 5
350
2400
10000
23750
32300
2360
10500
3750
800
350
107800
Total
Fig.19
Fig.20
110
111
valori
centrale
xi
lui X
Grupele
.
.
.
Total
unitati
pe grupe
de laY
Medii de
grupa de la Y
Dispersii
de grupa Y
ar ar+1 ] = xr
.
.
.
ai ai+1 ] = xi
a1 a2 ] = x1
:::
:::
:::
:::
:::
:::
:::
X1
(x)
2
1
:::
xr1
ni1
n11
b1 b2 ]
y1
j (x)
2
Xj
nj
nrj
nij
nij
bi bi+1 ]
yj
Grupele lui Y
:::
:::
:::
:::
:::
:::
:::
:::
s (x)
2
Xs
ns
nrj
nis
n1s
bs bs+1 ]
ys
yj valori centrale
(x)
nr
ni
n1
Total
unitati
pe grupe
de la X
Yr
Yi
Y1
Medii
de
grupa
de la X
(y)
r (y)
2
i (y)
2
Dispersii
de
grupa
de la X
2 (y )
1
y1
y2 : : : ys
Y i = n1
s
X
i j =1
yj nij
Notam cu Y media totala a caracteristicii Y , adica pentru ^ntreaga colectivitate ea poate obtinuta ^n doua forme:
{ ca medie a mediilor pe grupe, ponderile ind frecventele marginale ale
caracteristicii X (totalurile unitatilor pe grupe dupa caracteristica X )
r
X
ni Y i
= i=1r
X
i=1
ni
r
X
= i=1
ni Y i
N
y1
:::
yi
: : : ys
n q ::: n j ::: n s
112
Avem
s
X
s
X
yj n j
= j=1
s
X
j =1
nj
j =1
yj n j
N
r
r
s
1 Xn Y = 1 Xn Xy n =
Y=N
i i N
i
j ij
i=1
i=1
j =1
r s
1 XXy n =
=N
j ij
inversam sumele
i=1 j =1
s
r
s
1X X
1X
= N yi nij = N yj n j = Y
j =1
i
|=1{z }
j =1
nj
i=1
xi nij
X
sau
r
X
n j Xj
= j=1s
X
j =1
r
X
j =1
nj
xi ni
X = i=1
r
X
i=1
ni
s
1X
= N n j Xj
r
1 Xx n
=N
i i
i=1
113
2. Dispersiile de grupe.
2 (Y ) = j =1
(yj ; Y i )2 nij
s
X
j =1
nij
s
X
= j=1
(yi ; Y i )2 nij
ni
j (X ) =
i=1
(xi ; X j )2 nij
r
X
i=1
nij
r
X
= i=1
(xi ; X j )2 nij
nj
114
(Y i ; Y )2 ni
i;1
Y=X =
r
X
i=1
ni
i=1
r
1X
= N (Y i ; Y )2 ni
(X i ; X )2 ni
i;1
Y=X =
r
X
i=1
r
1X
= N (X i ; X )2 ni
i=1
ni
i (Y )ni
r
1 X (Y )n
i=1
=N
i
i
med (Y ) = X
r
i=1
ni
i=1
2
si analog
r
X
i (X )n j
r
1 X (X )n
i=1
(X ) = X
=N
i
j
med
r
i=1
nj
i=1
2
2 (Y ) = j =1
(yi ; Y )2 n j
s
X
j =1
s
1X
= N (yj ; Y )2 n j
j =1
nj
115
analog pentru X
r
X
2 (X ) = i=1
(xi ; X )2 ni
r
X
i=1
r
1X
= N (xj ; X )2 ni
i=1
ni
2 (Y ) = 2
med (X ) + X=Y
sau
med (Y ) + Y=X
2
RX=Y = 2X=Y)
(X
Se considera ca factorul de grupare X in uenteaza hotar^tor (semni caa
tiv) variatia caracteristicii Y daca
2
RY=X > 50%
Observatie. Indicatorii de mai sus se pot calcula pentru o serie dubla numai
116
antropologice asupra unui numar de N=350 persoane, dorind sa vada daca exista vreo legatura^ntre^naltimea persoanelor cercetate si lungimea antebratului
acestora si de ce natura este aceasta legatura. Au fost facute calcule si asupra
ecarei variabile ^n parte trag^nd concluziile si asupra celor doua caracterisa
tici luate separat. ^n tabel dimensiunile sunt date ^n inch (masura de lungime
I
anglo-saxona).
1 inch (deget, tol) 25mm:
Pe marginea tabelului sunt trecute frecventele marginale ni si n j
(frecventele pe grupe) si principali indicatori prezentati mai sus.
Vom utiliza acest tabel si pentru alte notiuni ce vor prezentate mai
departe (vezi tabelul urmator).
117
Fig.21
118
i=1 j =1
Cazuri particulare:
1. k = 0
r s
r
s
1 X X n xh = 1 X x h X n
=N
ij i N
ij
h0
i
i=1 j =1
r
1X
=N
i=1
j =1
j =1
xh ni = h (X )
i
119
s r
1 X X x0 y k n =
=N
0k
i j ij
j =1 i=1
s
r
1X k
1 X kX
= N yj nij = N yj n j = k (Y )
j =1
i=1
s
1X
= 1 (Y ) = N yj n j = Y
j =1
02
= 2 (Y )
120
1. h = 0, k = 0,
00 = 1 nu
serveste la nimic
h=0 k=1
, 01 = 10 = 0 analog
h=1 k=0
3. k = 0, h0 = h (X ) este momentul centrat de ordinul h pentru caracteristica simpla X
2.
s
r
X
1X
= N (xi ; X )h nij =
h0
i=1
j =1
r
1X
= N (xi ; X )h ni = h (X )
i=1
analog
s
1X
=N
5.
j =1
i=1
(yi ; Y )k n j = k (Y )
r s
XX
i=1 j =1
i=1 j =1
121
jr(X Y )j 1 () ;1 r(X Y ) 1
proprietati care s-au obtinut datorita normarii.
Pentru coe cientul de corelatie, ^n practica, se obisnuiesc
urmatoarele interpretari:
{
{
{
{
{
Y = aX + b
numita dupa Galton si regresie liniara (pentru demonstratie vezi
6]).
Observatie. Aceasta teorema este extrem de importanta deoarece
subliniaza relatia dintre corelatie si regresie, cele doua tipuri de
legaturi dintre doua caracteristici.
123
c) Sensul legaturii:
{ daca r(x y) > 0 X si Y se numesc direct corelate
{ daca r(x y) < 0 X si Y se numesc invers corelate.
2. Metoda gra ca se poate ilustra foarte usor pe exemplul dat de Galton si prezentat mai sus, ^n care sunt masurate pentru 350 de persoane
^naltimea si lungimea antebratului. Se observa ca doua colturi ale dreptunghiului interior sunt goale, frecventele absolute grup^ndu-se sub forma
a
unei elipse cu diagonala mare suprapusa peste diagonala dreptunghiului.
Valorile cele mai mari ale frecventelor ind chiar pe diagonala. Forma
norului de puncte ^n cazul reprezentarii gra ce ar chiar aceasta elipsa.
Citind tabloul, tragem concluzia ca nu exista ^n specia umana indivizi foarte mici cu antebrate foarte lungi (coltul st^nga sus) si nici india
vizi foarte ^nalti cu antebrate scurte (vezi coltul dreapta jos), adica aceste
doua elemente ale corpului uman sunt corelate. Evident ambele tipuri
de dimensiuni sunt caracteristici ale speciei de care apartinem, transmise prin ereditate. Adica sunt efecte ale aceleiasi cauze. Coe cientul
de corelatie care masoara cantitativ, exact, intensitatea acestei legaturi
se re ecta si el ^n gra cul numit "nor de puncte" prin forma elipsei si
anume:
{ valoarea lui r(X Y ) apropiata de zero este asociata unui tabel
umplut destul de uniform (cu toate colturile pline)
{ daca r(X Y ) variaza ^ntre 0,3 si 0,7, atunci elipsa ce cuprinde
frecventele sau punctele norului este din ce ^n ce mai subtire
a
{ r(X Y ) > 0 8 elipsa devine si mai subtire asa ca atunci c^nd r(X Y )
se apropie de 1 ea se reduce la o f^sie ^ngusta dreapta, care chiar
a
sugereaza un trend liniar ca legatura dintre X si Y .
124
xi ; X
respectiv
avem
1
C l (X Y ) = N
N
X xi ; X
X
i=1
N
X
= i=1
yi ; Y
Y
yi ; Y =
(xi ; X )(yi ; Y )
N X Y
a) Dupa semn:
{ daca C l (X Y ) este pozitiv legatura dintre variabile este directa,
adica cresc sau descresc ^mpreuna, nu neaparat proportional (liniar)
ci dupa o functie. Acest lucru se obtine pentru ca diferentele pozitive (xi ; X ) si (yj ; Y )^n general se cupleaza, la fel si cele negative
care dau tot produse pozitive. La medie rezultatul iese pozitiv
{ daca C l (X Y ) este negativ ^ntre variabile este legatura inversa.
Valoarea negativa provine din faptul ca diferentele cele mai mari
(xi ;X ) negative se^mperecheaza (se^nmultesc) cu diferente (yi ;Y )
pozitive asa ca majoritatea produselor (xi ; X )(yi ; Y ) rezulta negative si deci media este negativa. Deci ^n general c^nd X creste Y
a
descreste, sau invers.
b) Dupa valoarea absoluta:
{ daca C l (X Y ) este mic apropiat de zero, legatura este slaba
{ daca C l (X Y ) este ^n jurul lui 0,5, legatura este medie
{ daca C l (X Y ) este apropiat de 1, legatura este puternica, ceea ce
indica o variatie aproape proportionala, adica ^ntre X si Y exista o
legatura liniara.
Exemplu: e seriile paralele
Nr.
Vechime
^n munca
Salariu
saptam^nal
a
^n mii lei
10
16
27
16
20
22
18
29
11
860
970
870
910
950
850
930
910
970
870
Cl (X Y ) = 0 9251
126
care indica o legatura puternica ^ntre X si Y , cu acelasi sens al variatiei acestora. Valoarea mare a coe cientului sugereaza chiar o dependenta functionala
(regresie) liniara ^ntre X si Y aspect pe care ^l vom trata ceva mai departe.
A=
N
X
i=1
Ai
D=
N
X
i=1
Di
si
Dmin = 0
Kendall propune urmatorul coe cient:
;D
2(A
K = A A ; D = NAN ; 1) = N (N; D)
(
; 1)
max ; Dmin
2
Cl (x y) = i=1
(xi ; X )(yi ; Y )
N X Y
128
N
X
= v i=1
uX
uN
i=1
(xi ; X )(yi ; Y )
(xi ; X )2
N
X
i=1
(yi ; Y )2
N
X
i=1
di
S = 1 ; N (N 2 ; 1)
Acesta are aceeasi interpretare ca si cel a lui Kendall si se pot calcula ^n
paralel pe acelasi tabel.
De obicei coe cientul lui Spearmann este mai mare.
Exemplu
129
A8
A1
A3
A2
A10
A9
A6
A5
A4
A7
Total
Cheltuieli cu
reclama
mil.lei
20,4
13,2
12,0
11,6
9,2
8,8
7,6
6,4
4,4
4,0
d=
Rx ; Ry
1
2
3
4
5
6
7
8
9
10
Valoarea
v^nzarilor
a
mil.lei
1100
960
800
460
360
340
360
380
160
160
1
2
3
4
6
7
6
5
8
8
0
0
0
0
-1
-1
1
3
1
2
Rangurile
d2
A;D
0
0
0
0
1
1
1
9
1
4
17
9
8
7
6
3
2
2
2
0
0
39
0
0
0
0
1
2
1
0
0
0
-4
9
8
7
6
2
0
1
2
0
0
35
N
X
di
6
S = 1 ; N (N 2 ; 1) = 1 ; 10(10217 1) = 1 ; 0 103 = 0 897:
;
i=1
succesive
xi+1 = xi+1 ; xi
i = 1 2 : : : N ; 1:
yi+1 = yi+1 ; yi
Coe cientul lui Fechner, F are relatia
F = C ;D = C ;D
C +D N ;1
unde:
131
Numar
contracte
^ncheiate
Valoarea
primei ^n
mil.lei
1
2
3
4
5
6
7
8
9
10
10
11
16
18
20
24
26
30
40
41
1,5
1,3
1,7
1,8
1,9
2
1,8
2
2,8
2,5
xi
yi
xi+1
yi+1 C sau D
1
5
2
2
4
2
4
10
1
-0,2
0,4
0,1
0,1
0,1
-0,2
0,2
0,8
-0,3
D
C
C
C
C
D
C
C
D
6
1
F = C ; D = 10; 31 = 3 = 3 = 0 33 sau 33%
N ;1
; 9
Cele doua variabile se coreleaza slab, adica la premiere s-a tinut cont
prea putin de numarul de contracte.
Exercitiu. Se poate relua exemplul de mai sus, doar ca ^n locul numarului
de contracte sa se treaca valoarea totala a acestora, la ecare agent separat,
pentru a veri ca daca nu cumva acest indicator a in uentat marimea primei.
Propunem urmatoarele sume exprimate ^n milioane lei
Agentul a1 a2 a3 a4 a5 a6 a7 a8 a9
Suma 150 140 170 180 190 200 210 240 220
Raspuns:
;
8
F = 8 + 1 = 10; 11 = 7 = 0 777 =) 77 7%
8 1
; 9
132
r12(3 4:::s) =
; r12
r13(2) = p r13 2 p r32 2
1 ; 12 1 ; r32
p
r23(1) = p r23 ; r21 r31 2
1 ; r2 1 ; r31
21
a
X2 , r12(3) este mai mic dec^t coe cientul total de corelatie referitor la aceleasi
variabile r12
r12(3) < r12
134
ui
Caracteristici
X1
: : : uj
: : : uN
..
.
..........................
Xi
..
.
..........................
Xs
Total (suma)
adica:
2
(S ) 12 2
(S )
Ks = efectivS ) = s2 (efectiv 1)
2 (
N2 ;
max
135
8.7 Serii duble din care cel putin una este calitativa (nominativa)
Pentru aceste serii este foarte greu sa se gaseasca indicatori numerici,
singurele numere care apar la acestea ind frecventele. ^n aceste cazuri se
I
foloseste denumirea de tablou de asociere, ^n loc de tablou corelativ.
A
B
C
.
.
.
Total
y1 : : :
yi : : :
Total pe
grupele
lui X
ys
Y 1 ::: Y j ::: Y s
na =
si
N=
s
X
j =1
Dispersii
de grupa
Ya
Yb
:::
:::
Y
2 (Y )
na
nb
:::
:::
N
......................
......................
unde
Medii de
grupa
s
X
j =1
naj
y j = na + nb + : : :
136
2 (Y )
:::
:::
2 (Y )
Pentru aceste serii duble, pro t^nd de valorile lui Y , se pot calcula
a
urmatorii indicatori numerici:
{ Media pentru ecare grupa a variabilei X , notate Y a Y b : : :, unde
Ya =
s
X
j =1
naj yj
2 (Y )
Y=X + 2 (Y )
med
adica variatia totala a lui Y este egala cu variatia datorata in uentei lui X
(variatie explicita) plus variatia datorata altor factori (variatie reziduala).
Pentru masurarea intensitatii legaturii dintre Y si X se tine cont de
ponderea pe care o are primul membru 2 ^n variatia totala a lui Y . Acesta se
Y=X
obtine prin radacina patrata a raportului dintre cele doua, adica a asa numitului
coe cient de determinatie, a caracteristicii X asupra caracteristicii Y despre
137
RY=X =
2
Y=X
2 (Y )
2
= 1 ; med (Y )
2 (Y )
Acest indicator este utilizat cel mai des c^nd asociem o caracteristica
a
cantitativa cu una calitativa, de exemplu Y { este cantitativa, X { calitativa,
atunci putem calcula pe RY=X , pentru a stabili o valoare numerica a legaturii
dintre ele. Daca ambele caracteristici X si Y sunt cantitative (numerice) atunci
exista si coe cientul reciproc RY=X care indica in uenta factorului de grupare
a lui Y asupra variatiei lui X .
alegerea unui presedinte dintre trei candidati A B C . S-a pus problema daca
sexul alegatorilor are vreo in uenta asupra alegerii candidatilor. Din datele
culese s-a extras urmatorul tabel
Candidat
Sex
Masculin
Feminin
Total
Total
465
535
1000
Y
..
.
xi
..
.
: : : yi : : :
..
.
: : : nij : : : ni
..
.
nj
Testul
al lui Pearson
Pearson foloseste ideea ca daca structura frecventelor ^n tabel este aproximativ proportionala pe ansamblu cu structura frecventelor marginale, adica
sa avem:
nij ni
n = N
j
pentru orice i si j , atunci ^ntre cele doua caracteristici nu exista nici o legatura.
Se observa ca daca schimbam pozitia lui xi sau yi ^n careul de mai sus
al frecventelor cu care am facut proportia aceasta nu se schimba.
Pentru studiul unui exemplu concret se construieste un nou tabel cu
frecvente nij , asa zise arti ciale, care asigura independenta totala dintre X si
e
Y , calculate cu ajutorul frecventelor marginale din exemplul dat, dupa relatia
n
nij = ni N j
e
e
^n caz ca se lucreaza cu frecvente relative vom avea fij = fi f j . ExI
presie ce se obtine din precedenta prin ^mpartire cu N . Apoi se construieste
o expresie cu diferente ^ntre frecventele experimentale, concrete si cele "articiale" cu ajutorul careia vom aprecia "departarea" dintre cazul teoretic si cel
139
experiemtnal
e
2 = X X (nij ; nij )
c
nij
e
j =1 i=1
s
H0 : nij = nij
e
{ Se calculeza 2 cu expresia de mai sus
c
{ Se alege un prag de semni catie , de exemplu = 0 05
{ Se cauta ^n tabelul
valoarea de control
{ Daca
{ Daca 2 >
c
Sex
Masculin
Feminin
Total
calculam
Total
465 46 5%
535 53 5%
1000 100%
3 2
e 2
2 = X X (nij ; nij ) =
c
nij
e
j =1 i=1
(161 ; 167)2 (198 ; 188)2 (106 ; 109)2
+
+
+
167
188
109
; 193)2 + (207 ; 217)2 (129 ; 126)2 =
+ (199 193
217
126
36
9
36
9
= 167 + 100 + 109 + 193 + 100 + 126 = 1 5486:
188
217
141
X
X1
X2
Total
Y1
Y2
Total
a
b
a+b
c
d
c+d
a+c b+d a+b+c+d
YU = ad ; bc
ad + bc
Cazuri extreme:
c
a) Daca a = d =) X si Y sunt independente
b
b) Daca una din cele patru frecvente este zero { se obtine valoarea absoluta
maxima a coe cientului jYU j = 1 sau YU = 1 ceea ce semni ca o asociere
completa: directa sau inversa.
Rezultatul
examenului
Sexul
Promovati
Nepromovati
Total
F Total
49 31
11 9
60 40
80
20
100
;
YU = 49 9 ; 31 11 = 441 + 341 = 100 = 0 1278
49 9 + 31 11 441 341 782
Adica sexul nu
2.
Rezultatul
examenului
Sexul
Promovati
Nepromovati
Total
Prezenta
mare
la ore
73
2
75
Prezenta
slaba
la ore
7
18
25
Total
;2
YU = 73 18 + 2 7 = 1314 ; 14 = 1300 = 0 9789
73 18
7 1314 + 14 1328
143
80
20
100
Aplicatie
^n tabelul urmator se dau valorile si frecventele pentru doua caracterisI
tici numerice ale unei populatii formate din 187 salariati.
Caracteristica X reprezinta masa ^n kg, iar Y perimetrul toracic ^n centimetri.
Y
79{80
81{82
83{84
85{86
87{88
89{90
91{92
96{94
54{57
58{61
62{65
66{69
70{73
74{77
78{81
2
2
2
{
{
{
{
{
6
5
2
5
2
1
{
{
{
15
2
15
15
12
7
4
{
{
55
{
7
15
11
9
6
2
{
50
{
{
6
8
9
9
3
{
37
{
1
2
2
5
6
1
1
20
{
{
1
1
{
1
11
{
4
9
27
46
36
31
26
11
1
187
Sa se calculeze:
1. Frecventele relative si sa se construiasca un nou tabel.
2. Mediile si dispersiile de grupe pentru X si separat pentru Y .
3. Momentele initiale si momentele centrate de ordinul al doilea.
4. Coe ceintul de corelatie r(X Y ) si sa se faca interpretarile corespunzatoare.
144
Capitolul 9
din ecare familie a notat media ^naltimii acestora. A obtinut un tabel cu doua
serii paralele de date, de forma
^naltime tati
x1 x2 : : : xN
I
^naltime medie i y1 y2 : : : yN
I
Dupa reprezentarea gra ca ^ntr-un reper cartezian X 0Y a obtinut un
nor de punte cu trend liniar
Fig.22
Dupa aplicarea unei metode de ajustare liniara a gasit ca punctele se
aseaza ^n jurul unei drepte Y = 0 73X + 2 11. A constatat deci ca din tati
^nalti se obtin i proportional mai ^nalti, dar ^n medie, ^naltimea ilor este mai
mica dec^t a tatilor, panta dreptei gasite e mai mica dec^t a primei bisectoare
a
a
0 73 < 1. Aceasta arata ca procesul foarte elaborat al ereditatii, care tinde
sa conserve caracterele, dimensiunile, mai are si un rol de corijare a dimensiunilor externale, altfel specia ar degenera. Pentru ca ^n acest experiment media
^naltimii ilor a regresat putin fata de media ^naltimii tatilor Galton a numit
dreapta gasita, ca legatura clara ^ntre cele doua serii "regresie liniara".
Termenul de "regresie" s-a patrat^n statistica pentru a desemna notiunea
de functie ^ntre variabile statistice.
Problema gasirii unei regresii se pune doar pentru caracteristici numerice. Vom deosebi doua variante:
146
{ liniara y = ax + b
{ parabolica y = ax2 + bx + c
b
{ hiperbolica y = a + x
Cel mai des se foloseste metoda celor mai mici patrate descrisa de Gauss
^n 1794 la v^rsta de 17 ani.
a
Presupunem ca am propus ca regresie, o functie, de forma Y =
f (X a1 a2 : : : ap ) unde ai sunt parametrii. Ideea lui Gauss este de a minimiza o suma cu patratele diferentelor dintre valorile experimentare (statistice)
date ale lui Y si cele calculate prin functia propusa.
a) Cazul a doua serii paralele (nu avem frecvente), deci
X x1 x2 : : : xN
Y y1 y2 : : : yN
Expresia este:
S (a1 a2 : : : ap ) =
N
X
i=1
yi ; f (xi a1 a2 : : : ap )]2
b) Cele doua serii sunt date sub forma unui tablou de corelatie, ^n care
evident, frecventele diferite de zero sunt grupate pe o f^sie ^ngusta ^n
a
jurul unei linii, altfel nici nu propuneam regresia. Atunci avem:
S (a1 a2 : : : ap ) =
s r
XX
j =1 i=1
148
^n acest caz frecventele nij au rol de ponderi. Cele mai mari se vor aseza
I
chiar pe linia de regresie si eventual una doua ^n st^nga si dreapta, mai mici,
a
iar mai departe sunt zero. Pentru ecare valoare yi a lui Y vom avea maximum
3-4 valori xi una cu pondere mai mare si 2, 3 cu ponderi (frecvente) foarte mici.
Se formeaza un fel de medie a lor.
Se poate arata usor ca aceasta functie S (a1 a2 : : : ap ) care depinde de p
variabile a1 a2 : : : ap , parametrii regresiei, are ^ntotdeauna un punct de extrem
si acesta este un minim. De aceea pentru gasirea lui este su cient sa scriem
sistemul format cu derivatele partiale ale lui S pe care le anulam (vezi extreme
pentru functii de mai multe variabile), 5],
@S = 0 @S = 0 : : : @S = 0
@a1
@a2
@ap
0 a0 : : : a0 ) determina ^n nal forma regresiei.
Solutia gasita (a1 2
p
S=
derivam si formam sistemul
8
>
>
>
>
<
>
>
>
:
sau
N
X
i=1
yi ; (axi + b)]2
N
@S = 2 X(y ; ax ; b)(;x ) = 0 j : 2
i
i
i
@a
i=1
N
@S = 2 X(y ; ax ; b)(;1) = 0 j : 2
i
i
@b
i=1
8 X 2 X X
> a xi + b xi = yixi
>
<
> X
> a xi + bN = X yi
:
149
a=
b=
X
X X
xi yi ; xi yi
X 2 hX i2
xi ;
xi
X X
xi yi xi ; x2 yi
i
X 2 hX i2
N xi ;
xi
S=
sau
r s
XX
i=1 j =1
8 @S XX
> =2
(yj ; axi ; b)(;xi )nij = 0 j : 2
> @a
<
> @S XX
> =2
:
(y ; ax ; b)(;1)n = 0 j : 2
j
@b
ij
8 X 2X
> a xi nij + b X xi X nij = X X xi yj nij j : N
>
> i j
i
j
i j
<
> X X
> a xi nij + b X X nij = X yj X nij
>
j:N
:
i
150
Folosind notatiile pentru momente initiale, dupa ^mpartirea cu N { volumul total al populatiei, obtinem
8
>a
>
<
>
>
:a
20 + b 10
10 + b
11
01
a=
b=
^n nal
I
Y=
11 ; 10 01
20 ; 2
10
11 10 ; 20 01
20 ; 2
10
11 ; 10 01 X + 11 10 ; 20 01
20 ; 2
20 ; 2
10
10
01 = Y
r(x y) = C (x y)
C (x y) =
X Y
vom avea
sau
^n nal
11 ; 01 10
11 ; 01 10 (X ; )
10
20 ; 2
10
Y;
01
Y;
01
= r(x y)2 X Y (X ;
Y;
dar cum
10
avem
si tin^nd cont de
a
10 )
01 = r (x
y) Y (X ;
=X
si
10 )
01 = Y
Y ; Y = r(x y) Y (X ; X )
X
151
Concluzii
1. Regresia liniara trece prin centrul de greutate al celor doua serii format
de cele doua medii (X Y ).
2. Panta dreptei depinde de coe cientul de corelatie si raportul celor doua
abateri standard Y si X .
c) ^n cazul regresiei liniare se poate utiliza si o metoda elementara numita
I
Metoda centrelor de greutate { daca datele sunt sub forma a doua serii
paralele.
A
{ z B {
z 1 x2}| : : xk xk+1}|: : xn
x :
:
X
Y y1 y2 : : : yk
yk+1 : : : yN
Fig.23
{ Se calculeaza coordonatele centrelor de greutate ale celor doua grupe cu
152
8
N
> XB = 1 X xi
>
>
N ; k i=k+1
>
<
B>
N
>
> YB = 1 X yi
:
N ;k
8
k
> X = 1 Xx
> A
>
k i=1 i
>
<
A>
k
>
> YA = 1 X yi
:
k
i=1
i=k+1
Y ; YA X ; XA
YB ; YA = XB ; XA
sau
Y
Y ; YA = XB ; YA (X ; XA )
;X
B
xi
20
30
40
80
130
200
Total 500
yi
x2
i
xi yi
18 400 360
16 900 480
15 1600 600
12 6400 960
10 16900 1300
7 40000 1400
78 66200 5100
153
S (a b c) =
(ax2 + bxi + c ; yi )2
i
154
8X 4
> xi a
>X
<
3
> X xi2a
>
: xa
i
+ x3 b + x2 c = x2 yi
P xi2 b + P xi c = P xi y
+ i
i
i i
P x b +nc = P y
+ i
i
xi
yi
x2 x3
i
i
x4
i
xi yi
x2 yi
i
8
> 274a+
>
<
> 72a+
> 22a+
:
Z = lg y = x lg a + lg b
sau
Z =x A+B
A x2 + B xi =
Xi
P
A xi + B n =
Px z
i i
Pz
i
ti
Ii
1 4,1
2 4,6
3 5,8
4 7,2
5 15,1
6 20,5
Total 21 57,3
Zi = lg Ii t2
i
0,6178
0,6627
0,7634
0,8573
1,1789
1,3117
5,3918
ti zi
1 0,6178
4 1,3254
9 2,2902
16 3,4292
25 5,8945
36 7,8702
91 21,4273
8
< 91A+ 21B =
: 21A+ 6B =
21 4273
5 3972
A = 0 14087
de unde
B = 0 38815
I = 2 444 (1 382)t
Aceasta poate folosita pentru a face previziuni asupra ^ncasarilor si
pot plani cate investitiile pentru lunile urmatoare.
De exemplu pentru luna iulie se preconizeaza ^ncasari ^n valoare de circa
S (a b c) =
n
X
i=1
158
@S = 0
@b
@S = 0
@a
@S = 0
@c
8 X
> ;2 (zi ; axi ; byi ; c)xi
> X
<
> ;2 X(zi ; axi ; byi ; c)yi
> ;2 (zi ; axi ; byi ; c)
:
adica
8 X 2
> a xi
> X
<
> a X xi yi
>
:
a
xi
=0
=0
=0
+b xi yi +c xi = xi zi
P
P
P
+b yi2 +c yi = yi zi
P
P
+b yi +c n = zi
2
2
);2 z x
R(z=x y) = C (z x) + C (z y1 ; CC((x y)) C (z y) C (x y)
2
R(z=x y) = C 2 (z x) + C 2 (z y)
Acest indicator poate avea si forma
v n
u X
u
u
u i=1 (zi ; z(xi yi))2
u
R(z=x y) = u1 ; X
n
u
t
(zi ; Z )2
i=1
159
1
9,6
2
9,2
3
8,2
4
10,3
5
10,2
6
9,6
7
9
8
9,5
9
10,5
10
10,7
11
9
12
10,8
Sa se determine regresia ce leaga aceste doua serii si sa se estimeze protul pe lunile ianuarie si februarie.
160
xi
yi
1 9,6
2 9,2
3 8,2
4 10,3
5 10,2
6 9,6
7
9
8 9,5
9 10,5
10 11,7
11
9
12 10,8
Total 78 117,5
x2
i
xi yi
1
9,6
4 18,4
9 24,6
16 41,2
25 51,0
36 57,6
49 69,3
64 76,0
81 94,5
100 107,0
121 99,0
144 129,6
650 777,8
8
< 650a+
: 78a+
78b = 777 8
12b = 117 5
xi
0
5
10
15
20
Total 50
yi
2,26
2,61
3,36
4,81
7,27
2031
x2
i
x3
i
x4
i
x1 yi
x2 yi
i
0
0
0
0
0
25 125
625
13,5 65,25
100 1000 10000 33,6
336
225 3375 50625 72,15 1082,25
400 8000 160000 145,4 2908
750 12500 221250 264,2 4391,5
Sistemul obtinut va
8
> 221250a+
>
<
> 12500a+
>
: 750a+
8
< 174a+
: 3:528a+
10b = 9:090
174b = 160:980
a = 5 624
b ; 811 151
600
650
250 390 420 300 290 600 680 660 1000 960
a = 1 68
Regresia este
si
b = ;108 46
Y = 1 68X ; 108 46
v X
u
u
u1 ; X(yi ; yc)2 =
R(y x) = t
2
(yi ; Y )
p
p
= 1 ; 85387 79 = 1 ; 0 1288 = 0 8712 = 0 9335
664450
Capitolul 10
{ poate folosita ca metoda de control a cercetarii totale de mare amploare sau obtinerea unor informatii preliminare (vezi sondaje rapide la
referendumuri).
Reprezentativitatea esantionului.
Cele doua marimi d si P nu sunt independente. Fiind data una din ele
cealalta poate calculata.
^n consecinta, folosirea expresiei "esantion reprezentativ" este justi cata
I
daca prin aceasta se ^ntelege ca ^n raport cu toate caracteristicile studiate
eroarea d este sub o limita acceptabila, iar marimea P se a a peste un prag
ales, ^n general 95%.
O proprietate esentiala a selectiei este ca sporul de reprezentativitate al
esantionului nu este direct proportional cu volumul lui adica dependenta nu
este liniara. Dimpotriva este data de o curba numita cura de saturare si este
ilustrata mai jos.
Fig.24
Curba arata ca la ^nceput pentru cresteri mici ale volumului esantionului
gradul de reprezentativitate creste rapid ating^nd destul de repede un nivel su a
cient de ridicat. O crestere suplimentara, chiar masiva a volumului esantionului
dupa obtinerea unui nivel ^nalt de reprezentativitate este inutila si pagubitoare.
Aceasta observatie ne arata ca ^n teoria selectiei este su cient si recomandabil
sa se lucreze cu esantioane de volum mic raportate la ^ntreaga colectivitate fapt
care face teoria selectiei at^t de valoroasa ^n aplicatiile statisticii.
a
Conditiile pentru asigurarea unei bune reprezentativitati a unui esantion
167
sunt:
{ selectia unitatilor sa se faca ^n mod obiectiv si aleator cu probabilitate
egala de alegere
{ esantionul sa e su cient de mare. Volumul sau se poate calcula aproximativ pentru a ^ndeplini exigentele impuse
{ includerea unitatilor ^n esantion sa se faca independent de alte unitati.
Procedee de selectie:
{ Selectia aleatoare { este procedeul de baza cel mai folosit. Se face prin
tragere la sorti si exclude orice element subiectiv^n formarea esantionului.
{ Selectia dirijata { are un caracter subiectiv, alegerea unitatilor
esantionului se face de catre persoanele care culeg datele.
{ Selectia mixta { se ^mbina cele doua aspecte, colectivitatea se ^mparte ^n
grupe dupa alegerea cercetatorului ^n functie de o anumita caracteristica
dupa care se extrag la ^nt^mplare (aleator) unitati din ecare grupa.
a
Tehnici de extragere:
{ procedeul tragerii la sorti, pe baza de bile, biletele etc., care reprezinta
unitati din colectivitate. C^nd se poate, se trag chiar unitatile direct. De
a
exemplu piese mici din productia unei masini automate.
Schema de extragere poate :
k = N = volumul colectivitatii
n volumul esantionului
care ^mparte toata colectivitatea ^n grupe de volum egal. Se alege la ^nt^mplare
a
o unitate din prima grupa apoi prin adaugarea succesiva a pasului k la numarul
de ordine din lista gasim urmatoarele n ; 1 unitati ce vor forma esantionul.
Procedeul are un caracter semialeatoriu deoarece doar prima unitate este aleasa
la ^nt^mplare, restul unitatilor intr^nd ^n esantion ^n functie de prima.
a
a
Datorita simplitatii si uniformitatii este des folosit ^n practica.
Erori de selectie.
{ erori ^nt^mplatoare.
a
Erorile sistematice de reprezentativitate se datoreaza nerespectarii principiilor selectiei, adica ecare unitate a colectivitatii sa aiba sanse egale de a
selectata etc. Daca exista astfel de erori rezultatele nale pot avea abateri
importante. Ele se datoreaza comoditatii sau raspunsurilor voit gresite.
Erorile ^nt^mplatoare de reprezentativitatea sunt datorate faptului ca
a
esantionul este prea mic si nu poate reproduce structura colectivitatii. Aceste
erori sunt inevitabile.
Valoarea efectiva a erorilor de reprezentativitate se poate calcula doar
daca avem informatii asupra unor caracteristici relative la colectivitatea totala.
Veri carea se face prin compararea structurii pe diferite selectii cu colectivitatea generala.
Reprezentativitatea se poate veri ca prin coe cientul de reprezentativitate cr% calculat ca raport ^ntre valoarea efectiva de reprezentare r si media
colectivitatii generale X . Daca media generala X este cunoscuta se efectueaza
mai multe selectii succesive si se calculeaza media mediilor de selectie X . ^n
I
acest caz valoarea efectiva de reprezentativitate r se va calcula ca:
r =X ;X
si
cr% = X ; X 100%
X
Tipuri de selectie.
ni = Ni
n N
unde:
{ ni = volumul subesantionului
{ Ni = volumul stratului
{ n = volumul total al esantionului
{ N = volumul colectivitatii.
Selectia multistadiala (^n trepte). Colectivitatea este privita ca ind
formata din grupuri, care la r^ndul lor sunt formate din altele mai mici, care
a
171
si ele sunt alcatuite din altele si mai mici si asa mai departe, p^na se ajunge la
a
nivelul individului.
Esantionarea va ^ncepe cu grupurile mai mari , apoi cu urmatoarele,
trec^nd succesiv prin toate nivelurile p^na se ajunge la indivizi izolati.
a
a
^n primul stadiu se alege un numar de grupe mari, apoi din ecare grupa
I
mare un numar de grupe mai mici p^na ^n cele din urma se ajunge sa se obtina
a
un esantion de indivizi. Acest tip de solutii se aplica la colectivitati foarte mari
si care mai sunt si rasp^nditi pe o arie sau perioada foarte mare.
a
Spre exemplu populatia unei tari este grupata pe judete, din primul pas
ar putea alegerea unui esantion de judete. Apoi ^n cadrul judetelor alese se
selecteaza un numar de localitati, ^n cadrul localitatilor, anumite strazi, apoi
gospodarii si ^n sf^rsit indivizi.
a
Alt exemplu ar construirea unui esantion de studenti la nivelul national
(sau de elevi). Avem ^n esantion succesiv: centre universitare, institute de
^nvatam^nt superior, facultati, specializari, ani de studii, grupe de studenti, ^n
a
sf^rsit studenti. Esantionul multistadial se poate obtine doar daca colectivia
tatea are o caracteristica de baza care se poate ierarhiza. Scopul principal al
esantionarii multistadiale ^l constituie reducerea costului si a timpului pentru
culegerea informatiei. Este bine sa precizam ca la volum egal un esantion multistadial este mai putin reprezentativ dec^t unul simplu aleator.
a
Pentru o crestere a reprezentativitatii se poate combina metoda de strati care (grupare) cu cea multistadiala. ^n concluzie aceste metode speciale de
I
esantionare prezinta avantaje care le face sa e foarte utile ^n practica.
Probleme de baza ^n teoria selectiei. Dupa obtinerea esantionului
se trece la studierea unei caracteristici a indivizilor sau chiar la doua. Se vor
^nregistra valorile acestei caracteristici si se vor calcula indicatorii numerici
dupa metodele clasice prezentate ^n capitolele anterioare. Se pune problema ^n
ce masura acesti indicatori estimeaza pe cei corespunzatori ai ^ntregii populatii.
172
X 01 X 02 : : : X 0k : : :
Acestea la r^ndul lor formeaza o caracteristica de tip cantitativ pe care
a
0
o notam cu X si o numim distributie de esantioane. Vom da ^n continuare
patru proprietati ale acestei distributii care se pot demonstra utiliz^nd teoria
a
probabilitatilor.
a
1. Media caracteristicii X 0 coincide cu media lui X . Cu alte cuvinte fac^nd
media mediilor tuturor esantioanelor obtinem chiar media caracteristicii
X pentru ^ntreaga colectivitate.
2. ^n cazul esantionarii simple aleatoare repetate (cu returnarea elementului
I
p
extras) avem ca: abaterea standard a variabilei X 0 este de n mai mica
dec^t abaterea standard a variabilei X .
a
Daca notam abaterea standard a lui X 0 cu e care se mai numeste
eroare standard atunci pentru tipul de esantionare mentionat avem:
e = pn
173
cazul esantionarii simple aleatoare nerepetate (fara introducerea ^n urna a elementului extras) formula devine:
rN ; n
e = pn N ; 1
unde:
N = volumul populatiei
n = volumul esantionului.
Deoarece N este mult mai mare ca n valoarea radicalului este apropiata
de 1 si are doar un rol de corijare.
Cazul esantionarii prin strati care. Vom presupune ca populatia
este^mpartita^n s straturi de marime N1 N2 : : : Ns si din ecare strat se alege un
subesantion n1 n2 : : : ns . Daca subesantioanele sunt proportionale cu marimea
straturilor adica avem
ni = Ni
n N
i = 1 2 ::: s
X0 =
altfel se foloseste formula
X0 =
s
X ni
i=1
X 0i
n
s
X Ni
i=1
174
N Xi
e=
s
X Ni2
vs
uX n2
u i
e=t
2
i=1
i
N 2 ni
i
ni
vs
uX n
u i
=t
i=1
n2
i:
2,
p + q = 1.
k
X C k pk qn;k
n
k=0 1 2 ::: n
Se veri ca usor, cu binomul lui Newton, proprietatea de baza a unei
repartitii de probabilitate
n
X
k=0
k
Cn pk qn;k = (p + q)n = 1n = 1
M (X ) = np
D(X ) = = pnpq:
C
P (X = k) = CaC n b
k = 0 1 2 ::: n
a+b
k=0
n
Ca+b = 1
D2 (X ) = npq a + b ; n
a+b;1
a
P = Nlim CC k Cb =
!1
a+b
:b n
:
= Nlim a(a ; 1) : : k!(a ; k + 1) b(b ; 1) : : n(;;)! + k + 1) (a + b)(a + b ; 1)n:!: : (a + b ; n + 1)
!1
( k
^mpartim sus si jos cu N n = (a + b)n si avem:
; a k;1 b ; b ; 1 ; b n;k;1
a ;a 1
n!
N N ; N :;: : N ; ; N N N ; N : : : N ; N
P = k!(n ; k)! Nlim
1
2
;
!1
1 ; N 1 ; N : : : 1 ; nN 1
178
tin^nd cont ca
a
a
a
a+b = N =p
b
b
a+b = N =q
si
p + q = 1, obtinem:
!
k
P (X = k) = k!(nn; k)! pk qn;k = Cn pk qn;k
adica tocmai probabilitatea de la schema bilei ^ntoarse.
Legea evenimentelor rare a lui Poison. Spunem ca variabila X
de tip discret urmeaza legea lui Poison daca are distributia:
X pk )
k ( k=0 1 2 :::
unde
pk ( ) = k! e;
> 0:
Se veri ca usor ca este o repartitie de probabilitate daca utilizam dezvoltarea ^n serie a lui eX si anume
n
x 2 3
ex = 1 + 1! + x + x + : : : + x ! + : : : :
2! 3!
n
0 1 2 :::
1
X
k=0
;
;
k! e = e
1
X
;
0
k! = e e = e = 1
k=0
M (X ) =
D2 (X ) =
X Pk
(n k) k=0 n
k pk q n;k , si daca p = pn astfel ca n pn = > 0 constant,
unde P(n k) = Cn
atunci pentru n ! 1, X urmeaza legea lui Poisson, adica
k
lim P (n k) = k! e;
n!1
succesiv
n;k
k
lim P (n k) = nlim Cn n
1; n
=
n!1
!1
;k
n
k
::
= nlim k! n(n ; 1) :nk n ; k + 1 1 ; n
1; n =
!1
n
k
:(
= k! nlim n(n ; 1) : :nk n ; k + 1) nlim 1 ; n nlim 1 ; n =
!1
!1
!1
k
= k! 1 1 e; = k! e; :
Observatie. Deoarece n pn = constant, rezulta ca pentru n foarte mare
probabilitatea pn este mica. Deci probabilitatea de aparitie a evenimentului,
caruia i se ataseaza aceasta schema este foarte mica, de unde legea lui Poisson a primit denumirea de lege a evenimentelor rare. Se aplica foarte mult
la utilizarea calculatoarelor, la automate, ^n telefonie, la transporturi aeriene
tranzactii bancare unde probabilitatea aparitiei unei perturbatii, unui accident
este extrem de mica. Probabilitatea realizarii a 2 3 : : : k astfel de accidente
este si mai rara si se calculeaza cu legea mai sus amintita.
Practic se poate face comparatia ^ntre calitatea (adica precizia ^n
functionare) a doua calculatoare, automate, banci dupa asa numitul coe cient
a lui Poisson, atasat. Cu c^t acest coe cient este mai mic cu at^t aparatul
a
a
este mai performant, activitatea economica mai e cienta, etc.
180
;1
b
1 Z dx = x b = b ; a = 1
(x)dx = b ; a
b;a a b;a
a
F (x) =
+
Z1
;1
1 Z 1
;a
(t)dt = b ; a b ; a = x ; a
b
b
Mai precis daca tinem cont de toate pozitiile posibile ale lui x avem:
8
> 0
> x;a x<a
<
F (x) = > b ; a x 2 a b)
>
:
1
x b
Fig.25
3. Valoarea medie
+
Z1
1 Z xdx = 1 x2 b = b2 ; a2 = b + a
M (x) = x (x)dx = b ; a
b ; a 2 a 2(b ; a)
2
;1
a
b
181
4. Dispersia
M (X 2) =
+
Z1
x2
;1
D2 (X ) = M (X 2 ) ; M (X )2
b
1 Z x2 dx = x3 b = b3 ; a3
(x)dx = b ; a
3(b ; a) a 3(b ; a)
a
2
2
2
2
D2 (X ) = b + ab + a ; (a + b) = (a ; b)
3
4
12
x ;1
0
00
+
0
+
%
+
m;
+
m
+
% 1= 2
Fig.26
182
m+
-
&
-
i
0
+1
& 0
+ +
Fig.27
3. Caz particular: Legea normala normata (standard) este aceea pentru
care m = 0, = 1, adica are forma
2
(x 0 1) = p1 e; x2
2
Fig.28
Legat de acest caz important de lege normala mentionam functia lui
Laplace
t
Zt
1 Z e; x22 dx
(t) = (x 0 1)dx = p
2 0
0
Proprietati:
1) (0) = 0, (+1) = 1
2
2) este o functie impara adica (;t) = ; (t), 8t 2 R.
183
;1
1
(x m ) = p
2
Z1
+
Z1
x;m
e ( ) dx = p1
2
;1
; y2
;1
2
p
dy = p2 = 1
2
;1
y2
e; 2 dy = 2
;1
+
Z1
1
M (X ) = x (x m )dx = p
2
;1
2
xe; 1 (
x;m )2
dx =
;1
+
Z1m + y y
p e; dy:
=
2
2
2
;1
+
Z1
;1
2
p1 e; y2 dy + p
2
2
{z
+
Z1
;1
y2
ye; 2 dy
=m 1+0=m
{z }
D2 (X ) =
=1
+
Z1
(x ; m)2
;1
1
(x m )dx = p
2
184
+
Z1
(x ; m)2 e; 2 (
;1
x;m )2
dx
F (x) = P (X < x) =
Zx
Zx
1
(y m )dy = p
;1
2
e; 1 (
y;m )2
dy
;1
y ; m = t y = t + m dy = dt
si obtinem
F (x) = p1
2
x;m
e; t2 dt
2
;1
Daca utilizam functia lui Laplace amintita mai sus, putem scrie
1
F (x) = 2 +
x;m
b;m ;
a;m
" ;
;" = 2
"
P (10 < X < 50) = P (jx ; 30j < 20) = 2 (2) = 0 9545 = 95 45%
8 xa e; x
b
>
<
(x a b) = > ;(a + 1)ba+1
:
0
186
Fig.29
Sa veri cam ca este o densitate de probabilitate:
1) Se observa usor ca (x a b) 0, 8x 2 R
+
+
Z1
Z1 x
a+1
1
2)
(x a b)dx = ;(a + 1)ba+1 xa e; b dx = ;(a + 1)ba+1 = 1
;(a + 1)b
;1
0
Se face schimbarea de variabila x = t, dx = b dt si se utilizeaza expresia
b
functiei Gamma amintita la capitolul analiza matematica, 5].
Valoarea medie
M (X ) =
Z1
;1
Z1
0
b
xa+1 e; x dx =
a+2
= ba+1 ;(a + 2) = b(a + 1);(a + 1) = b(a + 1)
b ;(a + 1)
;(a + 1)
D2 (X ) = M (X 2 ) ; M (X )]2 = 2 ;
Dar
2 = b2 (a + 1)(a + 2)
2
1
de unde
D2 (X ) = b2 (a + 1)(a + 2) ; b2 (a + 1)2 = b2 (a + 1)
Utiliz^nd functia Gamma se pot calcula foarte usor momentele initiale
a
a
k de orice ordin si tin^nd cont de relatia de legatura cu cele centrate se pot
187
8 x n ;1e; x
> ; n x>0 n2N >0
<
(x n ) = > ; n 2 2
: 20
x 0
2 2
Aceasta densitate se poate obtine din legea Gamma prin ^nlocuirea lui
a = n ; 1 si b = 2 2 .
2
8
> m x;u
>
<
(x m x0 u) = > x0 x0
>
:
m;1
;
; xx0u
pentru 0 u x
x0 > 0 m > 0
pentru x < u
8
< 1 ; e; xx;u
F (x) = :
0
0
daca x u 0
daca x < u
Valoarea medie
1
M (X ) = x0 ; m + 1
188
Dispersia
D2 (X ) = x2
0
"
1
2
; m +1 ; ; m +1
2#
Aceasta repartitie se utilizeaza ^n abilitate la studiul defectelor accidentale c^nd acestea se datoreaza fenomenelor de uzura si ^mbatr^nire. Este
a
a
mult utilizata ^n asigurari.
Repartitia Erlang este din aceeasi clasa cu Gamma. Are densitatea:
8 ( k)k
>
<
xk;1 e; kx
(x k) = > ;(k)
:
0
Valoarea medie
Dispersia
pentru x 0 k 1 > 0
pentru x < 0
M (X ) = 1
D2 (X ) = k1 2
8
< e; x
(x ) = :
0
pentru x 0 > 0
pentru x < 0
Fig.30
189
8
< 1 ; e; x
F (x) = :
0
Legea Student
pentru x 0
pentru x < 0
Student este pseudonimul matematicianului englez W.Gosset (18761937). Densitatea are expresia
;
n+1
; n+1
t2 ; 2
2;
1+ n
(t n) = p
t2R
n; n
2
Parametrul n se numeste numarul gradelor de libertate. Legea este
folosita mult ^n statistica la construirea unor teste de veri care a ipotezelor
statistice. Pentru functia de repartitie s-au construit tabele de unde se extrag
-cvantile utile ^n teste (vezi anexa). Gra cul repartitiilor din aceasta familie
este asemanator cu cel al repartitiei normale normate, doar ca este putin mai
turtit.
Una din cele mai importante teoreme limita centrale a rma ca daca
n ! 1 repartitia Student tinde catre repartitia normala normata.
Se veri ca usor utiliz^nd limite de tipul "e" ca
a
2
lim (t n) = p1 e; x2 repartitia normala normata:
n!1
2
Student
Fig.31
^n aplicatiile ^n care se utilizeaza frecvent legea Student, daca n > 30
I
se poate trece la ^nlocuirea acestei legi cu legea normala normata si tabelul
190
M (X ) = 0
n
D2 (X ) = n ; 2 :
Observatii.
Fig.32
Valoarea medie este
a
M (X ) = a + b
191
Dispersia este
D2 (X ) = (a + b)2 (ab+ b ; 1)
a
3. Prin operatii elementare si treceri la limita ^n raport cu parametrii a
si b se poate face legatura dintre aceasta repartitie si altele cum ar
repartitia Gamma si repartitia normala. Aceste legaturi ^ntre modelele
probabilistice re ecta de fapt legaturile naturale reale dintre fenomenele
economice.
Recomandam utilizatorului sa studieze din bibliogra a citata si alte legi
de probabilitate, utile ^n practica, specializate pe clase de fenomene economice,
cum ar : legea Snedecor, Fisher, legea dupa triunghi isoscel a lui Simpson,
legea logaritmic normala etc.
= (X1 X2 : : : Xn)
192
Observatie.
193
Vom arata ca k dat de relatia de mai sus este o functie de selectie absolut
corecta pentru momentul teoretic de ordin k. Vom avea succesiv
n
n
1 X X k = 1 X M (X k ) =
(i) M ( ) = M n
i
i
n i=1
i=1
n
n
1 X M (X k ) = 1 X = n k = :
=n
k
k
n
n
i=1
si
i=1
n
n
1 X X k = 1 X D2 (X k ) =
(ii)
k
i
n i=1 i
n2 i=1
n
2(
2(
1 X
= n2 D2 (xk ) = nDn2X ) = D nX ) ;! 0
D2 (
) = D2
i=1
c^nd n ! 1, adica sunt veri cate ambele conditii din de nitia de mai sus.
a
Caz particular. Media de selectie este un estimator absolut corect pentru
media teoretica pentru ca avem M (X ) = 1 .
Exemplul 2. Momentul centrat de selectie de ordinul doi
2=
n
1 X(X ; X )2
i
n
i=1
n
n
2
(ii) D2 ( 2 ) = (n ;31) 4 ; (n ; 1)(n ; 3) 2 ;! 0 c^nd n ! 1.
a
2
n
n3
2=
n
X
n ; 1 i=1 (xi ; X )
194
sau
n
1 X
= n ; a (xi ; X )2
a
2
i=a
unde a este un ^ntreg pozitiv, atunci aceasta este functie de estimatie absolut corecta pentru dispersia teoretica D2 (X ) = 2.
Pentru a arata acest lucru sa observam ca:
2=
n
n ; 1 2:
n
(i) M ( 2 ) = M n ; 1
n
= n ; 1 M ( 2) =
n
= n ; 1 n ; 1 D2 (X ) = D2 (X )
n
n
(ii) D2 ( 2 ) = D2 n ; 1
am aratat mai sus.
n
= n;1
D2 ( 2 ) ;! 0, n ! 1, dupa cum
Pentru abaterea standard care este radacina patrata din dispersie avem
doua functii de selectie dupa cum am mai amintit ^ntr-un paragraf anterior si
anume
v n
u1 X
u
=t
(x ; X )2
n i=1 i
v
u
u
0=t
n
X
n ; 1 i=1 (xi ; X )
care este functia de estimatie absolut corecta pentru abaterea standard teoretica.
Reamintim ca deosebirea dintre ele ^n aplicatiile practice se manifesta
doar la selectii de volum mic n < 30, c^nd se recomanda utilizarea lui 0 ca
a
functie de estimatie pentru teoretic.
195
"
@ ln f (X )
@
2#
Proprietate. (Inegalitatea lui Rao{Cramer). O functie de selectie absolut corecta (X1 X2 : : : Xn ) pentru parametrul veri ca inegalitatea
D2 ( ) I 1 ) :
n(
D2 ( ) = I 1 )
n(
Expresia:
e( ) =
In ( ) D2 ( )
se numeste e cienta functiei de estimatie (X1 X2 : : : Xn ).
0
1
X@
p q
1
A
p + q = 1:
Sa veri cam daca media de selectie X este o functie de estimatie e cienta pentru parametrul p 2 (0 1). Se stie ca valoarea medie teoretica
M (X ) = p.
Densitatea de probabilitate poate scrisa ca
Daca
x = 0 =) f (0 p) = 1 ; p
x = 1 =) f (1 p) = p
deci
In (p) = p(1 n p)
;
D 2 (X ) = D 2
n
1 XX
n k=1
n
2(
1 X
;
= n2 D2 (Xk ) = D nX ) = p(1 n p)
k
k=1
;
Prin urmare se obtine ca D2 (X ) = In 1 (p) deci X este o functie de
estimatie e cienta pentru parametrul p.
V (x1 x2 : : : xk
1 2) =
n
Y
k=1
f (xk
1 2)
= 1 (X1 X2 : : : Xn ) si
2 = 2 (X1 X2 : : : Xn ) sunt functii de estimatie de verosimilitate maxima pentru
parametrii 1 , respectiv 2 , daca ele realizeaza maximul functiei de verosimilitate.
1
Procedeu de gasire:
1. Se logaritmeaza functia de verosimilitate
ln V (x1 x2 : : : xn
2) =
n
X
k=1
ln f (xk
1 2)
@V
@ 1 =0
@V
@ 2 =0
X2 : : : Xn ) si
= (X1 X2 : : : Xn )
Exemple:
1) Fie o caracteristica care urmeaza legea evenimentelor rare a lui Poisson,
adica
X k k;
> 0 necunoscut
e
k!
198
k=1
de unde
n
X
= 0 =) 1 xk ; n = 0
k=1
n
1X
= n xk
k=1
Rezulta ca
=X
de unde
8
>
>
>
>
<
>
>
>
:
sau
8 @ ln f (x m
>
>
@m
<
> @ ln f (x m
>
:
@
) = x;m
2
) = ; 1 + (x ; m)2
3
@m
k=1
@m
k=1
n n
n
@ ln V = X X @ ln f (Xk m ) = X ; 1 + (Xk ; m)2 = 0
3
@
@
k=1 k=1
k=1
8X
> n (X ; m) = 0
>
> k=1 k
<
>X
>
> ; 2 + (Xk ; m)2] = 0
:
v n
u1 X
u (X ; X )2 = p
=t
k
n
1X
m = n Xk = X
n k=1
k=1
pentru parametrii m si .
n i=1 i
k = 1 2 ::: s
200
xk f (x
1 2
i=q s
xf (x b)dx = 1 (x1 x2 : : : xn )
na i=1 i
201
mare. Practic ^n locul lui se poate lua orice valoare din intervalul ( 1 2 ).
Exemplul 1. Fie legea de probabilitate normala de tip Gauss N (m ) cu
> 0 cunoscut. Sa se gaseasca un interval de ^ncredere pentru media teoretica,
adica pentru parametrul m, daca presupunem ca am ales ca probabilitate de
^ncredere valoarea 1 ; .
Rezolvare. Efectuam o selectie repetata de volum n apoi alegem functia de
selectie (statistica)
;
1
Z = X p m unde X = n
n
n
X
i=1
Xi
Zx
0
e; t2 dt
2
adica
;z
1; 2
= 1;
2
P ;z1; 2
< X ;m <z
p
1; 2
=1;
sau efectu^nd calcule algebrice simple asupra celor doua inegalitati pentru izoa
larea parametrului m obtinem:
m1 (X1 X2 : : : Xn ) = X ; pn z1; 2
m2 (X1 X2 : : : Zn) = X + pn z1; 2 :
pentru gasirea unui interval de ^ncredere asociat mediei teoretice M (X ), necunoscuta, pe care o notam tot cu m si care poate servi ulterior la aproximarea
unui parametru al legii studiate, de care M (X ) este legat prin operatii algebrice.
Exemplul 2. Se da o caracteristica X ce urmeaza legea normala N (m ) unde
204
Xi ; m
X ; m = v n i=1
T=
1
u
n
u 1 X(X ; X )2
t n(n;1)
i
i=1
Fig.33
205
F (tn;1 1; 2 ) = 1 ; 2
unde F este functia de repartitie atasata legii Student. Dupa determinarea
intervalului
;t = ;t
1
n;1 1; 2 t2 = tn;1 1; 2
pentru serie
;
P t1 < X p m < t2 = 1 ;
n
P X ; t1 pn < m < X + t2 pn = 1 ;
de unde rezulta ca:
m1 = X ; tn;1 1; 2 pn
m2 = X + tn;1 1; 2 pn :
unde
2=
n
X
n ; 1 i=1
n
1X
(Xi ; X )2 si X = n Xi
i=1
206
Fig.34
h1 = hn;1 2 h2 = hn;1 1; 2
Aceaste abscise se determina separat din ecuatiile:
Fn;1 (h2 ) = 1 ; 2
Fn;1 (h1 ) = 2
P h1 < (n ; 1) < h2 = 1 ;
2
207
x > 0:
sau
2
P (n ; 1) <
h2
< (n ; 1)
h
=1;
n
X
2 2)
1 2
pentru
=h 1
n;1
n
X
i=1
(Xi ; X )2
H0 : m = m0
H1 : m 6= m1
aici ipoteza secundara este exprimata cu o relatie simetrica.
b) test unilateral st^nga:
a
H0 : m = m0
H1 : m < m2
H0 : m = m0
H1 : m > m3
210
Fig.35
ales putem determina intervalul de acceptare a ipotezei
1; 2 z1; 2 cu ajutorul functiei lui Laplace, ce serveste pentru exprimarea
functiei de repartitie la legea normala normata N (0 1). Avem
;;z
Pentru
P ;z1; 2 z1; 2 =
sau
;z
;;z
1; 2
;z
1; 2
1; 2
= 1;
2
213
=2
z1 ; 2 = 1 ;
Din tabelul functiei lui Laplace obtinem cvantila (abscisa) z1; 2 care
separa cele doua regiuni: de acceptare si de respingere a ipotezei.
Introducem valorile numerice x1 x2 : : : xn obtinute prin observare ^n
expresia functiei de selectie Z si vom avea valoarea calculata.
Concluzie:
a) Daca jZ j < z1; 2 atunci valoarea calculata se situeaza ^n zona de acceptare si admitem ipoteza nula H0 .
b) Daca jZ j z1; 2 respingem ipoteza H0 .
Fig.36
214
T = X ;m = v
p
u
u
t
n
X
i=1
Xi ; m
n
X
; +1
; m2;
F (t m) = p
m ; m
2
Zt
;1
2
1+ x
m
+1
; m2
dt
t2R
Fig.37
Sa presupunem ca n = 25, rezulta l = n ; 1 = 24 si = 0 05. Din
tabelul Student (vezi anexa) citim t24 0 975 = 2 064 pentru ca 1 ; 2 = 0 975.
Asadar zona de acceptare este (;2 064 2 064) si de respingere
(;1 ;2 064) (2 064 +1).
5. Introducem datele de selectie^n functia de selectie si sa presupunem ca
am obtinut Tc = 1 789, care apartine intervalului de acceptare. ^n consecinta
I
acceptam ipoteza nula facuta.
Observatie. Si ^n cazul testului Student pentru alta forma a ipotezei am
putut avea test asimetric
a) si anume
H0 : m = m0
H1 : m < m1 unde m1 < m0
9
=
216
Fig.38
b) ^n cazul ipotezei
H0 : m = m0
H1 : m > m2 m2 > m0
9
=
Fig.39
Exemplu de test
pentru dispersie
H2 =
(n ; 1)
2
n
1 X(X ; X )2
= 2
i
i=1
218
Fig.40
P h2 ;1 2 < H 2 < h2 ;1 1; 2 = 1 ;
n
n
Concret sa presupunem ca am ales = 0 05 atunci 2 = 0 025 si 1 ; 2 =
0 975, pentru n = 25, rezulta l = n ; 1 = 24 grade de libertate. Din tabelul
functiei de repartitie asociata repartitiei 2 (vezi anexa) citim
h2 0 025 = 12 4 si h2 0 975 = 39 4
24
24
rezulta ca zona de acceptare este (12 4 39 4), iar cea de respingere R ; Zac =
(;1 12 4) (39 4 +1).
Urmeaza calcularea expresiei H 2 prin introducerea valorilor selectate xi
^n locul variabilelor Xi . Daca H 2 calculat apartine zonei de acceptare validam
ipoteza H0 altfel o respingem.
a
Observatii. Si ^n cazul acestui test putem avea test unilateral st^nga, respectiv
dreapta, c^nd zona critica este doar pe st^nga, respectiv pe dreapta, zonei de
a
a
acceptare. ^n aceste cazuri avem doar o singura cvantila de separare a zonelor,
I
mai precis hn;1 ^n cazul "pe st^nga", respectiv hn;1 1; ^n cazul "pe dreapta".
a
Pentru exemplul numeric ales mai sus, cu l = 25 ; 1 = 24 si = 0 05
a) Cazul "pe st^nga" hn;1 = h24 0 05 = 13 8
a
8
< (;1 13 8) zona critica
: (13 8 +1) zona de acceptare
219
8
< (;1 36 41) zona de acceptare
: (36 41 +1) zona critica
Testul de concordanta
a lui Pearson
0
1
a1 a2 ] : : : ai ai+1 ] : : : ar ar+1 ] A
X@
n1
sau
ni
nr
r
X
i=1
nr = N
volumul selectiei
0
1
x1 : : : xi : : : xr A
X@
xi = ai +2ai+1
n1
ni
nr
H0 : F = F0 (x
0 0
1 2)
0
1
si
0
2
estimati.
Aceste probabilitati p0 calculate care estimeaza probabilitatile teoretic
i
pi pot veri cate cu ajutorul frecventelor ni obtinute experimental.
Se utilizeaza functia de selectie
r
r
02
02
2 = X (ni ; Npi ) = X (ni ; ni )
H
i=1
Np0
i
i=1
n0
i
Fie doua populatii independenteP1 si P2 la care urmarim aceeasi caracteristica. De exemplu, pot doua selectii din aceiasi populatie P , realizate
independent.
Vom nota cu X 0 caracteristica cercetata din populatia P1 si presupunem
ca urmeaza legea normala N (m1 1 ) si cu X 00 caracteristica similara de la
populatia P2 , care urmeaza legea normala cu N (m2 2 ). Ne intereseaza
legatura dintre dispersiile celor doua legi normale. Vom face ipoteza:
2
2
2
H0 : 1 = 2 ipoteza principala asupra dispersiilor teoretice 1 si
2
2 ale celor doua legi.
2
2
H1 : 1 6= 2 ipoteza alternativa.
221
2=
2
2
1
2
1
N
X
2
00 2
00
N2 ; 1 i=1 (X2 ; X )
2
2
2
2
F (x m n) = m
n
m
2
; + x
; m2 k Z m ;1
;m ; ;n t 2 1 + mt
n
; 2
2
0
+
; m2 n
dt
P fm n 2 < F < fm n 1; 2 = 1 ;
Zona critica (intervalul de respingere a ipotezei) se a a de o parte si de
alta a intervalului de acceptare. Cele doua cvantile se determina din tabelul cu
valorile functiei de repartitie Snedecor{Fisher (vezi anexa) din relatiile:
F fm n 2 = 2 si F fm n 1; 2 = 1 ; 2
Pentru ca are loc relatia:
fm n = f 1
n m 1;
se poate ca unele tabele se construiesc doar pentru valori mari ale lui
(0 95 0 975 0 99 etc:).
222
2
;n 2
F = s1 = m ; 1 1 ;
2
s2 n
a) Daca Fcalculat < Ftabelar { ipoteza nula se respinge, deci este semni cativ pentru intensitatea legaturii dintre cele doua variabile X si Y , adica
rezultatul se poate extinde la ^ntreaga populatie. ^n acest caz zona critica
I
se a a la st^nga cvantilei obtinute din tabel
a
b) Daca Fcalculat > Ftabelar { ipoteza nula H0 se admite ^n forma formulata,
adica nu este semni cativ pentru legatura dintre cele doua variabile si
indicatorul nu poate extins la nivelul ^ntregii populatii.
H0 : m = M (X ) = 320:
Statistica utilizata este:
;
;
Z = X p m = X p3 320
n
z1; 2
40
1
X=N
r
X
i=1
xi ni =
1
= 40 (220 4 + 260 6 + 300 12 + 340 10 + 400 8) = 316
Z = X ; m = 316 ; 320 = ;4
40
60 = ;0 421
n
40
Deoarece Z = ;0 421 2 (;2 58 2 58) se accepta ipoteza enuntata si
anume ca media investitiilor pe agent poate luata 320 mil.lei.
2. Fiind monitorizat timp de 15 zile un muncitor a obtinut zilnic un
numar de piese dupa cum urmeaza: 300, 425, 450, 375, 420, 390, 460, 275, 385,
410, 325, 395, 415, 325, 380.
Sa se veri ce cu un nivel de semni catie de 0,05 ipoteza care a rma ca
media zilnica este de 400 de piese, indicator necesar pentru xarea normei.
Rezolvare. Se considera ca variabila care da numarul zilnic de piese urmeaza
legea normala N (m ) cu m si necunoscuti. ^n acest caz ipoteza nula este:
I
p
60
p
H0 : m = 400 piese
Deoarece abaterea standard
selectie
;
T = Xp m
n
v
u
u
=t
n
X
2
n ; 1 k=1(xk ; X ) = 54
;
T = 382p 400 = ;1854 15 = ;1 29
54
15
Deoarece T = ;1 29 2 (;2 145 2 145) rezulta ca ipoteza nula poate acceptata si anume ca media zilnica de 400 piese este corecta si poate acceptata
ca norma standard pentru toti muncitorii care executa aceeasi piesa.
3. Urmarind functionarea unei masini automate timp de 1000 zile s-a
notat numarul de rateuri din ecare zi si s-a obtinut urmatorul tabel
(Monjallon)
Numar de
rateuri pe zi
Numar
de zile
229
325
257
119
50
17
xi
ni
P (X = k) = k! e;
Rezolvare.
226
unde M (X ) =
8
8
1 X n x = 1 X n x = 1500 = 1 5
X=N
i i 1000
i i 1000
i=1
i=1
Frecvente
teoretice
calculate ni
e
223,1
334,7
251
125,5
47,1
14,1
3,5
0,8
0,2
xi
h2 =
r
X ni ; Np0
i
i=0
Np0
i
227
r
X ni ; ni
e
ni
e
i=0
2.
0
1
2
3
4
5
5,9
-9,7
6
6,5
2,9
1,4
ni
e
34,81
0,156
44,09
0,281
36
0,143
42,25
0,337
8,41
0,179
1,96
0,105
Total h2 = 1 201
228
4. O masina produce o piesa circulara. Piesa se considera buna daca diametrul sau este cuprins ^ntre 249,9 si 250,1 mm. Care este probabilitatea producerii unui rebut de catre masina respectiva ^n ipoteza ca repartitia obtinerii
pieselor urmeaza legea normala a lui Gauss cu media m = 250,02 mm si
abaterea standard 0,05 mm.
Raspuns. Pentru ^nceput vom calcula probabilitatea obtinerii unei piese bune.
^n conditiile enuntate putem scrie:
I
250
250
P (249 9 < d < 250 1) = 250 10;05 02 ; 249 90;05 02 =
= (1 6) ; (;2 4) = (1 6) + (2 4) = 0 4452 + 0 4918 = 0 937
unde ( ) este functia lui Laplace (vezi anexa). ^n concluzie probabilitatea
I
obtinerii unui rebut este
Probleme propuse
1. Probabilitatea ca o ola de vaccin sa produca ^mbolnavirea este de
0,008. ^ntre ce limite variaza numarul de ^mbonaviri, cu probabiltiatea de 95%,
I
daca se administreaza 100.000 de doze.
2. Se efectueaza de 10.000 ori o operatie nanciara si de 8.050 de ori s-a
realizat un bene ciu, ^n rest pierdere. Cu un prag de ^ncredere = 0 05 este
plauzibila ipoteza ca probabilitatea obtinerii unui bene ciu la tipul respectiv
de operatie nanciara este de 80%?
Indicatie. valoarea teoretica a frecventei absolute de obtinere a bene ciului
este m = n p = 10000 80% = 8000.
Abaterea standard la schema de tip Bernouli este
Avem
Prababiltiatea
teoretica
de accidentare
Numar de
efectuari ale
activitatii
Numar de
accidente
efective
Numar de
accidente
teoretice
A1
A2
A3
A4
A5
A6
0,079
0,083
0,081
0,0123
0,0161
0,02
3118
2933
2822
2671
2446
2261
242
250
230
36
39
47
246
ne
nt
Anexe
Tabelul lui Grubbs
P
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
0,90
0,95
0,975
0,99
0
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4772
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4986
0.4990
0.4993
0.4995
0.4997
0.4998
0.4998
1
0040
0438
0832
1217
1591
1950
2291
2611
2910
3186
3437
3665
3869
4049
4207
4345
4463
4564
4649
4719
4778
4826
4864
4896
4920
4931
4955
4966
4075
4982
4987
4991
4993
4995
4997
4998
4998
2
0080
0478
0871
1255
1628
1985
2324
2642
2939
3212
3461
3686
3888
4066
4222
4357
4474
4573
4656
4726
4783
4830
4868
4898
4922
4941
4956
4967
4976
4982
4987
4991
4994
4996
4997
4998
4999
3
0120
0517
0910
1293
1664
2019
2357
2673
2967
3238
3485
3708
3907
4082
4236
4370
4484
4582
4664
4732
4788
4834
4871
4901
4925
4943
4957
4968
4977
4983
4988
4991
4994
4996
4997
4998
4999
Zx
0
e; t2 dt
232
6
0239
0636
1026
1406
1772
2123
2454
2764
3051
3315
3554
3770
3962
4131
4279
4406
4515
4608
4686
4750
4798
4846
4881
4909
4931
4948
4961
4971
4979
4985
4989
4992
4994
4996
4997
4998
4999
7
0279
0675
1064
1443
1808
2157
2486
2794
3078
3340
3577
3790
3980
4147
4292
4418
4525
4616
4693
4756
4803
4850
4884
4911
4932
4949
4962
4972
4980
4985
4989
4992
4995
4996
4997
4998
4999
8
0319
0714
1103
1480
1844
2190
2517
2823
3106
3365
3599
3810
3997
4162
4306
4429
4535
4625
4699
4761
4808
4854
4887
4913
4934
4951
4963
4973
4980
4986
4990
4993
4995
4996
4998
4998
4999
9
0359
0753
1141
1517
1879
2224
2549
2852
3137
3389
3621
3830
4015
4177
4319
4441
4545
4633
4706
4767
4817
4857
4890
4916
4936
4952
4964
4974
4981
4986
4990
4993
4995
4996
4998
4998
4999
K( )
0.0001
0.0003
0.0005
0.0008
0.0012
0.0019
0.0028
0.0039
0.0054
0.0073
0.0097
0.0125
0.0160
0.0200
0.0246
0.0300
0.0360
0.0428
0.0503
0.0585
0.0674
0.0771
0.0875
0.0986
0.1103
0.1227
0.1357
0.1492
0.1632
0.1777
0.1926
0.2079
0.2236
0.2395
0.2557
0.2721
0.2887
0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.78
0.79
0.80
0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90
0.91
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1.00
1.01
1.02
1.03
1.04
1.05
1.06
1.07
K( )
0.3054
0.3222
0.3391
0.3559
0.3728
0.3896
0.4063
0.4230
0.4395
0.4558
0.4720
0.4880
0.5038
0.5193
0.5346
0.5497
0.5645
0.5790
0.5933
0.6072
0.6209
0.6312
0.6473
0.6600
0.6725
0.6846
0.6964
0.7079
0.7191
0.7300
0.7405
0.7508
0.7607
0.7704
0.7797
0.7888
0.7976
1
X
k=;1
1.08
1.09
1.10
1.11
1.12
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20
1.21
1.22
1.23
1.24
1.25
1.26
1.27
1.28
1.29
1.30
1.31
1.32
1.33
1.34
1.35
1.36
1.37
1.38
1.39
1.40
1.41
1.42
1.43
1.44
233
(;1)k e;2k
K( )
0.8061
0.8143
0.8222
0.8299
0.8373
0.8445
0.8513
0.8580
0.8644
0.8706
0.8765
0.8822
0.8877
0.8930
0.8981
0.9029
0.9076
0.9121
0.9164
0.9205
0.9245
0.9282
0.9319
0.9353
0.9386
0.9418
0.9448
0.9477
0.9505
0.9531
0.9556
0.9580
0.9603
0.9624
0.9645
0.9665
0.9683
2 2
1.45
1.46
1.47
1.48
1.49
1.50
1.51
1.52
1.53
1.54
1.55
1.56
1.57
1.58
1.59
1.60
1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.80
1.81
K( )
0.9701
0.9718
0.9734
0.9749
0.9764
0.9777
0.9790
0.9803
0.9814
0.9825
0.9836
0.9846
0.9855
0.9864
0.9872
0.9880
0.9887
0.9801
0.9901
0.9907
0.9913
0.9919
0.9924
0.9929
0.9933
0.9938
0.9942
0.9946
0.9949
0.9953
0.9956
0.9959
0.9962
0.9964
0.9967
0.9969
0.9971
; +1
; m2;
= Fm (t ) = p
m ; m
2
mn
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
80
120
n > 120
0.75
1.000
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.691
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.681
0.681
0.679
0.677
0.674
0.90
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.306
1.303
1.291
1.289
1.282
Zt
;1
0.95
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.690
1.684
1.671
1.658
1.645
234
2
1+ x
m
0.975
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.030
2.021
2.000
1.980
1.960
+1
; m2
0.99
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.438
2.423
2.390
2.358
2.326
dx
0.995
63657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.724
2.704
2.660
2.617
2.576
Legea
= Fm (h2 ) = m 1; m
22; 2
mn
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
60
0.005
0.000
0.010
0.072
0.207
0.412
0.676
0.989
1.34
1.73
2.16
2.60
3.07
3.57
4.07
4.60
5.14
5.70
6.26
6.84
7.43
8.03
8.64
9.26
9.89
10.5
11.2
11.8
12.5
13.1
13.8
17.2
20.7
35.5
0.01
0.000
0.020
0.115
0.297
0.554
0.872
1.24
1.65
2.09
2.56
3.05
3.57
4.11
4.66
5.23
5.81
6.41
7.01
7.63
8.26
8.90
9.54
10.2
10.9
11.5
12.2
12.9
13.6
14.3
15.0
18.5
22.2
37.5
0.025
0.001
0.051
0.216
0.484
0.831
1.24
1.69
2.18
2.70
3.25
3.82
4.40
5.01
5.63
6.26
6.91
7.56
8.23
8.91
9.59
10.3
11.0
11.7
12.4
13.1
13.8
14.6
15.3
16.0
16.8
20.6
24.4
40.5
0.05
0.004
0.103
0.352
0.711
1.15
1.64
2.17
2.73
3.33
3.94
4.57
5.23
5.89
6.57
7.26
7.96
8.67
9.39
10.1
10.9
11.6
12.3
13.1
13.8
14.6
15.4
16.2
16.9
17.7
18.5
22.5
26.5
43.2
Zh
0.1
0.016
0.211
0.584
1.06
1.61
2.20
2.83
3.49
4.17
4.87
5.58
6.30
7.04
7.79
8.55
9.31
10.08
10.86
11.65
12.44
13.24
14.04
14.85
15.66
16.47
17.29
18.11
18.94
19.77
20.60
24.8
29.1
46.5
235
2
2
x m ;1 e; x dx
0.9
2.71
4.60
6.25
7.78
9.24
10.64
12.02
13.36
14.68
16.99
17.27
18.55
19.81
21.06
22.31
23.54
24.77
25.99
27.20
28.41
29.61
30.81
32.01
33.20
34.38
35.56
36.74
37.92
39.09
40.26
46.1
51.8
74.4
0.95
3.84
5.99
7.81
9.48
11.07
12.59
14.07
15.51
16.92
18.31
19.67
21.03
22.36
23.68
25.00
26.30
27.59
28.87
30.14
31.41
32.67
33.92
35.17
36.41
37.65
38.88
40.11
41.34
42.56
43.77
49.8
55.8
79.1
0.975
5.02
7.38
9.35
11.1
12.8
14.4
16.0
17.5
19.0
20.5
21.9
23.3
24.07
26.1
27.6
28.8
30.2
31.3
32.9
34.2
35.5
36.8
38.1
39.4
40.6
41.9
43.2
44.5
45.7
74.0
53.2
59.3
83.3
0.99
6.63
9.21
11.34
13.28
15.09
16.81
18.47
20.09
21.66
23.21
24.72
26.22
27.69
29.14
30.58
32.00
33.41
34.80
36.19
37.57
38.93
4.29
41.64
42.98
44.31
45.64
46.96
48.28
49.59
50.89
57.3
63.7
88.4
236
2
199:5
800
4999
19:00
39:0
99:00
9:55
16:0
30:84
6:94
10:6
18:00
5:79
8:43
13:27
5:14
7:26
10:91
4:74
6:54
9:55
4:46
6:06
8:65
3
216
864
5403
19:16
39:2
99:17
9:28
15:1
29:46
6:59
9:98
16:69
5:41
7:76
12:06
4:76
6:60
9:78
4:35
5:89
8:45
4:07
5:42
7:59
4
225
900
5625
19:25
39:2
99:25
9:12
15:4
28:71
6:39
9:60
15:98
5:19
7:39
11:39
4:53
6:23
9:15
4:12
5:52
7:85
3:84
5:05
7:01
5
230
922
5764
19:30
39:3
99:30
9:01
14:9
28:24
6:26
9:36
15:52
5:05
7:15
10:97
4:39
5:99
8:75
3:97
5:29
7:45
3:69
4:82
6:63
6
234
937
5859
19:33
39:3
99:33
8:94
14:7
27:91
6:16
9:20
15:21
4:95
6:98
10:67
4:28
5:82
8:47
3:87
5:12
7:19
3:58
4:65
6:37
7
237
948
5930
19:35
39:4
99:35
8:89
14:6
27:7
6:09
9:07
15:0
4:88
6:85
10:5
4:21
5:70
8:26
3:79
4:99
6:99
3:50
4:53
6:18
8
239
957
5981
19:37
39:4
99:36
8:85
14:5
27:49
6:04
8:98
14:80
4:82
6:76
10:27
4:15
5:60
8:10
3:73
4:90
6:84
3:44
4:43
6:03
; + f
; m2 n Z m ;1
;m ; ;n x 2 1 + mx
n
; 2
2
0
1
161:4
648
4052
18:51
38:5
98:49
10:13
17:4
34:12
17:71
12:2
21:20
6:61
10:0
16:26
5:99
8:81
13:74
5:59
8:07
12:2
5:32
7:57
11:26
m
2
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
= Fm n (f ) = m
n
nnm
Legea Snedecor{Fisher
+
; m2 n
dx
237
16
15
14
13
12
11
10
nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
1
5:12
7:21
10:56
4:96
6:94
10:04
4:84
6:72
9:65
4:75
6:55
9:33
4:67
6:41
9:07
4:60
6:30
8:86
4:54
6:20
8:68
4:49
6:12
8:53
2
4:26
5:71
8:02
4:10
5:46
7:56
3:98
5:26
7:20
3:88
5:10
6:93
3:81
4:97
6:70
3:74
4:86
6:51
3:68
4:76
6:36
3:63
4:69
6:23
3
3:86
5:08
6:99
3:71
4:83
6:55
3:59
4:63
6:22
3:49
4:47
5:95
3:41
4:35
5:74
3:34
4:24
5:56
3:29
4:15
5:42
3:24
4:08
5:29
4
3:63
4:72
6:42
3:48
4:47
5:99
3:36
4:28
5:67
3:26
4:12
5:41
3:18
4:00
5:21
3:11
3:89
5:04
3:06
3:80
4:89
3:01
3:73
4:77
5
3:48
4:48
6:06
3:33
4:24
5:64
3:20
4:04
5:32
3:11
3:89
5:06
3:03
3:77
4:86
2:96
3:66
4:70
2:90
3:58
4:56
2:85
3:50
4:44
6
3:37
4:32
5:80
3:22
4:07
5:39
3:09
3:88
5:07
3:00
3:73
4:82
2:92
3:60
4:62
2:85
3:50
4:46
2:79
3:41
4:32
2:74
3:34
4:20
7
3:29
4:20
5:61
3:14
3:95
5:20
3:01
3:76
4:89
2:91
3:61
4:54
2:83
3:48
4:44
2:76
3:38
4:28
2:71
3:29
4:14
2:66
3:22
4:03
8
3:23
4:10
5:47
3:07
3:85
5:06
2:95
3:66
4:74
2:85
3:51
4:50
2:77
3:39
4:30
2:70
3:29
4:14
2:64
3:20
4:00
2:59
3:12
3:89
238
24
23
22
21
20
19
18
17
nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
1
4:45
6:04
8:40
4:41
5:98
8:29
4:38
5:92
8:18
4:35
5:87
8:10
4:32
5:83
8:02
4:30
5:79
7:95
4:28
5:75
7:88
4:26
5:72
7:82
2
3:59
4:62
6:11
3:55
4:56
7:01
3:52
4:51
5:93
3:49
4:46
5:85
3:47
4:42
5:78
3:44
4:38
5:72
3:42
4:35
5:66
3:40
4:32
5:61
3
3:20
4:01
5:18
3:16
3:95
5:09
3:13
3:90
5:01
3:10
3:86
4:94
3:07
3:82
4:87
3:05
3:78
4:82
3:03
3:75
4:76
3:01
3:72
4:72
4
2:96
3:66
4:67
2:93
3:61
4:58
2:90
3:56
4:50
2:87
3:51
4:43
2:84
3:48
4:37
2:82
3:44
4:31
2:80
3:41
4:26
2:78
3:38
4:22
5
2:81
3:44
4:34
2:77
3:38
4:25
2:74
3:33
4:17
2:71
3:29
4:10
2:68
3:25
4:04
2:66
3:22
3:99
2:64
3:18
3:94
2:62
3:15
3:90
6
2:70
3:28
4:10
2:66
3:22
4:01
2:63
3:17
3:94
2:60
3:13
3:87
2:57
3:09
3:84
2:55
3:05
3:76
2:53
3:02
3:71
2:51
2:99
3:67
7
2:61
3:16
3:93
2:58
3:10
3:84
2:54
3:05
3:77
2:51
3:01
3:70
2:49
2:97
3:64
2:46
2:93
3:59
2:44
2:90
3:54
2:42
2:87
3:50
8
2:55
3:06
3:79
2:51
3:01
3:71
2:48
2:96
3:63
2:45
2:91
3:56
2:42
2:87
3:51
2:40
2:84
3:45
2:37
2:81
3:41
2:36
2:78
3:36
239
8
nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
9
19:4
39:4
99:4
8:81
14:5
27:3
6:00
8:90
14:7
4:77
6:68
10:2
4:10
5:52
7:98
3:68
4:82
6:72
3:39
4:36
5:91
10
19:4
39:4
99:4
8:79
14:4
27:1
5:96
8:84
14:5
4:74
6:62
10:1
4:06
5:46
7:89
3:64
4:76
6:62
3:35
4:30
5:81
11
19:4
39:4
99:4
8:76
14:4
27:1
5:94
8:79
14:4
4:70
6:57
9:96
4:03
5:41
7:79
3:60
4:71
6:54
3:31
4:24
5:73
12
19:4
39:4
99:4
8:74
14:3
27:1
5:91
8:75
14:4
4:68
6:52
9:89
4:00
5:37
7:72
3:57
4:67
6:47
3:28
4:20
5:67
13
19:4
39:4
99:4
8:73
14:3
27:0
5:89
8:72
14:3
4:66
6:49
9:82
3:98
5:33
7:66
3:55
4:63
6:41
3:26
4:16
5:61
14
19:4
39:4
99:4
8:71
14:3
16:9
5:87
8:69
14:2
4:64
6:46
9:77
3:96
5:30
7:60
3:53
4:60
6:36
3:24
4:13
5:56
15
19:4
39:4
99:4
8:70
14:3
26:3
5:86
8:66
14:2
4:62
6:43
9:72
3:94
5:27
7:56
3:51
4:57
6:31
3:22
4:10
5:52
16
19:4
39:4
99:4
8:69
14:2
26:8
5:84
8:64
14:2
4:60
6:41
9:68
3:92
5:25
7:52
3:49
4:54
6:27
3:20
4:08
5:48
240
16
15
14
13
12
11
10
nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
1
3:18
4:03
5:35
3:02
3:78
4:94
2:90
3:59
4:63
2:80
3:44
4:39
2:71
3:31
4:19
2:65
3:21
4:03
2:59
3:12
3:89
2:54
3:05
3:78
2
3:14
3:96
5:26
2:98
3:72
4:85
2:85
3:53
4:54
2:75
3:37
4:30
2:67
3:25
4:10
2:60
3:15
3:94
2:54
3:06
3:80
2:49
2:99
3:69
3
3:10
3:91
5:18
2:94
3:66
4:77
2:82
3:47
4:46
2:72
3:32
4:22
2:63
3:20
4:02
2:57
3:09
3:86
2:51
3:01
3:73
2:46
2:93
3:62
4
3:07
3:87
5:11
2:91
3:62
4:71
2:79
3:43
4:40
2:69
3:28
4:16
2:60
3:15
3:96
2:53
3:05
3:80
2:48
2:96
3:67
2:42
2:89
3:55
5
3:05
3:83
5:05
2:89
3:58
4:65
2:76
3:39
4:34
2:66
3:24
4:10
2:58
3:12
3:91
2:51
3:01
3:75
2:45
2:92
3:61
2:40
2:85
3:50
6
3:03
3:80
5:00
2:86
3:55
4:60
2:74
3:36
4:29
2:64
3:21
4:05
2:55
3:08
3:86
2:48
2:98
3:70
2:42
2:89
3:56
2:37
2:82
3:45
7
3:01
3:77
4:96
2:85
3:52
4:56
2:72
3:33
4:25
2:62
3:18
4:01
2:53
3:05
3:82
2:46
2:95
3:66
2:40
2:86
3:52
2:35
2:79
3:41
8
2:99
3:74
4:92
2:83
3:50
4:52
2:70
3:30
4:21
2:60
3:15
3:97
2:51
3:03
3:78
2:44
2:92
3:62
2:38
2:84
3:49
2:33
2:76
3:37
241
24
23
22
21
20
19
18
17
nnm
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
0:95
0:975
0:99
1
2:49
2:98
3:68
2:46
2:93
3:60
2:42
2:88
3:52
2:39
2:84
3:46
2:37
2:80
3:40
2:34
2:76
3:35
2:32
2:73
3:30
2:30
2:70
3:26
2
2:45
2:92
3:59
2:41
2:87
3:51
2:38
2:82
3:43
2:35
2:77
3:37
2:32
2:73
3:31
2:30
2:70
3:26
2:27
2:67
3:21
2:25
2:64
3:17
3
2:41
2:87
3:52
2:37
2:81
3:43
2:34
2:76
3:36
2:31
2:72
3:29
2:28
2:68
3:24
2:26
2:65
3:18
2:23
2:62
3:14
2:21
2:59
3:09
4
2:38
2:82
3:46
2:34
2:77
3:37
2:31
2:72
3:30
2:28
2:68
3:23
2:25
2:64
3:17
2:23
2:60
3:12
2:20
2:57
3:07
2:18
2:54
3:03
5
2:35
2:79
3:40
2:31
2:73
3:32
2:28
2:68
3:24
2:25
2:64
3:18
2:22
2:60
3:12
2:20
2:56
3:07
2:18
2:53
3:02
2:15
2:50
2:98
6
2:33
2:75
3:35
2:29
2:70
3:27
2:26
2:65
3:19
2:22
2:60
3:13
2:20
2:56
3:07
2:17
2:53
3:02
2:15
2:50
2:97
2:13
2:47
2:93
7
2:29
2:72
3:31
2:27
2:67
3:23
2:23
2:62
3:15
2:20
2:57
3:09
2:18
2:53
3:03
2:15
2:50
2:98
2:13
2:47
2:93
2:11
2:44
2:89
8
2:27
2:70
3:27
2:25
2:64
3:19
2:21
2:59
3:12
2:19
2:55
3:05
2:16
2:51
2:99
2:13
2:47
2:94
2:11
2:44
2:89
2:09
2:41
2:85
Bibliogra e
1] Baron R. (coord.). Biji E., Statistica teoretica si economica, Editura Didactica si Pedagogica, Bucuresti, 1996.
2] Bron T., Angheache C., Titan, Statistica, Editura Economica, Bucuresti,
1996.
3] Badita M., Baron T., Korka M., Statistica pentru afaceri, Editura E cient,
Bucuresti, 1998.
4] Biji E., Wagner P., Lilea E., Statistica, Editura Didactica si Pedagogica,
Bucuresti, 1999.
5] Blaga P., Lupas Al., Muresan A., Matematici aplicate, vol.I, Editura Promedia Plus, Cluj{Napoca, 1999.
6] Ionescu M.H., Statistica matematica, Editura Didactica si Pedagogica, Bucuresti, 1962.
7] Jaba E., Statistica, Editura Economica, 1998.
8] Mihoc G., Micu N., Elemente de teoria probabilitatilor si statistica (Proiect
de manual), Editura Didactica si Pedagogica, Bucuresti, 1966.
9] Moineagu C., Negura I., Urseanu V., Statistica, Editura Didactica si Pedagogica, Bucuresti, 1976.
10] Porojan D., Statistica si teoria sondajului, Editura Sansa, Bucuresti, 1993.
11] Rotaru T (coord.) si colectiv, Metode statistice aplicate ^n stiintele sociale,
Editura Polirom, 2000.
242
12] Simion D., Statistica, Editura Universitatii "Lucian Blaga" din Sibiu, 2000.
13] Simion D., Variatie. Corelatie, Editura Universitatii "Lucian Blaga" din
Sibiu, 2000.
14] Stanciu S., Andrei T., Statistica { teorie si aplicatii, Editura All, Bucuresti,
1995.
15] Wagner P., Covachi I., Isaic{Maniu Al., Ionica C., Statistica, Editura Didactica si Pedagogica, Bucuresti, 1997.
16] Wagner P., Topliceanu V., Bazele statisticii, Editura Macarie, T^rgoviste,
a
1999.
17] Yule G.U., Kendall M.G., introducere ^n teoria statistica, Editia XIV revizuita, Editura Stiinti ca, Bucuresti, 1969.
18] ***, Disctionar statistico{economic, Editia a II-a, Directia Centrala de
Statistica, Bucuresti, 1969.
243