Sunteți pe pagina 1din 42

Seminarii statistica

1. Variabile aleatoare. Organizarea datelor statistice.


2. Indicatori statistici
3. Distributii statistice

Elemente de Statistica Matematica


Statistica matematica se ocupa de gruparea, analiza siinterpretarea datelor referitoare
la un anumit fenomen precum si cu unele previziuni privind producerea lui viitoare.
Populatia statistica este orice multime definite de obiecte de aceeasi natura. Elementele
unei populatii se numesc unitati statisticesau indivizi. Numarul de elemente care constituie
populatia se numestevolumul populatiei.
Caracteristica (sau variabila statistica) a populatiei trasatura comuna tuturor unitatilor
(indivizilor) populatiei. Caracteristica poate fi cantitativa sau calitativa.
Caracteristicile cantitative pot fi discrete (sau discontinue) daca variabila statistica ia
valor finite sau continue daca variabila poate lua orice valoare dintr-un interval finit sau infinit.
Numarul tuturor indivizilor unei populatii se numeste efectivul total al acelei populatii.
Se numeste frecventa absoluta a unei valori x a caracteristicii, numarul de unitati ale
populatiei corespunzatoare acestei valori.
Se numeste frecventa relativa a unei valori xi a caracteristicii raportul dintre frecventa
absoluta ni a valorii xi si efectivul total al populatiei.
2.2.3. Frecvenele distribuiilor empirice Distribuia empiric este o punere fa n fa a
intervalelor de clas ale variabilei(sau numai a centrelor claselor) cu numrul de observaii
cuprinse n fiecare clas. Frecvena absolut = numrul de observaii corespunztoare fiecrei
clase. Frecvena absolut cumulat = frecvenele absolute ale claselor, cumulate succesiv.
Frecvena relativ = raportul dintre frecvena absolut i numrul total de observaii. Frecvena
relativ cumulat =sumele succesive ale frecvenelor relative.

Elemente Caracteristice ale unei Serii Statistice


1. Media
Pentru iruri statistice formate dintr-un numr redus de valori, media aritmetic ( x )
se calculeaz cu formula:

Pentru iruri statistice cu numr mare de valori, acestea se grupeaz mai nti n
clase iar pentru media aritmetic se folosete procedeul multiplicrii:

Se numeste medii caracteristicii x numarul:


2. Mediana
Mediana
sau egale cu

este o valoare astfel incat jumatatea valorilor


si cealalta jumate a valorilor

ale esantionului sunt mai mici

sunt mai mari sau egale cu

3. Modulul
Prin modulul (sau dominanta) unei serii statistice se intelege valoarea caracteristicii
corespunzatoare cele mai mari frecvente daca valorile caracteristicii sunt discrete si valoarea
centrala a clasei corespunzatoare celei mai mari frecvente daca variabila este continua.
Modul este valoarea caracteristicii cea mai des observata, de unde si denumirea de
dominanta (Do) a seriei.
Determinarea grafica a modului presupune reprezentarea grafica a seriei prin diagrama in
batoane sau prin poligonul frecventelor si observarea valorii xi, care corespunde frecventei
maxime.
Determinarea modului in cazul unei serii cu caracteristica exprimata pe intervalle de variatie
egale presupune parcurgerea urmatoarelor operatii :
-

Aflarea frecventei maxime (ni =nmax)


Aflarea intervalului modal (xi-1,xi) corespunzator frecvetei maxime ;
Determinarea modului, prin interpolare in intervalul modal, pe baza
relatiei :
M o=x i1+ d

in care

1
1 + 2

x i1 =limita inferioaraa intervalului modal

d= marimea intervalului modal (d=

x ix i1

);

1 = diferenta dintre frecventa intervalului modal si frecventa celui precedent


2 = diferenta dintre frecventa intervalului modal si frecventa celui urmator
4. Dispersia

Numarul v se numeste dispersia valorilor esantionului.


Numarul

se numeste abaterea mediei patratelor.

Mediana Mediana este o marime fundametala, de pozitie.


Mediana (Me) reprezinta valoarea centrala a unei serii statistice, ordonate in mod crescator sau
descrescator si care imparte unitatile colectivitatii observate in doua parti egale: 50% de unitati
au valori mai mari decat mediana si 50 % au valori mai mici dec at mediana.
Problema 1
Un profesor isi ia din catalogul unei clase mediile la matematica pe semestrul trecut in
vederea unor prelucrari statistice. Acestea sunt: 6, 7, 7, 5, 9, 8, 4, 10, 7, 5, 6, 6, 7, 8, 4, 4, 6, 5, 8,
6, 7, 5, 6, 9, 7.
1)
2)

Sa se completeze un tabel care contine rubricile: Nota, Frecventa absoluta, Frecventa


relativa, Frecventa Cumulata. Realizati reprezentarea in batoane si poligonul frecventelor.
Folosind datele din tabel precizati:
a.

Cati elevi au note mai mici decat 5? Indicati procentul lor.

b.

Cati elevi au note intre 5 si 7? Indicati procentul lor.

c.

Cati elevi au note intre 7 si 10?


Indicati procentul lor.

d. Reprezentati aceste date printr-o


diagrama in forma unui disc, cu a), b), c) indicate prin sectoare ale cercului.
3)

Determinati media aritmetica, mediana, dispersia si abaterea mediei patratice.

1)

Frecvent
a
absoluta
cumulata
0
0
0
3

2) a. 3 elevi au note sub

b. 10 elevi au note intre 5 si 7.

13

c.

19
22

5. Acestia reprezinta 12%.


Acestia reprezinta 40%.
12 elevi au note intre 7 si 10. Acestia
reprezinta 48%.

24
25

3) Media aritmetica = (4*3+5*4+6*6+7*6+8*3+9*2+10)/25=6.48


Mediana = 7
Dispersia = 2.48 (calculate tabelar)

Abaterea = 1.57
Problema 2
In cadrul laboratorului de matematica aplicata se considera aruncarea simultana a doua
zaruri de cate doi elevi si se inregistreaza suma punctelor obtinute pe cele doua zaruri. Se arunca
zarurile de 30 de ori. Completati un tabel care contine urmatoarele coloane: Suma obtinuta,
Frecventa absoluta, Frecventa relativa, Frecventa cumulata crescatoare. Alcatuiti diagrama in
batoane. Calculati media, dispersia si abaterea mediei patratica.
Media = 7,033333333
Dispersia = 8,165567
Abaterea = 2,857545

Problema 3
La examenul de bacalaureat, cei 500 de elevi ai unui liceu au obtinut la proba de
matematica rezultatele din tabelul alaturat. Sa se alcatuiasca histograma si poligonul
frecventelor.Calculati media, dispersia si abaterea mediei patratica.

Problema 4
Considerati urmatoarele valori 5,7 ,4, 5, 20,6,4.
a) Calculati media aritmetica si mediana acestui set de date; ce valoare vi se pare
mai potrivita pentru a caracteriza tendinta cetrala; media sau mediana?
b) Inlocuiti valoarea 20 cu 8 si recalculate cei doi indicatori ai tendintei central.
Explicati modificarile facute.
c) Adaugati 50 fiecarei valori initiale. Cum se va modifica media?
Raspuns
a)

x =

x = 51 =7.28
n

Pentru determinarea medianei, datele se ordoneaza 4,4,5,5,6,7,20.


Se determina locul medianei in serie:
ni+ 1 = 8 =4
loc Me=
.
2
2
Seria avand un numar impar de termini, mediana este egala cu valoarea termenului central (al
patrulea), deci Me=5.
Mediana este un indicator portivit pentru a studia tendinta centrala in acest set de date, deoarece
valoarea 20 este o valoare extrema, ce afecteaza, prin magnitudine, nivelul total al variabilei si
deci valoarea mediei. Sase dintre cele sapte valori se situeaza sub valoarea mediei aritmetice,
ceea ce face ca indicatorul mediana sa exprime mai correct tendinta centrala.
b) Noile valori sunt 4,4,5,5,6,7,8.
x =5.57
x =
, Me=5.
n
Valoarea medianei nu se schimba, ea tinand cont numai de numarul valorilor mari, nu si
de valoarea lor efectiva.
c) Valorile sunt: 55,57,54, 70, 56, 54.
x =57.28= x + 50
x =
.
n

Problema 5

Doua grupe de student, cu efective de 25 si respective 32 de personae, au sustinut un test de


cultura generala. Prima grupa a obtinut media 7.8 iar a doua 8.4. Cercetarorul este interest in a
determina nota medie pe ansamlul celor doua grupe.
Raspuns
Nota medie pe ansamblul celor doua grupe se poate determina ca o medie pe medii partiale. Sa
notam
n1=25, n2 =32.
Si

x 1=7.8

si

x 2=8.4

Atunci

x =

x ni = x 1 n1 + x 2 n2 =8.14 puncte
n1 +n 2
ni

Colectarea si prezentarea datelor statistice


Datele univariate sunt cele care se refera la o singura variabila statistica. Avem deci o singura
informatie pentru fiecare unitate statistica.
Datele bivariate sunt cele care se refera la doua variabile statistice, avand asadar exact cate doua
informatii pentru fiecare unitate statistica din colectivitate. Ele pot fi analizate independent si in
interdependenta
Datele multivariate sunt cele care se refera la trei sau mai multe varibiabile statistice, obtinand
deci cate trei sau mai multe informatii pentru fiecare unitate statistica din colectivitatea studiata.
Deasemenea datele statistice pot fi clasificate in date cantitative, inregistrate pentru variabile
cantitative (numerice) si date calitative inregistrate variabile calitative (nenumerice).
Datele cantitative pot fi discrete si date continue. Daca datele se inregistreaza pentru o
succesiune de momente sau intervale de timp, lucram cu date dinamice. Daca ordinea
inregistrarii nu este relevanta datele sunt statice
Observarea statistica reprezinta actiunea de culegere de la unitatile statistice a informatiilor
referitoare la caracteristicile urmarite, dupa criterii riguros stabilite.
Observarile statistice pot fi curente, periodice sau special organizate total sau partiale; directe
sau pe baza de documente.

Prin eroare statistica intelegem in sens larg diferenta dintre nivelul real al unui indicator sic el
rezultat din investigatia statistica.
Sistematizarea datelor statistice se realizeaza prin gruparea si clasificarea datelor statistice, adica
prin impartirea lor in grupe/clase omogene, dupa unul sau mai multe criterii de
grupare/clasificare.
Intervalul de variatie reprezinta un sir de valorinale variabilei studiate delimitat de intervalele
vecine prin limita inferioara si limita superioara.
Intervalele de variatie pot fi de marime egala sau neegala.
Pentru gruparea pe interval de variatie se recomanda utilizarea unui numar moderat de grupe.
Pentru alegerea numarului de interval de grupare (r) se poate utilize relatia lui Sturges
r=1+3.322 log10n
Pentru sistematizarea datelor pe intervale de variatie se recomanda utilizarea intervalelor de
marime egala.
Marimea intervalului (h) se recomanda a se rotunji la o valoare convenabila.
Punctul de plecare in alcatuirea intervalelor de grupare se alege, convenabil, 0 sau un numar
intreg putin mai mic decat valoarea minima din setul de date.
Limitelele intervalelor de grupare trebuie stabilite cu acuratete.
Limitele intervalelor de grupare se stabilesc exact, fara ambiguitati sau suprapunere.
Asadar pentru sistematizarea datelor pe intervale egale de grupare se prezinta urmatorii pasi:
1. Se stabileste amplitudinea variatiei caracteristicii:
A x =x maxx min
2. Se stabileste numarul de grupe r, in care or fi sistematizate datele;
3. Se calculeaza marimea aproximativa a intervalelor de grupare:
A x x
h = max min
r
r
4. Se stabilesc intervalele de grupare pornind de la
mica)
x min +hx min +2 h

x min

x maxx min +h

(sau de la o valoare putin mai

.
x min + ( r 1 ) hx min +rh
Seria statistica este prezentarea ordonata a datelor referitoare la manifestarile unui fenomen
colectiv sub forma a doua siruri de date : unul priveste variabila si modul cum a fost ea
sistematizata, iar al doilea- frecventa de aparitie sau nivelul unei variabile in raport cu primul sir.
Frecventa absoluta (ni) indica numarul total de unitati statistice care au valoarea variabilei
situate intr-un interval (xinf -xisup)
Frecventa relativa a grupei, indica proportia din numarul total de unitati care se incadreaza
in grupa:

ni

ni =

ni

ni
n

i=1

Unde n reprezinta volumul total al colectivitatii. Exprimata in procente, frecventa relative a


grupei I este:

ni

ni =

100=

ni

ni
100
n

i=1

Frecventele absolute cumulate (Fci) reprezinta numarul unitatilor statistice care au valoarea
variabilei mai mica (sau eventual egala) cu limita superioara a grupei (deci, au valoarea
variabilei mai mare decat xiinf si mai mica decat xisup).
Frecventele relative cumulate (Fci*) reprezinta proportia unitatilor statistice care au valoarea
variabilei situate pana la limita superioara a grupei:
i

Fci = n k
k=1

si

F = nk =1,00

cr

k=1

Daca intervalele sunt neegale, pentru asigurarea comparabilitatii datelor se pot calcula
frecventele reduse la un interval etalon (standard).
cor

Frecventa redusa (corectata) a unui interval ( ni

) se calculeaza prin raportarea frecventei

absolute la un factor de corelatie (I) ce reprezinta numarul intervalelor etalon ce incap intr-un
interval de grupare:
I=

hi
het

ncor
i =

ni
I

Tabelul statistic constituie o modalitate de prezentare a datelor statistice si este format dintro retea de linii paralele, orizonatale si vertical, in care sunt incadrate datele statistice.
Graficul este o imagine spatial, cu character conventional, care prin diferite mijloace plastic
de prezentare scoate in evident ceea ce este characteristic si essential in evolutia fenomenelor, in
schimbarile structural, in ceea ce priveste proportiile si corelatiile cu alte fenomene de aceeasi
natura sau calitativ diferite.
Problema 6
Un analist financiar este interesat in cunoasterea resurselor cheltuite de companiile de hard
si soft pentru cercetare-dezvoltare. Pentru 50 de astfel de firme alese intamplator, calculeaza
procentul cheltuielilor pentru carcetare-dezvoltare din totalul veniturilor din ultimul an. Datele
rezultate sunt urmatoarele:
Compani
a
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

Procentul din venituri


Cheltuieli pentru C-D
%
10.5
8.4
10.5
9.0
9.2
9.7
6.6
10.6
10.1
7.1
8.0
7.9
6.8
9.5
8.1
11.5
9.9
6.9
7.5
11.1
8.2
8.0
7.7

Compania
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48

Procentul din venituri


Cheltuieli pentru C-D
%
9.5
8.2
6.9
7.2
8.2
9.6
7.2
8.8
11.3
8.5
9.4
10.5
6.9
6.5
7.5
7.1
5.2
7.7
5.9
5.2
5.6
11.7
6.0

24
25

7.4
6.5

49
50

7.8
6.5

a) Sa se sistematizeze datele, grupandu-se pe interval egale de variatie;


b) Sa se calculeze frecventele cumulate;
c) Sa se reprezinte graphic distributia companiilor dupa procentul din venituri alocat pentru
cercetare-dezvoltare. Sa se figureze in cadrul unui graphic curbele cumulative ale
frecventelelor;
Rezolvare:
a) Se noteaza cu X-caracteristica de grupare (procentul) din venituri alocat pentru
cercetare). Se parcurg urmatorii pasi:
- Se calculeaza amplitudinea variatiei caracteristicii (Ax)
Ax=xmax-xmin=11.7-5.2=6.5%
- Se stabileste numarul de grupe (r)
R= 1+3.322log n=1+3.322log 50=6.64 7 (formula lui Sturges)
10

10

Se stabileste marimea intervalului de grupare (h)


A 6.5
h= x = =1
r
7

Stabilesc intervalele de variatie si se efectueaza gruparea


A) Cu variatie continua
Varianta I

Varianta II

Intervale de variatie a
procentului din venituri
cheltuieli pt C-D

Nr. companii

5.0-6.0
6.0-7.0
7.0-8.0
8.0-9.0
9.0-10.0
10.0-11.0
11.0-12.0
Total

4
9
11
9
8
5
4
50

Nota: Limita inferioara inclusa


interval
in interval
B) Cu variatie discontinua
Intervale

de

variatie

Nr.

Intervale de variatie a
procentului
din
venituri cheltuieli pt
C-D

5.0-6.0
6.0-7.0
7.0-8.0
8.0-9.0
9.0-10.0
10.0-11.0
11.0-12.0
Total

Nr. companii

5
8
13
8
7
5
4
50

Nota: Limita superioara inclusa in

procentului din
cheltuieli pt C-D

5.0-5.9
6.0-6.9
7.0-7.9
8.0-8.9
9.0-9.9
10.0-10.9
11.0-11.9
Total

venituri

companii

4
9
11
9
8
5
4
50

Marimea intervalului in cazul variatiei discrete, se calculeaza astfel


hi=lim lim +
i

inf i

unde

reprezinta valoarea cu care se discretizeaza intervalele.

h se mai poate calcula ca diferenta intre doua limite superioare alaturate, sau intre doua limite
inferioare alaturate
b) Pentru varianta I
Intervale de variatie a Nr.
procentului
din companii
venituri cheltuieli pt CD
5.0-5.9
4
6.0-6.9
9
7.0-7.9
11
8.0-8.9
9
9.0-9.9
8
10.0-10.9
5
11.0-11.9
4
Total
50

Frecventa cumulata
crescator
4
13
24
33
41
46
50
-

descrescato
r
50
46
37
26
17
9
4
-

Pentru reprezentarea histogramei vom utiliza Matlab


>>X=[rand(4,1)+5;rand(9,1)+6;rand(11,1)+7;rand(9,1)+8;rand(8,1)+9;rand(5,1)+10;
rand(4,1)+11];
>> c=[5.5 6.5 7.5 8.5 9.5 10.5 11.5];
>> hist(X,c)
>> grid on
>> xlabel('%intervalele pentru cercetare')
>> ylabel('nr companii')
>> title('distributia companiilor dupa procentul din venituri cheltuieli pentru cercetare')

12

distributia companiilor dupa procentul din venituri cheltuieli pentru cercetare

10

nr companii

8
9
10
%intervalele pentru cercetare

11

12

Problema 7
Despre cei 500 de angajati ai unui agent economic cu activitate in domeniul
constructiilor se cunsoc urmatoarele date:
Intervale de
variatie a vechimii
in activitate (ani

Sub 10
10-15
30
peste 30

Ponderea
angajatilor (%)

5
90

12
100

15-20

30

20-25

25-

75

b)
c)
d)
e)

Sa se precizeze tipul frecventelor redate in table


Sa se determinefrecventele absolute sis a se reprezinte graphic;
Sa se calculeze centrele de interval
Sa se calculeze frecventele absolute cumulate crescator si
descrescator sis a se reprezinte graphic
f) Care este ponderea salariatilor care au o vechime de peste 25 de ani?
Cati salariati indeplinesc aceasta conditie?
Rezolvare
a) In tabel sunt redate frecventele relative cumulate crescator
b) Fie n=numarul total de angajati; n=500

ni

n
n n
n =
100= i 100 ni= i (coloana3)
n
100
ni

Intervale
de
variatie a
vechimii
in prod.
(ani)

0
5-10
10-15
15-20
20-25
25-30
30-35
total

Ponderea
angajatilo
r
(%)

Frecvente
relative (

1
5
12
30
75
90
100
-

2
5
7
18
45
15
10
100

ni )

Frecvente
absolute

ni

3
25
35
90
225
75
50
500

Centre de
interval (

xi )

4
7.5
12.5
17.5
22.5
27.5
32.5
-

Frecvente absolute
cumulate
Crescator

Descresca
tor

5
25
60
150
375
450
500
-

6
500
475
440
350
125
50
-

reprezentarea grafica se face prin histograma si poligoul frecventelor


c)

x i=

inf
x inf
i + xi
2

(coloana 4)

d) Frecventele absolute cumulate crescator si descrescator sunt calculate in


coloanele 5, respective 6, iar reprezentarea lor grafica se face cu ajutorul
curbelor frecventelor cumulate
e) Ponderea salariatilor care au peste 25 de ani vechime 15+10=25%,
respective aceasta conditie este indeplinita de 125 de salariati.
Problema 8
Distributia firmelor dintr-un sector de activitate dupa cifra de afaceri obtinuta
intr-o luna este prezentata in tabelul urmator
Cifra de afaceri (mil.
Nr. Firme ni
lei) xi
0 -50
16
50-55
30
55-60
35
60-65
60
65-70
50
70-75
14
75 si peste
5
total
210
Se cere sa se determine valoarea modala a seriei.

Rezolvare
-se gaseste frecventa maxima nmax=60.
- se citeste in dreptul frecventei maxime, intervalul modal (60-65)
- se determina modul, prin interpolare in intervalul modal dupa formula

M o=x i1+ d

1
1 + 2

M o=60+ ( 6560 )

( 6035 )
25
=60+5 =60+3.57=63.57 mii lei
35
( 6035 ) + ( 6050 )

Problema 9
Distributia angajatilor dintr-o firma dupa numarul copiilor este prezentata in tabelul
Nr. Copiilor xi
0
1
2
3
4
5
6
Total

Nr. Angajatilor ni
16
14
24
8
5
2
1
70

Ni
16
30
54
62
67
69
70

Se cere sa se determine mediana


Rezolvare
i

-determinarea sirului frecventelor cumulate

N i = nh
h=1

- calcularea unitatii mediane si gasirea locului ei in sirul frecventelor


cumulate, respectand conditia

U Me=

Me

U =

n+1
2

(n<100)

70+1
=35.5
2

N i U Me

in dreptul lui

Ni U

Me

se afla nivelul caracteristicii egal cu mediana

N i=54 U Me
x i=M e =2 copii

Problema 9
Se considera un esantion de 20 de clienti, care intra intr-un magazin alimentar, pentru a cerceta
frecventa X cu care clientii fac apel la serviciile magazinului de-a lungul unei saptamani si
respectiv pentru cercetarea cheltuielilor lunare Y in mii lei, ale clientilor pentru procurarea de
bunuri alimentare. S-au obtinut urmatoarele date de selectie pentru X si respectiv Y.
X: 1, 2, 1, 4, 3, 2, 5, 6, 1, 2, 3, 2, 3, 4, 6, 2, 4, 3, 1, 2;
Y: 89, 90, 101, 88, 85, 77, 102, 100, 86, 97, 76, 121, 113, 110, 96, 92, 108, 112, 103, 109.
Se cere:
a)
b)
c)

distributiile empirice de selectie pentru fiecare din caracteristicile X si Y,


mediile de selectie, momentele centrate de selectie de ordinul al doilea si dispersiile
de selectie pentru caracteristicile X si Y,
functiile de repartitie de selectie pentru X si Y.

Solutie. a) Se observa ca datele de selectie pentru caracteristica X au numai N = 6 valori


distincte, deci distributia empirica de selectie pentru X este

.
Pentru caracteristica Y toate datele de selectie sunt distincte. Asadar, distributia empirica de
selectie a lui Y este un tablou in care pe o linie sunt trecute toate aceste valori (eventual ordonate
crescator), iar pe linia a doua se trec frecventele acestor valori, care sunt toate egale cu 1. Vom
face o grupare a datelor de selectie corespunzatoare caracteristicii Y. Anume, prima clasa

cuprinde cheltuielile lunare de la 80-89 mii lei, etc. Dupa efectuarea acestei grupari, distributia
empirica de selectie a lui Y devine

.
b) Mediile de selectie pentru cele doua caracteristici sunt respectiv

mii lei.
Daca se folosesc datele grupate pentru caracteristica Y se obtine

mii

lei

Valorile momentelor centrate de selectie de ordinul doi pentru cele doua caracteristici
sunt respectiv

.
Pentru simplificarea calculelor, se poate folosi formula

,
unde a este o constanta reala convenabil aleasa. Anume, daca pentru caracteristica X vom
alege a = 3, atunci

.
Pentru caracteristica Y vom lua a = 105, obtinandu-se astfel

.
Se observa ca
s-a calculat cu datele de selectie grupate, ceea ce conduce la o valoare
putin diferita de valoarea ce s-ar obtine cand se lucreaza cu datele de selectie primare
(negrupate).
Valorile dispersiilor de selectie pentru caracteristicile X si Y se calculeaza imediat, daca se
cunosc momentele centrate de selectie de ordinul doi, anume

,
respectiv

.
Astfel
respectiv

se

poate

obtine
mii lei.

c) Functiile de repartitie de selectie pentru cele doua caracteristici sunt respectiv

si

pentru caracteristica X si

pentru caracteristica Y.
2. La un control de calitate se verifica diametrul pieselor prelucrate de un strung. Pentru
realizarea acestui control s-a considerat o selectie de 18 piese si s-a obtinut ca diametrul X al
pieselor are urmatoarele dimensiuni (in cm):
Diametrul (in cm)

3,98

3,99

4,00

4,01

4,02

Numar de piese

Sa se determine:
a)
b)

o estimatie absolut corecta pentru diametrul mediu al pieselor realizate,


o estimatie corecta si una absolut corecta pentru dispersia diametrelor fata de
diametrul mediu.

Solutie. a) Distributia empirica de selectie a caracteristicii X este

.
Diametrul mediu este media teoretica

. Dar se cunoaste ca un estimator

absolut corect pentru media teoretica m este media de selectie


valoarea mediei de selectie
teoretica

. Prin urmare,

este o estimatie absolut corecta pentru media

. In cazul de fata se obtine

.
c) Deoarece un estimator corect al dispersiei teoretice

este momentul centrat de

selectie de ordinul doi, adica


, rezulta ca o estimatie corecta pentru
dispersia teoretica este valoarea momentului centrat de selectie de ordinul doi, adica

,
unde constanta reala a este convenabil aleasa. Asadar, in cazul de fata, o estimatie corecta a
dispersiei diametrelor fata de diametrul mediu este

Imediat avem o estimatie absolut corecta pentru dispersia teoretica, anume

.
3. Fie caracteristica X ce urmeaza legea normala N (m,s), unde m I R este cunoscut,
iar s > 0 este necunoscut. Se considera o selectie repetata de volum n. Sa se arate ca functia de
selectie
este o functie de estimatie absolut corecta pentru
parametrul
Solutie. Vom arata ca sunt satisfacute cele doua conditii din definitia functiei de
estimatie absolut corecte, adica
M(V) = s

si

lim D2 (V) = 0

In primul rand avem ca:

Deoarece caracteristica X urmeaza legea normala N(m, s) avem ca

Daca se face schimbarea de variabila si se tine seama de faptul ca functia de integrat obtinuta,
dupa aceea, este functie para, rezulta ca :
Prin urmare, obtinem ca M(V)= = s, deci prima conditie este
satisfacuta.

Pentru verificarea celeilalte conditii putem scrie succesiv:

de unde
Problema Se considera caracteristica X ce urmeaza legea binomiala, adica are distributia
teoretica

, unde P(m,k)=Ckmpkqm-q, q=1-p,


cu parametrul p I (0,1) necunoscut. Folosind o selectie de volum n, se cere
a)

estimatorul p* de verosimilitate maxima pentru p,

b)

sa se arate ca etimatorul p* este un estimator absolut corect pentru parametrul p

c)

sa se arate ca estimatorul p* este un estimator eficient pentru parametrul p.


Solutie. a) Functia de probabilitate pentru caracteristica X este f(x;p)= Ckmpx(1m-x

p) ,
Pentru a scrie ecuatia de verosimilitate maxima

avem ca ln f= (x;p)= ln Cxm + x ln p + (m-X) ln (1-p), de unde

Asadar, ecuatia verosimilitatii maxime este

adica

unde

.Ecuatia verosimilitatii maxime se mai scrie

de unde se obtine estimatorul de verosimilitate maxima

pentru parametrul p.
b) Vom arata ca estimatorul p* este un estimator absolut coret pentru parametrul p

Pentru aceasta avem, in primul rand, ca


iar apoi, pentru dispersie se poate scrie succesiv

Asadar, s-a obtinut

M(p*)=p si
deci estimatorul p* este estimator absolut corect pentru parametrul p.

c) Cantitatea de informatie relativa la parametrul p se poate calcula dupa cum urmeaza

Pe de alta parte, am vazut ca


urmare, are

prin

loc egalitatea deci estimatorul p* este estimator eficient pentru parametrul p.


5. Relativ la populatia C se cerceteaza caracteristica X privind media teoretica M(X)=m.
Stiind ca dispersia teoretica a caracteristicii X este D2(X)=0,35, sa se stabileasca un intreval de
incredere pentru media teoretica m cu probabilitatea de incredere 1 - a = 0,95 , utilizand
distributia empirica de selectie

Solutie. Deoarece volumul selectiei este n=35 > 30, putem considera ca statistica
unde

urmeaza legea normala N(0,1). Asadar, intervalul de incredere pentru media teoretica m se obtine
din relatia

sau

unde

astfel determinat incat


In cazul de fata, valoarea mediei de selectie este:

iar din Anexa I, pentru

se gaseste

De asemenea, avem ca

Obtinem in acest fel, intervalul de incredere pentru media teoretica m=M(X)

6 Pentru receptionarea unei marfi ambalata in cutii, se efectueaza un control, prin sondaj,
privind greutatea X a unei cutii. Pentru 22 de cutii cantarite s-a obtinut distribuirea empirica de
selectie, relativ la caracteristica X:

Folosind probabilitatea de incredere 0,98 sa se determine in interval de incredere pentru valoarea


medie a greutatii cutiilor, presupunand ca X urmeaza legea normala N(m, s).
Solutie. Deoarece abaterea standard este necunoscuta, se considera
statistica

care urmeaza legea Student cu n-1 grade de libertate.


Intervalul de incredere pentru valoarea medie teoretica m= M(X) este

Pentru n 1 =21 si 1 - a = 0,98 (a = 0,02) din Anexa II se


determina
De asemenea, folosind datele de selectie, obtinem valoarea

a mediei de selectie

anume:

si valoarea abaterii standard de selectie

Putem scrie atunci intervalul (numeric) de incredere:

7. Masa de carne ambalata in pachete de 1000 de grame de masinile M 1 si M2 este o


caracteristica X, ce urmeaza legea normala N(m, s) si respectiv o caracteristica X ce urmeaza
legea normala N(m, s).
Cantarind 100 de pachete din cele produse de masina M 1 s-a obtinut valoarea medie de
selectie

grame iar din cantarirea a 150 de pachete de la masina M 2 s-a

obtinut

grame.

Folosind probabilitatea de incredere 0,98 sa se determine intervalul de incredere pentru


diferenta m-m, daca se stie ca abateriile standard sunt s=3 si s=
Solutie. Se foloseste statistica
care urmea

za legea normala N(0,1). Astfel, intervalul de incredere pentru diferenta m-m este:

unde
se
obtinem

determina

astfel

ca

Folosind

Anexa

I,

3.

De asemenea, avem ca

Astfel,

intervalul de incredere pentru diferenta m - m este

8 Fiecare caracteristica X ce urmeaza legea normala N(m,s) si care reprezinta vanzarile


in milioane de lei pe saptamana la magazinele alimentare in orasul A si X vanzarile in milioane
de lei la magazinele alimentare din orasul B si care urmeaza legea normala N(m, s). S-au
efectuat doua sondaje, respectiv pentru X si X si s-a obtinut urmatoarele date de selectie:
X: 226,5 224,1 218,6 220,1 228,8 229,6 222,5
X: 221,5 230,2 223,3 224,3 230,8 223,8
Cu probabilitatea de incredere 0,95 sa se construiasca un interval de incredere pentru diferenta m
-m, daca s > 0 este necunoscut.
Solutie. Folosind statistica

care urmeaza legea Student cu n=n+n-2=7+6-2=11 grade de libertate, se va construi intervalul


de incredere pentru mm. Anume, acest interval de incredere este:

unde, s-a folosit notatia:

iar
se determina astfel incat
Student cu n grade de libertate, tabelata in Anexa II

fiind functia de repartitie a legii

Pentru a determina valoarea numerica a intervalului de incredere, se calculeaza pe rand

De asemenea, din Anexa II, pentru 1 - a = 0,95 si n = 11, obtinem


intervalul de incredere pentru m m va fi

astfel ca

9. Fie X caracteristica ce reprezinta timpul de producere a unei reactii chimice, masurat in


secunde. Daca X urmeaza legea normala N(m,s) si avand o selectie repetata de volum n=11, cu
datele de selectie 4,21; 4,03; 3,99; 4,05; 3,89; 3,98; 4,01; 3,92; 4,23; 3,85; 4,20; sa se determine
intervalul de incredere pentru dispersia
cu probabilitatea de incredere 0,95.

si pentru abaterea standard

Solutie. Se va considera statistica

care urmeaza legea 2 cu n-1 grade de libertate. Intervalul de incredere pentru s2 va fi:

iar pentru s

unde

si

se calculeaza din Anexa III.

Pentru determinarea valorilor numerice ale acestor intervale de incredere, calculam:

Asadar, intervalele de incredere pentru s2 si s sunt

respectiv

10. Caracteristica X reprezinta cheltuielile lunare in mii lei pentru abonamentele


la ziare si reviste ale unei familii. Sa se verifice, cu nivelul de semnificatie a=0,01, daca
stim media acestor cheltuieli lunare pentru o familie este de 16 mii lei, stiind ca abaterea
standard s =3 mii lei avand o selectie repetata de volum n=40, care ne da distributia empirica de
selectie

.
Solutie. Deoarece n=40>30 si abaterea standard s=3 este conoscuta, vom folosi
testul Z pentru verificarea ipotezei nule
H0 : m= M(X)=16, cu ipoteza alternativa H1 : m 16

Pentru a=0,01,

folosind

Anexa

astfel incat

Anume,

I,
se

se
obtine

ca

intervalul numeric (-2,58;2,58), pentru statistica notata prin

determina
care

ne

da

Calculam succesiv:

Deoarece
, rezulta ca se accepta ipoteza ca cheltuielile medii lunare
ale unei familii pentru abonamentele la ziare si reviste sunt de 16 mii lei, cu probabilitatea de risc
0,01.
11. Caracteristica X reprezinta gradul de ocupare zilnica a unei unitati hoteliere (in
procente), Sa se verifice, cu nivelul de semnificatie a=0,05, ipoteza ca media de ocupare zilnica a
hotelului este data prin m=80%, daca dintr-o selectie facuta in 15 zile s-au obtinut urmatoarele
date de selectie (in procente) : 60, 85, 90, 75, 84, 78, 92, 55, 77, 82, 65, 79, 83, 65, 76.
Solutie. Putem considera ca X urmeaza legea normala N(m, s ), cu m si s necunoscuti.
Ipoteza nula ce se face este H0 : m = 80, cu H1 : m 80 .
Deoarece abaterea standard s este necunoscuta, se foloseste testul T. Pentru aceasta,
considerand a=0,05,
incat

cu

ajutorul

Anexei

II,

se

. Se obtine in acest fel

pentru statistica T=
(-2,145; 2,145).

determina

astfel

. Prin urmare, intervalul

, care urmeaza legea Student cu n-1=14 grade de libertate, este

Calculam in continuare succesisv:

Deoarece
hoteliere este de 80% se accepta.

ipoteza ca media de ocupare zilnica a unitatii

12. La o unitate de imbuteliere a laptelui exista doua masini care efectueaza aceasta
operatie in sticle de un litru. Pentru a cerceta reglajul de imbuteliere la cele doua
masini s+au efectuat doua selectii relative la sticlele imbuteliate de cele doua masini si s-au
obtinut datele de selectie

(in ml)

(in ml)

990

995

1000

1005

1010

11

985

990

995

1000

1005

1010

Folosind nivelul de semnificatie

, sa se verifice daca mediile de umplere a sticlelor de

catre cele doua masini sunt aceleasi, in cayul in care abaterile standard sunt = 6 ml si
ml.
Solutie. Caracteristicile X si X ce reprezinta cantitatea de lapte (in ml) continuta de o
sticla imbuteliata de prima masina, respectiv de a doua, se considera ca urmand legile de
probabilitate normele N (m, 6) si N (m, 7,5).
Verivicarea ipotezei nule H0 : m = m cu alternativa H1 : m m, se va face cu
testul Z, deoarece sunt cunoscute abaterile standard.
Folosind

nivelul

de

semnificatie

valoarea
astfel incat
care ne da intervalul (-2,58; 2,58) pentru statistica :

se

determina

din

Anexa

Anume, se obtine ca z0,995 = 2,58,

Se calculeaza succesiv:

.
Deoarece
semnificativ pentru cele doua masini.

, rezulta ca mediile de umplere a sticlelor nu difera

13. Se cerceteaza doua loturi de ulei pentru automobile, din punct de vedere al vascozitatii,
obtinandu-se datele de selectie
Pentru primul lot:

10,27

10,28

10,29 10,30

10,32

1
Pentru al doilea lot:

10,26

10,27

10,29 10,30

10,31

Analizele facandu-se cu acelasi aparat, se considera ca abaterile standard sunt aceleasi.


Considerand nivelul de semnificatie
cele doua loturi nu difera semnificativ.

, sa se verifice daca mediile de vascpzitate pentru

Solutie: Caracteristicile X si X, ce reprezinta vascozitatile pentru cele doua loturi de


ulei, se considera ca urmeaza fiecare legea normala, respectiv N (m, ) si N (m, ), cu
ambaterea standard > 0 necunoscuta.
Verificarea ipotezei nule H0 : m = m cu alternativa H1 : m m, se va face cu testul T,
deoarece abaterea standard este necunoscuta.
Folosind nivelul de semnificatie a=0,05, se determina , din Anexa II, valoarea tn,1(a/2)

, astfel incat

, unde numarul gradelor de libertate este

n=n+n-2=8+8-2=1 Adica, se determina t14;0;975 astfel incat


t14;0;975=2,145. In acest mod , s-a obtinut intervalul
(-2,145;2,145) pentru statistica

,
care urmeaza legea Student cu n=n+n-2 grade de libertate.

obtinandu-se

Se calculeaza pe rand

(3 10,27+22,28++110,32)=10,285;

(2 10,26+22,27++310,31)=10,289;

3,14310-4;

4,98310-4;

=
Deoarece t=-0,397 I(-2,145;2,145), rezulta ca vascozitatile medii ale celor doua loturi de
ulei nu difera semnificativ.
1 Se efectueaza o selectie repetata de volum n=12 relativa la caracteristica X ce urmeaza
legea normala N(m,d), obtinandu-se distributia empirica de selectie

Sa se verfice , cu nivelul de semnificatie a=0,05, ipoteza nula


H0 : d2=D2(X)=0,5, cu alternativa H1: d20,5.
Solutie Deoarece caracteristica X urmeaza legea normala , pentru verificarea ipotezei nule
Ho: d20,5, se utilizeaza testul c2.

Pentru nivelul de semnificatie a=0,05, se determina intervalul


statistica H2=

, pentru

,care urmeaza legea c2 cu n-1 grade de libertate.

Se utilizeaza Anexa III, pentru a determina intervalul mai inainte precizat. Astfel,
deoarece
asemenea

n-1=12-1=11,

se

obtine

=3,82,

pentru

care

F11(3,82)=0,025

si

de

=21,9. Prin urmare , intervalul pentru statistica H2 este (3,82;21,9).

Se calculeaza succesiv

[1(-0,5)+2(-0,4)++11,5]=0,4167;

0,518;

h2=

=11,396

Deoarece h2=11,396 I(3,82;21,9), ipoteza nula facuta relativ la dispersia teoretica este
acceptata.
15 Doua strunguri produc acelasi tip de piese. Caracteristica cercetata este diametrul
acestor piese.Se considera doua selectii de volume n=7 si n=9, relative la diametrele pieselor
produse de cele doua strunguri. Datele de selectie sunt prezentate prin distributiile empirice de
selectie:

si respectiv
Considerand nivelul de semnificatie a=0,05, sa se verifice ipoteza nula H0:d=d, cu
alternativa H1: dd, daca se presupune ca X si X urmeaza legea normala N(m,d) si
respectiv N(m,d).

Solutie. Pentru compararea celor doua dispersii , se utilizeaza testul F. Statistica ce se


considera in acest caz este F=
-1) grade de libertate.

, care urmeaza legea Snedecor-Fisher cu (m,n)=(n-1,n

Pentru inceput se determina intervalul (f m,n;a/2; fm,n;1-a/2), pentru statistica F, folosind Anexa
IV.

Anume, se determina fm,n;a/2 astfel incat Fm,n (fm,n;a/2) =


incat Fm,n (fm,n;1-a/2) =1-

si respectiv fm,n;1-a/2 astfel

Deoarece m=n-1=7-1=6
ca
(0,18;4,65).

si n=n-1=9-1=8

=0,18.

Prin

urmare,

avem

intervalul

de

pe

de

incredere

parte

pentru F este

Se calculeaza, apoi, succesiv:

(13,4+43,6+23,8)=3,629;

(13,5+43,6+23,7+23,8)=3,656;

0,01905;

0,01028;

f=

=1,85.

Avand in vedere ca f=1,85I(0,18;4,65), rezulta ca ipoteza facuta, privind egalitatea


dispersiilor , este admisa.

16. Se cerceteaza capacitatea fiolelor farmaceutice de 100 ml, care provin de la doua
fabrici. In acest scop, se considera cate o selectie pentru doua loturi de fiole provenite respectiv
de la cele doua fabrici. Selectiile obtinute au distributiile empirice de selectie

respectiv, pentru X:110, 101, 112, 120, 117, 105, 109, 111, 118, 113, 106, 108, 115, 113, 112,
100, 116, 112, 114, 112.
a)

Folosind nivelul de semnificatie a=0,02, sa se compare dispersiile celor doua


caracteristici;

b)

Folosind acelasi nivel de semnificatie a=0,02, sa se compare mediile celor doua


caracteristici;

Solutie. a ) Vom considera ca cele doua caracteristici X si X sunt repartizate normal,


respectiv N(m;d) si N(m;d). Se poate aplica testul F, pentru compararea dispersiilor d2 si d2.
Calculam pe rand:

(1100+1101+2102++1109)=104,76;

111,2;

5,19;

27,537.

Deoarece
<
, se considera statistica F=
cu (m,n)= (n-1,n-1)=(19,24) grade de libertate.
Daca se considera ipoteza nula
H0:d2=d2, cu alternativa H1: d2d2,

, care urmeaza legea Snedecor-Fisher

avem ca f=

=5,31.

Pe de alta parte, pentru a=0,002, avem din Anexa IV, ca


fm,n;1-a/2=

fm,n;a/2=

=2,76;

=0,3

In acest fel , am obtinut intervalul (0,34;2,76), pentru statistica F.


Deoarece f=5,31(0,34;2,56),respingem ipoteza d2=d2.
b) Avand in vedere ca dispersiile teoretice d2 si d2 sunt necunoscute, iar comform
punctului precedent difera in mod semnificativ, folosim testul T pentru compararea mediilor m
si m. Statistica ce se considera , in acest caz , este:

care urmeaza legea Student cu n grade de libertate, unde n se calculeaza din relatia

, cu
Astfel , pentru determinarea lui n, avem succesiv

c=

si

=0,0404604,

de unde n=25.
Folosind Anexa II, se obtine ca t25;0,99=2,485, prin urmare intervalul pentru statistica T este
(-2,485;2,485).
Pe de alta parte ,avem ca

=
Deoarece t=-5,11(-2,485;2,485), respingem ipoteza ca mediile teoretice pentru fiolele
produse de cele doua fabrici nu difera semnificativ.

APLICAII REZOLVATE
1. Un auditor bancar a selectat 10 conturi i a nregistrat sumele existente n fiecare dintre
aceste conturi. Sumele sunt date n Euro:
150 175 195 200 235 240 250 256 275 294
Se cere:
a) s se calculeze suma medie de bani existent ntr-un cont i s se testeze proprietile
mediei;
b) s se calculeze indicatorii medii de poziie;
c) s se caracterizeze gradul de omogenitate al seriei.

2. Distribuia salariailor unui magazin n funcie de numrul de zile de concediu de odihn


dintr-un an se prezint astfel:
Zile concediu
Nr salariati

14
2

15
6

16
10

17
15

18
8

19
5

20
4

Se cere:
a) s se reprezinte grafic seria;
b) s se calculeze indicatorii tendinei centrale;
c) s se calculeze indicatorii sintetici ai variaiei;
d) s se caracterizeze gradul de asimetrie;
e) s se calculeze media i dispersia caracteristicii salariai care au avut un numr de zile
de concediu mai mare sau egal cu 17

S-ar putea să vă placă și