Documente Academic
Documente Profesional
Documente Cultură
Pentru iruri statistice cu numr mare de valori, acestea se grupeaz mai nti n
clase iar pentru media aritmetic se folosete procedeul multiplicrii:
3. Modulul
Prin modulul (sau dominanta) unei serii statistice se intelege valoarea caracteristicii
corespunzatoare cele mai mari frecvente daca valorile caracteristicii sunt discrete si valoarea
centrala a clasei corespunzatoare celei mai mari frecvente daca variabila este continua.
Modul este valoarea caracteristicii cea mai des observata, de unde si denumirea de
dominanta (Do) a seriei.
Determinarea grafica a modului presupune reprezentarea grafica a seriei prin diagrama in
batoane sau prin poligonul frecventelor si observarea valorii xi, care corespunde frecventei
maxime.
Determinarea modului in cazul unei serii cu caracteristica exprimata pe intervalle de variatie
egale presupune parcurgerea urmatoarelor operatii :
-
in care
1
1 + 2
x ix i1
);
b.
c.
1)
Frecvent
a
absoluta
cumulata
0
0
0
3
13
c.
19
22
24
25
Abaterea = 1.57
Problema 2
In cadrul laboratorului de matematica aplicata se considera aruncarea simultana a doua
zaruri de cate doi elevi si se inregistreaza suma punctelor obtinute pe cele doua zaruri. Se arunca
zarurile de 30 de ori. Completati un tabel care contine urmatoarele coloane: Suma obtinuta,
Frecventa absoluta, Frecventa relativa, Frecventa cumulata crescatoare. Alcatuiti diagrama in
batoane. Calculati media, dispersia si abaterea mediei patratica.
Media = 7,033333333
Dispersia = 8,165567
Abaterea = 2,857545
Problema 3
La examenul de bacalaureat, cei 500 de elevi ai unui liceu au obtinut la proba de
matematica rezultatele din tabelul alaturat. Sa se alcatuiasca histograma si poligonul
frecventelor.Calculati media, dispersia si abaterea mediei patratica.
Problema 4
Considerati urmatoarele valori 5,7 ,4, 5, 20,6,4.
a) Calculati media aritmetica si mediana acestui set de date; ce valoare vi se pare
mai potrivita pentru a caracteriza tendinta cetrala; media sau mediana?
b) Inlocuiti valoarea 20 cu 8 si recalculate cei doi indicatori ai tendintei central.
Explicati modificarile facute.
c) Adaugati 50 fiecarei valori initiale. Cum se va modifica media?
Raspuns
a)
x =
x = 51 =7.28
n
Problema 5
x 1=7.8
si
x 2=8.4
Atunci
x =
x ni = x 1 n1 + x 2 n2 =8.14 puncte
n1 +n 2
ni
Prin eroare statistica intelegem in sens larg diferenta dintre nivelul real al unui indicator sic el
rezultat din investigatia statistica.
Sistematizarea datelor statistice se realizeaza prin gruparea si clasificarea datelor statistice, adica
prin impartirea lor in grupe/clase omogene, dupa unul sau mai multe criterii de
grupare/clasificare.
Intervalul de variatie reprezinta un sir de valorinale variabilei studiate delimitat de intervalele
vecine prin limita inferioara si limita superioara.
Intervalele de variatie pot fi de marime egala sau neegala.
Pentru gruparea pe interval de variatie se recomanda utilizarea unui numar moderat de grupe.
Pentru alegerea numarului de interval de grupare (r) se poate utilize relatia lui Sturges
r=1+3.322 log10n
Pentru sistematizarea datelor pe intervale de variatie se recomanda utilizarea intervalelor de
marime egala.
Marimea intervalului (h) se recomanda a se rotunji la o valoare convenabila.
Punctul de plecare in alcatuirea intervalelor de grupare se alege, convenabil, 0 sau un numar
intreg putin mai mic decat valoarea minima din setul de date.
Limitelele intervalelor de grupare trebuie stabilite cu acuratete.
Limitele intervalelor de grupare se stabilesc exact, fara ambiguitati sau suprapunere.
Asadar pentru sistematizarea datelor pe intervale egale de grupare se prezinta urmatorii pasi:
1. Se stabileste amplitudinea variatiei caracteristicii:
A x =x maxx min
2. Se stabileste numarul de grupe r, in care or fi sistematizate datele;
3. Se calculeaza marimea aproximativa a intervalelor de grupare:
A x x
h = max min
r
r
4. Se stabilesc intervalele de grupare pornind de la
mica)
x min +hx min +2 h
x min
x maxx min +h
.
x min + ( r 1 ) hx min +rh
Seria statistica este prezentarea ordonata a datelor referitoare la manifestarile unui fenomen
colectiv sub forma a doua siruri de date : unul priveste variabila si modul cum a fost ea
sistematizata, iar al doilea- frecventa de aparitie sau nivelul unei variabile in raport cu primul sir.
Frecventa absoluta (ni) indica numarul total de unitati statistice care au valoarea variabilei
situate intr-un interval (xinf -xisup)
Frecventa relativa a grupei, indica proportia din numarul total de unitati care se incadreaza
in grupa:
ni
ni =
ni
ni
n
i=1
ni
ni =
100=
ni
ni
100
n
i=1
Frecventele absolute cumulate (Fci) reprezinta numarul unitatilor statistice care au valoarea
variabilei mai mica (sau eventual egala) cu limita superioara a grupei (deci, au valoarea
variabilei mai mare decat xiinf si mai mica decat xisup).
Frecventele relative cumulate (Fci*) reprezinta proportia unitatilor statistice care au valoarea
variabilei situate pana la limita superioara a grupei:
i
Fci = n k
k=1
si
F = nk =1,00
cr
k=1
Daca intervalele sunt neegale, pentru asigurarea comparabilitatii datelor se pot calcula
frecventele reduse la un interval etalon (standard).
cor
absolute la un factor de corelatie (I) ce reprezinta numarul intervalelor etalon ce incap intr-un
interval de grupare:
I=
hi
het
ncor
i =
ni
I
Tabelul statistic constituie o modalitate de prezentare a datelor statistice si este format dintro retea de linii paralele, orizonatale si vertical, in care sunt incadrate datele statistice.
Graficul este o imagine spatial, cu character conventional, care prin diferite mijloace plastic
de prezentare scoate in evident ceea ce este characteristic si essential in evolutia fenomenelor, in
schimbarile structural, in ceea ce priveste proportiile si corelatiile cu alte fenomene de aceeasi
natura sau calitativ diferite.
Problema 6
Un analist financiar este interesat in cunoasterea resurselor cheltuite de companiile de hard
si soft pentru cercetare-dezvoltare. Pentru 50 de astfel de firme alese intamplator, calculeaza
procentul cheltuielilor pentru carcetare-dezvoltare din totalul veniturilor din ultimul an. Datele
rezultate sunt urmatoarele:
Compani
a
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Compania
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
24
25
7.4
6.5
49
50
7.8
6.5
10
Varianta II
Intervale de variatie a
procentului din venituri
cheltuieli pt C-D
Nr. companii
5.0-6.0
6.0-7.0
7.0-8.0
8.0-9.0
9.0-10.0
10.0-11.0
11.0-12.0
Total
4
9
11
9
8
5
4
50
de
variatie
Nr.
Intervale de variatie a
procentului
din
venituri cheltuieli pt
C-D
5.0-6.0
6.0-7.0
7.0-8.0
8.0-9.0
9.0-10.0
10.0-11.0
11.0-12.0
Total
Nr. companii
5
8
13
8
7
5
4
50
procentului din
cheltuieli pt C-D
5.0-5.9
6.0-6.9
7.0-7.9
8.0-8.9
9.0-9.9
10.0-10.9
11.0-11.9
Total
venituri
companii
4
9
11
9
8
5
4
50
inf i
unde
h se mai poate calcula ca diferenta intre doua limite superioare alaturate, sau intre doua limite
inferioare alaturate
b) Pentru varianta I
Intervale de variatie a Nr.
procentului
din companii
venituri cheltuieli pt CD
5.0-5.9
4
6.0-6.9
9
7.0-7.9
11
8.0-8.9
9
9.0-9.9
8
10.0-10.9
5
11.0-11.9
4
Total
50
Frecventa cumulata
crescator
4
13
24
33
41
46
50
-
descrescato
r
50
46
37
26
17
9
4
-
12
10
nr companii
8
9
10
%intervalele pentru cercetare
11
12
Problema 7
Despre cei 500 de angajati ai unui agent economic cu activitate in domeniul
constructiilor se cunsoc urmatoarele date:
Intervale de
variatie a vechimii
in activitate (ani
Sub 10
10-15
30
peste 30
Ponderea
angajatilor (%)
5
90
12
100
15-20
30
20-25
25-
75
b)
c)
d)
e)
ni
n
n n
n =
100= i 100 ni= i (coloana3)
n
100
ni
Intervale
de
variatie a
vechimii
in prod.
(ani)
0
5-10
10-15
15-20
20-25
25-30
30-35
total
Ponderea
angajatilo
r
(%)
Frecvente
relative (
1
5
12
30
75
90
100
-
2
5
7
18
45
15
10
100
ni )
Frecvente
absolute
ni
3
25
35
90
225
75
50
500
Centre de
interval (
xi )
4
7.5
12.5
17.5
22.5
27.5
32.5
-
Frecvente absolute
cumulate
Crescator
Descresca
tor
5
25
60
150
375
450
500
-
6
500
475
440
350
125
50
-
x i=
inf
x inf
i + xi
2
(coloana 4)
Rezolvare
-se gaseste frecventa maxima nmax=60.
- se citeste in dreptul frecventei maxime, intervalul modal (60-65)
- se determina modul, prin interpolare in intervalul modal dupa formula
M o=x i1+ d
1
1 + 2
M o=60+ ( 6560 )
( 6035 )
25
=60+5 =60+3.57=63.57 mii lei
35
( 6035 ) + ( 6050 )
Problema 9
Distributia angajatilor dintr-o firma dupa numarul copiilor este prezentata in tabelul
Nr. Copiilor xi
0
1
2
3
4
5
6
Total
Nr. Angajatilor ni
16
14
24
8
5
2
1
70
Ni
16
30
54
62
67
69
70
N i = nh
h=1
U Me=
Me
U =
n+1
2
(n<100)
70+1
=35.5
2
N i U Me
in dreptul lui
Ni U
Me
N i=54 U Me
x i=M e =2 copii
Problema 9
Se considera un esantion de 20 de clienti, care intra intr-un magazin alimentar, pentru a cerceta
frecventa X cu care clientii fac apel la serviciile magazinului de-a lungul unei saptamani si
respectiv pentru cercetarea cheltuielilor lunare Y in mii lei, ale clientilor pentru procurarea de
bunuri alimentare. S-au obtinut urmatoarele date de selectie pentru X si respectiv Y.
X: 1, 2, 1, 4, 3, 2, 5, 6, 1, 2, 3, 2, 3, 4, 6, 2, 4, 3, 1, 2;
Y: 89, 90, 101, 88, 85, 77, 102, 100, 86, 97, 76, 121, 113, 110, 96, 92, 108, 112, 103, 109.
Se cere:
a)
b)
c)
.
Pentru caracteristica Y toate datele de selectie sunt distincte. Asadar, distributia empirica de
selectie a lui Y este un tablou in care pe o linie sunt trecute toate aceste valori (eventual ordonate
crescator), iar pe linia a doua se trec frecventele acestor valori, care sunt toate egale cu 1. Vom
face o grupare a datelor de selectie corespunzatoare caracteristicii Y. Anume, prima clasa
cuprinde cheltuielile lunare de la 80-89 mii lei, etc. Dupa efectuarea acestei grupari, distributia
empirica de selectie a lui Y devine
.
b) Mediile de selectie pentru cele doua caracteristici sunt respectiv
mii lei.
Daca se folosesc datele grupate pentru caracteristica Y se obtine
mii
lei
Valorile momentelor centrate de selectie de ordinul doi pentru cele doua caracteristici
sunt respectiv
.
Pentru simplificarea calculelor, se poate folosi formula
,
unde a este o constanta reala convenabil aleasa. Anume, daca pentru caracteristica X vom
alege a = 3, atunci
.
Pentru caracteristica Y vom lua a = 105, obtinandu-se astfel
.
Se observa ca
s-a calculat cu datele de selectie grupate, ceea ce conduce la o valoare
putin diferita de valoarea ce s-ar obtine cand se lucreaza cu datele de selectie primare
(negrupate).
Valorile dispersiilor de selectie pentru caracteristicile X si Y se calculeaza imediat, daca se
cunosc momentele centrate de selectie de ordinul doi, anume
,
respectiv
.
Astfel
respectiv
se
poate
obtine
mii lei.
si
pentru caracteristica X si
pentru caracteristica Y.
2. La un control de calitate se verifica diametrul pieselor prelucrate de un strung. Pentru
realizarea acestui control s-a considerat o selectie de 18 piese si s-a obtinut ca diametrul X al
pieselor are urmatoarele dimensiuni (in cm):
Diametrul (in cm)
3,98
3,99
4,00
4,01
4,02
Numar de piese
Sa se determine:
a)
b)
.
Diametrul mediu este media teoretica
. Prin urmare,
.
c) Deoarece un estimator corect al dispersiei teoretice
,
unde constanta reala a este convenabil aleasa. Asadar, in cazul de fata, o estimatie corecta a
dispersiei diametrelor fata de diametrul mediu este
.
3. Fie caracteristica X ce urmeaza legea normala N (m,s), unde m I R este cunoscut,
iar s > 0 este necunoscut. Se considera o selectie repetata de volum n. Sa se arate ca functia de
selectie
este o functie de estimatie absolut corecta pentru
parametrul
Solutie. Vom arata ca sunt satisfacute cele doua conditii din definitia functiei de
estimatie absolut corecte, adica
M(V) = s
si
lim D2 (V) = 0
Daca se face schimbarea de variabila si se tine seama de faptul ca functia de integrat obtinuta,
dupa aceea, este functie para, rezulta ca :
Prin urmare, obtinem ca M(V)= = s, deci prima conditie este
satisfacuta.
de unde
Problema Se considera caracteristica X ce urmeaza legea binomiala, adica are distributia
teoretica
b)
c)
p) ,
Pentru a scrie ecuatia de verosimilitate maxima
adica
unde
pentru parametrul p.
b) Vom arata ca estimatorul p* este un estimator absolut coret pentru parametrul p
M(p*)=p si
deci estimatorul p* este estimator absolut corect pentru parametrul p.
prin
Solutie. Deoarece volumul selectiei este n=35 > 30, putem considera ca statistica
unde
urmeaza legea normala N(0,1). Asadar, intervalul de incredere pentru media teoretica m se obtine
din relatia
sau
unde
se gaseste
De asemenea, avem ca
6 Pentru receptionarea unei marfi ambalata in cutii, se efectueaza un control, prin sondaj,
privind greutatea X a unei cutii. Pentru 22 de cutii cantarite s-a obtinut distribuirea empirica de
selectie, relativ la caracteristica X:
a mediei de selectie
anume:
obtinut
grame.
za legea normala N(0,1). Astfel, intervalul de incredere pentru diferenta m-m este:
unde
se
obtinem
determina
astfel
ca
Folosind
Anexa
I,
3.
De asemenea, avem ca
Astfel,
iar
se determina astfel incat
Student cu n grade de libertate, tabelata in Anexa II
astfel ca
care urmeaza legea 2 cu n-1 grade de libertate. Intervalul de incredere pentru s2 va fi:
iar pentru s
unde
si
respectiv
.
Solutie. Deoarece n=40>30 si abaterea standard s=3 este conoscuta, vom folosi
testul Z pentru verificarea ipotezei nule
H0 : m= M(X)=16, cu ipoteza alternativa H1 : m 16
Pentru a=0,01,
folosind
Anexa
astfel incat
Anume,
I,
se
se
obtine
ca
determina
care
ne
da
Calculam succesiv:
Deoarece
, rezulta ca se accepta ipoteza ca cheltuielile medii lunare
ale unei familii pentru abonamentele la ziare si reviste sunt de 16 mii lei, cu probabilitatea de risc
0,01.
11. Caracteristica X reprezinta gradul de ocupare zilnica a unei unitati hoteliere (in
procente), Sa se verifice, cu nivelul de semnificatie a=0,05, ipoteza ca media de ocupare zilnica a
hotelului este data prin m=80%, daca dintr-o selectie facuta in 15 zile s-au obtinut urmatoarele
date de selectie (in procente) : 60, 85, 90, 75, 84, 78, 92, 55, 77, 82, 65, 79, 83, 65, 76.
Solutie. Putem considera ca X urmeaza legea normala N(m, s ), cu m si s necunoscuti.
Ipoteza nula ce se face este H0 : m = 80, cu H1 : m 80 .
Deoarece abaterea standard s este necunoscuta, se foloseste testul T. Pentru aceasta,
considerand a=0,05,
incat
cu
ajutorul
Anexei
II,
se
pentru statistica T=
(-2,145; 2,145).
determina
astfel
Deoarece
hoteliere este de 80% se accepta.
12. La o unitate de imbuteliere a laptelui exista doua masini care efectueaza aceasta
operatie in sticle de un litru. Pentru a cerceta reglajul de imbuteliere la cele doua
masini s+au efectuat doua selectii relative la sticlele imbuteliate de cele doua masini si s-au
obtinut datele de selectie
(in ml)
(in ml)
990
995
1000
1005
1010
11
985
990
995
1000
1005
1010
catre cele doua masini sunt aceleasi, in cayul in care abaterile standard sunt = 6 ml si
ml.
Solutie. Caracteristicile X si X ce reprezinta cantitatea de lapte (in ml) continuta de o
sticla imbuteliata de prima masina, respectiv de a doua, se considera ca urmand legile de
probabilitate normele N (m, 6) si N (m, 7,5).
Verivicarea ipotezei nule H0 : m = m cu alternativa H1 : m m, se va face cu
testul Z, deoarece sunt cunoscute abaterile standard.
Folosind
nivelul
de
semnificatie
valoarea
astfel incat
care ne da intervalul (-2,58; 2,58) pentru statistica :
se
determina
din
Anexa
Se calculeaza succesiv:
.
Deoarece
semnificativ pentru cele doua masini.
13. Se cerceteaza doua loturi de ulei pentru automobile, din punct de vedere al vascozitatii,
obtinandu-se datele de selectie
Pentru primul lot:
10,27
10,28
10,29 10,30
10,32
1
Pentru al doilea lot:
10,26
10,27
10,29 10,30
10,31
, astfel incat
,
care urmeaza legea Student cu n=n+n-2 grade de libertate.
obtinandu-se
Se calculeaza pe rand
(3 10,27+22,28++110,32)=10,285;
(2 10,26+22,27++310,31)=10,289;
3,14310-4;
4,98310-4;
=
Deoarece t=-0,397 I(-2,145;2,145), rezulta ca vascozitatile medii ale celor doua loturi de
ulei nu difera semnificativ.
1 Se efectueaza o selectie repetata de volum n=12 relativa la caracteristica X ce urmeaza
legea normala N(m,d), obtinandu-se distributia empirica de selectie
, pentru
Se utilizeaza Anexa III, pentru a determina intervalul mai inainte precizat. Astfel,
deoarece
asemenea
n-1=12-1=11,
se
obtine
=3,82,
pentru
care
F11(3,82)=0,025
si
de
Se calculeaza succesiv
[1(-0,5)+2(-0,4)++11,5]=0,4167;
0,518;
h2=
=11,396
Deoarece h2=11,396 I(3,82;21,9), ipoteza nula facuta relativ la dispersia teoretica este
acceptata.
15 Doua strunguri produc acelasi tip de piese. Caracteristica cercetata este diametrul
acestor piese.Se considera doua selectii de volume n=7 si n=9, relative la diametrele pieselor
produse de cele doua strunguri. Datele de selectie sunt prezentate prin distributiile empirice de
selectie:
si respectiv
Considerand nivelul de semnificatie a=0,05, sa se verifice ipoteza nula H0:d=d, cu
alternativa H1: dd, daca se presupune ca X si X urmeaza legea normala N(m,d) si
respectiv N(m,d).
Pentru inceput se determina intervalul (f m,n;a/2; fm,n;1-a/2), pentru statistica F, folosind Anexa
IV.
Deoarece m=n-1=7-1=6
ca
(0,18;4,65).
si n=n-1=9-1=8
=0,18.
Prin
urmare,
avem
intervalul
de
pe
de
incredere
parte
pentru F este
(13,4+43,6+23,8)=3,629;
(13,5+43,6+23,7+23,8)=3,656;
0,01905;
0,01028;
f=
=1,85.
16. Se cerceteaza capacitatea fiolelor farmaceutice de 100 ml, care provin de la doua
fabrici. In acest scop, se considera cate o selectie pentru doua loturi de fiole provenite respectiv
de la cele doua fabrici. Selectiile obtinute au distributiile empirice de selectie
respectiv, pentru X:110, 101, 112, 120, 117, 105, 109, 111, 118, 113, 106, 108, 115, 113, 112,
100, 116, 112, 114, 112.
a)
b)
(1100+1101+2102++1109)=104,76;
111,2;
5,19;
27,537.
Deoarece
<
, se considera statistica F=
cu (m,n)= (n-1,n-1)=(19,24) grade de libertate.
Daca se considera ipoteza nula
H0:d2=d2, cu alternativa H1: d2d2,
avem ca f=
=5,31.
fm,n;a/2=
=2,76;
=0,3
care urmeaza legea Student cu n grade de libertate, unde n se calculeaza din relatia
, cu
Astfel , pentru determinarea lui n, avem succesiv
c=
si
=0,0404604,
de unde n=25.
Folosind Anexa II, se obtine ca t25;0,99=2,485, prin urmare intervalul pentru statistica T este
(-2,485;2,485).
Pe de alta parte ,avem ca
=
Deoarece t=-5,11(-2,485;2,485), respingem ipoteza ca mediile teoretice pentru fiolele
produse de cele doua fabrici nu difera semnificativ.
APLICAII REZOLVATE
1. Un auditor bancar a selectat 10 conturi i a nregistrat sumele existente n fiecare dintre
aceste conturi. Sumele sunt date n Euro:
150 175 195 200 235 240 250 256 275 294
Se cere:
a) s se calculeze suma medie de bani existent ntr-un cont i s se testeze proprietile
mediei;
b) s se calculeze indicatorii medii de poziie;
c) s se caracterizeze gradul de omogenitate al seriei.
14
2
15
6
16
10
17
15
18
8
19
5
20
4
Se cere:
a) s se reprezinte grafic seria;
b) s se calculeze indicatorii tendinei centrale;
c) s se calculeze indicatorii sintetici ai variaiei;
d) s se caracterizeze gradul de asimetrie;
e) s se calculeze media i dispersia caracteristicii salariai care au avut un numr de zile
de concediu mai mare sau egal cu 17