Documente Academic
Documente Profesional
Documente Cultură
matematică
138
Elemente de matematică
139
Elemente de statistică matematică
140
Elemente de matematică
3. observarea statistică,
4. prelucrarea datelor,
5. analiza datelor,
6. inferenţa statistică,
7. decizia statististică.
Enunţarea obiectivelor trebuie sa fie clară să ţină seama de condiţiile de
desfăşurare a sondajului.
Obiectivele unui sondaj pot fi estimarea unor caracteristici ale unei distribuţii
statistice sau verificarea unor ipoteze privind legătura dintre fenomene, evoluţia
fenomenelor analizate.
Problema fundamentală a cercetărilor prin sondaj este plecând de la datele
înregistrate asupra unei părţi reprezentative dintr-o colectivitate şi calculând anumite
valori caracteristice ale eşantionului să se afle parametrii populaţiei globale.
Eşantionarea - această etapă presupune alegerea din populaţia generală a unui
număr exact de indivizi ce va fi reprezentativ pentru colectivitate.
Selecţia unui eşantion se poate face prin diferite metode (Stoleriu, 2010):
- selecţie simplă de un volum dat prin care toţi indivizii ce compun populaţia au
aceeaşi şansă; (toţi studenţii ce participă la un seminar au aceeaşi şansă să fie scoşi la
tablă).
- selecţie sistematică - presupune aranjarea populaţiei studiate după o anumită
schemă (aleg primul student aleator apoi pe ceilalţi dupa schema din 5 în 5 candidaţi
înscrişi);
- selecţie stratificată - în care populaţia este separată pe categorii şi alegerea se
face la întâmplare din fiecare categorie (aleg un număr de studenţi din fiecare judeţ în
funcţie de cât de mare este populaţia judeţului);
- selecţie ciorchine - populaţia este împărţită pe categorii şi selectăm indivizi din
fiecare categorie (alegem studenţii dupa anumite categorii – alegem studenţii din
anumite judeţe);
- selecţia de tip experienţă - care ţine cont de elementul temporar în selecţie
(encefalogramă);
- selecţie de convenienţă - pentru un studiu în care dorim să analiză cât de
cunoscută este o facultate alegem respondenţii dintre studenţii care se înscriu la acea
facultate;
- selecţie de judecată - profesorul decide ce student intră în selecţie şi cine nu;
- selecţie de cotă - alegerea în urma unui vot, se vor primi un număr de locuri
proporţional cu numărul de voturi primite.
142
Elemente de matematică
Definţie 1: Seriile statistice sunt şiruri de date, care pot fi grupate după unul din
criteriile generale cunoscute în statistică: gruparea în timp; gruparea în spaţiu şi
gruparea calitativă.
143
Elemente de statistică matematică
<n.
144
Elemente de matematică
Tabel 3
Diametrul piesei xi (cm) ni = Nr. de piese
[2, 5) 5
[5, 10) 4
[10, 15) 3
[15, 20) 4
[20, 25) 4
[25, ) 3
În continuare vom prezenta tot o serie cu caracteristici cantitative, dar cu două
caracteristici ale studenţilor: culoarea ochilor şi culoarea părului. În acest caz citirea
tabelelor devine greoaie şi este necesară o nouă grupare a datelor.
Tabel 4
Culoarea ochilor
Culoarea părului negri căprui verzi albaştri Total
Negru 145 285 30 11 471
Castaniu 62 431 87 67 647
Blond 33 36 185 128 382
Total 240 752 302 206 1500
145
Elemente de statistică matematică
Diferitele reprezentări grafice ce apar aici sunt ale datelor din paragraful
anterior. De exemplu la reprezentarea grafică prin puncte am ales să reprezentăm
numărul de studenţi în funcţie de notele pe care le-au obţinut.
Fiecare punct ce apare în grafic are două valori ataşate: abscisa şi ordonata. La
valoarea 6 de pe axa orizontală (nota 6) îi corespunde valoarea 16 pe axa verticală
(numărul de studenţi ce au luat nota 6) (fig. 9).
25
20 21
Numar studenti
15 16 15
12 12
10 10
5 5
0 1 1
0 1 2 3 4 5 6 7 8 9 10 11
Nota examen
25
21
20
Numar studenti
16 15
15 12 12
10
10
5
5
1 1
0
2 3 4 5 6 7 8 9 10
Nota examen
146
Elemente de matematică
Figura 11 - Histograma
1, 1% 1, 1%
5, 5% 2
10, 11% 3
12, 13%
15, 16% 4
16, 17% 5
21, 23% 6
12, 13%
7
8
9
147
Elemente de statistică matematică
100%
80%
60%
40%
20%
0%
negri căprui verzi albaştri
Exemplu:
La o bancă s-au înregistrat depunerile efectuate într-o lună şi s-a obţinut tabelul:
Sume depuse
[1, 7) [7, 11) [11, 21) [21, 27) [27,31)
(mil. Lei)
Număr
34 19 18 28 12
deponenţi
R: Pentru o bună reprezentare a datelor vom calcula valoarea medie a intervalului apoi
vom reprezenta grafic.
Sume depuse
[1, 7) [7, 11) [11, 21) [21, 27) [27,31)
(mil. Lei)
Media
4 9 16 24 29
intervalului
Număr
34 19 18 28 12
deponenţi
40
Numar depunatori
30 34
28
20 19 18
10 12
0
3 8 13 18 23 28
Sume depuse (in medie) (mil lei)
148
Elemente de matematică
40 34
Numar depunatori
28
30
19 18
20 12
10
0
4 9 16 24 29
Sume depuse (in medie) (mil lei)
Număr
Număr deponenţi,
deponenţi, 19, 17%
18, 16%
4 9 16 24 29
Figura 14 - Reprezentarea grafică a numărului de clienţi prin puncte, coloane şi sector de disc.
Exerciţii
149
Elemente de statistică matematică
nivelul unei populaţii, unde valorile xi reprezintă valori posibile ale caracteristicii.
caracteristicii X determinate anterior şi funcţia f este continuă mai puţin într-un număr
finit de valori.
Definiţie 3. Numim media valorilor unei serii statistice valoarea notată x calculată
după una din formulele:
Media simplă
n
x x ... xn
x
i 1
i
x 1 2 .
n n
x1k1 x2 k2 ... xn kn n
xi pi , unde ponderea este pi n i
k
x
k1 k2 ... kn i 1
ki i 1
Media pătratică
150
Elemente de matematică
x12 x 22 ... x 2n x
i 1
2
i
xp .
n n
Observaţie: 1. Media aritmetică reprezintă valoarea pe care ar purta-o fiecare element
din eşantion dacă distribuţia ar fi omogenă.
2. Media armonică este utilizată de multe ori în calculul indicelui mediu armonic al
preţurilor (Jaba 2000).
xi x
di xi x respectiv d i % 100 , i=1, ... n.
x
x x
i 1
i
d ,
n
n
d k x i x pi .
i 1
Definţie 6. Dispersia este media aritmetică a pătratelor abaterilor faţă de medie ale
valorilor seriei statistice. Pentru date negrupate avem:
2 1 i 1
,
n n
x x ki
2
x1 x k1 x2 x k2 ... xn x kn
2 2 2
i
k2 i 1
.
k1 k2 ... kn n
ki
i 1
x i x
2
2 i 1
,
n
Respectiv pentru date grupate:
151
Elemente de statistică matematică
x x ki
2
k i 1
n
.
k
i 1
i
Definiţie 8. Raportul dintre abaterea medie pătratică şi valoarea medie a unei serii
statistice se numeşte coeficient de variabilitate (variaţie) notat C.V.
C.V .( X )% 100.
x
x
i 1
i
1850
Media x 370 lei /sac.
n 5
Abaterile individuale sunt calculate în tabel în coloanele a doua şi a treia.
n
x x i
60
Abaterea medie liniară d i 1
12 lei /sac.
n 5
Folosind această valoare determinăm primul interval mediu de variaţie:
I d x d , x d 370 12, 370 12 358, 382 lei /sac.
152
Elemente de matematică
x i x
2
1000
Varianţa: 2 i 1
200 lei/sac.
n 5
n
x i x
2
Deviaţia standard: 2 i 1
200 14,142 lei/sac.
n
Folosind această valoare determinăm al doilea interval mediu de variaţie:
I x , x 370 14.142, 370 14.142 355.855, 384.142 lei /sac.
Coeficientul de variaţie:
14.142
C.V .( X )% 100 100 0.0382 100 3.82% .
x 370
Interpretare:
Preţul mediu de vânzare a unui sac de porumb în cele 5 magazine este de 370
lei/sac şi se abate în medie de la preţul mediu cu 12 lei /sac. Din al doilea interval mediu
de variaţie constatăm că 68% din vânzători au un preţ cuprins între 355.855 lei/sac şi
384.142lei/sac. Coeficientul de variaţie arată o dispersie mică (<17%) ceea ce reprezintă
un set de date cu distribuţie omogenă şi media este reprezentativă pentru datele
analizate.
Observaţie: În cazul în care datele adunate în urma experimentului sunt grupate
în intervale atunci se va folosi pentru calculele anterioare valoarea din mijlocul fiecarui
interval ( xi* ). În continuare prezentăm un asemenea exemplu.
Exemplu:
x
*
n i ki
N ki 60 , media: x
3940
i 1
65.66 locuri de cazare.
i 1 N 60
x x ki
n
2
23273.33
Varianţa: 2 i 1
387.89 .
N 60
153
Elemente de statistică matematică
xi ki xi
xi ki
xi x x
i
x
2
x
i
2
x ki
[20,40) 8 30 240 -35.67 1272.11 10176.89
[40,60) 10 50 500 -15.67 245.44 2454.44
[60,80) 32 70 2240 4.33 18.78 600.89
[80,100) 7 90 630 24.33 592.11 4144.78
[100,120) 3 110 330 44.33 1965.44 5896.33
suma 60 3940 23273.33
n
x x ki
2
23273.33
Deviaţia standard: i 1
19.69 locuri de
N 60
cazare.
Coeficientul de variaţie
19.69
C.V .% 100 100 0.2998 100 29.98 30% .
x 65.66
Interpretare:
În cazul acestui sondaj numărul de locuri de cazare mediu la unităţile verificate
este de 65,66 locuri. Abaterea media pătratică este de 19,69 locuri de cazare faţă de
media de 65,66 locuri de cazare. Coeficientul de variaţie este de aprovimativ 30% ceea
ce înseamnă că fenomenul are o repartiţie slab omogenă şi că valoarea medie este slab
reprezentativă.
Exerciţiu
Definiţie 9. Se numeşte frecvenţa absolută a unei valori x numărul de apariţii ale acelei
valori în efectivul total.
Tabel 5
Nr. de studenţi= Frecvenţa
Nota
Frecvenţa absolută relativă
1
2 1 0,01
100
3 1 0,01
4 5 0,05
5 14 0,14
6 16 0,16
7 17 0,17
8 21 0,21
9 15 0,15
10 10 0,10
Total 100
Definiţie 10. Se numeşte frecvenţă relativă a unei valori x raportul dintre frecvenţa
absolută a valorii x şi volumul selecţiei.
Notăm:
f x
nx
,
n
unde f(x) este frecvenţa relativă a valorii x, nx este frecvenţa absolută a acestei valori, iar
n este efectivul total al selecţiei.
x x2 xn
X : 1 ,
p1 p2 pn
unde pe prima linie sunt trecute valorile variabilei, iar în cea de-a doua linie
probabilităţile corespunzătoare acelei valori.
Tabel 6
Valori Frecvenţa
x1 p1
x2 p2
x3 p3
... ...
xn pn
Observaţie:
Suma frecvenţelor relative ale tuturor valorilor variabilei este 1.
155
Elemente de statistică matematică
Definiţie 11. Se numeşte frecvenţa absolută cumulată crescătoare a unei valori x suma
frecvenţelor absolute ale tuturor valorilor variabilei care sunt mai mici sau egale cu x.
Definiţie 13. Se numeşte frecvenţă relativă cumulată crescătoare a unei valori x suma
tuturor frecvenţelor relative ale valorilor care sunt mai mici sau egale cu x.
Tabel 7
1 2 3 4 5 6 7
Nota Frecvenţa Frecvenţa Frecvenţa Frecvenţa Frecvenţa Frecvenţa
absolută relativă absolută absolută relativă relativă
cumulată cumulată cumulată cumulată
crescătoare descrescătoare crescătoare descrescătoare
2 1 0,01 1 100 0,01 1
3 1 0,01 2 99 0,02 0,99
4 5 0,05 7 98 0,07 0,98
5 14 0,14 21 93 0,21 0,93
6 16 0,16 37 79 0,37 0,79
7 17 0,17 54 63 0,54 0,63
8 21 0,21 75 46 0,75 0,46
9 15 0,15 90 25 0,90 0,25
10 10 0,10 100 10 1 0,10
Exemplu:
Într-un cartier al unui oraş distribuţia familiilor după numărul de copii este dată
de tabelul:
xi 0 1 2 3 4 5 6 7
ni 18 30 32 28 22 10 12 11
156
Elemente de matematică
a). Să se calculeze numărul de familii care au cel puţin 4 copii şi cel mult 3 copii.
b). Să se calculeze ponderea familiilor cu 5 copii, ponderea familiilor cu cel mult 4
copii şi ponderea familiilor cu cel puţin 3 copii.
c). Să se calculeze numărul mediu de copii pe familie în acest cartier.
Soluţie:
a). numărul de familii care au cel puţin 4 copii = 55 familii (coloana 5);
numărul de familii care au cel mult 3 copii = 108 familii (coloana 4);
b). ponderea familiilor cu 5 copii = 0.061 * 100 = 6,1% (coloana 3);
ponderea familiilor cu cel mult 4 copii = 0.798 * 100 = 79.8 % (coloana 6);
ponderea familiilor cu cel puţin 3 copii = 0.509 * 100 = 50.9 % (coloana 7);
7
x k i i
465
c. numărul mediu de copii pe familie = i 1
7
2.852 copii pe familie.
k
163
i
i 1
Exerciţiu
Repartiţia frecvenţelor absolute ale elevilor olimpici dintr-un total de 100 de şcoli
este dată de tabelul:
x (nr. de olimpici) 2 3 4 5 6 7 8
y (frecvenţa absolută) 5 6 7 10 23 24 25
Se cere să se determine frecvenţele absolute şi relative simple şi cumulate. Să se
determine ponderea şcolilor ce au cel puţin 7 elevi olimpici şi numărul şcolilor cu cel
mult 4 elevi olimpici.
157
Elemente de statistică matematică
Pentru a evidenţia o relaţie între două sau mai multe seturi de date (două sau
mai multe variabile) este necesar să le studiem cu ajutorul unei analize de corelaţie sau a
unei analize de regresie.
Analiza de regresie este o metodă statistică care permite studierea şi măsurarea
relaţiei care există între două sau mai multe variabile, iar analiza de corelaţie este o
metodă statistică în care se măsoară intensitatea legăturii dintre variabile (Jaba 2000).
În urma unei cercetări ştiinţifice se măsoară pentru diferite caracteristici valori
diferite grupate în seturi de date. Un cercetător doreşte să folosească rezultatele
obţinute pentru a stabili dacă un set de date determină valorile celorlate seturi de date.
Acest lucru este necesar pentru a se constata dacă există legături între valorile măsurate
ale caracteristicilor analizate.
Metoda care se foloseşte pentru a descrie relaţia între valorile a două sau mai
multe seturi de date se numeşte metoda regresiei.
Observaţie: Pearson în anul 1908 a introdus noţiunea de regresie.
Regresiile pot fi liniare dacă legătura între date este de tip liniar sau regresii
neliniare dacă legăturile sunt de tip polinomial, exponenţial, logaritmic.
Vom considera doar două seturi de date obţinute în urma a n măsurători pentru
două caracteristici pe acelaşi eşantion ales xi şi yi , unde i 1, ..., n .
158
Elemente de matematică
9 10
7 8
5 6
3 4
2
1
0
-1 0 5 10 0 5 10
Figura 15 - Nor de puncte cu valori dependente (a) şi cu valori independente (b)
x1 x2 x3 xn
y1 y2 y3 yn
h a, b yi yi
n
2
Considerăm funcţia h: 2
definită
i 1
i 1
să aibă valoare minimă (suma pătratelor diferenţelor dintre yi şi yi să fie cea mai
n 2 n n
a
i 1
xi b
i 1
xi
i 1
xi yi ,
n n
a x n b
i 1
i
i 1
yi .
Acest sistem este întotdeauna compatibil determinat pentru valori diferite ale
lui xi . În concluzie punctul a, b este un punct de extrem pentru funcţia
h a, b yi yi .
n
2
i 1
Regresie neliniară
Al doilea procedeu este să căutăm o funcţie polinomială de forma (Burdujan,
2006):
y a x
n
h a0 , a1 ,...,an
2
i n
n
an1 x n1 an2 x n2 ... a1 x1 a0 x 0 .
i 0
na0 a1 xi a2 xi 2
yi ,
i 1 i 1 i 1
n n n n
0
a xi a1 xi
2
a2 x 3
i xi yi ,
i 1 i 1 i 1 i 1
n n n n
i 1
a0 xi2 a1 xi3 a2 xi4
i 1
i 1
i 1
xi2 yi ,
n a x
m
şi vor minimizează valoarea expresiei: h a0 , a1 , a2
2
i 2
2
a1 x1 a0 .
i 0
160
Elemente de matematică
Exemplu:
100 10 43 30 13
şi găsim valoarile lui a 0.1538 şi b 2.6
650 65 5 5
Interpretare:
161
Elemente de statistică matematică
Exerciţii
x 33 29 22 12 9
y 144 81 49 36 9
Definiţie 32. Fie X şi Y două variabile ce admit medie. Se numeşte corelaţie a celor două
variabile:
x x yi y
n
i
r i 1
.
x x yi y
n n
2 2
i
i 1 i 1
. 1
n n n
x y i i
n
x i
y i
r i 1 i 1 i 1
x n x y n y
n
1
2 1 n
2 n
2
n 2
i i i i
i 1 i 1 i 1 i 1
Interpretare:
1. dacă coeficientul de corelaţie r ia o valore apropiată de -1 indică o corelaţie
negativă puternică, adică valorile unei variabile vor scade puternic când valorile ceilalte
variabile vor creşte;
2. dacă coeficientul de corelaţie r ia o valore apropiată de +1 indică o corelaţie
pozitivă puternică, adică valorile unei variabile vor creşte puternic când valorile ceilalte
variabile cresc.
Exemplu:
Se consideră datele obţinute de un fermier la un soi de porumb de pe 10 parcele
agricole privind două variabile suprafaţa (hectare) şi producţia la porumb (tone).
xi
5.5 6.7 8.1 9.5 7.2 5.3 9.3 4.1 7.1 3.2
(ha)
yi
1.56 1.64 1.77 1.87 1.61 1.49 1.98 1.32 1.71 0.99
(tone)
163
Elemente de statistică matematică
dispersia 2 .
164
Elemente de matematică
x1 x2 xn
ˆ x
n
unde valorile x1 , x2 , , xn sunt valorile observate ale selecţiei iar n este volumul acesteia.
2
selecţie s :
1
ˆ 2 s 2 xi x pentru n 30,
n
2
n i 1
1
xi x pentru n 30.
n
ˆ 2 s 2
2
n 1 i1
165
Elemente de statistică matematică
încredere să acopere parametrul . Cu cât valoarea lui este mai mică cu atât şansa
este mai mare.
Modul de lucru pentru determinarea intervalului de încredere este următorul: se
pleacă de la o estimaţie a valorii parametrului pentru un eşantion al populaţiei şi se
determină extremităţile intervalului de încredere.
I x z ,xz .
n n
Interpretare:
Cu o probabilitate de 1 100% se poate considera că valorile parametrului
166
Elemente de matematică
Exemplu:
1. Producţia de trifoi de pe 10 loturi (în tone) a fost: 0.8; 1.3; 1.5; 1.7; 1.7; 1.8;
2.0; 2.0; 2.0 şi 2.2. Să se determine un interval de încredere pentru media de selecţie cu
nivel de încredere 0.05 ştiind că 0.46 .
Soluţie:
Analizăm tabelul din anexa 1 şi căutăm valoarea funcţiei 0.475. O găsim pe linia 1.9 şi
coloana 6, deci z 1.96 .
0.46 0.46
Din ipoteză cunoaştem valoarea 0.46 şi 0.145 .
n 10 3.162
x z , xz 1.7 1.96 0.145, 1.7 1.96 0.145
n n
1.7 0,2842, 1.7 0.2842 1.4158,1.9842 .
Interpretare:
Cu o probabilitate de 95% se poate considera că producţia de trifoi de pe 10
loturi (în tone) este acoperită de intervalul I 1.4158, 1.9842 . Există un risc de 5%
x
1
8 10 12 8 11 14 10 12 10.625 .
8
Pas. 2. Analog ca în exemplul anterior se calculează valorea z 1.96 .
Pas. 3. Intervalul de încredere este:
167
Elemente de statistică matematică
1.84 1.84
x z , xz 10.625 1.96 8 , 10.625 1.96 8
n n
Interpretare:
Cu o probabilitate de 95% se poate considera că media producţiei de plante
medicinale pe parcele de 10 m2 este acoperită de intervalul I 9.351, 11.899 .
ˆ ˆ
I x t , x t .
2
;n1
n 2
;n1
n
Exemplu:
Fie un eşantion de volum n 5 firme dintr-un oras T cu cheltuieli în luna
august X : 10, 8, 12, 6, 4. (mii lei). Să se estimeze prin interval de încredere cheltuielile
firmelor din oraşul T , considerând un nivel de risc 0,05 .
ˆ ˆ
I x t , x t .
2
;n1
n 2
;n1
n
n
x
i 1
i
10 8 12 6 4 40
x 8.
n 5 5
168
Elemente de matematică
x x
n
10 8 8 8 12 8 6 8 4 8
2
2 2 2 2 2
i
ˆ i 1
de unde
n 1 4
ˆ 8 2.83 .
Pentru a calcula valoarea t t 0.025;4 se utilizeaza tabelul din Anexa 2. t0.025;4 2.776 ,
;n1
2
2.83 2.83
I 8 2.776 , 8 2.776 .
2.23 2.23
Adică
I 8 2.776 1.26, 8 2.776 1.26 .
I 8 3.497, 8 3.497 .
I 4.503,11.497 .
Interpretare:
Cu o probabilitate de 95% se poate considera că firmele din oraşul T vor
cheltui în luna august o sumă ce se va situa în intervalul I 4.503,11.497 mii lei. Există
Scopul testării ipotezelor statistice este acela de a verifica dacă valoarea unui
parametru (medie, dispersie etc.) este egală cu valoarea estimată a acestuia calculată
utilizând datele de la un eşantion reprezentativ.
Înainte de a continua considerăm următorul exemplu.
Un fermier doreste să cumpere o tonă de seminţe de porumb de un anumit tip
cu condiţia ca producţia obţinută în medie la hectar să fie de 500kg
( 0 500 ). Vom considera ipoteză nulă 0 500 . Fermierul nu va cumpăra
cantitatea propusă dacă testul statistic arată că valoarea reală 1 500 pentru că
acest lucru indică o producţia medie la hectar mai mică decât valoarea stabilită.
Valoarea 1 500 se numeşte ipoteză alternativă a testului.
Dacă testul statistic indică ipoteză nulă adevărată atunci această ipoteză este
acceptată, în caz contrar ipoteza va fi respinsă.
Totuşi există un risc ca decizia luată să fie greşită. Vom nota prin
probabilitatea de a respinge ipoteza nulă când de fapt aceasta este adevărată. Această
valoare se numeşte nivelul de semnificaţie al testului.
169
Elemente de statistică matematică
factori aleatori (erori de măsurare etc.) sau dacă este semnificativă pentru populaţia
studiată.
Presupunem că producţia medie obţinută la hectar are o variabilă X cu
aleatoare
X 0
Z are o distribuţie N 0,1 .
n
Trebuie să alegem nivelul de semnificaţie 0.05 . Dacă ipoteza nulă este
adevărată probabilitatea ca o valoare calculată z a variabilei Z să fie mai mică decât
valoarea critică LI este 0.05 . Deci dacă pentru selecţia pe care am făcut-o
observăm că valoarea z calculată este mai mare decât valoarea critică atunci acceptăm
ipoteză nulă.
O ipoteză statistică este întotdeauna o presupunere asupra populaţiei şi nu
asupra selecţiei. Presupunerea făcută poate fi adevărată sau falsă şi de aceea se
numeşte ipoteză.
Considerăm o variabilă X a cărei funcţie de repartiţie depinde de un parametru
şi vom verifica ipoteza conform căreia parametrul este egal cu 0 . Putem
presupune că în afară de valoarea 0 putem alege şi alte valori 1 , 2 , 3 pentru
Numim ipoteza H 0 : 0 ipoteza nulă. Orice altă ipoteză care se opune lui H 0 se va
170
Elemente de matematică
ipoteza alternativă H1 : 0 .
Definiţie 19. Intervalul dintr-o distribuţie de selecţie a unei variabile considerate în care
este respinsă ipoteza nulă se numesţe interval de respingere.
Intervalul în care este acceptată, printr-un test, ipoteza nulă se numeşte interval de
acceptare (interval de încredere) cuprins între , limita inferioară t1 şi limita superioară
t2 .
Am ales două selecţii de studenţi de la o facultate, din diferiţi ani de studiu, care
au luat examenul la matematică (studenţi şi studente). Aleg un nivel de risc 0.05 şi
facem 7 observaţii. Vom utiliza testul Fisher pentru examinarea varianţelor a două
populaţii (dacă sunt egale sau nu).
Etapele testării:
1. Alegem un nivel de risc echivalent cu un nivel de semnificaţie 1 .
2. Alegem câte o selecţie din fiecare populaţie x1 , x2 , , xn şi y1 , y2 , , yn .
12
3. Construim un interval de încredere pentru la nivelul de semnificaţie
22
1 .
Dacă valoarea 1 se găseşte în intervalul de încredere atunci acceptăm ipoteza
H 0 (varianţele sunt egale) dacă nu respingem ipoteza H 0 (varianţele sunt diferite).
172
Elemente de matematică
Observaţie:
Este bine ca valoarea obţinută la varianţa variabilei 1 să fie mai mare decât
varianţa de la variabila 2. În exemplul utilizat 168.95 > 119.23.
Programul MS. Excel calculează valoarea F ca fiind raportul celor două varianţe
12
. Dacă valoarea F este mai mare decât valoarea critică (F critical) respingem
22
ipoteza nulă.
173
Elemente de statistică matematică
În exemplul ales valoarea F =1.41 < F critical = 4.28, deci acceptăm ipoteza nulă
precum că varianţele celor două populaţii sunt egale.
ipoteza alternativă H1 : 1 2 .
Etapele testării:
1. Alegem un nivel de risc echivalent cu un nivel de semnificaţie 1 .
2. Alegem câte o selecţie din fiecare populaţie x1 , x2 , , xn şi y1 , y2 , , yn .
Testăm dacă cele două selecţii provin din populaţii de varianţe egale folosind
testul Fisher:
ipoteza nulă H '0 : 12 22 şi
Dacă este admisă ipoteza H '1 atunci construim un interval de încredere pentru
Am ales două selecţii de studenţi de la o facultate, din diferiţi ani de studiu, care
au luat examenul la matematică (studenţi şi studente). Aleg un nivel de risc 0.05 şi
facem 7 observaţii.
Din exemplul anterior ştim că cele două seturi de date au varianţe egale:
Executam comanda pentru testul t din Data Analysis pentru varianţe egale.
174
Elemente de matematică
nulă.
În exemplul ales valoarea t Stat =-0.1336 > t critical = - 2.1788, deci acceptăm
ipoteza nulă precum că mediile celor două populaţii sunt egale.
175
Elemente de statistică matematică
Observaţie:
În alte aplicaţii informatice concluzia se poate trage utilizând doar valoarea
critică probabilă pv afişată în linia P T t two tail 0.8959 astfel: dacă pv atunci
Pentru alte soluţii software în care se pot realiza aplicaţii practice ale testelor
statistice sau problemelor matematice vă recomand programele GNUPLOT (Aldea,
2006), WxMaxima (Bunu, 2012), MATLAB (Stoleriu, 2010), şi binenţeles: SPSS, R sau
Statistica.
Exerciţii
1. În scopul estimării producţie unei cereale se cultivă 8 parcele a 10 m2 şi se
obţine media aritmetică a producţiei de x 10 kg şi o abatere standard de 500 g .
176