Sunteți pe pagina 1din 78

Statistică Matematică și Prelucrarea

Datelor Experimentale
SMPDE - curs
Inferență statistică
• Observațiile sau investigările statistice presupun
studierea unei caracteristici corespunzătoare unei
populații.
• Datorită faptului că accesul la întreaga populație
(toate observațiile posibile) este mai dificil de realizat
(populație finită sau infinită), această colectare a
datelor cu privire la o caracteristică (caracteristici) se
realizează în general prin eșantionarea.
• Inferența statistică reprezintă procesul de extrapolare
(generalizare) a informațiilor rezultate în urma
studierii unui eșantion, la nivelul întregii populații.
Inferență statistică
• Inferența statistică reprezintă partea statisticii ce se
ocupă cu dezvoltarea metodelor și tehnicilor de
investigare a unei populații.
• Importanța acestei operații poate fi mai bine sesizată
dacă luăm în considerare faptul că eșantionul
reprezintă un procent infim din întreaga populație
(1:10000).
• Concluziile obținute pot fi eronate dacă eșantionul
analizat nu reprezintă întreaga diversitate pe care o
întâlnim în populație.
operației de eșantionare
Eșantionarea
• Eșantionul (lot) - reprezintă o submulțime a populației
statistice asupra căreia experimentatorul aplică
metode statistice propriu-zise.
• Extragerea unui eșantion dintr-o populație se bazează
pe anumite metode de alegere a elementelor
eșantionului.
• Metode de alegere:
– metode bazate pe reprezentativitate (elemente ce
dețin toate caracteristicile populației);
– metode probabiliste (elementele au aceeași șansă
de a fi selectate din populație).
Inferență statistică
• Eșantionarea unei populații se poate face:
– cu returnare (după extragerea unui element, acesta
se introduce din nou în cadrul populației, putând fi
ulterior extras);
– fără returnare.
• Dintr-o populaţie de volum N se pot extrage
eşantioane de volum n, unde n<N.
– Rezultă că numărul de eșantioane ce pot fi extrase
este mare.
– Valoarea indicatorilor statistici (ex. media) analizați
variază de la un eșantion la altul.
Eșantionarea
Exemplu:
Se consideră o populație în care o variabila poate
lua orice valoare întreagă între 0 și 4 (valoare numerică
ce reprezintă numărul de defecte ale unui produs).
Se consideră populația ca fiind formată din 5
obiecte, fiecare având 0, 1, 2, 3 sau 4 defecte.
Se extrag eșantioane formate din două exemplare.
Eșantionarea se face atât cu returnare de element
cât și fără returnare de element.
Eșantionarea
• După extragerea unui
Eşantionarea fără returnare element, acesta NU se
0, 1 reintroduce în populație
1, 2
0, 2 2, 3
1, 3 3, 4 • Se obțin 10 de eșantioane;
0, 3 2, 4
1, 4 • Fiecare element are asociat
0, 4
un număr de defecte;
Mediile fiecărui eşantion
• Media calculate pentru
0.5 fiecare eșantion diferă de la
1.5
1.0 2.5 un eșantion la altul.
2.0 3.5
1.5 3.0
2.5
2.0
x

Eşantionarea
Distribuţia mediilor
Nr. Prob. de
𝑥ҧ eşantioane apariţie
 x   x / N  2 .0
f f/f
0.5 1 1/10
1.0 1 1/10
1.5 2 2/10 
 ix  x 2

2.0 2 2/10  x2   0.75


N
2.5 2 2/10
3.0 1 1/10
3.5 1 1/10  x  2.0,   0.75
2
x

Total 10
Eşantionarea
Eșantionarea
Eşantionarea cu returnare • După extragerea unui
0, 01, 0 2, 0 3, 0 4, 0 element, acesta se
0, 11, 1 2, 1 3, 1 4, 1 reintroduce în populație
0, 21, 2 2, 2 3, 2 4, 2 • Se obțin 25 de eșantioane;
0, 31, 3 2, 3 3, 3 4, 3
• Fiecare element are asociat
0, 41, 4 2, 4 3, 4 4, 4
un număr de defecte;
Mediile fiecărui eşantion
0.0 0.5 1.0 1.5 2.0
• Media calculate pentru
0.5 1.0 1.5 2.0 2.5
fiecare eșantion diferă de la
1.0 1.5 2.0 2.5 3.0
un eșantion la altul.
1.5 2.0 2.5 3.0 3.5
2.0 2.5 3.0 3.5 4.0
x

Eşantionarea
Distribuţia mediilor
Nr. Probabiltatea
𝑥ҧ eşantioane de apariţie
f f/f
0.0 1 1/25  x   x / N  2 .0
0.5 2 2/25
1.0 3 3/25
1.5 4 4/25 
 ix  x 2

2.0 5 5/25  x2   1.00


N
2.5 4 4/25
3.0 3 3/25
3.5 2 2/25  x  2.0,   1.02
x
4.0 1 1/25
Total 25
x

Eşantionarea
x

Volumul eşantionului n = 3
Nr. Probabilitate
𝑥ҧ eşantioane f de apariţie
0.00 1 0.008
0.33 3 0.024
0.67
1.00
6
10
0.048
0.080
 x   x / N  2 .0
1.33 15 0.120
1.67
2.00
18
19
0.144
0.152 
 ix  x 2

2.33 18 0.144
 x2   0.75
N
2.67 15 0.120
3.00 10 0.080
3.33
3.67
6
3
0.048
0.024
 x  2.0,   0.66
2
x
4.00 1 0.008
Total 125 1.00
Eşantionarea
x

Volumul eşantionului n = 4
Nr. eşantioane Probabilitate de
𝑥ҧ f apariţie

0.00 1 0.0016
0.25 4 0.0064
0.50 10 0.0160
0.75
1.00
20
35
0.0320
0.0560  x   x / N  2 .0
1.25 52 0.0832
1.50 68 0.1088


 i 
1.75 80 0.1280

2
2.00 85 0.1360 x x
2.25 80 0.1280  x2   0.66
2.50 68 0.1088 N
2.75 52 0.0832
3.00 35 0.0560
3.25
3.50
20
10
0.0320
0.0160  x  2.0,   0.52
x
3.75 4 0.064
4.00 1 0.0016
Total 625 1.0000
Eşantionarea
Eşantionarea

 ix  x 2

  0  1  2  3  4  5  2.0 2   2.00
N

n = 2 cu returnare fără returnare


 x  2.0,  x2  1.0  x  2.0,  x2  0.75
n=3
 x  2.0,  x2  0.66
n=4
 x  2.0,  x2  0.5
. Eşantionarea

La eşantionarea cu returnare, relaţia dintre σ2xത și σ2


este:  2
x 
2

n
La eşantionarea fără returnare:
 2
 N n
x 
2
 
n  N 1 
Pentru n<=0.05N factorul de corecţie poate fi ignorat
Eşantionarea
• Histogramele pentru eșantionări cu
volum n = 2, n = 3, și n = 4
elemente.
• Pe măsură ce n crește, repartiția se
apropie de cea normală.
• Tendința este adevărată pentru
toate eșantioanele, indiferent de
distribuția populației.
• Această tendință se numește
teorema limită centrală.
Eşantionarea
• Pe măsură ce volumul eşantionului
crește, distribuția tinde spre una
normală (chiar în situația când
populația are o altfel de
distribuție).
• Proprietățile repartiției normale
pot fi aplicate pentru determinarea
erorii ce apare datorită
eșantionării.
• În practică teorema limită centrală
se aplică pentru eșantioane de
volum 𝑛 ≥ 30
Inferența statistică
estimarea valorilor testarea ipotezelor
parametrilor unei referitoare la
populaţii parametrii
(media, dispersia) populaţiei
Estimări

• În practică studiul unei populații se efectuează pe o


submulțime a sa, un eșantion, iar concluziile
obținute sunt extinse prin inferență statistică la
nivelul întregii populații.
• Concluziile rezultate în urma studiului sunt
afirmații adevărate la nivelul eșantionului, dar la
nivelul populației ele au aceeași valoare numai cu o
anumită probabilitate.
• Determinarea valorilor parametrilor populației pe
baza valorilor unor indicatori, obținute pe
eșantioane, se numește estimare statistică.
Estimări

• Mărimile caracteristice ale unei populații se


numesc parametri.
₋ media populației 𝜇
₋ deviația standard a populației 𝜎
₋ eroarea standard a mediei 𝜎𝑥ҧ
• Mărimile caracteristice ale unui eșantion se
numesc statistici sau indicatori statistici.
– media eșantionului 𝑥ҧ
– deviația standard a eșantionului 𝑆
– eroarea standard a mediei 𝑆𝑥ҧ
Estimări

• Estimatorul reprezintă o statistică utilizată pentru a


aproxima un parametru.
Ex: media eșantionului 𝑥ҧ este un estimator al mediei
populației 𝜎.
• Estimația reprezintă valoarea pe care o ia un
estimator într-o determinare concretă.
• Un estimator trebuie sa aibă cel puțin doua calități:
– să reflecte corect rezultatele obținute;
– să aibă o precizie suficient de mare.
Estimări

punctuală
Estimare

cu un interval
Estimări
• Media unui eşantion poate fi considerată o estimare
punctuală.
• În cazul estimării punctuale a mediei se consideră
abaterea standard  a populaţiei cunoscută.
• Condiții necesare pentru o estimare bună
– Estimare eficientă (deviația standard să fie cât mai
mică posibil);
– Estimare nedeplasată (media eșantionului este
egală cu parametrul estimat);
– Estimare consistentă (valoarea estimată tinde spre
valoarea adevărată pe măsură ce volumul
eșantionului creşte).
Estimări

• În statistică se consideră că valoarea adevărată a


unui parametru reprezintă un element necunoscut,
o valoare intrinsecă.
• Valoarea adevărată poate fi estimată cu ajutorul
unor măsurări repetate asupra aceleiași mărimi,
corespunzătoare parametrului respectiv, sau
asupra unor entități de același tip, ce conține
informații despre parametru căutat.
Estimări
• O singură estimare a mediei diferă de media
populației, datorită erorii de eșantionare.
• Din acest motiv, în multe situații se preferă
estimarea printr-un interval de încredere:
• Intervalul de încredere reprezintă “o plaje de
valori” în interiorul căruia poate fi stabilit cu o
anumită certitudine poziția parametrului populației
estimat.
• Intervalul estimat cu un nivel de încredere 1 − 𝛼
se numește interval de încredere (unde 𝛼 este
nivelul de semnificație).
Estimari
• 100(1 - ) este nivelul de încredere
• Z/2 este valoarea variabilei Z ce exclude la fiecare
extremitate a distribuției o arie de /2
• /2-cvantila distribuției normale standard.

2.5% Arie 95% 2.5%

 
-1.96 +1.96
n n
Estimări

• Astfel estimarea unui parametru teoretic nu se face


printr-o singura valoare ci printr-un interval în care
parametrul estimat se găsește cu o probabilitate
mare.
𝜎
• 𝜇 = 𝑥ҧ ± 𝑍𝛼Τ2
𝑛
𝜎
• 𝜎𝑥ҧ = 𝑥ҧ ± 𝑍𝛼Τ2
𝑛
Estimări

  x  1.96

 x  x  1.96
n

• Valoarea corespunzătoare mediei populației este o


cantitate fixă, dar necunoscută.
• Este incorect să se interpreteze estimare pe baza
intervalului de încredere ca o probabilitate
corespunzătoare mediei populației 𝝁.
Estimări

• Estimarea cu ajutorul unui interval de încredere


pentru media µ a distribuției normale se bazează
pe un eșantion de volum n și medie 𝑥ҧ .
• Se pot utiliza diferite nivele de încredere în
estimarea intervalului valorii medii.
• În practică s-a demonstrat că nivelul de încredere
de 95% pentru media  a populației satisface
optim cerințele în majoritatea cazurilor concrete.
Estimări

• Exemplu: În cadrul unui studiu clinic s-a constatat că


media glicemiei la un eșantion de 121 de pacienți este
105 iar varianța este 36.
– Care este intervalul de încredere corespunzător
mediei populației, ce are o distribuție normală, din
care s-a extras eșantionul analizat cu un prag de
semnificație 𝛼 = 0.05.
Estimări

𝑛 = 121
𝑆 2 = 36 => 𝑆 = 6
𝑥ҧ = 105
𝜎
𝜇 = 𝑥ҧ ± 𝑍𝛼Τ2
𝑛
Z = 1.96
6
𝜇 = 105 ± 1.96
121

[105 − 1.07 105 + 1.07]


[103.93 + 106.07]
Estimări

• Un interval de încredere prea mare (larg) conferă


foarte puține informații.
• De exemplu se realizează o estimare a salariului unui
inginer debutant, cu un interval de încredere de 95%.
– Cu limitele între 2000 lei și 10000 lei.
– Cu limite între 2500 și 2700 lei.
• Cea de-a doua estimare este cu un interval mai
îngust, ceea ce confer informații mai precise cu
privire la salariul unui debutant.
Estimări

• Dimensiunea intervalului de încredere este o funcție


ce depinde de
– Nivelul de încredere;
– Deviația standard a populației;
– Dimensiunea eșantionului.
𝜎
𝑥ҧ ± 𝑍𝛼Τ2
𝑛
• Creșterea dimensiunii eșantionului conduce la
diminuarea intervalului de încredere pentru același
nivel de încredere.
Estimări

• Un nivel de încredere mare conduce la un interval de


încredere mare.
Estimări

• O deviație standard mare a populației conduce la un


interval de încredere mai larg.
Estimări
• În mod uzual,  este o mărime necunoscută
(informaţii certe sunt cele legate de eşantion).
• Se poate demonstra, că S este o estimare nedeplasată
a abaterii standard.
– În cazul eşantioanelor de volum mare, estimarea
este foarte bună;
– În cazul eşantioanelor de volum mic, S poate fi
subestimat.
Din acest motiv la eşantioanele de volum mic, trebuie
lărgit intervalul de încredere. Acest lucru se realizează
prin utilizarea repartiţiei t.
Estimări
• În cazul în care 𝑥ҧ este media unui eșantion mic (N<
30 ), abaterea 𝑆 nu este aproape de valoarea
parametrului 𝜎.
• În acest caz mediile eșantioanelor au o distribuție t
ce este caracterizată de numărul gradelor de libertate
𝜈 =𝑁−1
• Similar cu repartiția normală 𝜇 = 𝑥ҧ ± 𝑡𝛼Τ2,𝜈 ∙ 𝑆𝑥ҧ
𝑆
unde 𝑡(1 − 𝛼Τ2 , 𝑛 − 1) iar 𝑆𝑥ҧ =
𝑛
• Cvantila repartiției t se evaluează în Matlab cu
𝑡𝑖𝑛𝑣(𝑡, 𝑣).
Estimări

Exemplu: Masa unor persoane ce utilizează un ascensor


este prezintă o distribuție normală. În urma extragerii
unui eșantion avem următoarele valori:

71 85 68 72 58 76 74 80

– Să se estimeze cu o probabilitate de 95% valoarea


medie.
Estimări

  x  t 1   2 , n  1 
S
n
t 1   2 , n  1  t 0.05 2 ,8  1  2.365
𝑡𝑖𝑛𝑣([0.025 0.975], 7)
x  73 S 2.365
Sx    2.86
S  8.09 n 8

 = 73  (2.3652.86) = 73  6.76

  66.24;79.76
Estimări
De reținut:
• Pentru o estimare corectă a unui parametru statistic
se utilizează intervalul de încredere.
• Intervalul de încredere depinde de volumul
eșantionului și de eroarea standard.
• Cu cât volumul eșantionului este mai mic cu atât
intervalul de încredere este mai larg.
• Cu cât eroarea standard este mai mare cu atât
intervalul de încredere este mai larg.
Testarea ipotezelor

• Informațiile legate de o anumită populație statistică


se obțin prin selectarea unui eșantion, cu ajutorul
căruia se estimează parametrii populației respective.
• Pe baza acestor parametri se poate forma o imagine
asupra caracteristicilor analizate.

Exemplu:
• Dintr-un lot de piese se extrage un eșantion de n
elemente și se efectuează măsurări ale greutății G
• Greutatea presupusă va fi o variabilă repartizată
normal cu media 𝜇 și dispersia 𝑆.
Testarea ipotezelor

• Pentru eșantionul extras s-a determinat prin calcul


media experimentală.
• Se pune problema dacă, rezultatul obținut constituie
o ipoteză statistică, adică o presupunere (supoziție)
asupra populației statistice luate în studiu.
• Se numește ipoteză statistică orice presupunere
relativă la parametrii uneia sau mai multor populații
statistice sau presupuneri legate de distribuția de
probabilitate a populației statistice.
Testarea ipotezelor
• În multe probleme din inginerie se pune problema
dacă se acceptă sau se resping valorile obținute.
• Chiar dacă ipoteza statistică este avansată pe baza
unui eșantion, concluzia referitoare la valoarea
parametrului sau la natura repartiției se referă la
întreaga populație.
• O presupunere asupra unor elemente ale repartiției
ഥ ) poate admite o alternativă (µ ≠ G
(µ = G ഥ).
• Ipotezele pot fi acceptate sau nu cu anumite
probabilități de corectitudine a deciziei.
Testarea ipotezelor

• Ipoteza inițială se mai numește și ipoteză nulă și se


notează H0.
• Ipoteza nulă presupune că toate măsurătorile pe care
dorim să le comparăm sunt egale, iar eventualele
diferențe se datorează exclusiv întâmplării.
• Ipoteza nulă este ipoteza care se testează statistic.
• În funcție de rezultatul testării se acceptă sau se
respinge ipoteza inițială.
Testarea ipotezelor

• Pe baza ipotezei nule se pot compara:


– O valoare medie (obținută pe baza unui eșantion)
cu o valoare data;
– Două valori medii (obținute pe baza a două
eșantioane);
– O distribuție experimentală cu una teoretică;
– Două distribuții experimentale;
– Două sau mai multe dispersii.
Testarea ipotezelor

• Cealaltă ipoteză se numește ipoteza alternativă sau


concurentă se notează H1.
• Dacă ipoteza alternativă este acceptată, decizia
susține faptul că variația fenomenului studiat nu se
datorează doar întâmplării (intervin și alți factori).
• Se acceptă ipoteza alternativă dacă diferențele
constatate sunt vizibil astfel încât nu pot fi explicate
prin efectul întâmplării.
Testarea ipotezelor

• Ipotezele statistice nu sunt echivalente cu ipotezele


științifice.
• În cazul unei ipoteze științifice este suficient un
singur exemplu contrar pentru a o infirma, dar o
ipoteză statistică poate fi adevărată, chiar dacă într-o
anumită situație a fost respinsă ca fiind falsă.
Testarea ipotezelor

• Ipotezele statistice sunt însoţite de două tipuri de


erori:

– O eroare - probabilitatea de a respinge ipoteza H0,


când în realitate ea este adevărată. Eroarea :
 = P(respinge H0H0 adevărată).

– O eroare –probabilitatea de acceptare a ipotezei


H0, când în realitate ea este falsă. Eroarea :
 = P(acceptă H0H0 falsă).
Testarea ipotezelor

Aceste erori se mai numesc erori de tip I şi II.


Testarea ipotezelor

• Metoda efectivă de luare a deciziei asupra


acceptării sau respingerii ipotezei H0 se face cu
ajutorul unui test sau criteriu statistic.
• Testul impune luarea uneia dintre cele două decizii
(acceptare sau respingere a ipotezei nule) cu un
anumit risc.
• 1 -  este probabilitatea de respingere a ipotezei
nule când aceasta este falsă.
• 1 -  se consideră ca fiind puterea testului
respectiv
Testarea ipotezelor

• Din punct de vedere practic, pentru a verifica ipoteza


H0 cu alternativa H1 sunt necesare:
– o statistică a cărei repartiție să fie cunoscută;
– o valoare considerată “critică” cu care să se
compare valoarea calculată a statisticii;
– o regulă de decizie prin care să se accepte sau să se
respingă Ho;
– o valoare a riscului ales , ce se mai numeşte nivel
de semnificaţie al testului.
Testarea ipotezelor

• Etapele aplicării unui test statistic


o Formularea ipotezei nule şi a celei alternative.
H 0 :   0 H 0 :   0 H 0 :   0
sau sau .
H 1: :    0 H 1: :    0 H 1: :    0
o Alegerea nivelului de semnificație 𝛼 (uzual este 5% sau
1%).
o Selectarea statisticii şi a valorii critice.

Ipoteze
Tip test
H0 H1
x Z t
2 extremităţi =0   0 0  Z / 2 x  Z/2  t(/2,)
o extremitate =0   0  0  Z  x + Z + t(,)
o extremitate =0   0  0  Z  x - Z - t(,)
Testarea ipotezelor
regiune de respingere regiune de respingere
a) b)

Arie Arie Arie


/2% /2% %

regiune de acceptare regiune de acceptare

H0:  = 0 H0:  = 0
H1:  ≠ 0 regiune de respingere H1:  > 0
c)

Arie
%

H0:  = 0
regiune de acceptare H1:  < 0
Testarea ipotezelor
• Etapele aplicării unui test statistic (continuare)
o Determinarea statisticii testului (media experimentală sau
valoarea transformată în format standard Z sau t).
x  0 x  0
Z sau t 
x Sx
o Formularea deciziei
– se acceptă H0, dacă 𝑥ҧ aparține intervalului de acceptare (se
respinge H0 dacă acest lucru nu se întâmplă)
– Dacă utilizăm Z sau t se acceptă H0 dacă valoarea Z, respectiv t
cade în interiorul domeniului de acceptare (în caz contrar se
respinge)
– se acceptă H0 dacă 𝑥ҧ , Z sau t este mai mare sau mai mic decât
valoarea critică (în funcţie de ipoteza alternativă) și se respinge în
caz contrar
Testarea ipotezelor
Exemplu: În urma unui studiu statistic cu privire la
procesul de sudare a caroseriilor unor mașini, s-a
constatat că un robot sudează în medie 5 caroserii pe
oră cu o deviație standard de 0.8. Analizând un
eșantion de 60 de caroserii sudate de un al doilea
robot s-a constatat că procesul de asamblare are o
medie de 5.45 caroserii pe oră.
• Să se testeze ipoteza că producția de 5.45 diferă de
cea de 5. Se admite un nivel de semnificație de
0.05.
Testarea ipotezelor
• Deoarece se cunoaşte valoarea lui , se aplică
distribuţia normală, cu variabila Z.
• Date iniţiale:
–  = 5;  = 0.8; n = 60
• Ipoteze:
– H0: 0 = ; H1: 0  
• Nivel de semnificaţie  = 0.05  Z/2 = Z0.025 =
1.96
– În Matlab 𝑛𝑜𝑟𝑚𝑖𝑛𝑣(0.975, 0, 1)
Testarea ipotezelor
Deviaţia standard a mediei:
 0 .8
x    0.1033
n 60
Valori critice (limitele):
– pentru 𝑥:ҧ 0  Z / 2 x

5  1.960.1033  4.7975 şi 5.2025

– pentru Z:  Z/2  -1.96 şi 1.96


Testarea ipotezelor
Formularea deciziei:
– valoarea 𝑥ҧ = 5.45 cade în afara intervalului
determinat de valorile critice (5.45> 5.2025)

x  0 5.45  5
– Valoarea Z    4.3562
x 0.1033
se găseşte în afara intervalului determinat de valorile
critice.
Concluzia: Indiferent de testul aplicat se poate afirma
că se respinge ipoteza nulă cu un interval de
încredere de 95%, deci media producției în cel de-al
doilea caz diferă de prima.
Testarea ipotezelor
Testarea ipotezelor

Nu se poate afirma că media eșantionului este mai


mare, deoarece s-a utilizat un test cu două extreme.
• Se testeze dacă media eșantionului este mai mare
decât media populației

• Ipoteze:
H0: 0 = ; H1: 0 > 
• Nivel de semnificaţie
 = 0.05  Z = Z0.05 = 1.645

𝑛𝑜𝑟𝑚𝑖𝑛𝑣(0.95,0,1)
Testarea ipotezelor
• Deviația standard a mediei:
 x  0.1033
Valori critice (limitele):
– pentru 𝑥:ҧ 0  Z  x

5 + 1.6450.1033 = 5.1699

– pentru Z: + Z 1.645


Testarea ipotezelor
Formularea deciziei:
– valoarea𝑥ҧ = 5.45 valoare critică 5.1699.
– valoarea 𝑍 = 4.3562 > 1.645
x  0 5.45  5
Z   4.3562
x 0.1033

Concluzia: În ambele teste se respinge ipoteza nulă şi


cu un interval de încredere de 95% se acceptă ipoteza
alternativă (productivitatea celei de-al doilea robot
este mai mare).
Testarea ipotezelor
Testarea ipotezelor
Exemplu: În urma unui sondaj realizat, de un
producător de telefoane mobile, asupra unui eșantion
de acumulatori ce urmau să fie integrați într-un nou
produs, s-a constatat că durata medie de funcționare
între încărcări este de 148 ore.
• Să se verifice ipoteza că durata de funcționare este de 150
de ore (ipoteza alternativa fiind un timp de funcționare
mai mic de 150 ore) la un nivel de semnificație de 0.05,
știind că dispersia duratei de funcționare este 35.
Testarea ipotezelor
• Deoarece se cunoaşte valoarea lui 𝜎 2 , se aplică
distribuţia normală, cu variabila Z.
• Date iniţiale:
–  = 148; 𝜎 = 5.92; n = 30
• Ipoteze:
– H0: 0 = ; H1: 0  
• Nivel de semnificaţie  = 0.05  Z/2 = Z0.025 = 1.96
– În Matlab 𝑛𝑜𝑟𝑚𝑖𝑛𝑣(0.975, 0, 1)
Testarea ipotezelor
Deviaţia standard a mediei:
 5.92
x   1
n 35
Valori critice (limitele):
– pentru 𝑥:ҧ 0  Z / 2 x

148  1.961 146.04 şi 149.96

– pentru Z:  Z/2  -1.96 şi 1.96


Testarea ipotezelor
Formularea deciziei:
– valoarea 𝑥ҧ = 150 cade în afara intervalului
determinat de valorile critice (150> 149.96)

x  0 150  148
– Valoarea Z  2
x 1
se găseşte în afara intervalului determinat de valorile
critice.
Concluzia: Indiferent de tipul testului aplicat se poate
afirma că se respinge ipoteza nulă cu un interval de
încredere de 95%, deci media duratei de funcționare
nu este 150 de ore.
Testarea ipotezelor
Testarea ipotezelor

Nu putem afirma că media eșantionului este mai


mică, deoarece s-a utilizat un test cu două extreme.
• Se testeze dacă media eșantionului este mai mică
decât media populației

• Ipoteze:
H0: 0 = ; H1: 0 < 
• Nivel de semnificaţie
 = 0.05  Z = Z0.05 = 1.645

𝑛𝑜𝑟𝑚𝑖𝑛𝑣(0.95,0,1)
Testarea ipotezelor
• Deviația standard a mediei:
x 1
Valori critice (limitele):
– pentru 𝑥:ҧ 0  Z x

148 − 1.6451 = 146.355

– pentru Z: - Z -1.645


Testarea ipotezelor
Formularea deciziei:
– valoarea𝑥ҧ = 150 valoare critică 146.355.
– valoarea 𝑍 = 2 > 1.645
x  0 150  148
Z  2
x 1

Concluzia: Conform ambelor teste, se se acceptă cu


un interval de încredere de 95% că durata de
funcționare nu este cu mult diferită de media de 150
de ore.
Testarea ipotezelor
Testarea ipotezelor
Exemplu: Pentru determinarea nivelului de pregătire,
pentru examenul de licență, au fost testați studenți din
două departamente cu profil diferit. Au fost formate
două eșantioane de 15 studenți, iar rezultatele
centralizate sunt prezentate în continuare (valoarea
înregistrată fiind notele obținute).
volum medie S
profil 1 n1 = 15 7.5 7.1
profil 2 n2 = 15 6.2 9.3

Datorită faptului că studenții provin de la două


departamente diferite nu sunt motive să se presupună
că varianţele cele două populaţii ar fi egale.
Testarea ipotezelor
• Se va aplica testul t, varianțele fiind necunoscute și
volumul eșantioanelor mic.
• Ipoteze:
H0: 0 = ; H1: 0  
• Nivel de semnificaţie:
𝛼 = 0.05
• Deviaţia standard a mediei:

S12 S 22 7.12 9.32


S x1  x2      3.0210
n1 n2 15 15
Testarea ipotezelor
• Valori critice  t/2 =  2.05 cu  = 28
(𝑡/2 = 𝑡𝑖𝑛𝑣(0.975,28) ș𝑖 = 15 + 15 − 2)


S1
2
n1  S n2
2
2  2

 28
S 2
  S 22 
 1
 n1  1    n2  1
 n1   n2 
• Testul
t
x1  x2   1   2   7.5  6.2  0.43
S x1  x2 3.0210

Concluzie: Deoarece |t| < |t/2| nu se respinge ipoteza


nulă, deci între cele două departamente nu există
diferenţe statistice semnificative.