Sunteți pe pagina 1din 45

3 direcţii majore în analiza datelor:

Studiul comparativ al
Studiul relaţiei între Studiul relaţiei între mai
variaţiei unei variabile în
două variabile în acelaşi multe variabile diferite în
două sau mai multe
eşantion acelaşi eşantion
eşantioane

2 eşantioane:
Compararea mediilor:
Coeficientul de corelaţie Modele de regresie multiplă
Testul t Student
mai mult de 2 eşantioane:
Modele de regresie Modele de analiză complexă
Compararea varianţelor:
Testul ANOVA
ETAPELE DE VERIFICARE A UNEI
IPOTEZE PRINTR-UN TEST STATISTIC:

• Enunţarea ipotezei
1

• Alegerea parametrului de studiu (eventual conţinut în


2 enunţarea ipotezei)

• Deducerea şi calculul formulei matematice a


3 testului (DISCRIMINANTA STATISTICĂ)

• Acceptarea / respingerea ipotezei prin compararea


valorii calculate a testului cu regiunile de acceptare /
4 respingere ale distribuţiei de valori a statisticii testului
TEST STATISTIC DE VERIFICARE A UNEI IPOTEZE =
metodă de a realiza o decizie asupra datelor unui studiu statistic,
verificând o afirmaţie – IPOTEZĂ STATISTICĂ.

În statistică, un rezultat se numeşte „SEMNIFICATIV


STATISTIC” dacă apariţia sa nu este întâmplătoare / aleatoare, fiind
rezultatul sistematic al manifestării unui fenomen, iar probabilitatea de
apariţie a sa este deasupra unei valori prag, denumită „NIVEL DE
SEMNIFICAŢIE”.
Noţiunea „test de semnificaţie” – Ronald Fisher

Ipoteza statistică ce va fi testată:


- IPOTEZA NULĂ (H0): nu există nici o schimbare – ex. nu
există diferenţe semnificative între mediile a două
eşantioane extrase din populaţii diferite;
- IPOTEZA ALTERNATIVĂ (H1): opusul ipotezei nule.
1. Concluzia aşteptată, adică ceea ce dorim să verificăm
prin experiment, va fi plasată în ipoteza alternativă.

2. Ipoteza nulă trebuie să conţină un operator de


comparaţie, de forma =, ≤ sau ≥ .

3. Ipoteza nulă este ipoteza care va fi testată.

4. Ipoteza nulă şi ipoteza alternativă sunt complementare.


Tipul de H0 HA Tipul de distribuţie
ecuaţie
  = 50   50 Two-tail, 2 regiuni de
respingere / critice
   50   50 One-tail, regiunea
critică la dreapta
   50   50 One-tail, regiunea
critică la stânga
• calculul formulei matematice a testului
3 (DISCRIMINANTA STATISTICĂ)

FORMULA GENERALĂ:

𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑒𝑠 − 𝑃𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑢 𝑑𝑒 𝑖𝑝𝑜𝑡𝑒𝑧ă


𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑎 =
𝐸𝑟𝑜𝑎𝑟𝑒𝑎 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑 𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑖𝑖 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑒𝑠

Exemplu:
𝑥ҧ = media eşantionului
𝜇0 = parametrul de ipoteză – media populaţiei
𝜎/ 𝑛 = eroarea standard a lui 𝑥ҧ
OBSERVAŢII:

• Testarea ipotezelor nu demonstrează de fapt afirmaţia. Ea


indică numai dacă afirmaţia (ipoteza statistică) este verificată
sau nu în eşantionul studiat.
• Alegerea discriminantei statistice (a statisticii) depinde de
modul de formulare a ipotezelor de verificat.
• Natura distribuţiei discriminantei statistice (a statisticii)
trebuie cunoscută.
Ex: Statistica z respectă distribuţia normală standard
Statistica t respectă distribuţia Student.
• Criteriile de decizie trebuie de asemenea stabilite.
• Acceptarea / respingerea ipotezei
4

• Nivelul de semnificaţie, , este o probabilitate, şi anume


probabilitatea de a respinge o ipoteză nulă adevărată.
• De exemplu,  = 0.05 cu 95% interval de confidenţă înseamnă
că există 5% şanse ca valoarea parametrului testat să nu
aparţină intervalului de confidenţă 95%.
• Aceasta este o sursă de eroare şi conduce la o concluzie falsă.
• Atunci când valoarea calculată a discriminantei statistice
aparţine regiunii de respingere / critică, se spune că este
SEMNIFICATIVĂ.
• De regulă se aleg valori mici pentru , de exemplu 0.10, 0.05
sau 0.01, pentru a minimiza cât mai mult probabilitatea de a
respinge o ipoteză nulă adevărată.

• Test One-tail: Regiunea critică este situată la una dintre
extremităţile distribuţiei de valori a discriminantei
statistice.
• Test Two-tail: Regiunea critică este situată la ambele
extremităţi ale distribuţiei de valori a discriminantei
statistice.
• La formularea ipotezei nule se precizează de regulă şi
tipul de test care urmează a fi folosit.

CRITERIUL DE DECIZIE:
1 -  = 0.95
Se respinge ipoteza H0
dacă Z < - Z1- =0.05
(când se foloseşte testul Z)
Se respinge ipoteza H0
dacă T < -t1-,n-1
(când se foloseşte testul t)
-1.645 0 Z

Regiunea de IPOTEZE:
respingere /
H0:   30
critică
H1:  < 30

CRITERIUL DE DECIZIE:
1 -  = 0.95
Se respinge ipoteza H0
dacă Z > Z1- =0.05
(când se foloseşte testul Z)
Se respinge ipoteza H0
dacă T > t1-,n-1
0 1.645 Z
(când se foloseşte testul t)

IPOTEZE: Regiunea de
respingere /
H0:  ≤ 30 critică
H1:  > 30
CRITERIUL DE DECIZIE:
Se respinge ipoteza H0

dacă Z > Z1-/2 sau
1 -  = 0.95
Z < -Z1-/2
/2 = /2 =
(când se foloseşte testul Z) 0.025 0.025
Se respinge ipoteza H0
dacă T > t1-/2,n-1 sau
T < -t1-/2,n-1
(când se foloseşte testul t) -1.96 0 1.96 Z

IPOTEZE:
H0:  = 30 Regiunea de Regiunea de
H1:   30 respingere / respingere /
critică critică
• Z1-α/2 , Z1-α , Zα sunt valori tabelate obţinute din tabele
statistice construite pentru valori diferite ale lui n
• t1-α/2 , t1-α , tα sunt valori tabelate obţinute din tabele
statistice construite pentru valori diferite ale lui (n-1) =
numărul de grade de libertate (df)
• Lucrând cu cele două ipoteze şi cu o anumită probabilitate (nivel
de încredere), decizia finală va fi supusă .
• Practic, între realitate şi decizia luată, vor exista
:
Sistem decizional cu REALITATE
prag H0 adevărată H1 adevărată
Ipoteza H0 Nu există eroare Eroare de tipul II
Decizie prin test

acceptată 1- 
Adevărat pozitiv Fals negativ
Ipoteza H0 Eroare de tipul I Nu există eroare
respinsă  1-
H1 acceptată Fals pozitiv Adevărat negativ
 = Nivelul de semnificaţie a testului
1 -  = Puterea testului
• Nivelul de semnificaţie (eroarea de tip I) este determinat
de valoarea  a probabilităţii şi standard are valori de 0.05
(5%) sau 0.01(1%).

• Puterea testului se defineşte prin coeficientul 1-. Valorile


standard sunt de 0.8 sau 0.9 şi corespunzător,  = 0.2,
respectiv  = 0.1.

• În funcţie de tipul de studiu folosit, se ţine cont de eroarea


de tip I sau de ambele tipuri de erori (I și II).

• Valoarea p este probabilitatea ca un rezultat să fie să
fie la fel de mare sau mai mare decât o valoare
observată atunci când ipoteza nulă este adevărată.
• Valoarea p este cea mai mică valoare a lui  pentru
care ipoteza nulă poate fi respinsă.
• Dacă valoarea p este mai mică sau egală cu a, ipoteza
nulă va fi respinsă; altfel ipoteza nulă va fi acceptată.
PRACTIC, în orice software de analiză statistică:

- Dacă p < 0.05 (sau p<0.01)


=> IPOTEZA NULĂ ESTE INFIRMATĂ

- Dacă p > 0.05 (sau p > 0.01)


=> IPOTEZA NULĂ ESTE CONFIRMATĂ

Intervalele de confidenţă sunt folosite pentru a testa
ipoteze.

EXEMPLU:
Ipoteza nulă este H0:  = 30
Se calculează intervalul de confidenţă 95% care corespunde
mediei parametrului măsurat în populaţie.
Dacă valoarea 30 aparţine intervalului de confidenţă, se
concluzionează că ipoteza nulă nu este respinsă la nivelul
de semnificaţie stabilit (95%).
• În funcţie de natura datelor cu care se lucrează:

Cele mai simple şi


mai frecvent
utilizate teste de
semnificaţie
statistică sunt
TESTELE
PARAMETRICE
bazate pe
compararea
mediilor sau a
varianţelor.

3 situaţii – natura eşantionului extras:

Populaţie normal distribuită – ഥ − 𝝁𝟎


𝒙
dispersia cunoscută 𝒁=
𝝈/ 𝒏
Populaţie normal distribuită – ഥ − 𝝁𝟎
𝒙
dispersia necunoscută 𝒕=
𝑺/ 𝒏
Populaţia nu este normal distribuită, ഥ − 𝝁𝟎
𝒙
n  30 𝒁=
Dimensiunea eşantionului  30 – se 𝑺/ 𝒏
aplică teorema limitei centrale
3 modalităţi de formulare a ipotezei:


H0:  = x; H1:   x - test two-tail
H0:   x; H1: 1 < x - test one-tail
H0:  ≤ x; H1: 1 > x - test one-tail

OBSERVAŢIE:
În practică, în ştiinţele sociale şi medicale se folosesc teste
de tip two-tail, deoarece sunt mai fiabile.
Testele one-tail se folosesc atunci când:
• Modificările în regiunea opusă sunt lipsite de sens
• Modificările în regiunea opusă nu sunt de interes
• Nici o teorie nu prognozează modificări în regiunea opusă
Exemplu – populaţie normal distribuită – varianţe cunoscute, test 2-tail

Un eşantion simplu aleatoriu de 10 persoane dintr-o populaţie are vârsta


medie de 27 ani. Putem concluziona că vârsta medie a populaţiei nu este
30? Dispersia este 20.  = 0.05.
DATE: Calcule:
n = 10 27 − 30 −3
2 = 20 𝑧= = = −2.12 ≤ −1.96
20/10 1.4142
ഥ = 𝟐𝟕
𝒙
H0 respinsă; valoare semnificativă cu pragul 0.05
= 0.05
   30; p = 0.0340
Populaţie normal distribuită
z = -2.12 corespunde unei suprafeţe de .0170.
Deoarece regiunea critică are 2 zone într-un test two
IPOTEZE:
tail, valoarea lui p este dublul suprafeţei, adică .0340.
H0:  = 30 (2-tail test)
H1:   30
Intervalul de confidenţă:
Statistica: ഥ − 𝝁𝟎
𝒙 ഥ±𝒛∙𝝈 𝒏
𝒙
𝒁=
𝝈/ 𝒏  𝟐𝟕 ± 𝟏. 𝟗𝟔 ∙ 𝟐𝟎/𝟏𝟎
 27 ± 1.96 · 1.4142
 (24.228, 29.772)
Criteriul de decizie:
Se respinge H0 dacă valoarea z aparţine regiunii
critice; test 2-tail.
Se respinge H0 dacă z ≤ -1.96 sau z ≥ 1.96
Exemplu – populaţie normal distribuită – varianţe cunoscute, test 1-tail

Un eşantion simplu aleatoriu de 10 persoane dintr-o populaţie are vârsta


medie de 27 ani. Putem concluziona că vârsta medie a populaţiei este mai
mică de 30? Dispersia este 20.  = 0.05.
DATE: Calcule:
n = 10 27 − 30 −3
2 = 20 𝑧= = = −2.12 ≤ −1.645
20/10 1.4142
ഥ = 𝟐𝟕
𝒙
H0 respinsă; valoare semnificativă cu pragul 0.05
= 0.05
  < 30; p = 0.0170
Populaţie normal distribuită
z = -2.12 corespunde unei suprafeţe de .0170.
IPOTEZE:
Intervalul de confidenţă :
H0:   30 (test one-tail)
ഥ±𝒛∙𝝈 𝒏
𝒙
H1:  < 30
 𝟐𝟕 ± 𝟏. 𝟗𝟔 ∙ 𝟐𝟎/𝟏𝟎
Statistica: ഥ − 𝝁𝟎
𝒙  27 ± 1.96 · 1.4142
𝒁=
𝝈/ 𝒏  (24.228, 29.772)

Criteriul de decizie :
Se respinge H0 dacă valoarea z aparţine
regiunii critice; test one-tail .
Se respinge H0 dacă z ≤ -1.645
Exemplu – populaţie normal distribuită – varianţe necunoscute

Un eşantion simplu aleatoriu de 14 persoane dintr-o populaţie are


indicele BMI ca în tabel. Se poate concluziona că indicele BMI în populaţie
nu este 35? Fie  = 0.05.
Statistica: ഥ−𝝁𝟎
𝒙
t=
𝒔/ 𝒏

Dacă presupunerile sunt corecte şi H0 este adevărată,


statistica respectă o distribuţie Student cu 13 grade de
libertate.

Criteriul de decizie :
DATE: Se respinge H0 dacă valoarea z aparţine regiunii critice; test 2-
n = 14 tail.
s = 10.63918736 Valorile critice cu 13 df sunt -2.1604 şi 2.1604.
ഥ = 𝟑𝟎. 𝟓
𝒙
= 0.05 Se respinge H0 dacă t ≤ -2.1604 sau t  2.1604
Populaţie normal distribuită Calcule:
30.5 −35 −4.5
𝑡= = = −1.58 > −2.1604
10.639/ 14 2.8434
IPOTEZE:
H0 nu este respinsă
H0:  = 35 (test two-tail)
 Este posibil ca  = 35; p = 0.1375
H1:   35
Exemplu – populaţie care nu este normal distribuită

Un eşantion simplu aleatoriu din 242 persoane dintr-o populaţie are


vârsta medie 33.3. Se poate concluziona că vârsta medie a populaţiei este
mai mare decât 30? Fie  = 0.05.
DATE: Criteriul de decizie :
n = 242 Se respinge H0 dacă valoarea z aparţine regiunii
s = 12.14 critice; test one-tail.
ഥ = 𝟑𝟑. 𝟑
𝒙 Se respinge H0 dacă z  1.645
= 0.05

Populaţia nu este normal distribuită Calcule:


33.3 − 30 3.3
𝑧= = = 4.23 > 1.645
IPOTEZE: 12.14/ 242 0.7804
H0:  ≤ 30 (test one-tail) H0 respinsă; valoare semnificativă cu pragul de
H1:  > 30 0.01
Statistica: ഥ − 𝝁𝟎
𝒙   > 30; p = 0.0000117 < 0.001
𝒁=
𝒔/ 𝒏
Ca urmare a Teoremei Limitei
Centrale, statistica este aproximativ
normal distribuită cu  = 0 dacă H0
este adevărată.

Se foloseşte testul z pentru două eşantioane, care stabileşte
dacă mediile în cele două populaţii sunt egale sau nu.
3 variante de formulare a ipotezei:

H0: 1 = 2; H1: 1  2 - test two-tail


H0: 1  2; H1: 1 < 2 - test one-tail
H0: 1 ≤ 2; H1: 1 > 2 - test one-tail
3 situaţii distincte:

Populaţia normal 𝑥1ҧ − 𝑥ҧ2 − (𝜇1 − 𝜇2 )0


distribuită –
varianţe cunoscute
 𝑧=
𝜎1
2
𝜎2
2
+
𝑛1 𝑛2

Populaţia normal
distribuită – 𝑥1ҧ − 𝑥ҧ2 − (𝜇1 − 𝜇2 )0
varianţe necunoscute , 𝑡=
2 2
dar egale 𝑠𝑝 𝑠𝑝
+
n1, n2 mici 𝑛1 𝑛2
Statistica t respectă o
distribuţie Student cu
2 2
n1 + n2 - 2 grade de 2 𝑛1 − 1 ∙ 𝑠1 + 𝑛2 − 1 ∙ 𝑠2
𝑠𝑝 =
libertate şi o varianţă 𝑛1 + 𝑛2 − 2
combinată sp2
Populaţia nu este Dacă varianţele din populaţie nu
normal distribuită – sunt cunoscute, se foloseşte
Ambele eşantioane au
dimensiunea  30 – se

varianţa din eşantioane:

aplică teorema limitei 𝑥ҧ1 −𝑥ҧ 2 −(𝜇1 −𝜇2 )0


centrale z=
2 2
𝜎1 𝜎
𝑛1
+ 2𝑛
2
Statistica z
Exemplu – populaţii normal distribuite cu varianţe cunoscute

Nivelele serice de acid uric: Există vreo diferenţă între nivelele serice
medii de acid uric la pacienţii cu Sindrom Down comparativ cu subiecţii
normali?
DATE: Criteriul de decizie:
ഥ 𝟏 = 𝟒. 𝟓, n1 = 12, 12 = 1
𝒙 Se respinge H0 dacă valoarea z aparţine regiunii
ഥ 𝟐 = 𝟑. 𝟒, n2 = 15, 22 = 1.5
𝒙 critice; test 2-tail.
= 0.05 Se respinge H0 dacă z ≤ -1.96 sau z ≥ 1.96.

Două eşantioane aleatorii independente


Populaţii normal distribuite Calcule:
4.5 − 3.4 − 0 1.1
IPOTEZE: 𝑧= = = 2.57 > 1.96
1 1.5 0.4282
H0: 1 = 2 (test two-tail) +
12 15
H1: 1  2 H0 respinsă; p = 0.0102
Statistica: ഥ
𝒙𝟏 − ഥ
𝒙𝟐 − (𝝁𝟏 − 𝝁𝟐 )𝟎  Mediile populaţiilor nu sunt egale.
𝒛=
𝟐 𝟐
𝝈𝟏 𝝈
+ 𝟐
𝒏𝟏 𝒏𝟐

Dacă presupunerile sunt corecte şi


ipoteza H0 este adevărată, statistica
respectă o distribuţie normală.
Exemplu – populaţii normal distribuite cu varianţe necunoscute, dar egale
(varianţă combinată)
Indicele de degradare a plămânului: Dorim să verificăm dacă putem
concluziona, cu un interval de confidenţă de 95%, că fumătorii, în general,
au plămânii mai degradaţi decât nefumătorii.
DATE: Statistica: ഥ
𝒙𝟏 − ഥ
𝒙𝟐 − (𝝁𝟏 − 𝝁𝟐 )𝟎
fumători: 𝒙
ഥ 𝟏 = 𝟏𝟕. 𝟓, n1 = 16, s1 = 4.4752 𝒕=
𝟐 𝟐
nefumători: 𝒙
ഥ 𝟐 = 𝟏𝟐. 𝟒, n2 = 9, s2 = 4.8492 𝒔𝒑 𝒔𝒑
+
= 0.05 𝒏𝟏 𝒏𝟐

Varianţa combinată: Dacă presupunerile sunt corecte şi


𝟐 𝟐
ipoteza H0 este adevărată, statistica
𝟐 𝒏𝟏 − 𝟏 ∙ 𝒔𝟏 + 𝒏𝟐 − 𝟏 ∙ 𝒔𝟐 respectă o distribuţie Student cu 23
𝒔𝒑 =
𝒏𝟏 + 𝒏𝟐 − 𝟐 grade de libertate.
2 15 ∙ 4.4711 + 8 ∙ 4.8492 Criteriul de decizie:
𝑠𝑝 =
16 + 9 − 2 Se respinge H0 dacă t > 1.7139
299.86 + 188.12 (= 0.05, df=23)
= = 21.2165
23
Două eşantioane aleatorii independente Calcule:
Populaţii normal distribuite 17.5 − 12.4 − 0 5.1
𝑡= = = 2.6563 > 1.7139
21.2165 21.2165 1.92
IPOTEZE: +
16 9
H0: 1  2 (test one-tail ) H0 respinsă; p = 0.014
H1: 1 > 2  1 > 2
Exemplu – populaţii care nu sunt normal distribuite

Scala de evaluare a Limitelor de Activităţi Profilactice la Persoanele


Disabilitate (BHADP): Dorim să ştim dacă putem concluziona, cu un nivel
de confidenţă de 99%, că persoanele cu disabilităţi au scoruri mai ridicate
pe această scală decât persoanele fără disabilităţi.
DATE: Statistica: ഥ𝟏 −ഥ
𝒙 𝒙𝟐 −(𝝁𝟏 −𝝁𝟐 )𝟎
disabilitaţi: 𝒙
ഥ 𝟏 = 𝟑𝟏. 𝟖𝟑, n1 = 132, s1 = 7.93 z=
𝟐 𝟐
𝝈𝟏 𝝈
normali: 𝒙ഥ 𝟐 = 𝟐𝟓. 𝟎𝟕, n2 = 137 s2 = 4.80 𝒏𝟏
+ 𝟐
𝒏𝟐
= 0.01
Criteriul de decizie:
Două eşantioane aleatorii independente Se respinge H0 dacă z > 2.33
Populaţii normal distribuite (= 0.01)

IPOTEZE: Calcule:
H0: 1  2 (test one-tail) 31.83 − 25.07 − 0 6.76
H1: 1 > 2 𝑧= = = 8.42 > 2.33
7.93 2 4.80 2 0.8029
Deoarece eşantioanele sunt suficient +
132 137
de mari, Teorema Limitei Centrale H0 respinsă
permite calcularea statisticii z . 1 > 2
Dacă presupunerile sunt corecte şi
ipoteza H0 este adevărată, statistica
respectă distribuţia normală.
Când datele sunt

reprezentate de un singur eşantion
aleatoriu extras dintr-o populaţie normal distribuită,
statistica folosită pentru testarea ipotezei despre varianţa
populaţiei este:
(𝑛 − 1)𝑠 2
𝜒2 =
𝜎2
Când ipoteza H0 este adevărată, 2 respectă o distribuţie 2
cu n – 1 grade de libertate.
Exemplu:

Evaluarea răspunsului la inhalarea de alergeni la primatele alergice. Se


studiază un eşantion de 12 maimuţe, la care eroarea standard a mediei
pentru inhalarea de alergeni este 0.4 la unul dintre itemi. Dorim să ştim
dacă putem concluziona că varianţa populaţiei este diferită de 4.

DATE: Dacă presupunerile sunt corecte şi ipoteza H0 este


n = 12 adevărată, statistica respectă o distribuţie 2 cu 11
Eroarea standard = 0.4 df.
= 0.05 Criteriul de decizie:
df = 11 Pentru = 0.05 şi 11 df, valorile critice sunt 3.816 şi
21.920.
Eşantion simplu aleatoriu Se respinge H0 dacă 2 < 3.816 sau 2 > 21.920.
Populaţie normal distribuită
Calcule:
IPOTEZE:
H0: 2 = 4
s2 = 0.4 * 12 = 4.8
H1: 2  4
11 ∙ 4.8
𝜒2 = = 13.2 < 21.920
Statistica: 𝟐
(𝒏 − 𝟏)𝒔𝟐 4
𝝌 = H0 nu este respinsă, p > 0.05
𝝈𝟐
Nu putem concluziona că varianţa populaţiei este
diferită de 4.
semnificativă

Testul este folosit pentru a determina dacă există o
diferenţă statistic între două
varianţe. Statistica testului este raportul varianţelor:
2
𝑠1
𝑉𝑅 = 2
𝑠2

Când ipoteza H0 este adevărată, VR respectă o distribuţie F


cu:
n1 – 1 grade de libertate la numărător şi
n2 – 1 grade de libertate la numitor .

Test two-tail Varianţa mai mare este pusă la numărător.
Test one-tail
2
H0: 12 ≤ 22 𝑠1
𝑉𝑅 =
H1: 12 > 22 𝑠2
2

Test one-tail
2
H0: 12  22 𝑠2
𝑉𝑅 =
H1: 12 < 22 𝑠1
2
Exemplu:
Adenomul pituitar. Deviaţia standard a greutăţii la 12 pacienţi cu
adenom pituitar este de 21.4 kg. Un eşantion de control de 5 pacienţi fără
adenom pituitar au o deviaţie standard a greutăţii de 12.4 kg. Dorim să
ştim dacă greutatea pacienţilor cu adenom pituitar variază mai mult decât
cea a pacienţilor din grupul de control.
DATE: Criteriul de decizie:
Lot activ: n1 = 12, s1 = 21.4 Valoarea critică este F = 5.91.
Lot de control: n2 = 5, s2 = 12.4 Se respinge H0 dacă VR > 5.91
= 0.05

Eşantioane simple aleatorii Calcule:


Populaţia normal distribuită
21.42
𝑉𝑅 = = 2.98 < 5.91
IPOTEZE: 12.42
H0: 12 ≤ 22
H1: 12 > 22 H0 nu este respinsă, p > 0.05 (p = 0.1517)
𝟐
Statistica: 𝒔𝟏 Greutatea populaţiei de pacienţi nu
𝑽𝑹 = 𝟐
𝒔𝟐 variază mai mult decât cea a subiecţilor
din lotul de control.
Dacă presupunerile sunt corecte şi ipoteza H0
este adevărată, statistica respectă o distribuţie
F cu 11 grade de libertate la numărător şi 4
grade de libertate la numitor.

Testarea ipotezelor despre proporţia într-o populaţie (P) se
realizează oarecum similar cu procedura pentru media unei
populaţii.
Date cunoscute:
- Dimensiunea eşantionului, n;
෡:
- Proporţia în eşantion, 𝐏

෡ = 𝒏𝒓.𝒅𝒆𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒆𝒊𝒏𝒆𝒔𝒂𝒏𝒕𝒊𝒐𝒏𝒄𝒖𝒐 𝒄𝒂𝒓𝒂𝒄𝒕𝒆𝒓𝒊𝒔𝒕𝒊𝒄𝒂𝒂𝒏𝒖𝒎𝒆 = 𝒂
𝑷
𝒅𝒊𝒎𝒆𝒏𝒔𝒊𝒖𝒏𝒆𝒂 𝒆𝒔𝒂𝒏𝒕𝒊𝒐𝒏𝒖𝒍𝒖𝒊 𝒏
- Proporţia în eşantion, 𝐏 ෡ este aproximativ normal
distribuită
- Proporţiile în populaţie P0 şi Q0 = 1 – P0.
Statistica testului este: 𝑃෠ − 𝑃0
𝑍=
𝑃0 𝑄0
𝑛

Când ipoteza H0 este adevărată, statistica Z respectă o
distribuţie normală standard.

Există trei modalităţi de formulare a ipotezelor:


෡ = P0;
H0: 𝐏 ෡  P0 - test two-tail
H1: 𝐏
෡ = P0;
H0: 𝐏 ෡ < P0 - test one-tail
H1: 𝐏
෡ = P0;
H0: 𝐏 ෡ > P0 - test one-tail
H1: 𝐏
Exemplu:
Variabila de interes este procentajul de subiecţi cu prediabet într-un eşantion
de 301 femei hispanice din Texas. În studiu, 24 de femei au fost diagnosticate
cu prediabet. Prevalenţa diabetului în populaţia de femei hispanice din Texas
este evaluată la 6.3%.
Există suficiente motive pentru a concluziona că populaţia de femei hispanice
din Texas are o prevalenţă a prediabetului mai mare de 6.3%? Fie α=0.05.
DATE: 𝑃෠ − 𝑃0
n = 301 Statistica: 𝑍=
𝑃0 𝑄0
P0 = 6.3/100 = 0.063 𝑛
Q0 = 1 – P0 = 1 – 0.063 = 0.937
a = 24 Calcule:
P = 24 / 301 = 0.08
= 0.05 0,08 −0,063
Z= = 1,21 < 1,645
0,063∙0,937
P este normal distribuită 301

IPOTEZE: H0 nu este respinsă, p > 0.05 (p = 0.1131)


H0: P = 0.063
H1: P > 0.063 Femeile hispanice din Texas nu au
prevalenţa IFG mai mare de 6.3%.
Criteriul de decizie:
Valoarea critică este Z1-=Z1-0,05 = Z0,95 = 1,645.
Se respinge H0 dacă Z > 1,645

Testarea ipotezelor despre diferenţa proporţiilor în două
populaţii (P1, P2) se realizează oarecum similar cu
procedura pentru diferenţa între mediile în două populaţii.
Date cunoscute:
- Dimensiunile eşantioanelor, n1 şi n2;
𝒂𝟏 𝒂𝟐
෢ ෢
- Proporţiile în eşantioane, 𝐏𝟏 = , 𝐏𝟐 = , unde a1, a2 =
𝒏𝟏 𝒏𝟐
nr. de subiecţi din eşantion cu o caracteristică specifică,
𝒂𝟏 + 𝒂𝟐
𝑷ഥ=
𝒏𝟏 + 𝒏𝟐
- Populaţiile sunt independente
- Proporţiile în cele două populaţii, P1 , P2.
෢1 − 𝑃
𝑃 ෢2 − (𝑃1 − 𝑃2 )
Statistica testului este: 𝑍=
ത − 𝑃)
𝑃(1 ത ത − 𝑃)
𝑃(1 ത
+
𝑛1 𝑛2

Când ipoteza H0 este adevărată, statistica Z respectă o
distribuţie normală standard.
Există trei variante de formulare a ipotezelor:

H0: 𝐏 ෢𝟐  𝐏
෢𝟏 = 𝐏 ෢𝟏 - 𝐏
෢𝟐 = 0;
෢𝟏  𝐏
H1: 𝐏 ෢𝟐  𝐏 ෢𝟐  0
෢𝟏 - 𝐏 - test two-tail

H0: 𝐏 ෢𝟐  𝐏
෢𝟏 = 𝐏 ෢𝟏 - 𝐏
෢𝟐 = 0;
H1: 𝐏 ෢𝟐  𝐏
෢𝟏 < 𝐏 ෢𝟏 - 𝐏
෢𝟐 < 0 - test one-tail

H0: 𝐏 ෢𝟐  𝐏
෢𝟏 = 𝐏 ෢𝟏 - 𝐏
෢𝟐 = 0;
෢> 𝐏
H1: 𝐏 ෢𝐏 ෢-𝐏 ෢>0 - test one-tail
Exemplu:
Sindromul Noonan este o condiţie genetică care influenţează dezvoltarea
inimii, coagularea sângelui şi dezvoltarea mentală şi fizică. Într-un studiu
clinic pe 29 bărbaţi şi 44 femei cu sindrom Noonan a fost analizată statura lor.
Valoarea de prag folosită pentru evaluarea staturii a fost a treia percentilă din
înălţimea unui adult normal. 11 dintre bărbaţii investigaţi şi 24 dintre femei
au fost identificaţi cu înălţimea sub valoarea de prag stabilită, raportată pe
genuri.
Acest studiu furnizează suficiente argumente pentru a concluziona că, între
pacienţii cu sindrom Noonan, femeile sunt mai susceptibile decât bărbaţii să
aibă înălţimea sub valoarea de prag stabilită? Se consideră α=0.05.

DATE: Statistica: ෢ ෢2 − (𝑃1 − 𝑃2 )


𝑃1 − 𝑃
𝑍=
nM = 29, nF = 44 ത − 𝑃)ത ത − 𝑃)ത
𝑃(1 𝑃(1
aM = 11, aF = 24 𝑛1
+
𝑛2

= 0.05 Calcule:

𝟏𝟏 + 𝟐𝟒 0,545 −0,479 −0
ഥ=
𝑷 = 𝟎, 𝟒𝟕𝟗 Z= = 1,39 < 1,645
𝟐𝟗 + 𝟒𝟒 0,479∙0,521 0,479∙0,521
+
𝟏𝟏
𝑷෢𝑴 = = 𝟎, 𝟑𝟕𝟗 , 𝑷 ෢𝑭 = 𝟐𝟒 = 𝟎, 𝟓𝟒𝟓 44 29
𝟐𝟗 𝟒𝟒
P1 = P2
Populaţiile sunt independente.

IPOTEZE:
H0: PF = PM  PF – PM = 0
H1: PF > PM  PF – PM > 0

Criteriul de decizie:
Valoarea critică este Z1-=Z1-0,05 = Z0,95 = 1,645.
Se respinge H0 dacă Z > 1,645

Calcule:

Z = 1,39 < 1,645

H0 nu este respinsă, p > 0.05 (p = 0.0823)

Dintre pacienţii cu sindrom Noonan, femeile nu sunt mai susceptibile decât


bărbaţii să aibă înălţimea mai mică decât valoarea de prag stabilită.
FAZA I: METODOLOGIA
FAZA V:
Identificarea
Comunicarea
subiectului cercetării
CERCETĂRII
rezultatelor
Raportarea rezultatelor IDENTIFICAREA
- Direcţii pt. cercetările PROBLEMEI
ulterioare

Revizuirea datelor din


literatură – cadrul de
lucru teoretic

IDENTIFICAREA
FAZA IV: VARIABILELOR
Analiza datelor

Interpretarea FORMULAREA
rezultatelor IPOTEZEI – scopul FAZA II:
cercetării Proiectarea studiului

STABILIREA
Analiza datelor PROTOCOLULUI –
FAZA III: Alegerea eşantionului
Metode

COLECTAREA
DATELOR

S-ar putea să vă placă și