Sunteți pe pagina 1din 17

TESTE DE

SEMNIFICATIE
1. COMPARAREA MEDIILOR
PROBLEMA:
Se lucrează cu 2 eşantioane de volume
diferite, n1, n2; se găsesc medii
corespunzătoare m1, m2 pentru o variabila
data x.
Trebuie determinat dacă diferenţa observată
între cele două medii este datorată unei
fluctuaţii aleatoare sau corespunde unei
diferenţe reale cauzata de natura celor două
eşantioane, fiind “semnificativă”.
SOLUTIE: 1
Se studiaza intervalul de
confidenta al mediei in
fiecare esantion.
SITUATII POSIBILE:
m1 m2

3 2

m1 m2
m1 m2
REZOLVAREA CAZULUI 3:
Se foloseste un TEST DE IPOTEZA:

2 MODALITĂŢI:
1. Ipoteza nulă: parametrii de comparat
se consideră egali
H0: m1 = m2
2. Ipoteza alternativă: parametrii de
comparat se consideră diferiţi.
H1: m1 ≠ m2

IPOTEZA NULĂ: Cele două eşantioane aparţin aceleiaşi


populaţii de origine. Se vor determina abaterea maximă şi
abaterea limită care pot fi observate între cele două medii
considerate, sub influenţa fluctuaţiilor statistice.
TESTUL T - Student
ASPECTE PRACTICE:
Sunt necesare 2 variabile:
-O variabila cantitativa, continua (variabila dependenta):
reprezinta variabila de analizat
CONDITII: - normal distribuita;
- varianţele in cele doua loturi omogene.
- O variabila calitativa binara (variabila independenta):
imparte esantionul in cele 2 loturi.

Se analizeaza daca exista diferente SEMNIFICATIVE


STATISTIC intre valorile variabilei cantitative intre cele
doua loturi determinate de variabila binara.
VARIANTE DE FORMULE DE CALCUL AL
PARAMETRULUI T:
1. FORMULA DE BAZA (varianţe egale):

x1 − x2
t=
∑x +∑x
2
1
2
2 1 1
⋅  + 
n1 + n2 − 2  n1 n2 

2. FORMULA SEPARATA: x1 − x2
t=
(varianţe diferite)
σ2
σ 2
1
+ 2
n1 n2
3. TESTUL T CORELAT (eşantioane dependente):
x1 − x2
t=
σ 2
σ 2
σ1 σ 2
+1
− 2r ⋅
2

n1 n2 n1 n2
OBSERVATII:
2) Daca variabila continua nu este normal distribuita, testul
t nu poate fi folosit; in locul sau se vor folosi teste
neparametrice:
- Mann-Whitney U – pt. var. cantitative;
- Chi-patrat – pt. var. calitative.
2) Omogenitatea varianţelor se testeaza separat, prin testul
Levene; daca varianţele nu sunt omogene, testul t de
asemenea nu poate fi folosit) :
INTERPRETARE:

1. Se calculeaza coeficientul t;
2. Se fixeaza un interval de incredere al ipotezei nule,
formulate anterior, P (95% sau 99%) si se cauta in tabele
valorile teoretice ale coeficientului t pentru acel interval, in
conditiile date.
3. Se compara t-calculat cu t-teoretic:
- daca t-calculat > t-tabel:
IPOTEZA NULA ESTE INFIRMATA
=> DIFERENTA INTRE MEDII ESTE SEMNIFICATIVA
STATISTIC
- daca t-calculat < t-tabel:
IPOTEZA NULA ESTE CONFIRMATA
=> DIFERENTA INTRE MEDII ESTE
INTAMPLATOARE
PRACTIC, orice software de analiza statistica determina un
coeficient de incredere p, referitor la confirmarea ipotezei
nule cu o probabilitate de 95 sau 99%:
- Daca p < 0.05 (sau p<0.01)
=> IPOTEZA NULA ESTE INFIRMATA
=> DIFERENTA INTRE MEDII ESTE SEMNIFICATIVA
STATISTIC
- Daca p > 0.05 (sau p > 0.01)
=> IPOTEZA NULA ESTE CONFIRMATA
=> DIFERENTA INTRE MEDII ESTE
INTAMPLATOARE
2. COMPARAREA DISPERSIILOR

PROBLEMA:
Se lucrează cu mai mult de 2 eşantioane de
volume diferite; se doreste compararea
valorilor pentru o variabila data x, intre aceste
esantioane.
Se vor studia diferentele intre toate loturile,
prin analiza varianţelor inter şi intra grup.
(ANOVA – Analysis of Variance)
IPOTEZA NULA:
Loturile provin din aceeasi populatie de origine,
adica mediile variabilei studiate pentru fiecare lot
in parte sunt egale.

ASPECTE PRACTICE:
Sunt necesare 2 variabile:
-O variabila cantitativa, continua (variabila dependenta):
reprezinta variabila de analizat
CONDITII: - normal distribuita;
- varianţele la nivelul fiecărui lot omogene.
- O variabila calitativa nominală (variabila independenta):
imparte esantionul in loturi.
VARIANŢA INTRA-GRUP: Vi
k esantioane, fiecare compus din nk valori individuale
Suma abaterilor patratice de la media grupului, pt. fiecare
esantion in parte:
n
S 2j = ∑ ( xi − x) 2 , j = 1, k
i =1

S 2 = S12 + S 22 + ... + S k2
n1 n2 nk
⇒ S 2 = ∑ ( xi1 − x1 ) 2 + ∑ ( xi2 − x 2 ) 2 + ... + ∑ ( xik − x k ) 2
i1 =1 i2 =1 ik =1

k nj

⇒ S 2 = ∑∑ ( xi j − x j ) 2
j =1 i j =1

γ = (n1 − 1) + (n2 − 1) + ... + (nk − 1)


⇒γ = N −k 1 k nj

⇒ Vi = ⋅ ∑∑ ( xi j − x j ) 2

N − k j =1 i j =1
VARIANŢA INTER-GRUP: Vo
k esantioane, fiecare compus din nk valori individuale
Toate valorile din grup se asimileaza la media grupului
si se determina abaterile de la media generala a
esantionului:

S '2 = n ⋅ ( x − X ) 2
S '2 = S1'2 + S 2'2 + ... + S k'2
⇒ S '2 = n1 ⋅ ( x1 − x) 2 + n2 ⋅ ( x 2 − x) 2 + ... + nk ⋅ ( x k − x) 2
k
⇒ S = ∑ ni ⋅ ( x i − x) 2
'2

i =1

γ = k −1

k
1
⇒ Vo = ⋅ ∑ ni ⋅ ( xi − x) 2

k − 1 i =1
Se calculeaza:
VARIANŢA INTRA-GRUP: Vi
VARIANŢA INTER-GRUP: Vo
VARIANŢA TOTALĂ A EŞANTIONULUI: Vt = Vi + Vo

Se defineste raportul F = Vo / Vi si se compara cu valorile


teoretice, obtinute din tabele, pentru un interval de incredere
stabilit (95% sau 99%).

- daca F-calculat > F-tabel:


IPOTEZA NULA ESTE INFIRMATA
=> DIFERENTA INTRE MEDII ESTE
SEMNIFICATIVA STATISTIC
- daca F-calculat < F-tabel:
IPOTEZA NULA ESTE CONFIRMATA
=> DIFERENTA INTRE MEDII ESTE
INTAMPLATOARE
CORELATIA
STATISTICA
DIAGRAMA DE DISPERSIE
4,5 3,5
4 3
3,5 2,5
3
2
2,5 y
y 1,5
2
1,5 1

1 0,5
0,5 0
0 0 0,5 1 1,5 2 2,5
0 0,5 1 1,5 2 2,5 x
x

y3

0
0 2 4 6 8
x
COVARIANTA: P=
∑ ( x − x)( y − y )
N

-CORELATIE POZITIVA: ∑ ( x − x)( y − y) > 0


-CORELATIE NEGATIVA: ∑ (x − x) ⋅ ( y − y) < 0
-CORELATIE ZERO:
∑ ( x − x)( y − y) → 0

COEFICIENTUL DE CORELATIE
LINIARA:
.

r=
P
=
∑ ( x − x)( y − y)
σ x ⋅σ y N ⋅σ x ⋅σ y