Curs Anova

TESTE DE COMPARATIE
Conf. Dr. Mihaela Moscalu

Conf. Dr. Lucian V. Boiculese
ERORILE DE TIP I ŞI II
 Eroarea de tip I (α) apare atunci când tragem concluzia că un efect este
semnificativ statistic, însă diferenţa a fost datorată întâmplării.
 Tratamentul nu a avut nici un efect, iar variabilitatea întâmplătoare prezentă în cele două grupuri
ne-a făcut să tragem concluzia greşită că între ele există o diferenţă.
 Probabilitatea de a efectua o astfel de greşeală este p.
 Eroarea de tip II (β) apare atunci când tragem concluzia că nu există un efect
semnificativ statistic, dar tratamentul este eficace.
 Tratamentul a avut efect, însă variabilitatea întâmplătoare prezentă în cele două grupuri a ascuns
diferenţa.
 Această eroare apare atunci când studiul nu a avut destulă putere statistică.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE
Etapele de urmat în verificarea prin test statistic vor fi:
 1. Enunțarea ipotezei. Se definesc ipotezele: nula, respectiv alternativa. Acestea

urmăresc scopul cercetării, exprimând ceea ce avem de verificat.
 2. Alegerea parametrului de studiu (poate sa fie conținut implicit în enunțarea ipotezei).

Ca exemple avem: media, varianta, relația exprimata prin corelație, parametrii de regresie,
proporții în cadrul populațiilor, etc.
 3. Deducerea si calculul statisticii discriminante dorite aplicând regula de decizie.

De exemplu, la compararea mediilor se poate lua în calcul o noua variabila aleatoare
definita ca diferența între indicatori. În acest caz aceasta poate urma o distribuție de tip t
(Student) sau Z, deci normala.
 4. Acceptarea sau respingerea ipotezei prin calculul semnificației p. Se calculează

statistica (t, Z sau Fisher spre exemplu) din datele eșantioanelor de lucru. Corespunzător
se deduce valoarea p, care reprezintă probabilitatea de a avea o eroare de tip I. Aceasta
este o integrala în cadrul distribuției de frecventa determinate si reprezintă semnificația
testului.
Testele de ipoteza sunt foarte importante deoarece reprezintă o metoda statistica de

decizie bazata pe „cântărirea” cunoștințelor obiective, prin estimări probabilistice asupra
setului de valori determinate practic.
 Testul ipotezei simple – compararea mediei unui esantion cu o valoare de referinta

Acest test consta în specificarea valorile parametrilor necunoscuți din cadrul unei
repartitii. Este vorba de seturi de date de tip continuu.
Ca exemple putem prezenta verificarea egalitatii mediei glicemiei unui subgrup cu

valoarea standard cunoscuta, sau media presiunii arteriale, sau greutatea la nastere etc.
 Testul ipotezei duble – compararea mediilor a doua esantioane (t, Student)

Foarte frecvent în aplicatiile de tip medical (si nu numai) apare problema compararii unor
parametri dintr-un esantion cu parametrii altui esantion (pot fi chiar din aceeasi populatie,
dar la momente diferite).
 Când dorim să comparăm mai mult de două grupe de subiecţi nu vom

mai folosi testul t, ci vom apela la tehnicile ANOVA cunoscută şi sub
denumirea de analiză dispersională sau analiză de varianţă
Testul ipotezei multiple – compararea mediilor mai multor eșantioane

(ANOVA)
 Presupunem ca avem de determinat semnificația diferențelor dintre m

grupe independente de date.
 Făcând apel la cunoștințele deja prezentate, un posibil răspuns ar fi sa

comparam doua câte doua, grupuri în toate combinațiile posibile (se va
aplica testul t). Daca am avea 10 loturi atunci numărul de teste ar fi
combinări de 10 luate câte 2, adică 45. Un număr destul de mare de
variante.
 Utilizând testul t de comparaţii in cazul în care avem o variabilă independentă cu

3 modalităţi va trebui să îl utilizăm de trei ori câte o data pentru fiecare din cele
trei perechi de câte 2 modalităţi adică în cazul comparării grupei 1 cu grupa 2,
grupei 1 cu grupa 3 şi grupei 2 cu grupa 3.
 Orice calcul statistic presupune efectuarea unor erori ori calculând teste t ar
trebui să calculăm trei astfel de teste iar utilizând ANOVA, vom obţine un singur
indicator F.
 Fiecare test t calculat introduce distorsiuni care se calculează după formula
următoare:
1-(1-α)C
unde α este pragul de semnificaţie stabilit pentru fiecare test t efectuat (frecvent p=0.05), iar c este dat
de numărul de teste t ce trebuie efectuate.
 Dacă există doar două grupe de subiecţi, se aplică un singur test t pentru a testa diferenţele
dintre mediile celor două grupe
 Dacă există trei grupe de subiecţi, precum în situaţia prezentată mai sus, vom avea de aplicat
trei teste.
1-(1-0.05)1=0.05
1-(1-0.5)3=0.15
 Aplicând formula de mai sus, observam că doar în primul caz (un singur test t pentru un design
cu două eşantioane de comparat), probabilitatea de a comite o eroare de tip I rămâne .05 în cel
de al doilea caz prezentat de noi ea devine de 0.15 situaţie in care vom respinge ipoteza nulă
când ea nu ar fi trebuit respinsă.
 Din acest motiv nu vom putea utiliza testul t în situaţii de comparare a mai mult de două grupe.
 Totuşi unii autori utilizează testele t şi efectuează o ajustare, prin metoda Bonferroni, astfel încât
să elimine eroarea setului de comparaţii şi să controleze şansele de a comite eroarea de tip I.
 Din punct de vedere statistic această abordare nu aduce un plus de rigoare in cercetare ci
dimpotrivă creşte şansa de a comite eroarea de tip I, iar atunci când aceasta este controlată,
sporesc şansele de comitere a erorii de tip II, motiv pentru care nu recomandam acest tip de
demers in cercetare.
 Prin analiza variantei numita ANOVA (analysis of variances) se aplica un singur

test, ce respecta o statistica de tip Fisher pentru determinarea semnificației
diferenței dintre mediile eșantioanelor.
 Presupunem ca avem m grupe de date, fiecare grup j având nj elemente. Notam

un element din întregul set de valori cu xij, unde i reprezinta pozitia elementului
din grupul j. Astfel i variază de la 1 la nj, iar j de la 1 la m.
 Ipoteza H0 este: 1 =2... =j=... =m, iar alternativa,
 H1: Exista cel puţin doua grupe de medii diferite. Exista k, l pentru care k≠l.
 Ca ipoteza de lucru, se presupune ca fiecare grup de date este distribuit

normal iar dispersiile sunt egale între grupuri.
 Aceste presupuneri trebuie verificate, altfel testul ANOVA nu poate fi

aplicat.
 Variația variabilei aleatoare X de interes este măsurata conventional în termeni ai deviației fata
de valoarea medie.
 Suma totala a patratelor deviatiilor este (total sum of square): SST
Aceste variații reprezintă:
 Suma totala a patratelor deviatiilor: SST
 Suma pătratelor deviațiilor între grupuri (sum of square between): SSB
 Suma pătratelor deviațiilor în grupuri (sum of square within): SSW
 Avem egalitatea: SST = SSW + SSB.
Deducem astfel, ca exista doua surse de variație, între grupuri si în cadrul grupurilor. Raportul
mediilor acestor doua surse de variație respecta (în cazul presupunerilor de repartitii normale si
dispersii egale) o distribuție de tip Fisher. Aceasta este statistica de analizat în studiul de tip ANOVA.
În final se va determina valoarea statisticii Fisher.

 Pentru interpretare se calculează valoarea F prin raportul prezentat si se

compara cu valoarea tabelata corespunzătoare gradelor de libertate determinate
si unui nivel de semnificație standard de 5% (0,05).
 Daca valoarea calculata este mai mare decât cea tabelata, rezulta ca mediile nu
sunt egale si exista cel puțin doua grupe cu diferența semnificativa statistic.
 Daca se calculează valoarea semnificației, aceasta se va compara cu valoarea

5%. În situația în care este mai mica atunci exista diferența semnificativa
statistic.
 Testul ANOVA în cazul existentei diferenței semnificative are dezavantajul de a

nu putea prezenta care sunt grupurile care diferă.
 Aceasta metoda este optima în situația în care nu avem diferența semnificativa

între grupe deoarece am realizat un singur test pentru m grupe de comparație.
Clasificarea tehnicilor ANOVA
Cele mai întâlnite design-uri de cercetare experimentală utilizează una dintre

următoarele patru forme de analiză de varianţă:
 ANOVA simplă sau unifactorială
 ANOVA cu măsurători repetate
 ANOVA factorială cel mai utilizat fiind bifactorială
 ANOVA mixtă.
ANOVA unifactorială este modelul cel mai simplu dintre tehnicile ANOVA, fiind un
corespondent al testului t pentru două eşantioane independente.
Exemplu:
 Un cercetător doreşte să vadă dacă profesia influenţează competitivitatea
interpersonală. În acest sens selectează aleator trei grupuri de bărbaţi: fotbalişti
profesionişti, profesori de colegiu şi manageri care sunt evaluaţi pentru a se
determina cat de mult le place competiţia interpersonală. Scorurile mari indică
nivele ridicate ale competitivităţii.
ANOVA cu măsurători repetate este un model corespondent al testului t pentru

două eşantioane perechi.
Exemplu:
 Intr-o experienţă de psihofarmacologie, vrem să studiem efectul a două
substanțe de tipul amfetaminei asupra timpilor de reacţie la un test
psihomotricitate. Pentru a controla o posibilă sursă de eroare, se folosesc
aceiaşi subiecţi cărora li se aplică, la intervale de două săptămâni, trei
tratamente diferite: cu substanţa α, cu substanța β şi placebo. Se măsoară de
fiecare dată timpii de reacţie ai subiecţilor exprimaţi în milisecunde.
 Intr-un studiu de psihologia muncii vrem să evidenţiem efectul zgomotului

asupra discriminării perceptive. În acest scop, subiecţii sunt supuşi unui număr
de trei condiţii experimentale-dimineaţa la începutul zilei de muncă. În prima
realizează o sarcină de discriminare perceptivă în absenţa zgomotului, in a doua
sarcină zgomotul este intermitent iar în a treia sarcină zgomotul este continuu.
Se monitorizează erorile efectuate
Compararea seturilor de date prin testul t corelat şi metoda ANOVA
 Se doreşte compararea valorilor unui parametru între două eşantioane diferite, dar dependente – caracterizate
prin aceea că valorile parametrului cantitativ care se analizează provin de la aceiaşi subiecţi (de
exemplu, într-un lot de pacienţi se doreşte compararea valorilor glicemiei la momentul 0 şi la momentul 3 luni,
cele 2 determinări fiind realizate la aceleaşi persoane):
 În această situaţie se foloseşte tot testul t; în notaţiile anterioare, diferă numai formula de calcul a lui t,
folosindu-se ceea ce se numeşte testul t corelat (t-pairs, sau t-Test: Paired Two Sample For Means)
 Testul t în această formă determină dacă valorile variabilei urmărite la cele două momente în timp provin din
populaţii cu media aritmetică a variabilei egală. Nu este necesară verificarea unor condiţii privind varianţa
parametrului în cele două populaţii.
 Excel: Se selectează comanda Data / Data Analysis / t-Test: Paired Two Sample For Means
 În plus faţă de cazul anterior este calculat şi un coeficient de corelaţie între cele 2 variabile, Glicemia la
momentul 0 şi Glicemia la momentul 3 luni, Pearson Correlation, a cărui semnificaţie va fi discutată ulterior şi
care are rolul de a măsura intensitatea legăturii între ele – legătura între două variabile fiind cu atât mai
puternică cu cât acest coeficient este mai apropiat de 1.
 MANOVA factorială este un model mai complex, testând efectele mai multor variabile independente
(factori) asupra unei variabile dependente.
 Varianta multivariată (MANOVA) – în cazul în care există mai mulţi factori de grupare a variabilelor;
Exemplu:
 Deoarece diverse parţi ale creierului sunt specializate pentru comportamente specifice, studiile au
arătat că diferenţele dintre stângaci şi dreptaci se datorează diferenţelor în ce priveşte emisfera
dominantă. Pornind de la acest fapt cercetătorii au presupus că dreptacii şi stângacii au abilităţi şi
talente diferite. În vederea testării acestei ipoteze un psiholog a evaluat discriminarea de acord
componentă a abilităţilor muzicale- pentru trei grupuri de subiecţi: stângaci, dreptaci şi ambidextri în
două condiţii experimentale: când subiecţii sunt odihniți si după 24 de ore in condiţiile privării de somn.
Performanţa discriminativă a subiecţilor a fost măsurată cu o probă specifică.
ANOVA factorială poate fi utilizată în cazul măsurătorilor repetate dacă sunt manipulaţi cel puţin doi factori.
Exemplu:
 Un psiholog educaţional studiază motivaţia elevilor. Un lot de 7 subiecţi sunt urmăriţi timp de 3 ani din
clasa a patra până în clasa a şasea. În fiecare an elevii completează un chestionar măsurând motivaţia
şi entuziasmul pentru şcoală centrat pe 3 discipline: matematica, romana, muzica. Psihologul vrea să
ştie dacă apar schimbări semnificative între nivelurile de motivaţie de-a lungul celor 3 ani si intre
interesul pentru diferite discipline.
ANOVA mixtă este o combinaţie între ANOVA simplă şi ANOVA cu

măsurători repetate.
Exemplu:
 Intr-o cercetare care vizează efectul imaginilor mentale un grup
de 16 studenţi - dintre care 50% sunt fete şi restul băieţi, este
supus la trei condiţii experimentale la interval de două săptămâni.
Prima condiţie presupune învățarea fiecărui cuvânt însoţit de
desenarea acestuia – „imagine mentală construită”, a doua
condiţie presupune învăţarea cuvântului însoţită de copierea
imaginii acestuia care îi este prezentată împreună cu cuvântul–
„imagine mentală dată” . Al treilea grup învaţă cuvintele pur şi
simplu „ condiţia de control”. Ce se poate spune cu privire la
efectele tipului învăţării asupra numărului de cuvinte reamintite la
fete şi băieţi?
Condiţii necesare pentru aplicarea ANOVA

 (1) Eşantionul a fost selectat aleator din populaţie, iar dacă acest lucru nu este posibil
se recomandă ca măsură compensatorie distribuirea aleatoare a subiecţilor în grupele
experimentale.
 (2) Variabila dependentă prezintă distribuţie normală. Această condiţie este greu de
îndeplinit în cazul în care grupele experimentale sunt constituite dintr-un număr mic de
subiecţi (ex. n = 10).
 (3) Dispersia subiecţilor împărţiţi pe grupe experimentale să fie egală. Testul Levene
este special construit pentru a observa în ce măsură este realizată această omogenitate a
dispersiei.
 (4) Pentru ANOVA pe măsurări repetate apare o condiţie suplimentară denumită condiţia
de sfericitate. Aceasta implică premisa unei relaţii similare între fiecare pereche de
condiţii experimentale, ea fiind o condiţie mai generală a simetriei complexe. Aceasta din
urmă este îndeplinită, dacă dispersia este egală în toate situaţiile experimentale
(omogenitatea dispersiei) În practică se observă că este foarte dificil de îndeplinit dubla
condiţie, majoritatea design-urilor ANOVA cu măsurători repetate cu mai mult de două
grupe încălcând această condiţie
Tehnicile ANOVA sunt destul de robuste la nerespectarea primelor două

condiţii. Cu alte cuvinte, indicele general F nu este afectat foarte mult de
primele două condiţii. În schimb, neîndeplinirea condiţiei patru, absenţa
unei omogenităţi a dispersiei dintre grupe, afectează semnificativ
valorile lui F. Într-o asemenea situaţie sunt posibile două măsuri alternative:
 (a) renunţarea la aplicarea tehnicilor ANOVA şi utilizarea unor tehnici

corespondente neparametrice;
 (b) aplicarea tehnicilor parametrice ANOVA prin apelul la o corecţie a

gradelor de libertate la interpretarea lui F.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE.
ALEGEREA TESTELOR POST HOC
Testul ANOVA, însă, se foloseşte numai dacă este verificată condiţia de egalitate a varianţelor între grupuri –
care se verifică prin testul F de omogenitate a varianţelor.
 ANOVA nu determină însă decât dacă există sau nu diferenţe semnificative statistic între toate mediile
valorilor parametrului numeric analizat corespunzătoare grupurilor generate de parametrul calitativ, dar
nu indică exact între ce grupuri apar diferenţele semnificative statistic între medii. Pentru a se stabili
acest lucru, se poate apela la aşa-numitele „teste post-hoc”, iar în particular la următoarele teste:
 Testele de comparaţie multiplă pairwise LSD şi Bonferroni, care verifică diferenţele între fiecare pereche
de medii şi generează o matrice în care sunt marcate cu  mediile semnificativ diferite cu un prag de
semnificaţie de 0.05:
 Testul LSD realizează comparaţii perechi între mediile grupurilor, fără a ajusta rata de eroare în
cazul comparaţiilor multiple.
 Testul Bonferroni funcţionează analog, dar controlează rata globală de eroare prin limitarea ratei
de eroare a fiecărui test sub o anumită valoare de prag, determinată experimental.
 Testele de rang multiplu – SNK (Student – Newman-Keuls), care identifică grupurile de medii omogene.
Testul SNK realizează toate comparaţiile perechi între medii, identifică subgrupurile de medii omogene
şi ordonează crescător mediile în cadrul acestora. În cazul în care eşantioanele au dimensiuni egale,
compară de asemenea şi perechile de medii din interiorul subgrupurilor omogene.
Număr de subiecţi
Egali Relativ Profund

Alegerea testelor post hoc
inegali inegali
Dispersii Scheffe Gabriel Hochberg

egale Tukey Tukey b GT2
Omogenitatea
dispersiei Dispersii Dunnett T3 Games- Games-
inegale Howell Howell
 Dacă numărul de subiecţi este un criteriu evident încă din datele iniţiale ale unei cercetări,
omogenitatea dispersiei se testează prin apelul la testul Levene.
 Dacă rezultatul este nesemnificativ statistic, dispersiile dintre cele două grupe sunt
considerate egale.
 Când rezultatul este semnificativ statistic, dispersiile vor fi considerate a fi
eterogene, diferite şi vom apela la metodele de comparare post-hoc precizate în
cazul dispersiilor inegale, după ce, anterior am ajustat citirea lui F.
 In cea ce privesc testele post-hoc trebuie menţionat că acestea se interpretează în

valoare absolută semnul minus neînsemnând altceva decât faptul că subiecţii au obţinut,
în medie, rezultate mai mari la a doua grupă de comparaţie decât la prima. Pentru cei
comozi, SPSS-ul oferă un sprijin important în a identifica diferenţele semnificative la un p <
.05, acestea fiind marcate cu asterisc in cazul în care selectăm această opțiune.
EXEMPLE
 Pentru a decide cu privire la metoda de analiză statistică adoptată va trebui să

verificăm forma distribuţiei datelor.
 Dacă datele prezintă o distribuţie normală la nivelul populaţiei atunci vom utiliza
metoda inferenţiale parametrice – respectiv ANOVA cu un singur factor intergrup
(One Way Anova), iar dacă asumţia cu privire la normalitatea distribuţiei nu este
îndeplinită vom folosi metode inferenţiale nonparametrice, respectiv testul U
generalizat denumit şi Kruskal – Walis sau proba medianei extinsă – opţiunea
depinzând de particularităţile datelor.
 În vederea verificării formei distribuţiei vom utiliza testul non-parametric

Kolmogorov – Smirnov pe fiecare eşantion ce urmează a fi comparat.
 În acest sens vom selecta funcţia de SPLIT FILE din meniul DATA şi vom cere
organizarea output-ului în funcţie de modalităţile variabilei independente ( adică
a tipului de program) aşa cum apare în ecranele de mai sus.
 Analizând valorile testului Kolmogorov – Smirnov în toate cele 3 condiţii ale

variabilei program, constatăm că datele respectă criteriul de normalitate la
nivelul populaţiei din care fac parte.
 În consecinţă vom utiliza metode de analiză parametrice şi anume ANOVA cu un

singur factor intergrup (One Way Anova).
 Analiza statistică descriptivă relevă existenţa unor diferenţe între mediile timpilor
necesari reinserţiei profesionale a personalului cuprins în programele de
reinserţie în funcţie de tipul programului. Vom analiza în continuare în ce măsură
aceste diferenţe între medii se datorează hazardului sau sunt efectul
programelor de reinserţie la care participă persoana.
 În cazul nostru fiind vorba de dispersii egale şi număr egal de subiecţi putem
opta pentru Scheffe sau Tukey. Cum însă Scheffe este un test statistic mai
puternic prima noastră opţiune va fi pentru acesta.
EXEMPLUL 1
Într-un studiu, un cercetător a dorit să determine influenţa a trei medicamente asupra bolii. În
acest sens, au fost selectaţi aleator câte un număr de 20 subiecţi care să participe la fiecare
din cele trei studii . In vederea evaluării eficienţei medicamentului s-a măsurat perioada de
timp exprimată în săptămâni necesară fiecăruia pentru a se însănătoşi.
Med 1 Med 2 Med 3
1. 1 8 1
Pasul 1 1.
1.
3
5
7
5
3
4
Identificarea variabilelor 1. 4 6 2
1. 7 9 6
 variabilă independent: medicamentul 1. 6 7 3
1. 7 2 5
 şi variabila dependentă X – eficienţa lui 1. 8 7 1
1. 4 9 7
Pasul 2 1. 5 8 5
1. 4 7 1
Designul cercetării 1. 2 9 3
1. 6 5 5
1. 7 7 2
1. 8 9 6
1. 4 7 7
1. 1 2 8
1. 3 7 4
1. 5 9 1
1. 6 9 3
1. 7 7 5
Pasul 3
Ipoteza
 Eficienţa medicamentelor diferă semnificativ
 Sau
 Există diferenţe semnificative între perioada de timp necesară vindecării în funcţie de tipul
medicamentului.
Pasul 4
Construcţia bazei de date şi alegerea metodei statistice
 În consecinţă, în baza de date vom avea două variabile, tiptratament cu trei modalităţi şi eficienta =
perioada de timp [luni].
 Pentru a decide cu privire la metoda de analiză statistică adoptată va trebui să verificăm

forma distribuţiei datelor.
Dacă datele prezintă o distribuţie normală la

nivelul populaţiei atunci vom utiliza metoda
inferenţiale parametrice – respectiv ANOVA cu
un singur factor intergrup (One Way Anova), iar
dacă asumţia cu privire la normalitatea
distribuţiei nu este îndeplinită vom folosi metode
inferenţiale nonparametrice, respectiv testul U
generalizat denumit şi Kruskal – Walis sau proba
medianei extinsă – opţiunea depinzând de
particularităţile datelor.
În vederea verificării formei distribuţiei vom

utiliza testul non-parametric Kolmogorov –
Smirnov pe fiecare eşantion ce urmează a fi
comparat.
În acest sens vom selecta funcţia de SPLIT FILE
din meniul DATA şi vom cere organizarea
output-ului în funcţie de modalităţile variabilei
independente (adică a tipului de program).
 Analizând valorile testului Kolmogorov – Smirnov în toate cele 3 condiţii ale variabilei program, constatăm că datele respectă
criteriul de normalitate la nivelul populaţiei din care fac parte.
 În consecinţă vom utiliza metode de analiză parametrice şi anume ANOVA cu un singur factor intergrup (One Way Anova).
 Pasul 5
 Analiza statistică propriu – zisă
 Analiza statistică descriptivă relevă existenţa unor diferenţe între mediile timpilor necesari vindecării în
funcţie de tipul tratamentului.
 Vom analiza în continuare în ce măsură aceste diferenţe între medii se datorează hazardului sau sunt
efectul tratamentului.
Testul de omogenitate Levene

ne arata în ce măsură
eşantioanele comparate sunt
omogene din punct de vedere al
varianţei, în cazul de faţă
Levene = 0.612 şi p = 0.546 >
pragul critic p =0.05 ceea ce ne
permite să afirmăm că cele trei
eşantioane comparate sunt
omogene din punct de vedere al
varianţei.
Să nu uităm că omogenitatea
varianţei eşantioanelor
comparate este o condiţie
necesară pentru analiza de
varianţă.
Interpretarea rezultatelor
 Analizând în continuare relaţia dintre timpul
necesar vindecării şi tipul de tratament,
obţinem un F (2, 60) = 11.323 şi un p =0.000 <
p critic =0.01 deci putem afirma cu un risc de a
greşi de 1% că perioada de timp necesară
vindecării diferă în funcţie de tratament.
 Testul F omnibuz fiind un test global nu ne

permite să vedem între care dintre cele 3
programe există diferenţe, în consecinţă vom
apela la teste post – hoc.
 În cazul nostru fiind vorba de dispersii egale şi

număr egal de subiecţi putem opta pentru
Scheffe sau Tukey. Cum însă Scheffe este un
test statistic mai puternic prima noastră opţiune
va fi pentru acesta.
 Analizând rezultatele testelor post – hoc

constatăm că diferenţa mediilor dintre timpii
necesari vindecării în cazul tratamentului 1,
comparativ cu tratamentul 2 este de – 2.048
semnificativ la un p =0.01 < pragul critic de
0.05, ceea ce ne permite să afirmăm cu un
risc de a greşi mai mic de 2 % că subiecţii cu
tratamentul 2 au nevoie de un timp mai mare
pentru a se vindeca comparativ cu cei care
urmează tratamentul 1, cu aproximativ 2
săptămâni ( în medie).
 Comparând rezultatele persoanelor implicate

tratamentul 2 comparativ cu cei implicaţi în
tratamentul 3, diferenţele mediilor sunt de
3.048 şi p = 0.000.
 Putem afirma cu un risc de a greşi mai mic de
1 % că subiecţii cu tratamentul 2 au nevoie de
un timp mai lung – în medie cu 3.04 săptămâni
– comparativ cu subiecţii cu tratamentul 3
pentru a se vindeca.
 Sintetizând, putem afirma că tratamentul 2
este cel mai puţin eficient, eficienţa lui
diferind semnificativ atât de tratamentul 1 cât
şi de tratamentul 3, motiv pentru care în cazul
replicării acestei intervenţii la acest tratament
am fi îndreptăţiţi să renunţăm fiind cel mai
puţin eficient.

Curs Anova

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Curs Anova

Încărcat de

Drepturi de autor:

Formate disponibile

TESTE DE COMPARATIE

Conf. Dr. Mihaela Moscalu

Etapele de urmat în verificarea prin test statistic vor fi:

 1. Enunțarea ipotezei. Se definesc ipotezele: nula, respectiv alternativa. Acestea

 2. Alegerea parametrului de studiu (poate sa fie conținut implicit în enunțarea ipotezei).

 3. Deducerea si calculul statisticii discriminante dorite aplicând regula de decizie.

 4. Acceptarea sau respingerea ipotezei prin calculul semnificației p. Se calculează

Testele de ipoteza sunt foarte importante deoarece reprezintă o metoda statistica de

 Testul ipotezei simple – compararea mediei unui esantion cu o valoare de referinta

Ca exemple putem prezenta verificarea egalitatii mediei glicemiei unui subgrup cu

 Testul ipotezei duble – compararea mediilor a doua esantioane (t, Student)

 Când dorim să comparăm mai mult de două grupe de subiecţi nu vom

Testul ipotezei multiple – compararea mediilor mai multor eșantioane

 Presupunem ca avem de determinat semnificația diferențelor dintre m

 Făcând apel la cunoștințele deja prezentate, un posibil răspuns ar fi sa

 Utilizând testul t de comparaţii in cazul în care avem o variabilă independentă cu

 Prin analiza variantei numita ANOVA (analysis of variances) se aplica un singur

 Presupunem ca avem m grupe de date, fiecare grup j având nj elemente. Notam

 Ca ipoteza de lucru, se presupune ca fiecare grup de date este distribuit

 Aceste presupuneri trebuie verificate, altfel testul ANOVA nu poate fi

Aceste variații reprezintă:

 Suma totala a patratelor deviatiilor: SST

 Suma pătratelor deviațiilor între grupuri (sum of square between): SSB

 Suma pătratelor deviațiilor în grupuri (sum of square within): SSW

 Avem egalitatea: SST = SSW + SSB.

În final se va determina valoarea statisticii Fisher.

 Pentru interpretare se calculează valoarea F prin raportul prezentat si se

 Daca se calculează valoarea semnificației, aceasta se va compara cu valoarea

 Testul ANOVA în cazul existentei diferenței semnificative are dezavantajul de a

 Aceasta metoda este optima în situația în care nu avem diferența semnificativa

Clasificarea tehnicilor ANOVA

Cele mai întâlnite design-uri de cercetare experimentală utilizează una dintre

 ANOVA simplă sau unifactorială

 ANOVA cu măsurători repetate

 ANOVA factorială cel mai utilizat fiind bifactorială

ANOVA cu măsurători repetate este un model corespondent al testului t pentru

 Intr-un studiu de psihologia muncii vrem să evidenţiem efectul zgomotului

Compararea seturilor de date prin testul t corelat şi metoda ANOVA

ANOVA mixtă este o combinaţie între ANOVA simplă şi ANOVA cu

Condiţii necesare pentru aplicarea ANOVA

Tehnicile ANOVA sunt destul de robuste la nerespectarea primelor două

 (a) renunţarea la aplicarea tehnicilor ANOVA şi utilizarea unor tehnici

 (b) aplicarea tehnicilor parametrice ANOVA prin apelul la o corecţie a

Egali Relativ Profund

Dispersii Scheffe Gabriel Hochberg

 In cea ce privesc testele post-hoc trebuie menţionat că acestea se interpretează în

 Pentru a decide cu privire la metoda de analiză statistică adoptată va trebui să

 În vederea verificării formei distribuţiei vom utiliza testul non-parametric

 Analizând valorile testului Kolmogorov – Smirnov în toate cele 3 condiţii ale

 În consecinţă vom utiliza metode de analiză parametrice şi anume ANOVA cu un

 Pentru a decide cu privire la metoda de analiză statistică adoptată va trebui să verificăm

Dacă datele prezintă o distribuţie normală la

În vederea verificării formei distribuţiei vom

Testul de omogenitate Levene

 Testul F omnibuz fiind un test global nu ne

 În cazul nostru fiind vorba de dispersii egale şi

 Analizând rezultatele testelor post – hoc

 Comparând rezultatele persoanelor implicate

S-ar putea să vă placă și