Sunteți pe pagina 1din 34

APLICAŢII FOLOSIND METODA ANOVA ÎN

COMPARAREA SETURILOR DE DATE

Sef lucr. Dr. Mihaela Moscalu


METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Etapele de urmat în verificarea prin test statistic vor fi:

 1. Enunțarea ipotezei. Se definesc ipotezele: nula, respectiv alternativa. Acestea urmăresc


scopul cercetării, exprimând ceea ce avem de verificat.

 2. Alegerea parametrului de studiu (poate sa fie conținut implicit în enunțarea ipotezei). Ca


exemple avem: media, varianta, relația exprimata prin corelație, parametrii de regresie,
proporții în cadrul populațiilor, etc.

 3. Deducerea si calculul statisticii discriminante dorite aplicând regula de decizie. De exemplu,


la compararea mediilor se poate lua în calcul o noua variabila aleatoare definita ca diferența
între indicatori. În acest caz aceasta poate urma o distribuție de tip t (Student) sau Z, deci
normala.

 4. Acceptarea sau respingerea ipotezei prin calculul semnificației p. Se calculează statistica (t,
Z sau Fisher spre exemplu) din datele eșantioanelor de lucru. Corespunzător se deduce
valoarea p, care reprezintă probabilitatea de a avea o eroare de tip I. Aceasta este o integrala
în cadrul distribuției de frecventa determinate si reprezintă semnificația testului.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Testele de ipoteza sunt foarte importante deoarece reprezintă o metoda statistica de decizie
bazata pe „cântărirea” cunoștințelor obiective, prin estimări probabilistice asupra setului de
valori determinate practic.

 Testul ipotezei simple – compararea mediei unui esantion cu o valoare de referinta


Acest test consta în specificarea valorile parametrilor necunoscuți din cadrul unei repartitii.
Este vorba de seturi de date de tip continuu.

Ca exemple putem prezenta verificarea egalitatii mediei glicemiei unui subgrup cu valoarea
standard cunoscuta, sau media presiunii arteriale, sau greutatea la nastere etc.

 Testul ipotezei duble – compararea mediilor a doua esantioane (t, Student)


Foarte frecvent în aplicatiile de tip medical (si nu numai) apare problema compararii unor
parametri dintr-un esantion cu parametrii altui esantion (pot fi chiar din aceeasi populatie, dar
la momente diferite).
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Când dorim să comparăm mai mult de două grupe de subiecţi nu


vom mai folosi testul t, ci vom apela la tehnicile ANOVA cunoscută şi
sub denumirea de analiză dispersională sau. analiză de varianţă

Testul ipotezei multiple – compararea mediilor mai multor eșantioane


(ANOVA)

 Presupunem ca avem de determinat semnificația diferențelor dintre


m grupe independente de date.

 Făcând apel la cunoștințele deja prezentate, un posibil răspuns ar fi


sa comparam doua câte doua, grupuri în toate combinațiile posibile
(se va aplica testul t). Daca am avea 10 loturi atunci numărul de
teste ar fi combinări de 10 luate câte 2, adică 45. Un număr destul
de mare de variante.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Utilizând testul t de comparaţii in cazul în care avem o variabilă independentă cu 3


modalităţi va trebui să îl utilizăm de trei ori câte o data pentru fiecare din cele trei
perechi de câte 2 modalităţi adică în cazul comparării grupei 1 cu grupa 2, grupei 1
cu grupa 3 şi grupei 2 cu grupa 3.

 Orice calcul statistic presupune efectuarea unor erori ori calculând teste t ar trebui
să calculăm trei astfel de teste iar utilizând ANOVA, vom obţine un singur indicator F.
 Fiecare test t calculat introduce distorsiuni care se calculează după formula
următoare:

1-(1-α)C

unde α este pragul de semnificaţie stabilit pentru fiecare test t efectuat (frecvent p=0.05), iar c este dat de
numărul de teste t ce trebuie efectuate.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Dacă există doar două grupe de subiecţi, se aplică un singur test t pentru a testa diferenţele dintre
mediile celor două grupe
 Dacă există trei grupe de subiecţi, precum în situaţia prezentată mai sus, vom avea de aplicat trei
teste.

1-(1-0.05)1=0.05
1-(1-0.5)3=0.15

 Aplicând formula de mai sus, observam că doar în primul caz (un singur test t pentru un design cu
două eşantioane de comparat), probabilitatea de a comite o eroare de tip I rămâne .05 în cel de al
doilea caz prezentat de noi ea devine de 0.15 situaţie in care vom respinge ipoteza nulă când ea nu
ar fi trebuit respinsă.

 Din acest motiv nu vom putea utiliza testul t în situaţii de comparare a mai mult de două grupe.
 Totuşi unii autori utilizează testele t şi efectuează o ajustare, prin metoda Bonferroni, astfel încât să
elimine eroarea setului de comparaţii şi să controleze şansele de a comite eroarea de tip I.

 Din punct de vedere statistic această abordare nu aduce un plus de rigoare in cercetare ci dimpotrivă
creşte şansa de a comite eroarea de tip I, iar atunci când aceasta este controlată, sporesc şansele de
comitere a erorii de tip II, motiv pentru care nu recomandam acest tip de demers in cercetare.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Prin analiza variantei numita ANOVA (analysis of variances) se aplica un


singur test, ce respecta o statistica de tip Fisher pentru determinarea
semnificației diferenței dintre mediile eșantioanelor.

 Presupunem ca avem m grupe de date, fiecare grup j având nj elemente.
Notam un element din întregul set de valori cu xij, unde i reprezinta pozitia
elementului din grupul j. Astfel i variază de la 1 la nj, iar j de la 1 la m.
 Ipoteza H0 este: 1 =2... =j=... =m, iar alternativa,
 H1: Exista cel puţin doua grupe de medii diferite. Exista k, l pentru care
k≠l.

 Ca ipoteza de lucru, se presupune ca fiecare grup de date este distribuit
normal iar dispersiile sunt egale între grupuri.

 Aceste presupuneri trebuie verificate, altfel testul ANOVA nu poate fi aplicat.


METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Variația variabilei aleatoare X de interes este măsurata conventional în termeni ai deviației fata de
valoarea medie.
 Suma totala a patratelor deviatiilor este (total sum of square): SST

 Aceste variații reprezintă:

 Suma totala a patratelor deviatiilor: SST

 Suma pătratelor deviațiilor între grupuri (sum of square between): SSB

 Suma pătratelor deviațiilor în grupuri (sum of square within): SSW

 Avem egalitatea: SST = SSW + SSB.

 Deducem astfel, ca exista doua surse de variație, între grupuri si în cadrul grupurilor. Raportul
mediilor acestor doua surse de variație respecta (în cazul presupunerilor de repartitii normale si
dispersii egale) o distribuție de tip Fisher. Aceasta este statistica de analizat în studiul de tip ANOVA.

 În final se va determina valoarea statisticii Fisher.


METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Pentru interpretare se calculează valoarea F prin raportul prezentat si se compara


cu valoarea tabelata corespunzătoare gradelor de libertate determinate si unui nivel
de semnificație standard de 5% (0,05).

 Daca valoarea calculata este mai mare decât cea tabelata, rezulta ca mediile nu
sunt egale si exista cel puțin doua grupe cu diferența semnificativa statistic.

 Daca se calculează valoarea semnificației, aceasta se va compara cu valoarea 5%.


În situația în care este mai mica atunci exista diferența semnificativa statistic.

 Testul ANOVA în cazul existentei diferenței semnificative are dezavantajul de a nu


putea prezenta care sunt grupurile care diferă.

 Aceasta metoda este optima în situația în care nu avem diferența semnificativa între
grupe deoarece am realizat un singur test pentru m grupe de comparație.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Clasificarea tehnicilor ANOVA

Cele mai întâlnite design-uri de cercetare experimentală utilizează una dintre


următoarele patru forme de analiză de varianţă:

 ANOVA simplă sau unifactorială

 ANOVA cu măsurători repetate;

 ANOVA factorială cel mai utilizat fiind. bifactorială

 ANOVA mixtă.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

ANOVA unifactorială este modelul cel mai simplu dintre tehnicile ANOVA, fiind un
corespondent al testului t pentru două eşantioane independente.

Exemplu:
 Un cercetător doreşte să vadă dacă profesia influenţează competitivitatea
interpersonală. În acest sens selectează aleator trei grupuri de bărbaţi: fotbalişti
profesionişti, profesori de colegiu şi manageri care sunt evaluaţi pentru a se
determina cat de mult le place competiţia interpersonală. Scorurile mari indică
nivele ridicate ale competitivităţii.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

ANOVA cu măsurători repetate este un model corespondent al testului t pentru două


eşantioane perechi.

Exemplu:
 Intr-o experienţă de psihofarmacologie, vrem să studiem efectul a două substanțe
de tipul amfetaminei asupra timpilor de reacţie la un test psihomotricitate. Pentru a
controla o posibilă sursă de eroare, se folosesc aceiaşi subiecţi cărora li se aplică, la
intervale de două săptămâni, trei tratamente diferite: cu substanţa α, cu substanța β
şi placebo. Se măsoară de fiecare dată timpii de reacţie ai subiecţilor exprimaţi în
milisecunde.

 Intr-un studiu de psihologia muncii vrem să evidenţiem efectul zgomotului asupra


discriminării perceptive. În acest scop, subiecţii sunt supuşi unui număr de trei
condiţii experimentale-dimineaţa la începutul zilei de muncă. În prima realizează o
sarcină de discriminare perceptivă în absenţa zgomotului, in a doua sarcină
zgomotul este intermitent iar în a treia sarcină zgomotul este continuu. Se
monitorizează erorile efectuate
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Compararea seturilor de date prin testul t corelat şi metoda ANOVA

 Se doreşte compararea valorilor unui parametru între două eşantioane diferite, dar dependente –
caracterizate prin aceea că valorile parametrului cantitativ care se analizează provin de la aceiaşi
subiecţi (de exemplu, într-un lot de pacienţi se doreşte compararea valorilor glicemiei la momentul 0
şi la momentul 3 luni, cele 2 determinări fiind realizate la aceleaşi persoane):

 În această situaţie se foloseşte tot testul t; în notaţiile anterioare, diferă numai formula de calcul a lui
t, folosindu-se ceea ce se numeşte testul t corelat (t-pairs, sau t-Test: Paired Two Sample For Means)

 Testul t în această formă determină dacă valorile variabilei urmărite la cele două momente în timp
provin din populaţii cu media aritmetică a variabilei egală. Nu este necesară verificarea unor condiţii
privind varianţa parametrului în cele două populaţii.

 Excel: Se selectează comanda Data / Data Analysis / t-Test: Paired Two Sample For Means

 În plus faţă de cazul anterior este calculat şi un coeficient de corelaţie între cele 2 variabile, Glicemia
la momentul 0 şi Glicemia la momentul 3 luni, Pearson Correlation, a cărui semnificaţie va fi
discutată ulterior şi care are rolul de a măsura intensitatea legăturii între ele – legătura între două
variabile fiind cu atât mai puternică cu cât acest coeficient este mai apropiat de 1.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 MANOVA factorială este un model mai complex, testând efectele mai multor variabile independente (factori)
asupra unei variabile dependente.

 Varianta multivariată (MANOVA) – în cazul în care există mai mulţi factori de grupare a variabilelor;

Exemplu:
 Deoarece diverse parţi ale creierului sunt specializate pentru comportamente specifice, studiile au arătat că
diferenţele dintre stângaci şi dreptaci se datorează diferenţelor în ce priveşte emisfera dominantă. Pornind
de la acest fapt cercetătorii au presupus că dreptacii şi stângacii au abilităţi şi talente diferite. În vederea
testării acestei ipoteze un psiholog a evaluat discriminarea de acord componentă a abilităţilor muzicale-
pentru trei grupuri de subiecţi: stângaci, dreptaci şi ambidextri în două condiţii experimentale: când subiecţii
sunt odihniți si după 24 de ore in condiţiile privării de somn. Performanţa discriminativă a subiecţilor a fost
măsurată cu o probă specifică.

ANOVA factorială poate fi utilizată în cazul măsurătorilor repetate dacă sunt manipulaţi cel puţin doi factori.
Exemplu:
 Un psiholog educaţional studiază motivaţia elevilor. Un lot de 7 subiecţi sunt urmăriţi timp de 3 ani din clasa
a patra până în clasa a şasea. În fiecare an elevii completează un chestionar măsurând motivaţia şi
entuziasmul pentru şcoală centrat pe 3 discipline: matematica, romana, muzica. Psihologul vrea să ştie dacă
apar schimbări semnificative între nivelurile de motivaţie de-a lungul celor 3 ani si intre interesul pentru
diferite discipline.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

ANOVA mixtă este o combinaţie între ANOVA simplă şi ANOVA cu


măsurători repetate.

Exemplu:
 Intr-o cercetare care vizează efectul imaginilor mentale un grup de
16 studenţi - dintre care 50% sunt fete şi restul băieţi, este supus la
trei condiţii experimentale la interval de două săptămâni. Prima
condiţie presupune învățarea fiecărui cuvânt însoţit de desenarea
acestuia – „imagine mentală construită”, a doua condiţie presupune
învăţarea cuvântului însoţită de copierea imaginii acestuia care îi
este prezentată împreună cu cuvântul– „imagine mentală dată” . Al
treilea grup învaţă cuvintele pur şi simplu „ condiţia de control”. Ce
se poate spune cu privire la efectele tipului învăţării asupra
numărului de cuvinte reamintite la fete şi băieţi?
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Condiţii necesare pentru aplicarea ANOVA


 (1) Eşantionul a fost selectat aleator din populaţie, iar dacă acest lucru nu este posibil se
recomandă ca măsură compensatorie distribuirea aleatoare a subiecţilor în grupele
experimentale.

 (2) Variabila dependentă prezintă distribuţie normală. Această condiţie este greu de îndeplinit
în cazul în care grupele experimentale sunt constituite dintr-un număr mic de subiecţi (ex. n =
10).

 (3) Dispersia subiecţilor împărţiţi pe grupe experimentale să fie egală. Testul Levene este
special construit pentru a observa în ce măsură este realizată această omogenitate a
dispersiei.

 (4) Pentru ANOVA pe măsurări repetate apare o condiţie suplimentară denumită condiţia de
sfericitate. Aceasta implică premisa unei relaţii similare între fiecare pereche de condiţii
experimentale, ea fiind o condiţie mai generală a simetriei complexe. Aceasta din urmă este
îndeplinită, dacă dispersia este egală în toate situaţiile experimentale (omogenitatea dispersiei)
În practică se observă că este foarte dificil de îndeplinit dubla condiţie, majoritatea design-
urilor ANOVA cu măsurători repetate cu mai mult de două grupe încălcând această condiţie
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Tehnicile ANOVA sunt destul de robuste la nerespectarea primelor două


condiţii. Cu alte cuvinte, indicele general F nu este afectat foarte mult de
primele două condiţii. În schimb, neîndeplinirea condiţiei patru, absenţa unei
omogenităţi a dispersiei dintre grupe, afectează semnificativ valorile lui F. Într-o
asemenea situaţie sunt posibile două măsuri alternative:

 (a) renunţarea la aplicarea tehnicilor ANOVA şi utilizarea unor tehnici


corespondente neparametrice;

 (b) aplicarea tehnicilor parametrice ANOVA prin apelul la o corecţie a


gradelor de libertate la interpretarea lui F.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE.
ALEGEREA TESTELOR POST HOC

Testul ANOVA, însă, se foloseşte numai dacă este verificată condiţia de egalitate a varianţelor între grupuri – care
se verifică prin testul F de omogenitate a varianţelor.

 ANOVA nu determină însă decât dacă există sau nu diferenţe semnificative statistic între toate mediile
valorilor parametrului numeric analizat corespunzătoare grupurilor generate de parametrul calitativ, dar nu
indică exact între ce grupuri apar diferenţele semnificative statistic între medii. Pentru a se stabili acest
lucru, se poate apela la aşa-numitele „teste post-hoc”, iar în particular la următoarele teste:

 Testele de comparaţie multiplă pairwise LSD şi Bonferroni, care verifică diferenţele între fiecare pereche de
medii şi generează o matrice în care sunt marcate cu  mediile semnificativ diferite cu un prag de
semnificaţie de 0.05:
 Testul LSD realizează comparaţii perechi între mediile grupurilor, fără a ajusta rata de eroare în cazul
comparaţiilor multiple.
 Testul Bonferroni funcţionează analog, dar controlează rata globală de eroare prin limitarea ratei de
eroare a fiecărui test sub o anumită valoare de prag, determinată experimental.

 Testele de rang multiplu – SNK (Student – Newman-Keuls), care identifică grupurile de medii omogene.
Testul SNK realizează toate comparaţiile perechi între medii, identifică subgrupurile de medii omogene şi
ordonează crescător mediile în cadrul acestora. În cazul în care eşantioanele au dimensiuni egale, compară
de asemenea şi perechile de medii din interiorul subgrupurilor omogene.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Număr de subiecţi

Egali Relativ Profund


Alegerea testelor post hoc
inegali inegali

Dispersii Scheffe Gabriel Hochberg


egale Tukey Tukey b GT2

Omogenitatea
dispersiei Dispersii Dunnett T3 Games- Games-
inegale Howell Howell
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Dacă numărul de subiecţi este un criteriu evident încă din datele iniţiale ale unei cercetări,
omogenitatea dispersiei se testează prin apelul la testul Levene.
 Dacă rezultatul este nesemnificativ statistic, dispersiile dintre cele două grupe sunt
considerate egale.
 Când rezultatul este semnificativ statistic, dispersiile vor fi considerate a fi eterogene,
diferite şi vom apela la metodele de comparare post-hoc precizate în cazul dispersiilor
inegale, după ce, anterior am ajustat citirea lui F.

 In cea ce privesc testele post-hoc trebuie menţionat că acestea se interpretează în valoare


absolută semnul minus neînsemnând altceva decât faptul că subiecţii au obţinut, în medie,
rezultate mai mari la a doua grupă de comparaţie decât la prima. Pentru cei comozi, SPSS-ul
oferă un sprijin important în a identifica diferenţele semnificative la un p < .05, acestea fiind
marcate cu asterisc in cazul în care selectăm această opțiune.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE.
EXEMPLE

 Pentru a decide cu privire la metoda de analiză statistică adoptată va trebui să


verificăm forma distribuţiei datelor.

 Dacă datele prezintă o distribuţie normală la nivelul populaţiei atunci vom utiliza
metoda inferenţiale parametrice – respectiv ANOVA cu un singur factor intergrup
(One Way Anova), iar dacă asumţia cu privire la normalitatea distribuţiei nu este
îndeplinită vom folosi metode inferenţiale nonparametrice, respectiv testul U
generalizat denumit şi Kruskal – Walis sau proba medianei extinsă – opţiunea
depinzând de particularităţile datelor.

 În vederea verificării formei distribuţiei vom utiliza testul non-parametric Kolmogorov


– Smirnov pe fiecare eşantion ce urmează a fi comparat.

 În acest sens vom selecta funcţia de SPLIT FILE din meniul DATA şi vom cere
organizarea output-ului în funcţie de modalităţile variabilei independente ( adică a
tipului de program) aşa cum apare în ecranele de mai sus.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Analizând valorile testului Kolmogorov – Smirnov în toate cele 3 condiţii ale variabilei
program, constatăm că datele respectă criteriul de normalitate la nivelul populaţiei
din care fac parte.

 În consecinţă vom utiliza metode de analiză parametrice şi anume ANOVA cu un


singur factor intergrup (One Way Anova).

 Analiza statistică descriptivă relevă existenţa unor diferenţe între mediile timpilor
necesari reinserţiei profesionale a personalului cuprins în programele de reinserţie
în funcţie de tipul programului. Vom analiza în continuare în ce măsură aceste
diferenţe între medii se datorează hazardului sau sunt efectul programelor de
reinserţie la care participă persoana.

 În cazul nostru fiind vorba de dispersii egale şi număr egal de subiecţi putem opta
pentru Scheffe sau Tukey. Cum însă Scheffe este un test statistic mai puternic prima
noastră opţiune va fi pentru acesta.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE.
EXEMPLUL 1

Într-un studiu, un cercetător a dorit să determine influenţa a trei medicamente asupra bolii. În
acest sens, au fost selectaţi aleator câte un număr de 20 subiecţi care să participe la fiecare din
cele trei studii . In vederea evaluării eficienţei medicamentului s-a măsurat perioada de timp
exprimată în săptămâni necesară fiecăruia pentru a se însănătoşi.
Med 1 Med 2 Med 3
1. 1 8 1
Pasul 1 1.
1.
3
5
7
5
3
4
Identificarea variabilelor 1. 4 6 2
1. 7 9 6
 variabilă independent: medicamentul 1. 6 7 3
1. 7 2 5
 şi variabila dependentă X – eficienţa lui 1. 8 7 1
1. 4 9 7
Pasul 2 1. 5 8 5
1. 4 7 1
Designul cercetării 1. 2 9 3
1. 6 5 5
1. 7 7 2
1. 8 9 6
1. 4 7 7
1. 1 2 8
1. 3 7 4
1. 5 9 1
1. 6 9 3
1. 7 7 5
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Pasul 3
Ipoteza
 Eficienţa medicamentelor diferă semnificativ
 Sau
 Există diferenţe semnificative între perioada de timp necesară vindecării în funcţie de tipul medicamentului.
Pasul 4
Construcţia bazei de date şi alegerea metodei statistice
 În consecinţă, în baza de date vom avea două variabile, tiptratament cu trei modalităţi şi eficienta = perioada
de timp [luni].
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Pentru a decide cu privire la metoda de analiză statistică adoptată va trebui să verificăm forma
distribuţiei datelor.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Dacă datele prezintă o distribuţie normală la


nivelul populaţiei atunci vom utiliza metoda
inferenţiale parametrice – respectiv ANOVA cu un
singur factor intergrup (One Way Anova), iar dacă
asumţia cu privire la normalitatea distribuţiei nu
este îndeplinită vom folosi metode inferenţiale
nonparametrice, respectiv testul U generalizat
denumit şi Kruskal – Walis sau proba medianei
extinsă – opţiunea depinzând de particularităţile
datelor.

În vederea verificării formei distribuţiei vom utiliza


testul non-parametric Kolmogorov – Smirnov pe
fiecare eşantion ce urmează a fi comparat.
În acest sens vom selecta funcţia de SPLIT FILE din
meniul DATA şi vom cere organizarea output-ului în
funcţie de modalităţile variabilei independente
(adică a tipului de program).
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Analizând valorile testului Kolmogorov – Smirnov în toate cele 3 condiţii ale variabilei program, constatăm că datele respectă
criteriul de normalitate la nivelul populaţiei din care fac parte.

 În consecinţă vom utiliza metode de analiză parametrice şi anume ANOVA cu un singur factor intergrup (One Way Anova).

 Pasul 5
 Analiza statistică propriu – zisă
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Analiza statistică descriptivă relevă existenţa unor diferenţe între mediile timpilor necesari vindecării în
funcţie de tipul tratamentului.

 Vom analiza în continuare în ce măsură aceste diferenţe între medii se datorează hazardului sau sunt efectul
tratamentului.

Testul de omogenitate Levene ne


arata în ce măsură eşantioanele
comparate sunt omogene din
punct de vedere al varianţei, în
cazul de faţă Levene = 0.612 şi p
= 0.546 > pragul critic p =0.05
ceea ce ne permite să afirmăm că
cele trei eşantioane comparate
sunt omogene din punct de
vedere al varianţei.

Să nu uităm că omogenitatea
varianţei eşantioanelor comparate
este o condiţie necesară pentru
analiza de varianţă.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

Interpretarea rezultatelor
 Analizând în continuare relaţia dintre timpul
necesar vindecării şi tipul de tratament, obţinem
un F (2, 60) = 11.323 şi un p =0.000 < p critic
=0.01 deci putem afirma cu un risc de a greşi de
1% că perioada de timp necesară vindecării
diferă în funcţie de tratament.

 Testul F omnibuz fiind un test global nu ne


permite să vedem între care dintre cele 3
programe există diferenţe, în consecinţă vom
apela la teste post – hoc.

 În cazul nostru fiind vorba de dispersii egale şi


număr egal de subiecţi putem opta pentru
Scheffe sau Tukey. Cum însă Scheffe este un test
statistic mai puternic prima noastră opţiune va fi
pentru acesta.
METODA ANOVA ÎN COMPARAREA SETURILOR DE DATE

 Analizând rezultatele testelor post – hoc


constatăm că diferenţa mediilor dintre timpii
necesari vindecării în cazul tratamentului 1,
comparativ cu tratamentul 2 este de – 2.048
semnificativ la un p =0.01 < pragul critic de
0.05, ceea ce ne permite să afirmăm cu un risc
de a greşi mai mic de 2 % că subiecţii cu
tratamentul 2 au nevoie de un timp mai mare
pentru a se vindeca comparativ cu cei care
urmează tratamentul 1, cu aproximativ 2
săptămâni ( în medie).

 Comparând rezultatele persoanelor implicate


tratamentul 2 comparativ cu cei implicaţi în
tratamentul 3, diferenţele mediilor sunt de 3.048
şi p = 0.000.
 Putem afirma cu un risc de a greşi mai mic de 1
% că subiecţii cu tratamentul 2 au nevoie de un
timp mai lung – în medie cu 3.04 săptămâni –
comparativ cu subiecţii cu tratamentul 3 pentru
a se vindeca.
 Sintetizând, putem afirma că tratamentul 2 este
cel mai puţin eficient, eficienţa lui diferind
semnificativ atât de tratamentul 1 cât şi de
tratamentul 3, motiv pentru care în cazul
replicării acestei intervenţii la acest tratament
am fi îndreptăţiţi să renunţăm fiind cel mai puţin
eficient.

S-ar putea să vă placă și