Sunteți pe pagina 1din 4

Informatică

medicală
Lucrare practică
Obiective:

• ANOVA – single factor


• ANOVA – two factors with replication
• ANOVA – two factors without replication

1. ANOVA one factor – EXCEL 2010

Fie urmatoarele coloane de valori:


Ele reprezinta imbolnaviri medii saptamanale de gripa, pe regiuni ale SUA, raportate la populatia
regiunilor, distrubuite pe perioada unui an (Google Flu Trends estimated ILI, 2005-2006). Să se estimeze
dacă există diferenţe datorate regiunilor, în îmbolnavirile medii ale populaţiei SUA.
Adresa absoluta a celulelor ce se
R: Se selectează ANOVA : single factor din meniul Data/Data Analysis
doresc analizate

Nivelul de semnificaţie a
estimării
Adresa absoluta a celulei din
colţul stânga sus a zonei de
afisare a rezultatului

Rezultatul: Numărul de elemente, suma


valorilor, media şi varianţa
pentru fiecare coloană

Suma patratelor abaterilor


individuale, faţă de media
colecţiei selectate, pentru toate
coloanele (SS between groups),
şi a abaterilor individuale faţă
de media coloanei, pentru toate
coloanele (SS within group).

Numărul gradelor de libertate: df=k-1  between groups, k=4  numărul de grupuri


df=(n-1)*4within group, n=volumul grupului

Media pătratelor: MS=SS/df; parametrul testului: F=MSbetween_groups/MSwithin_group

p-Value = P(F<Fcrit); se compară cu α: p <αse respinge H0: grupurile diferă semnificativ,


p>α, nu se poate rejecta H0 grupurile înregistrează variaţii similar, indiferent de grupuri (mediile
populaţiilor egale).

2. ANOVA: 2 factors with replication


Datele de intrare în algoritm sunt grupate, cum se vede în figura următoare.
Numărul de rânduri pe fiecare
grup anotimp

Se dau 13 înregistrări pe fiecare anotimp, corespunzătoare îmbolnăvirilor medii în cele 3 regiuni de pe


coasta de E a SUA, pe anotimpuri. Să se analizeze dacă există deosebiri semnificative privind dinamica
îmbolnăvirilor în aceste zone, datorată zonei, anotimpului, sau ambelor.

Rezultat: diferenţe semnificative între îmbolnăvirile sezoniere de gripă (p=4E-43), posibil datorate
îmbolnăvirilor semnificativ mai numeroase din timpul toamnei şi iernii (medii diferite); variaţiile datorate
locaţiei sau coroborării locaţiei şi sezonului nu justifică respingerea ipotezei nule: lipsa deosebirilor
semnificative între regiunile de pe coasta de E a SUA, dpdv. al îmbolnăvirilor de gripă.
3. ANOVA: 2 factors without replication
Să se compare valorile medii ale regiunilor de pe coasta de E a SUA, pe anotimpuri. Există
diferenţe semnificative datorate locaţiei, sau anotimpului?
Surse de diferenţiere
posibile

Datele de intrare

Valorile p indică o diferenţă semnificativă a îmbolnăvirilor de gripă pe anutimpuri (7E-7), în timp ce


variaţia datorată diverselor regiuni nu justifică respingerea H0.