Sunteți pe pagina 1din 26

Strategii de analiza datelor

Criterii pentru alegerea metodelor de


analiza

 Tipul de scala (n,o,i,p)


 Numarul de esantioane... (unul, doua sau
mai multe)
 Natura relatiilor dintre aceste esantioane
(independente sau dependente)
 Numarul variabilelor luate in considerare
in analiza (unul, doua sau mai multe)
Obiectivele urmarite

 Determinarea tendintei centrale a


variabilelor considerate
 Caracterizarea variatiei si repartitiei
acestora
 Masurarea gradului de asociere dintre ele
 Realizarea unor estimari si previziuni
 Evaluare diferentelor dintre variabile sau
grupuri de variabile
 Evidentierea legaturilor cauzale dintre ele
Analiza univariata
 Modalitatile de determinare a
tendintei centrale
 Modalitati de caracterizare a
variatiei si repartitiei variabilelor
Analiza bivariata
 Presupune masurarea gradului de
asociere a doua variabile sub aspectul
 Directiei (naturii)
 Intensitatii
 Semnificatiei statistice

 Testele utilizate sunt alese in functie de


 modul de masurare al variabilelor,
 numarul de esantioane (grupuri) analizate
 si relatiile existente intre esantioane
Variabile categoriale
 • Variabile categoriale:
 2 grupuri:
 » Independente:
 χ 2 , MannWhitney, WaldWolfowitz;
 » Dependente:
 χ 2 (varianta McNemar), Wilcoxon;
 mai multe grupuri: KruskalWallis;
Variabile proportionale
 2 grupuri:
 » Independente:
 testul Student pentru variabile independente;
 » Dependente:
 testul Student pentru variabile dependente;
 mai multe grupuri:
 ANOVA
Testul neparametric χ2
 In varianta clasica, testul χ2 presupune
testarea unor variabile categoriale (de regula
nonparametrice) si independenta
esantioanelor analizate.
 Se bazeaza pe utilizarea tabelelor de
contingenta.
 Bazat pe ipoteza nula:
 H0: nu exista diferente semnificative intre cele
doua variabile.
Testul neparametric χ2
 Valoarea calculata χc2 a testului se
compara cu valoarea tabelata χt2 a
acestuia, obtinuta in functie de
probabilitatea de garantare a rezultatului
si gradele de libertate asociate: (r-1)(k-
1).
 χc2 ≤ χt2 : se accepta ipoteza nula
 χc2 > χt2 : se respinge ipoteza nula

 Pentru mai mult de doua subesantioane


independente trebuie ca frecventele
Oij > 1 si Oij < 5 sa nu depaseasca 20%.
Masurarea gradului de asociere
 Pt Variabile nominale
ad-bc
rphi =
(a+b)(c+d)(a+c)(b+d)

 Doar pt tabele 2x2


 Valori intre -1 si 1
 rphi2 determina in ce proportie
preferintele pt o variabila sunt
explicate de cealalta variabila
Masurarea gradului de asociere
 Coeficientul de contingenta
χc2
C=
N+ χc2

 Utilizat indiferent de natura


repartitie (normala sau nu) si de
natura variabilelor (continue sau
discrete)
Limitele coeficientului de contingenta

 Nu ia valori intre (0, 1) ci intre


0, (k-1/k)1/2 cand k=r
 Doi indicatori de contingenta nu pot
fi comparati intre ei decat daca sunt
din tabele de contingenta de aceiasi
marime
 C are sens doar daca se poate
calcula χc2
Testul neparametric Χ2 pt tabele 2x2

N(ad-bc)2
χc2=
(a+b)(c+d)(a+c)(b+d)
Corectia pt continuitate
 Deoarece testul este conceput
pentru repartitii continue atunci
cand il aplicam pentru date in forma
discreta, pentru o mai mare
exactitate aplicam o corectie de
continuitate
 Corectia lui Yates
Recomandari
 Daca intr-un tabel de contingenta de
tipul 2x2, N>40, se utilizeaza χc2
preferandu-se pentru calcul ultima
formula

 20<N<40 χc2 se poae utiliza doar daca


toate frecventele Aij sunt mai mari decat
5
 Daca N<20 sau 20<N<40 si
Aij<5, se va utiliza testul
probabilitatii exacte ale lui
Fisher
Testul Mc Nemar
 Inlocuieste testul χ2 atunci cand
cele doua esantioane investigate nu
sunt independente
Utilizarea testelor neparametrice

 atunci când variabila dependentă este măsurată pe


scală nominală sau ordinală;

 atunci când variabila dependentă este de tip


categorial, indiferent de scala de măsurare;

 volumul esantionului este foarte mic.

 atunci când, desi variabila dependentă este măsurată


pe scală cantitativă (interval sau raport), nu
întruneste conditiile impuse de testele parametrice:
 distributie care se abate grav de la forma normală asimetrie
sau boltire mari,
 valori excesive:
Tipuri de teste neparametrice
 Teste neparametrice pentru date nominale:
 testul z pentru proportia unui singur esantion;
 testul z pentru diferenta dintre proportiile a două esantioane;
 testul semnului;
 testul chi-pătrat al asocierii (independentei);
 testul chi-pătrat pentru gradul de corespondentă (goodness
of fit).

 Teste neparametrice pentru date ordinale:


 testul Mann-Whitney (U) pentru două esantioane
independente;
 testul Wilcoxon pentru două esantioane perechi ;
 testul Kruskal-Wallis pentru mai mult de două esantioane
independente ;
 testul Friedman pentru măsurări repetate;
 teste de corelatie pentru date ordinale (Spearman, Kendall)
Comparaţia a Regresie
Student (t) liniară
2 grupuri
multiplă
distribuţie teste Comparaţia a
normală Test F (ANOVA)
parametrice 3 grupuri

Corelaţia a 2 Corelaţie
Variabilă variabile în (coeficient Pearson)/
cantitativă acelaşi grup regresie

distribuţie Corelaţia a 2 Corelaţie


nonnormală variabile în (coef. Spearman)
acelaşi grup
Variabilă teste
ordinală non- Comparaţia a Mann-Whitney U,
parametrice 2 grupuri Wilcoxon

Comparaţia a Kruskall-Wallis
3 grupuri

Variabilă Regresie
dihotomică X2 logistică
Fisher exact
Interval de Modelul
Log rank
timp lui Cox
Number of Nature of  Nature of Dependent
Dependent Independent Variable(s)
Variables Variables   Test(s)
interval & normal one-sample t-test
ordinal or interval one-sample median
categorical
 (2 categories) binomial test
 0 Ivs (1 population) categorical  Chi-square goodness-of-fit
 1 IV with 2 levels  interval & normal 2 independent sample t-test
   ordinal or interval Wilcoxon-Mann Whitney test
   Chi- square test
   categorical Fisher's exact test
interval & normal one-way ANOVA
ordinal or interval Kruskal Wallis
1 IV with 2 or more levels
(independent groups) categorical Chi- square test
1 IV with 2 levels interval & normal paired t-test 
(dependent/matched groups)  ordinal or interval Wilcoxon signed ranks test 
   categorical McNemar
1 IV with 2 or more levels interval & normal one-way repeated measures ANOVA
(dependent/matched groups) ordinal or interval Friedman test
  categorical repeated measures logistic regression
2 or more IVs interval & normal factorial ANOVA
Number of Nature of  Nature of Depend
ent
Dependent Independent Variable(s)

Variables Variables   Test(s)


1 IV with 2 or more
levels

2 or more (independent groups) interval & normal one-way MANOVA


multivariate multiple linear
2 or more 2 or more interval & normal regression

2 sets of 

2 or more 0 interval & normal canonical correlation

2 or more 0 interval & normal factor analysis

http://www.ats.ucla.edu/stat/spss/sk/

S-ar putea să vă placă și