Sunteți pe pagina 1din 26

Strategii de analiza datelor

Criterii pentru alegerea metodelor de analiza


Tipul de scala (n,o,i,p) Numarul de esantioane... (unul, doua sau mai multe) Natura relatiilor dintre aceste esantioane (independente sau dependente) Numarul variabilelor luate in considerare in analiza (unul, doua sau mai multe)

 

Obiectivele urmarite
     

Determinarea tendintei centrale a variabilelor considerate Caracterizarea variatiei si repartitiei acestora Masurarea gradului de asociere dintre ele Realizarea unor estimari si previziuni Evaluare diferentelor dintre variabile sau grupuri de variabile Evidentierea legaturilor cauzale dintre ele

Analiza univariata


Modalitatile de determinare a tendintei centrale Modalitati de caracterizare a variatiei si repartitiei variabilelor

Analiza bivariata


Presupune masurarea gradului de asociere a doua variabile sub aspectul


  

Directiei (naturii) Intensitatii Semnificatiei statistice

Testele utilizate sunt alese in functie de


  

modul de masurare al variabilelor, numarul de esantioane (grupuri) analizate si relatiile existente intre esantioane

Variabile categoriale


Variabile categoriale:


2 grupuri:  Independente:


2 , MannWhitney, WaldWolfowitz; 2 (varianta McNemar), Wilcoxon;

Dependente:


mai multe grupuri: KruskalWallis;

Variabile proportionale


2 grupuri:


Independente:


testul Student pentru variabile independente; testul Student pentru variabile dependente;

Dependente:


mai multe grupuri:




ANOVA

Testul neparametric 2


In varianta clasica, testul 2 presupune testarea unor variabile categoriale (de regula nonparametrice) si independenta esantioanelor analizate. Se bazeaza pe utilizarea tabelelor de contingenta. Bazat pe ipoteza nula:


H0: nu exista diferente semnificative intre cele doua variabile.

Testul neparametric 2


Valoarea calculata c2 a testului se compara cu valoarea tabelata t2 a acestuia, obtinuta in functie de probabilitatea de garantare a rezultatului si gradele de libertate asociate: (r-1)(k1).
 
c c 2 2

>

2 t 2 t

: se accepta ipoteza nula : se respinge ipoteza nula

Pentru mai mult de doua subesantioane independente trebuie ca frecventele Oij > 1 si Oij < 5 sa nu depaseasca 20%.

Masurarea gradului de asociere




Pt Variabile nominale

rphi =
 

ad-bc

(a+b)(c+d)(a+c)(b+d)

Doar pt tabele 2x2 Valori intre -1 si 1

rphi2 determina in ce proportie preferintele pt o variabila sunt explicate de cealalta variabila

Masurarea gradului de asociere




Coeficientul de contingenta
C=
2 c

N+

 Utilizat

indiferent de natura repartitie (normala sau nu) si de natura variabilelor (continue sau discrete)

Limitele coeficientului de contingenta




Nu ia valori intre (0, 1) ci intre 0, (k-1/k)1/2 cand k=r Doi indicatori de contingenta nu pot fi comparati intre ei decat daca sunt din tabele de contingenta de aceiasi marime C are sens doar daca se poate calcula c2

Testul neparametric

pt tabele 2x2

2= c

N(ad-bc)2
(a+b)(c+d)(a+c)(b+d)

Corectia pt continuitate


Deoarece testul este conceput pentru repartitii continue atunci cand il aplicam pentru date in forma discreta, pentru o mai mare exactitate aplicam o corectie de continuitate Corectia lui Yates

Recomandari
 Daca

intr-un tabel de contingenta de tipul 2x2, N>40, se utilizeaza 2 preferandu-se pentru calcul c ultima formula se poae utiliza doar daca toate frecventele Aij sunt mai mari decat 5
c 2

 20<N<40

 Daca

N<20 sau 20<N<40 si Aij<5, se va utiliza testul probabilitatii exacte ale lui Fisher

Testul Mc Nemar


Inlocuieste testul 2 atunci cand cele doua esantioane investigate nu sunt independente

Utilizarea testelor neparametrice




atunci cnd variabila dependent este m surat pe scal nominal sau ordinal ; atunci cnd variabila dependent este de tip categorial, indiferent de scala de m surare; volumul esantionului este foarte mic. atunci cnd, desi variabila dependent este m surat pe scal cantitativ (interval sau raport), nu ntruneste conditiile impuse de testele parametrice:
 

 

distributie care se abate grav de la forma normal asimetrie sau boltire mari, valori excesive:

Tipuri de teste neparametrice




Teste neparametrice pentru date nominale:


    

testul z pentru proportia unui singur esantion; testul z pentru diferenta dintre proportiile a dou esantioane; testul semnului; testul chi-p trat al asocierii (independentei); testul chi-p trat pentru gradul de corespondent (goodness of fit).

Teste neparametrice pentru date ordinale:


    

testul Mann-Whitney (U) pentru dou esantioane independente; testul Wilcoxon pentru dou esantioane perechi ; testul Kruskal-Wallis pentru mai mult de dou esantioane independente ; testul Friedman pentru m sur ri repetate; teste de corelatie pentru date ordinale (Spearman, Kendall)

Compara ia a 2 grupuri distribu ie normal teste parametrice Compara ia a u3 grupuri Corela ia a 2 variabile n acela i grup distribu ie nonnormal Variabil ordinal teste nonparametrice Corela ia a 2 variabile n acela i grup Compara ia a 2 grupuri Compara ia a u3 grupuri Variabil dihotomic Interval de timp

Student (t) Test F (ANOVA)

Regresie liniar multipl

Variabil cantitativ

Corela ie (coeficient Pearson)/ regresie Corela ie (coef. Spearman)

Mann-Whitney U, Wilcoxon Kruskall-Wallis Regresie logistic Modelul lui Cox

X2 Fisher exact Log rank

Number of Dependent Variables

Nature of Independent Variables

Nature of Dependent Variable(s) Test(s) interval & normal ordinal or interval categorical (2 categories) binomial test Chi-square goodness-of-fit 2 independent sample t-test Wilcoxon-Mann Whitney test Chi- square test categorical interval & normal Fisher's exact test one-way ANOVA Kruskal Wallis Chi- square test paired t-test Wilcoxon signed ranks test McNemar one-way repeated measures ANOVA Friedman test repeated measures logistic regression factorial ANOVA ??? one-sample t-test one-sample median

0 Ivs (1 population) 1 IV with 2 levels

categorical interval & normal ordinal or interval

1 IV with 2 or more levels (independent groups) 1 IV with 2 levels (dependent/matched groups)

ordinal or interval categorical interval & normal ordinal or interval categorical

1 IV with 2 or more levels (dependent/matched groups)

interval & normal ordinal or interval categorical

2 or more IVs (independent groups)

interval & normal ordinal or interval

Number of Dependent Variables

Nature of Independent Variables 1 IV with 2 or more levels

Nature of Dependent Variable(s) Test(s)

2 or more 2 or more 2 sets of 2 or more 2 or more

(independent groups) 2 or more

interval & normal interval & normal

one-way MANOVA multivariate multiple linear regression

0 0

interval & normal interval & normal

canonical correlation factor analysis

http://www.ats.ucla.edu/stat/spss/sk/

S-ar putea să vă placă și