Sunteți pe pagina 1din 26

Strategii de analiza datelor

Criterii pentru alegerea metodelor de analiza


Tipul de scala (n,o,i,p) Numarul de esantioane... (unul, doua sau mai multe) Natura relatiilor dintre aceste esantioane (independente sau dependente) Numarul variabilelor luate in considerare in analiza (unul, doua sau mai multe)

Obiectivele urmarite

Determinarea tendintei centrale a variabilelor considerate Caracterizarea variatiei si repartitiei acestora Masurarea gradului de asociere dintre ele Realizarea unor estimari si previziuni Evaluare diferentelor dintre variabile sau grupuri de variabile Evidentierea legaturilor cauzale dintre ele

Analiza univariata

Modalitatile de determinare a tendintei centrale Modalitati de caracterizare a variatiei si repartitiei variabilelor

Analiza bivariata

Presupune masurarea gradului de asociere a doua variabile sub aspectul


Directiei (naturii) Intensitatii Semnificatiei statistice

Testele utilizate sunt alese in functie de


modul de masurare al variabilelor, numarul de esantioane (grupuri) analizate si relatiile existente intre esantioane

Variabile categoriale

Variabile categoriale:

2 grupuri: Independente:

2 , MannWhitney, WaldWolfowitz 2 (varianta McNemar), Wilcoxon

Dependente:

mai multe grupuri: KruskalWallis

Variabile proportionale

2 grupuri:

Independente:
testul Student pentru variabile independente testul Student pentru variabile dependente

Dependente:

mai multe grupuri:


ANOVA

Testul neparametric 2

In varianta clasica, testul 2 presupune testarea unor variabile categoriale (de regula nonparametrice) si independenta esantioanelor analizate. Se bazeaza pe utilizarea tabelelor de contingenta. Bazat pe ipoteza nula:

H0: nu exista diferente semnificative intre cele doua variabile.

Testul neparametric 2

Valoarea calculata c2 a testului se compara cu valoarea tabelata t2 a acestuia, obtinuta in functie de probabilitatea de garantare a rezultatului si gradele de libertate asociate: (r-1)(k1).

c2 t2 : se accepta ipoteza nula c2 > t2 : se respinge ipoteza nula

Pentru mai mult de doua subesantioane independente trebuie ca frecventele Oij > 1 si Oij < 5 sa nu depaseasca 20%.

Masurarea gradului de asociere

Pt Variabile nominale

rphi =

ad-bc

(a+b)(c+d)(a+c)(b+d)

Doar

pt tabele 2x2 Valori intre -1 si 1

rphi2 determina in ce proportie preferintele pt o variabila sunt explicate de cealalta variabila

Masurarea gradului de asociere

Coeficientul de contingenta
C=

c2
N+ c2

Utilizat

indiferent de natura repartitie (normala sau nu) si de natura variabilelor (continue sau discrete)

Limitele coeficientului de contingenta

Nu ia valori intre (0, 1) ci intre 0, (k-1/k)1/2 cand k=r Doi indicatori de contingenta nu pot fi comparati intre ei decat daca sunt din tabele de contingenta de aceiasi marime C are sens doar daca se poate calcula c2

Testul neparametric 2 pt tabele 2x2

c 2 =

N(ad-bc)2
(a+b)(c+d)(a+c)(b+d)

Corectia pt continuitate

Deoarece testul este conceput pentru repartitii continue atunci cand il aplicam pentru date in forma discreta, pentru o mai mare exactitate aplicam o corectie de continuitate Corectia lui Yates

Recomandari
Daca

intr-un tabel de contingenta de tipul 2x2, N>40, se utilizeaza c2 preferandu-se pentru calcul ultima formula c2 se poae utiliza doar daca toate frecventele Aij sunt mai mari decat 5

20<N<40

Daca

N<20 sau 20<N<40 si Aij<5, se va utiliza testul probabilitatii exacte ale lui Fisher

Testul Mc Nemar

Inlocuieste testul 2 atunci cand cele doua esantioane investigate nu sunt independente

Utilizarea testelor neparametrice

atunci cnd variabila dependent este msurat pe scal nominal sau ordinal atunci cnd variabila dependent este de tip categorial, indiferent de scala de msurare volumul esantionului este foarte mic. atunci cnd, desi variabila dependent este msurat pe scal cantitativ (interval sau raport), nu ntruneste conditiile impuse de testele parametrice:

distributie care se abate grav de la forma normal asimetrie sau boltire mari, valori excesive:

Tipuri de teste neparametrice

Teste neparametrice pentru date nominale:


testul z pentru proportia unui singur esantion testul z pentru diferenta dintre proportiile a dou esantioane testul semnului testul chi-ptrat al asocierii (independentei) testul chi-ptrat pentru gradul de corespondent (goodness of fit).

Teste neparametrice pentru date ordinale:


testul Mann-Whitney (U) pentru dou esantioane independente testul Wilcoxon pentru dou esantioane perechi testul Kruskal-Wallis pentru mai mult de dou esantioane independente testul Friedman pentru msurri repetate teste de corelatie pentru date ordinale (Spearman, Kendall)

Comparaia a 2 grupuri distribuie normal teste parametrice Comparaia a 3 grupuri Corelaia a 2 variabile n acelai grup distribuie nonnormal Variabil ordinal teste nonparametrice Corelaia a 2 variabile n acelai grup Comparaia a 2 grupuri Comparaia a 3 grupuri Variabil dihotomic Interval de timp

Student (t) Test F (ANOVA) Corelaie (coeficient Pearson)/ regresie Corelaie (coef. Spearman)

Regresie liniar multipl

Variabil cantitativ

Mann-Whitney U, Wilcoxon Kruskall-Wallis Regresie logistic Modelul lui Cox

X2 Fisher exact Log rank

Number of Dependent Variables

Nature of Independent Variables

Nature of Dependent Variable(s) Test(s) interval & normal ordinal or interval categorical (2 categories) binomial test Chi-square goodness-of-fit 2 independent sample t-test Wilcoxon-Mann Whitney test Chi- square test categorical interval & normal ordinal or interval categorical interval & normal ordinal or interval categorical interval & normal ordinal or interval categorical interval & normal Fisher's exact test one-way ANOVA Kruskal Wallis Chi- square test paired t-test Wilcoxon signed ranks test McNemar one-way repeated measures ANOVA Friedman test repeated measures logistic regression factorial ANOVA one-sample t-test one-sample median

0 Ivs (1 population) 1 IV with 2 levels

categorical interval & normal ordinal or interval

1 IV with 2 or more levels (independent groups) 1 IV with 2 levels (dependent/matched groups) 1 IV with 2 or more levels (dependent/matched groups) 2 or more IVs

Number of Dependent Variables

Nature of Independent Variables 1 IV with 2 or more levels

Nature of Dependent Variable(s) Test(s)

2 or more 2 or more 2 sets of 2 or more 2 or more

(independent groups) 2 or more

interval & normal interval & normal

one-way MANOVA multivariate multiple linear regression

0 0

interval & normal interval & normal

canonical correlation factor analysis

http://www.ats.ucla.edu/stat/spss/sk/

S-ar putea să vă placă și