Documente Academic
Documente Profesional
Documente Cultură
2. Clasificarea variabilelor:
- Calitative:
- Cantitative (numerice):
3. Variabilele calitative sunt nominale (categoriale) si ordinale
4. Variabilele cantitative (numerice) sunt de tip interval si de tip raport.
5. Scalele nominale sunt calitative si presupun o categorizare a variabilei fara a indica o
anumita ordine ori cantitate.
6. Scalele ordinale sunt calitative, numerele sunt ierarhii si exprima locul sau ordinea
ntr-un sir de date.
7. n cazul datelor ordinale, diferenta numerica ntr-un clasament nu este necesar egala
cu diferenta numerica exprimata n unitatea de masura utilizata.
8. Scalele nominale si ordinale presupun totdeauna utilizarea unor teste statistice
neparametrice.
9. Scala de tip interval permite comparatia dintre date.
10. Scalele de tip raport poseda toate calitatile unei scale de interval si au n plus doua
calitati noi :
permit multiplicarea sau divizarea datelor
indica valoarea zero absolut, care arata lipsa totala a cantitatii masurate.
11. Scalele de interval, respectiv de raport sunt expresii cantitative ale variabilelor care
pot fi supuse analizei statisticii parametrice cu mici exceptii.
12. Datele variabilelor pot fi prezentate (organizate) simplu sau grupat .
13. Pentru datele variabilelor organizate simplu se stabileste frecventa de aparitie a
fiecarei valori;
14. Pentru datele variabilelor organizate grupat se tine cont de distributia grupata a
datelor, fiind necesara mpartirea valorilor n clase de intervale egale.
15. Metoda lui Spatz in patru pasi de mpartire a datelor pe intervale pentru variabilele
grupate:
1. Numarul de intervale trebuie sa fie ntre 10 si 20. Aceasta conditie are rolul de a
maximiza grafic conceptul de distributie normala a datelor :
2. Stabilirea marimii intervalului (notat cu i).
3. Primul interval ncepe cu o valoare multiplu de i ales.
17. Frecventa cumulata a unei clase este egala cu: suma frecventelor din clasa respectiva
si frecventele din toate clasele cu valori inferioare.
18. Poligonul frecventelor este un grafic utilizat n cazul variabilelor cantitative.
19. Histogramele - pot fi utilizate pentru variabile exprimate att cantitativ ct si
calitativ.
20. Cercurile de tip "placinta" - pot fi utilizate pentru variabile calitative, nominale.
21. Mediana este parametrul care prin pozitia sa, se afla n mijlocul seriei de date.
22. Mediana reprezinta punctul central al seriei, deoarece la stnga si la dreapta ei se
situeaza cte 50% din totalitatea datelor.
23. Mediana coincide cu media n cazul unei distributii teoretice normale si se
ndeparteaza mult de aceasta daca distributia este asimetrica.
24. In cazul distributiei simple a datelor pentru n impar locul medianei = (n+1) / 2, iar
valoarea medianei este data de valoarea existenta in sir pe acel loc.
25. In cazul distributiei simple a datelor pentru n par valoarea medianei se obtine prin
adunarea valorilor din centrul seriei si mpartirea sumei obtinute la doi.
26. n cazul n care sirul de date este prezentat ntr-un tabel de frecvente pentru calculul
valorii medianei se aplica formula:
unde:
l este limita inferioara a intervalului de clasa care contine mediana;
fc este frecventa cumulata precednd clasa care contine mediana;
fi este frecventa clasei intervalului care contine mediana;
N este numarul total al cazurilor;
j este marimea intervalului (i) care cuprinde mediana.
27. Mediana tine seama de toate cazurile, dar nu este afectata de cazurile (valorile)
extreme.
28. Modul este parametrul care corespunde celei mai mari frecvente (valoarea cea mai
frecvent ntlnita).
29. Pentru date grupate valoarea modala este egala cu valoarea gasita n centrul
intervalului care are cea mai mare frecventa.
30. Media este recomandata n cazul variabilelor numerice care ndeplinesc conditiile
parametrice (distributie normala, omogenitate s.a.).
31. Mediana se recomanda pentru cazurile n care nu sunt ndeplinite conditiile
parametrice (distributii asimetrice, etrogenitate crescuta etc) si n cazul variabilelor de tip
ordinal.
32. Modul este utilizat mai rar pentru date numerice, fiind nsa foarte util n cazul
variabilelor de tip categorial (date calitative, nominale), deoarece nu putem calcula
ceilalti parametrii centrali.
33. Amplitudinea - parametru care arata distanta dintre valoarea minima si valoarea
maxima din cadrul unui sir de date
34. Notam cuabaterea standard a populatiei.
35. Notam cus estimatorul abaterii standard a populatiei.
36. Notam cuSabaterea standard a esantionului unei populatii.
37. Amplitudinea este de obicei de doua pna la cinci, sase ori mai mare dect abaterea
standard.
38. Dispersia este egala cu abaterea standard la patrat.
39. Coeficientul de variabilitate este utilizat n scopul stabilirii gradului de omogenitate
a unui esantion
40. In literatura de specialitate, pentru un coeficient de variabilitate mai mic decat 35%,
se admite ca, media este reprezentativa pentru colectivitatea respectiva iar colectivitatea
este omogena. (A. Novac)
41. Coeficientul de variabilitate este aplicabil doar n cazul variabilelor masurate pe scala
de raport, cu origine naturala zero.
78. Coeficientul b din forma generala a ecuatiei de regresie arata cu ct este influentat Y
atunci cnd X creste cu o unitate.
79. Coeficientul de corelatie (fi) este o proba corelationala neparametrica utilizata
pentru variabile dihotomice obtinute nu datorita unei regrupari ci prin nsasi natura
variabilei.
80. Coeficientul de contingenta C al lui Pearson este o proba corelationala neparametrica
utilizata pentru date categoriale nominale.
81. Coeficientul V al lui Cramer este o proba corelationala neparametrica utilizata pentru
date categoriale nominale.
82. Testul Spearman al corelatiei diferentei rangurilor este o proba corelationala
neparametrica utilizata pentru date ordinale;
83. Coeficientul a lui Kendall este o proba corelationala neparametrica utilizata pentru
date ordinale.
84. Interpretarea coeficientul de corelatie se face la fel ca cea a coeficientului de
corelatie r, deoarece coeficientul de corelatie este n esenta o varianta a acestui
coeficient.
85. Semnul coeficientului de corelatie (fi) calculat dupa formula:
- daca cele doua variabile au mai multe ranguri egale se utilizeaza coeficientul a lui
Kendall.
102. Pentru a analiza daca un esantion de subiecti difera de o populatie mai mare se
utilizeaza testul z daca:
- se cunoaste abaterea standard a variabilei dependente la nivelul populatiei;
- numarul de subiecti cuprinsi n esantionul comparativ este suficient de mare (de
regula peste 30 de subiecti).
103. Daca in cadrul analizei unui esantion de subiecti fata de o populatie mai mare, una
din urmatoarele doua conditii :
- se cunoaste abaterea standard a variabilei dependente la nivelul populatiei;
- numarul de subiecti cuprinsi n esantionul comparativ este suficient de mare (de
regula peste 30 de subiecti).
nu este ndeplinita, se utilizeaza testul t pentru un esantion.
104. Testul t valideaza sau infirma ipoteza nula potrivit careia, nu exista nici o diferenta
ntre media (m) obtinuta pe esantion de subiecti si media (m ) obtinuta pe populatia din
care a fost extras esantion
105. Testul t pentru un esantion .
Daca avem motive sa credem ca datorita unor caracteristici speciale media esantionului
comparativ este mai mare (sau mai mica) dect media populatiei din care face parte
esantionul vom utiliza valorile testului t unilateral din tabel.
106. Testul t pentru un esantion .
Daca consideram ca cele doua medii, media esantionului comparativ si media populatiei
din care face parte esantionul difera semnificativ, fara a putea anticipa ca una ar fi mai
mare dect cealalta dintr-o perspectiva teoretica exprimata n ipoteza de lucru vom utiliza
valorile testului t bilateral din tabelul lui t.
107. Daca se luceraza cu testul t pentru un esantion, marimea efectului propusa de
Cohen si notata cu d are o importante deosebita in determinarea puterii experimentului si
n calcularea marimii esantionului necesar pentru a da credibilitate cercetarii efectuate.
108. Interpretarea valorii d (marimea efectului) obtinuta se face prin raportarea ei la
conventia propusa de Cohen si adoptata de cercetatori:
Efect mic d = 0,20;
Efect mediu d = 0,50;
Efect mare d = 0,80
109. Interpretarea valorii obtinuta cu testul z se face raportnd aceasta valoare la valorile
standardizate ale lui z. Spre deosebire de testul t, pentru care trebuie consultat tabelul lui t
pentru a putea admite sau respinge ipoteza nula, n cazul testului z bilateral, valoarea
obtinuta se compara cu doua valori standardizate:
z = 1,96 pentru un p .05
128. Testul ANOVA factorial, studiaza influenta simultana a doua sau mai multe
variabile independente asupra unei variabile dependente
129. Raporturile F stabilite n cazurile ANOVA simpla, ANOVA cu masuratori repetate si
ANOVA factorial se numesc si teste omnibus.
130. Exista doua mari categorii de comparatii multiple:
- comparatii post-hoc (realizate dupa calcularea lui F din ANOVA),
- comparatii a priori (tehnici alternative ANOVA care pornesc de la alte ipoteze
nule si care sunt planificate nainte de desfasurarea experimentului pe baze
rationale).
131. Exista doua criterii dupa care sunt selectate metodele post-hoc folosite: numarul egal
de subiecti din fiecare grupa si tipul de contrast realizat. Astfel, testul Tukey si testul
Newman-Keuls se aplica n cazul grupelor egale si al comparatiilor perechi (cte doua
medii comparate);
132. Exista doua criterii dupa care sunt selectate metodele post-hoc folosite: numarul egal
de subiecti din fiecare grupa si tipul de contrast realizat. Astfel, testul Tukey-Kramer se
aplica n cazul grupelor de subiecti inegale si al comparatiilor perechi;
133. Exista doua criterii dupa care sunt selectate metodele post-hoc folosite: numarul egal
de subiecti din fiecare grupa si tipul de contrast realizat. Astfel, testul Scheffe se aplica n
cazul contrastelor complexe (pot fi comparate combinatii de medii, depasind nivelul
contrastului dintre doua medii). Prin contrast se ntelege compararea de date n vederea
evidentierii diferentelor dintre ele
134. Metoda Tukey, simbolizata HSD, denumita si testul diferentei semnificative oneste
realizeaza comparatii ntre toate perechile de medii n timp ce mentine eroarea
experimentului la valorile alfa stabilite.
135. Metoda Scheffe este procedeeul post-hoc cel mai conservator (sesizeaza cele mai
putine diferente), nsa este foarte utila cand se doreste realizarea de comparatii complexe
ce depasesc nivelul perechilor de medii.
136. Limita contrastelor ortogonale planificate care pot fi generate de cercetator la
nceputul studiului este k-1, unde k reprezinta numarul de grupe din studiu.
137. Analiza contrastelor ortogonale se aplica daca variabila independenta din ANOVA
este exprimata, fie cantitativ fie calitativ .
138. Procedurile analizei directionale pornesc de la dubla conditie:
- treptele variabilei independente sunt egal distantate,
- numarul de subiecti este egal.
Aceasta dubla conditie poate fi ncalcata, dar procedeul matematic se complica foarte
mult.
139. In cazul analizei multiple a priori directionala exista patru tipuri de directii a datelor:
- liniara (doua sau mai multe grupe);
- curbilinie (trei sau mai multe grupe);
- exponentiala sau cubica (patru sau mai multe grupe);
- cuartica ( cinci sau mai multe grupe).
140. Testul Tukey , testul Newman-Keuls, testul Tukey-Kramer , testul Scheffe , analiza
contrastelor ortogonale si analiza directionala se aplica att n cazul ANOVA simpla, ct
si n cazul ANOVA cu masuratori repetate. Rezultatele obtinute insa n cazul ANOVA cu
masuratori repetate sunt mai mari si mai des semnificative statistic, facand din aceasta
un test mai eficient si mai puternic.
141. Exemple de teste statistice neparametrice :
tehnica lui 2 (hi patrat);
testul U a lui Mann-Whitney;
testul Wilcoxon al rangurilor pereche;
testul ANOVA Kruskal-Wallis al rangurilor;
testul Friedman ANOVA biunivoc al rangurilor.
142. Testul neparametric U a lui Mann-Whitney este echivalentul testului parametric t
independent.
143. Testul neparametric Wilcoxon al rangurilor pereche este echivalentul testului
parametric ANOVA cu masuratori repetate ori al testului t dependent.
144. Testul neparametric ANOVA Kruskal-Wallis al rangurilor este echivalentul testului
parametric ANOVA simpla, nsa datele sunt convertite n ranguri.
145. Testul neparametric Friedman ANOVA biunivoc al rangurilor este echivalentul
testului parametric ANOVA cu masuratori repetate.
146. Testul hi patrat este un test statistic asupra semnificatiei deosebirii dintre rezultatele
observate (distributia reala) si cele asteptate (distributia teoretica).
147. Gradele de libertate pentru tabelul de contingenta sunt (r-1) (c-1), unde r este
numarul de rnduri iar c numarul de coloane.
148. La utilizarea testului hi patrat observatiile trebuie sa fie independente si categoriile
formate trebuie sa se excluda reciproc. Este vorba de eliminarea raspunsurilor multiple si
de alegerea unui singur raspuns la ntrebare.
149. Testul hi patrat nu se poate aplica daca mai mult de 20 la suta din casute au valorile
teoretice ale frecventelor mai mici de cinci (n astfel de situatii este se combine casutele
adiacente, marind valoarea frecventei teoretice).