Procesul de Analiza A Datelor

SINTEZA ANALIZA DATELOR
2017-2018
1
1. PROCESUL DE ANALIZA A DATELOR: ACTIVITĂȚI SI ETAPE 4
1.1. ACTIVITĂȚI PRINCIPALE DE ANALIZA A DATELOR 4
1.2. EPICICLUL DE ANALIZA A DATELOR 4
1.2.1. STABILIREA AȘTEPTĂRILOR 4
1.2.2. COLECTAREA INFORMAȚIILOR (DATELOR) SI COMPARAREA CU AȘTEPTĂRILE 4
1.2.3. REVIZUIREA AȘTEPTĂRILOR DVS. SAU A PROCESULUI DE COLECTARE A DATELOR 5
SE REALIZEAZĂ IN FUNCȚIE DE CONCLUZIILE EXTRASE DIN ETAPA 2. 5
2. FORMULAREA INTREBARILOR DE CERCETARE SI ANALIZA DATELOR 5

2.1. TIPURI DE ÎNTREBĂRI 5
2.1.1. INTREBARILE DESCRIPTIVE 6
2.1.2. INTREBARILE EXPLORATORII 6
2.1.3. INTREBARILE INFERENȚIALE 7
2.1.4. INTREBARILE PREDICTIVE 7
2.1.5. INTREBARILE CAUZALE 7
2.1.6. INTREBARILE MECANICISTE 8
2.2. CARACTERISTICILE UNEI BUNE ÎNTREBĂRI 8
2.3. SFATURI PRACTICE PENTRU FORMULAREA UNEI INTREBARI 9
3. ANALIZA EXPLORATORIE A DATELOR (STATISTICI DESCTIPTIVE) 10

3.1. ANALIZA DE FRECVENTE 10
3.2. PREZENTAREA GRAFICA A DATELOR 11
3.3. INDICATORI AI TENDINTEI CENTRALE 14
4. CONSTRUIREA MODELELOR STATISTICE (STATISTICI INFERENTIALE) 16

4.1. TESTELE T 16
4.1.1. TESTUL T PENTRU UN EȘANTION 16
TESTUL T (STUDENT) PENTRU UN SINGUR EŞANTION 17
4.1.2. TESTUL T PENTRU EŞANTIOANE INDEPENDENTE 17
4.1.3. TESTUL T PENTRU EŞANTIOANE PERECHI 19
5. ANALIZA DE VARIANTA ANOVA 21
5.1. DEFINITIE 21
5.2. CLASIFICAREA TEHNICILOR ANOVA 21
5.3. ANOVA SIMPLĂ SAU UNIFACTORIALĂ 21
5.4. ANOVA CU MĂSURĂTORI REPETATE 21
5.5. ANOVA FACTORIALĂ 22
5.6. ANOVA MIXTĂ 23
5.7. CONDIŢII PENTRU APLICAREA ANOVA 23
1. STRUCTURA UNUI PROTOCOL DE CERCETARE 24

1.1. INTRODUCERE 24
1.1.1. PREZENTARE GENERALA 24
1.1.2. CONTEXT ȘI ARGUMENTE 24
1.2. OBIECTIVE 24
1.3. SELECTIA PARTICIPANTILOR 3 25
1.4. RECRUTARE SI RANDOMIZARE 25
1.5. DESIGNUL SI METODELE STUDIULUI 25
1.5.1. DESIGN / TIPUL DE STUDIU 25
2
1.5.2. SELECTAREA INSTRUMENTELOR 25
1.5.3. DESCRIEREA INTERVENȚIEI 26
1.5.4. COLECTAREA DATELOR 26
1.5.5. DESCRIEREA PROCESULUI/PROCEDURII 26
1.5.6. REACTII ADVERSE ȘI GESTIONAREA LOR 27
1.6. ANALIZA STATISTICĂ 27
1.7. REFERINȚE 27
1.8. ANEXE 27
2. SELECTIA PARTICIPANTILOR SI DETERMINAREA VOLUMULUI ESANTIONULUI 28

2.1. VOLUMUL EŞANTIONULUI RECOMANDAT ÎN DIFERITE PROCEDURILOR STATISTICE 28
2.1.1. VOLUMUL CELULELOR (GRUPURILOR) PENTRU TESTELE UTILIZATE ÎN DETECTAREA DIFERENŢELOR DINTRE MEDII
28
2.1.2. MĂRIMEA EŞANTIONULUI ATUNCI CÂND SE STUDIAZĂ ASOCIEREA VARIABILELOR 29
2.1.3. VOLUMUL EŞANTIONULUI PENTRU TESTUL CHI-PĂTRAT 30
2.2. METODE DE ESANTIONARE 30
2.2.1. ESANTIOANE PROBABILISTICE 30
2.2.2. ESANTIOANELE NON-PROBABILISTICE: 32
3
A. ELEMENTE TEORETICE DE ANALIZA
DATELOR
1. Procesul de analiza a datelor: activități si etape
1.1. Activități principale de analiza a datelor
Există 5 activități principale de analiză a datelor:

1. Formularea și rafinarea întrebării
2. Explorarea datelor (Analiza exploratorie a datelor = ADE)
3. Construirea modelelor statistice
4. Interpretarea rezultatelor
5. Comunicarea rezultatelor
Deși există multe tipuri diferite de activități ce apar în timp ce facem analiza datelor, fiecare
aspect din întregul proces poate fi abordat printr-un proces interactiv pe care îl numim
"epiciclul analizei datelor" si care este alcătuit din trei etape distincte.
1.2. Epiciclul de analiza a datelor
In mod specific, pentru fiecare din cele cinci activități principale, este critic să vă angajați în
următorii pași: 1) stabilirea așteptărilor, 2) colectarea datelor comparând datele cu datele
așteptările dvs. și - dacă așteptările nu se potrivesc-, 3) revizuirea așteptărilor sau ajustarea
procesului de colectare a datelor astfel încât datele și așteptările dvs. se potrivesc.
1.2.1. Stabilirea așteptărilor

Stabilirea așteptărilor este procesul de gândire deliberată despre ceea ce vă așteptați sa
obțineți înainte de a iniția o acțiune (de ex. sa inspectați datele, să efectuați o procedură sau să
introduceți o comandă). Pentru analiștii cu experiență, în anumite circumstanțe, stabilirea
așteptărilor poate fi automata, aproape subconștienta, dar pentru novici aceasta este o
activitate importantă care trebuie cultivata in mod deliberat.
1.2.2. Colectarea informațiilor (datelor) si compararea cu așteptările
4
Acest pas presupune colectarea de informații despre întrebarea sau datele dvs. Pentru
întrebare puteți sa colectați informații prin efectuarea unei căutări de literatură sau solicitarea
unor experți pentru a vă asigura că întrebarea dvs. este una bună.
Veți descoperi daca datele se potrivesc cu așteptările atunci când inspectați datele sau
efectuați anumite proceduri de analiză statistica. Prin comparare cu așteptările inițiale puteți
stabili apoi daca este au apărut discrepante prea mari ca sa fie credibile. Există două explicații
posibile pentru o astfel de discordanță: a) așteptările dvs. au fost greșite și trebuie revizuite,
sau b) colectarea datelor a fost greșită sau in procesul de colectare a apărut o eroare.
1.2.3. Revizuirea așteptărilor dvs. sau a procesului de colectare a datelor

Se realizează in funcție de concluziile extrase din etapa 2.
In tabelul 1 de mai jos sunt oferite exemple concrete pentru modul in care epiciclul de analiza
a datelor poate apare in fiecare dintre cele 5 activități de cercetare.
Tabel 1 – Activitati si etape de cercetare
Stabileste Colecteaza date Revizuiste asteptari

asteptari
Formularea Intrebarea este de Literatura de O intrebare mai tintita
intrebarii interes pentru specialitate/Experti
audienta
Analiza Datele sunt Distributii exploratorii Revizuieste intrebarea
exploratorie adecvate pentru ale datelor sau colecteaza mai
a datelor intrebare (reprezentare grafica) multe date
Modelare Modelul primar Testeaza modelul Revizuieste modelul
formala raspunde intrebarii secundar formal
2. Formularea intrebarilor de cercetare si analiza datelor
2.1. Tipuri de întrebări
5
Înainte de a începe să formulam întrebări, este util să luam în considerare diferitele tipuri de
întrebări posibile.
In cercetare există șase tipuri de întrebări de bază iar înțelegerea acestora poate fi cel mai
important pas in cercetare si procesul de analiza a datelor deoarece tipul de întrebare pe care îl
alegeți îl influențează direct modul în care interpretați rezultatele.
Cele șase tipuri de întrebări sunt: descriptive, exploratorii, inferentiale, predictive, cauzale,
mecaniciste
2.1.1. Intrebarile descriptive

• Sumarizeaza caracteristicile unui set de date
• Proportia de barbati dintr-o populatie studiata
• Numarul mediu de fructe si legume consumate pe zi
• Frecventa unei anumite patologii intr-un set de date
• Nu exista interpretare a rezultatului in sine
• Rezultatul reprezinta un adevar, un atribut al unui set de date
2.1.2. Intrebarile exploratorii

• Analizam datele pentru a descoperi daca apar:
• patternuri (modele) = un set de itemi, subsecvente sau substructuri care apar
frecvent impreuna intr-un set de date; proprietati intriseci si importante ale
datelor
• trenduri sau
• relatii intre variabile
• Acest tip de analize se mai numesc si “generatoare de ipoteze” deoarece mai degraba
decat sa testam o ipoteza, incercam sa identific patternuri care ar sustine propunerea
unei ipoteze
• De ex. daca banuiesti ca o anumita patologie (e.g. depresia) este asociata cu dieta intr-
un anumit fel, se poate examina relatia dintre un anumit set de factori legati de dieta si
patologia respectiva
• In analiza exploratorie descoperi ca indivizii care consuma mananca un anumit tip de
alimente (cu potential anti-inflamator sau inflamator scazut cum ar fi uleiul de
6
masline, brocoli, kale) au mai putine episoade depresive decat cei care nu le includ in
alimentatie
• Formulezi ipoteza ca in randul adultilor consumul de alimente cu potential anti-
inflamator este asociat cu scaterea numarului anul de episoade depresive in randul
populatiei studiate
2.1.3. Intrebarile inferențiale

• O intrebare inferentiala face o asumptie despre ceva din afara setului de date in baza
datelor colectate
• Reprezinta o reformulare a ipotezei generate prin analiza exploratorie sub forma unei
intrebari la care raspundem prin analiza unui nou set de date
• prin acesta noua analiza putem determina
• Daca asociatia observata in analiza exploratorie se pastreaza intr-un esantion
diferit
• Si daca se pastreaza intr-un esantion reprezentativ pentru populatia studiata
2.1.4. Intrebarile predictive

• Predictia unui set de trasaturi in baza unui alt set de trasaturi; NU ne ofera informatii
despre cum au loc anumite fenomene
• De ex. nu ne intereseaza de ce cineva consuma o anumita dieta (cauza) ci care sunt
factorii care prezic o anumita dieta
• Venituri mai ridicate
• Statut socio-economic
• Educatie
• Etc.
2.1.5. Intrebarile cauzale

• Prin care ne dorim sa determinam modul in care un anumit set de variabile are impact
asupra unui alt set de variabile
• De exemplu: daca o anumita dieta determina un impact in numarul de cazuri de
depresie
• Intrebarile cauzale intreaba daca prin modificarea unui factor determinam schimbarea
unui alt factor
7
• In general datele sunt colectate in mod expres pentru a raspunde la aceasta intrebare,
de exemplu in cadrul unui studiu de tip RCT
• In multe situatii unde un RCT nu este posibil, o intrebare cauzala poate fi adresata
indirect prin utilizarea datelor observationale
2.1.6. Intrebarile mecaniciste

• Testeaza legatura deterministica intre 2 seturi de trasaturi; ori de cate ori modifici A in
procent de X, o schimbare de Y va avea loc in B
• Aceste intrebari raspund la intrebarea CUM impacteaza un factor modificarea celui de
al doilea
• De exemplu, cum un anumit tip de dieta conduce la un numar mai scazut de depresii
• Foarte dificil de raspuns in afara unui mediu controlat
2.2. Caracteristicile unei bune întrebări
Există cinci caracteristici cheie ale unei întrebări bune pentru analiza datelor si vom discuta
cum să evaluăm acest lucru în mai multe detalii in cele ce urmează.
Pentru început, întrebarea ar trebui să fie de interes pentru publicul dvs., a căror identitate va
depinde de contextul și mediul în care lucrați cu date. Dacă sunteți în mediul academic,
publicul poate fi colaboratorii dvs., comunitatea științifică, autoritățile de reglementare
guvernamentale, finantatorii sau publicul general.
De asemenea, trebuie să verificați dacă nu s-a răspuns deja la întrebarea care va interesează.
Cu explozia recentă a datelor, cantitatea tot mai mare de date disponibile publicului și
literatura științifică nesfârșită precum și disponibilitatea altor resurse, ați putea sa descoperiți
ca deja s-a răspuns la întrebarea inițiala pe care ați formulat-o. Verificările preliminarii și
discuțiile cu experții va pot ajuta să rezolvati aceasta situatie deoarece chiar dacă întrebarea
specifică pe care o aveți în minte are un răspuns, s-ar putea să fi existe întrebări înrudite la
care nu exista răspunsuri incă.
8
In al treilea rand, intrebarea ar trebui să fie plauzibila. Dacă formulati o întrebare care nu este
plauzibila, este posibil să ajungeți la un răspuns dificil de interpretat sau in care sa aveți
încredere limitata. Puteți să vă asigurați că întrebarea dvs. este plauzibilă prin utilizarea
propriilor cunoștințe despre subiectul abordat și printr-o mica cercetare preliminara (pilot),
care împreună pot sa vă ajute să stabiliți dacă întrebarea formulata este plauzibile.
In al patrulea rand, la intrebarea formulata trebuie sa poata fi oferit un raspuns. Cu toate ca

poate că acest lucru nu are nevoie să fie precizat, merită atins faptul că la unele dintre cele mai
bune întrebări posibile nu poate fi oferit un raspuns fie pentru că datele nu există sau nu există
nici un mijloc de a colecta datele din cauza lipsei de resurse, probleme de fezabilitate, sau
probleme etice.
In cele din urma, specificitatea este - de asemenea - o caracteristică importantă a unei întrebări
bune. Un exemplu de întrebare generală este: Este a o dieta mai sănătoasă mai buna pentru
tine? Pentru a formula o întrebare mai specifica ar trebui sa clarificam ce înseamnă
o dietă "mai sănătoasă" și ca ceva este "mai bun pentru tine"? Procesul de creștere a
specificității ar trebui să conducă la o întrebare finală, rafinată, cum ar fi: "O dieta ce contine
cel putin 5 porții pe zi de fructe și legume proaspete conduce la mai puține infecții ale
tractului respirator superior (răceli)? Cu acest grad de specificitate, planul dvs. de atac este
mult mai clar și răspunsul pe care îl veți primi la sfârșitul analizei datelor va fi mai
interpretabil. De asemenea veți putea recomanda sau nu acțiunea specifică de a mânca cel
puțin 5 porții din fructe și legume proaspete pe zi ca mijloc de protecție împotriva infecțiilor
tractului respirator superior.
Mnemonica PICO- detaliata mai jos- este adesea utilizata pentru a formula întrebari de
cercetare mai specifice.
 P = Populație/ pacient
 I = Intervenție/ indicator
 C = Comparator/ control
 O = Outcome/ rezultat
2.3. Sfaturi practice pentru formularea unei intrebari
9
Alege un subiect de interes și initiaza o cercetare preliminara cu privire la modul in care acest
subiect a fost abordat în literature de specialitate pentru a vedea ce arii de cercetare au fost
deja acoperite. Acest lucru va ajuta si la a determina ce tipuri de întrebări acest subiect
generează cu preponderenta. După ce ați efectuat cercetarea preliminara, începeti prin
formularea unor intrebari deschise de tipul " Cum ? " Ce ? " si " De ce? ". Apoi evaluati
posibilele răspunsuri la aceste întrebări.
Exemplu de lista de verificare pentru formularea intrebarilor de cercetare in stiinte umaniste

(Universitatea Vanderbilt):
1 ) Este întrebarea de cercetare ceva ce ma intereseaza pe mine/ii intereseaza pe altii?
2 ) Este întrebarea de cercetare o abordare noue pe o problema veche sau rezolva problema?
3 ) Este prea vasta sau prea limitata?
4 ) Este întrebarea de cercetare cercetabila în intervalul de timp si locatia disponibile?
5 ) Ce informații sunt necesare ?
Cel mai comun tip de întrebare clinica este despre cum se trateaza o boală sau o stare si astfel
de întrebări stau la baza unor studii de “interventie”. Nu toate întrebările de cercetare sunt insa
despre eficienta anumitor intervenții. Adesea pot apărea si alte tipuri de întrebări :
 Care sunt cauzele problemei? => Studii etiologice, cercetari ale factorilor de risc
 Care este frecvența problemei? => Studii de frecventa
 Are o anumita persoană problema investigata? => Studii de diagnostic
 Cine este la risc sa dezvolte problema? => Studii de prognoza, predictie
3. Analiza exploratorie a datelor (statistici desctiptive)
3.1. Analiza de frecvente
Mai multe variante de raportare a frecventelor apar in practica. Mai jos sunt listate si definite
cel mai frecvent intalnite variante.
 Frecventa simpla: frecvenţa de apariţie a fiecărei valori dintr-o distribuţie
10
 Frecvenţa cumulată (fc). Totalul valorilor care se cumulează începând de la valoarea
cea mai mare până la valoarea cea mai mică din tabel.
 Frecvenţa relativă raportată la unitate fr(1). Este raportul dintre frecvenţa absolută
şi suma frecvenţelor absolute (fa/Σfa).
 Frecvenţa relativă cumulată, raportată la unitate fr(1): Este similară frecvenţei
cumulate absolute, cu deosebirea că în acest caz se cumulează frecvenţele relative.
 Frecvenţa relativă procentuală fr(%): Exprimă procentul valorilor care se situează
până la o anumită valoare din cadrul distribuţiei. Se calculează fie prin înmulţirea fr(1)
cu 100, fie prin calcularea direct procentului pe care îl reprezintă o anumită valoare
raportat la totalul valorilor dintr-o distribuţie. Suma frecvenţelor relative procentuale
este întotdeauna egală cu 100.
 Frecvenţa relativă cumulată procentuală (frc%): Exprimă procentul valorilor dintr-
o distribuţie care se plasează până la o anumită valoare (inclusiv aceasta). Frecvenţa
relativă procentuală cumulată se numeşte si rang percentil.
3.2. Prezentarea grafica a datelor
Prezentarea grafică a datelor statistice depinde de necesitatile de evidentiere a rezultatelor.

Cel mai frecvent utilizate grafice sunt
 graficul de tip bară: este cel mai simplu mod de reprezentare grafică a datelor. Se
utilizează atunci când dorim să reprezentăm o variabilă „discretă” (care prezintă valori
întregi, de exemplu, numărul de răspunsuri corecte la un test în funcţie de nivelul de
instruire al subiecţilor).
11
 histograma: la prima vedere, histograma este asemănătoare cu graficul de tip bar; ea
este insa mai adecvată pentru situaţiile când variabila pe care dorim să o reprezentăm
este de tip „continuu” (adică poate lua orice valoare pe o scală numerică, de ex.,
număr de răspunsuri corecte, timpul de reacţie, lungimea).
 poligonul de frecvenţe: este o reprezentare alternativă la histogramă. Punctele centrale

ale suprafeţelor rectangulare care reprezintă frecvenţa sunt unite cu o linie care
delimitează suprafaţa poligonului.
 graficul frecvenţei cumulate: este un grafic de tip liniar care reprezintă valorile
frecvenţei absolute cumulate
12
 graficul circular: este utilizat în situaţiile în care valorile sunt „parte a unui întreg”. De
exemplu, poate fi utilizat la reprezentarea distribuţiei de frecvenţe grupate, pentru a
avea o imagine directă a ponderii frecvenţei fiecărei clase de interval în raport cu
celelalte.
 graficul de tip „stem and leaf” („tulpină şi frunze”); atunci când utilizăm o distribuţie
de frecvenţe grupate, cazurile individuale „se pierd” la nivelul fiecărei clase de
interval fără a mai putea şti unde se plasează fiecare valoare iniţială în interiorul
fiecărui interval. Reprezentarea de tip stem-and-leaf (pe scurt stem plot), are tocmai
avantajul de a realiza graficul distribuţiei cu păstrarea valorilor individuale
13
3.3. Indicatori ai tendintei centrale
Modul (Mo) = valoarea cu frecvenţa cea mai mare de apariţie
Mediana (Me) = valoarea „din mijlocul” unei distribuţii, adică aceea care are 50% dintre
valori deasupra ei şi 50% dintre valori dedesubtul ei
Media aritmetică (m) = raportul dintre suma valorilor distribuţiei şi numărul acestora
Notaţii uzuale:
 μ (miu), atunci când este media întregii populaţii de referinţă
 m, atunci când se calculează pentru un eşantion (cazul cel mai frecvent)
Abaterea medie (d de la deviaţie medie) = distanţa dintre o valoare anumită şi media

distribuţiei se numeşte abaterea valorii (Xi-m); media abaterilor într-o distribuţie este
întotdeauna egală cu zero
Dispersia (varianţa, abaterea medie pătratică) = pentru a elimina inconvenientul abaterilor

de la medie de a avea suma egală cu zero, se operează ridicarea la pătrat a abaterilor valorilor
individuale
Notaţii uzuale:
 s2 (când se calculează pentru eşantion)
14
 σ2 (când se calculează pentru întreaga populaţie)
Abaterea standard = Abaterea standard se obţine prin extragerea radicalului din expresia
abaterii medii pătratice (dispersiei).
Notaţii uzuale:
 s (pentru eşantioane)
 σ (pentru populaţie)
 SD (Standard Deviation, în standardul APA ) ab.std.
Distributia normala
 Reprezentarea grafică a rezultatelor măsurărilor reale poate lua diverse forme, curba
distribuţiei putând fi unimodală sau multimodală, aplatizată sau înaltă, simetrică sau
asimetrică. În statistică există însă un tip special de distribuţie, numită „distribuţie
normală”, care corespunde reprezentării grafice a unei caracteristici pentru care există
un mare număr de măsurări, tinzând spre infinit
 Conceptul de „curbă normală” (expresia grafică a „distribuţiei normale”) se referă la
un anumit tip de distribuţie teoretică care are câteva proprietăţi caracteristice:
o are formă de „clopot”. Cea mai mare parte a valorilor se concentrează în zona
centrală (medie);
o este perfect simetrică pe ambele laturi ale sale;
o linia curbei se apropie la infinit de axa OX (orizontală), fără a o atinge
vreodată;
o în conformitate cu proprietatea 2, de fiecare parte a mediei se află exact
jumătate dintre valorile distribuţiei.
Distribuţia normală z
 Curba normală în care valorile sunt exprimate în scoruri z se numeşte curba normal
standardizată. Ea are toate proprietăţile enunţate mai sus, având însă şi parametrii
oricărei distribuţii z: m=0 şi s=1. Rezultă astfel că distribuţia normală standardizată (z)
este este simetrică în jurul lui 0.
 Curba normal standardizată are câteva caracteristici pe care este important să le
reţinem:
15
o Aproximativ 34% dintre scorurile distribuţiei normale se află între medie şi o
abatere
o standard deasupra mediei (z=+1)
o Între – 1z şi +1z se află aproximativ 68% dintre valorile distribuţiei
o Aproximativ 96% dintre scoruri se află între –2z şi +2z
4. Construirea modelelor statistice (statistici inferentiale)
4.1. Testele t
Testele t = procedură de testare a semnificației statistice a diferenței dintre două medii –
variabila dependentă este măsurată pe scală cantitativă (interval-raport)
Distribuția teoretică de referință (distribuția de nul)
 normală, pentru eșantioane mai mari de 30 de subiecți
 t - Student, pentru eșantioane mai mici de 30 de subiecți
4.1.1. Testul t pentru un eșantion
16
Uneori interesul nostru nu este de a compara doua grupe, ci doar de a compara rezultatele unei
grupe fata de o anumita valoare standard, reprezentata cel mai frecvent de media populatiei de
interes. In aceste situatii se aplica testul t pentru un esantion, precum in exemplul urmator:
„Un test de empatie a fost administrat pe o populatie de elevi proaspat intrati la liceu (N =
1250), obtinandu-se un scor mediu de 25.00 si o abatere standard de 7.00. La aceeasi proba, la
una dintre clasele testate (n = 28), s-a obtinut un scor mediu de 28.00 si o abatere standard de
7.06. Are aceasta clasa un nivel de empatie mai ridicat decat media populatiei de elevi?”.
Astfel, pentru a aplica testul t pentru un esantion este nevoie ca :

 variabila comparata sa fie exprimata numeric, fiind vorba de comparatii intre medii;
 una dintre mediile comparate sa reprezinte populatia de interes sau o valoare standard
a priori stabilita;
 cealalta grupa sa fie constituita dintr-un lot de participanti a caror medie si abatere
standard la variabila comparata sunt cunoscute.
Pe scurt, testul t pentru un singur esantion:
 Testează diferența dintre media unui eșantion și media populației
 Mai general, diferența dintre media eșantionului și o valoare de referință…
 Procedura SPSS – Analyze/Compare means/One Sample T Test…
Raportare
 Media și abaterea standard a eșantionului
 Media populației (valoarea de referință)
 Intervalul de încredere pentru diferența dintre medii
 Mărimea efectului: d m /
Testul t (Student) pentru un singur eşantion

 testul t poate fi utilizat doar atunci când cunoaştem media populaţiei de referinţă şi
avem la dispoziţie un eşantion „mare” (adică de cel puţin 30 de subiecţi, în cazul unei
variabile despre care avem motive să credem că se distribuie normal).
 distribuţia mediei de eşantionare urmează legea curbei normale standardizate doar
pentru eşantioane de minim 30 de subiecţi, conform teoremei limitei centrale.
17
4.1.2. Testul t pentru eşantioane independente
Atunci cand criteriul (variabila dependenta) este masurat printr-o scala numerica, iar noi
suntem interesati sa comparam rezultatele obtinute de doua grupe diferite de subiecti vom
utiliza testul t pentru 2 esantioane independente.
Exemple de cercetari care necesita apelul la testul t pentru 2 esantioane independente:
(1) Un cercetator crede ca strategiile sintetice conduc mai repede la deprinderea cititului
decat strategiile analitice. Pentru a testa ipoteza el selecteaza doua clase paralele de
elevi aflati in clasa I, fiecare dintre ele avand cate 20 de elevi. Primul grup a fost
invatat sa citeasca analitic (începand cu literele, trecand apoi la cuvinte), in timp ce al
doilea grup a invatat sa citeasca sintetic (pornind de la asocierea cuvintelor cu imagini,
pentru a deprinde ulterior literele). Variabila dependenta a constat intr-o proba de
citire contra cronometru, obtinandu-se un indicator pe baza formulei: numărul de
cuvinte citite intr-un minut / numarul de erori.
(2) Un alt cercetator este interesat sa studieze daca exista diferente la nivelul increderii in
fortele proprii intre copiii institutionalizati (n = 35) si o grupa de copii proveniti din
familii normale (n = 32). Pentru masurarea nivelului de incredere in sine a folosit
scorul total obtinut de cei 67 de participanti inclusi in cercetare la o scala ce masura
perceptia eficientei de sine (Self-efficacy).
(3) ntr-un alt studiu se urmareste daca exista diferente intre persoanele introvertite si cele
extrovertite cu privire la performanta lor in vanzarile de automobile. Pentru aceasta,
cercetatorul aplica mai intai o proba de personalitate pentru a masura locul fiecarui
participant pe axa introversiune-extroversiune. Toti participantii inclusi in studiu erau
angajati la departamentul vanzari la o companie de automobile. Pe baza rezultatelor
initiale, el imparte lotul de subiecti in doua grupe egale : cei care au obtinut rezultate
mai mari decat valoarea medianei sunt inclusi in grupa persoanelor « extravertite », in
timp ce persoanele care au obtinut un rezultat sub valoarea medianei au fost incluse in
grupa persoanelor « introvertite ». In pasul urmator, cercetatorul a cules date despre
performantele obtinute in vanzari de catre cele doua grupe, pornind de la registrul de
vanzari. Datele respective sunt folosite pentru a vedea daca exista diferente intre
introvertiti si extrovertiti cu privire la performantele lor in vanzari.
18
Conditii necesare pentru a folosi testul t pentru esantioane independente:
 sa fie vorba de compararea a doua grupe ;
 cele doua grupe sa fie independente (sa nu existe vreo legatura intre ordinea de
introducere a datelor pentru subiectii dintr-o grupa si cea de introducere a datelor din
cealalata grupa) ;
 Variabila supusă măsurării să se distribuie normal în ambele populaţii. Aceasta ne
garantează că şi distribuţia diferenţelor dintre medii se distribuie normal. Totuşi,
teorema limitei centrale ne permite asumarea normalităţii distribuţiei mediei de
eşantionare chiar şi în cazul variabilelor care nu se distribuie normal la nivelul
populaţiei, pentru eşantioane mari. Dacă însă, analiza distribuţiilor indică forme
aberante, iar volumul grupurilor comparate este foarte mic, se va allege soluţia unui
test neparametric.
 Dispersia celor două eşantioane să fie omogenă. Testul t poate fi aplicat strict în
cazurile în care dispersiile celor două populaţii („practicanţi”, „nepracticanţi”) au
aceeaşi dispersie (omogenitatea dispersiei). Din fericire, există trei situaţii în care
această condiţie nu trebuie să ne preocupe:
o când eşantioanele sunt suficient de mari (cel puţin 100 fiecare)
o când cele două eşantioane au acelaşi volum (N1=N2)
o când dispersiile celor două eşantioane nu diferă semnificativ (dar, chiar şi
pentru acest caz, există formule care ţin cont de diferenţa dispersiilor).
4.1.3. Testul t pentru eşantioane perechi
In momentul in care criteriul (variabila dependenta) este masurata printr-o scala numerica, iar
noi suntem interesati sa comparam rezultatele obtinute de doua grupe, in conditiile in care
cele doua grupe sunt in relatie una cu cealalta prin interventia experimentatorului sau prin
corespondenta naturala a elementelor din cele doua grupe, vom utiliza testele pentru
esantioane perechi (corelate / dependente).
Astfel exista trei situatii in care vorbim de esantioane perechi :

• cazul masuratorilor repetate ;
• cazul perechilor naturale ;
• cazul perechilor artificiale.
19
Exemple de cercetari care necesita apelul la testul t pentru doua esantioane perechi:
Cazul masuratorilor repetate
(1) Obiectivul cercetarii este de a studia influenta metodelor de relaxare asupra reducerii
conduitelor agresive la adolescenti. O grupa de 15 adolescenti cu tulburari comportamentale
este testata initial (pre-test) in ceea ce priveste nivelul agresivitatii printr-un inventar de
personalitate. Dupa testare, cei 15 urmeaza un program de relaxare, constituit din cinci sedinte
de relaxare saptamanale, fiecare durand o ora. Dupa o perioada de doua luni, participantii sunt
retestati (post-test) pentru a se observa daca nivelul lor de agresivitate a scazut in urma
practicarii tehnicilor de relaxare invatate.
Cazul perechilor natural
(2) Un cercetator norocos gaseste 20 de perechi de gemeni univitelini, dar crescuti in familii
diferite, fiind despartiti de la nastere. Mai mult, diferenta era de ordin calitativ, unii crescand
in familii „normale”, iar ceilalti in familii cu „probleme”. Obiectivul studiului era de a stabili
in ce masura agresivitatea este invatata social, dovedita prin existenta unor diferente
semnificative in manifestarile agresive ale gemenilor din cele doua grupe. Agresivitatea a fost
codata pe baza unui protocol de observatie, scorurile variind intre 4 si 20.
Cazul perechilor „artificiale”
(3) Obiectivul cercetarii este de a studia efectul atmosferei de lucru asupra rezolvarii
problemelor de matematica. Cercetatorul decide sa imparta subiectii in cele doua grupe de
lucru pe baza unui criteriu prestabilit. Astfel, sunt testate initial cunostintele de matematica ale
elevilor, iar pe baza rezultatelor obtinute are loc distribuirea elevilor in cele doua grupe,
pentru a controla (elimina) influenta acestora asupra relatiei dintre variabilele studiate. Pentru
a echivala cele doua grupe, cercetatorul ia primii doi subiecti, care au obtinut rezultatele cele
mai bune la testul initial, si ii distribuie in grupe diferite. Apoi trece la urmatorii doi pe care ii
distribuie, de asemenea, in grupe diferite. Se continua algoritmul pana sunt divizati toti
participantii. Apoi, una dintre cele doua grupe nou-formate va rezolva probleme de
matematica intr-o atmosfera calma, relaxanta, in timp ce al doilea grup va rezolva probleme
de matematica intr-o atmosfera tensionata, conflictuala. Variabila dependenta este
20
performanta obtinuta de fiecare elev, exprimata in numarul de probleme rezolvate corect,
maximum fiind 10.
Dupa cum se observa, testul t pentru doua esantioane independente necesita trei conditii
esentiale :
• sa fie vorba de compararea a doua grupe ;
• cele doua grupe sa fie dependente (sa existe o legatura intre ordinea de introducere a datelor
pentru subiectii dintr-o grupa si cea de introducere a datelor din cealalta grupa);
• variabila (dependenta) supusa compararii sa fie exprimata numeric.
5. Analiza de varianta ANOVA
5.1. Definitie
ANOVA este o generalizare a testului t pentru mai mult de doua medii, pentru c deseori în
cercetarea psihologica studiem mai mult de doua grupuri în acelasi timp. De subliniat este
faptul ca ANOVA poate fi folosita si la compararea dintre doua medii insa este mai eficient
utilizata cand comparam 3 sau mai multe medii.
5.2. Clasificarea tehnicilor ANOVA

Cele mai întâlnite design-uri de cercetare experimentală utilizează una dintre următoarele
patru forme de analiză de varianţă:
1. ANOVA simplă sau unifactorială
2. ANOVA cu măsurători repetate;
3. ANOVA factorială cel mai utilizat fiind bifactorială
4. ANOVA mixtă
5.3. ANOVA simplă sau unifactorială

ANOVA unifactorială este modelul cel mai simplu dintre tehnicile ANOVA, fiind un
corespondent al testului t pentru două eşantioane independente.
Exemplu:Un cercetător doreşte să vadă dacă profesia influenţează competitivitatea

interpersonală. În acest sens selectează aleator trei grupuri de bărbaţi: fotbalişti profesionişti,
21
profesori de colegiu şi manageri care sunt evaluaţi pentu a se determina cat de mult le place
competiţia interpersonală. Scorurile mari indică nivele ridicate ale competitivităţii.
5.4. ANOVA cu măsurători repetate

ANOVA cu măsurători repetate este un model corespondent al testului t pentru două
eşantioane perechi.
Exemplu: Intr-un studiu de psihofarmacologie vrem să studiem efectul a două substante de
tipul amfetaminei asupra timpilor de reacţie la un test de psihomotricitate. Pentru a controla o
posibilă sursă de eroare, se folosesc aceiaşi subiecţi cărora li se aplică, la intervale de două
săptămîni, trei tratamente diferite: cu substanţa α , cu subsatnţa β şi placebo. Se măsoară de
fiecare dată timpii de reacţie ai subiecţilor exprimaţi în milisecunde.
Intr-un studiu de psihologia muncii vrem să evidenţiem efectul zgomotului asupra

discriminării perceptive. În acest scop, subiecţii sunt supuşi unui număr de trei condiţii
experimentale-dimineaţa la începutul zilei de muncă. În prima realizează o sarcină de
discriminare perceptivă în absenţa zgomotului, in a doua sarcină zgomotul este intermitent iar
în a treia sarcină zgomotul este continuu. Se monitorizează erorile efectuate
5.5. ANOVA factorială
ANOVA factorială este un model mai complex, testand efectele mai multor variabile
independente (factori) asupra unei variabile dependente.
Exemplu: Deoarece diverse parţi ale creierului sunt specializate pentru comportamente
specifice, studiile au arătata că diferenţele intre stîngaci şi dreptaci se datorează diferenţelor
în ce priveşte emisfera dominantă. Pornind de a acest fapt cercetătorii au presupus că dreptacii
şi stîngacii au abilităţi şi talente diferite. În vederea testării acestei ipoteze un psiholog a
evaluat discriminarea de acord -componentă a abilităţilor muzicale- pentru trei grupuri de
subiecţi: stîngaci, dreptatci şi ambidecştri în două condiţii experimentale: cand subiecţii sunt
odihniti si dupa 24 de ore in condiţiile privării de somn. Performanţa discriminativă a
subiecţilor a fost măsurată cu o probă specifică.
ANOVA factorială poate fi utilizată în cazul măsurătorilor repetate dacă sunt manipulaţi cel
puţin doi actori.
22
Exemplu:Un psiholog educaţional studiază motivaţia elevilor. Un lot de 7 subiecţi sunt
urmăriţi timp de 3 ani din clasa a patra până în clasa a şasea. În fiecare an elevii conpletează
un chestionar măsurînd motivaţia şi entuziasmul pentru şcoală centrat pe 3 discipline:
matematica, romana, muzica.Psihologul vrea să ştie dacă apar schimbări semnificative între
nivelurile de motivaţie de-a ungul celor 3 ani si intre interesul pentru diferite discipline.
5.6. ANOVA mixtă
ANOVA mixtă este o combinaţie intre ANOVA simplă şi ANOVA cu măsurători repetate.
Exemplu: Intr-o cercetare care vizează efectul imaginilor mentale un grup de 16 studenţi
-dintre care 50% sunt fete şi restul băieţi.-este upus la trei condiţii experimentale la interval de
două săptămîni. Prima condiţie presupune invăţarea fiecarui cuvînt însoţit de desenarea
acestuia – „imagine mentală construită”, a doua condiţie presupune învăţarea cuvîntului
însoţită de copierea imaginii acestuia care îi este prezentată împreună cu cuvîntul– „imagine
mentală dată” . Al treilea grup învaţă cuvintele pur şi simplu „ condiţia de control”. Ce se
poate spune cu privire la efectele tipului învăţării asupra umărului de cuvinte reamintite la
fete şi băieţi?
5.7. Condiţii pentru aplicarea ANOVA
• Independenţa observaţiilor (valorilor) pentru fiecare grup comparat

– valorile măsurate pe subiecţii unui grup să nu fie în nici un fel influenţate de valorile
măsurate pe celelalte grupuri.
• Distribuţie normală a valorilor fiecărui grup comparat
– distribuţiile comparate trebuie să fie simetrice sau...
– asimetriile să fie în aceeaşi direcţie
– testul F este considerat remarcabil de robust în cazul încălcării condiţiei de
normalitate.
23
– ANOVA este mai vulnerabilă dacă distribuţia variabilei dependente este prea
aplatizată
sau prea înaltă (kurtosis≠0) decât în cazul asimetriei (skewness≠0).
– Cu cât volumul grupurilor supuse comparaţiei este mai mare, cu atât aspectele legate
de
normalitatea distribuţiei au un efect mai mic asupra ANOVA.
• Omogenitatea dispersiei la nivelul fiecărui grup
– Împrăştierea valorilor variabilei dependente în interiorul grupurilor definite prin
valorile
variabilei independente trebuie să fie egală.
– încălcarea acestei condiţii nu invalidează testul ANOVA, care este destul de robust şi
în
acest caz
– se vor analiza cu atenţie cazurile care prezintă valori extreme, care au un efect
important
asupra varianţei. Egalitatea (omogenitatea) varianţei poate fi testată cu testul Levene
– Teste alternative: Brown, Forsythe sau Welch
B.PROTOCOL DE CERCETARE
1. Structura unui protocol de cercetare
5.8. Introducere
Introducerea ar trebui să fie un rezumat succint al studiului și include următoarele elemente:
5.8.1. Prezentare generala

Primul paragraf trebuie să sumarizeze studiul propus. Acesta ar trebui să descrie
scopul de studiului și răspunda la următoarele întrebări: 1) Incearcă studiul să
testeze o ipoteză pilot pentru un proiect viitor? 2) Incearcă studiul să valideze un
instrument? 3) Vor fi proiectate intervenții viitoare in baza rezultatelor? Dacă este
cazul, acest alineat ar trebui să menționeze, de asemenea, informații legate de
finanțare.
24
5.8.2. Context și argumente
Această secțiune ar trebui să ofere contextul și motivația pentru inițierea
studiului. Rezultatele revizuirii literaturii de specialitate trebuie să fie descrise,
inclusiv referiri detaliate ale studiilor anterioare. Rezultatele studiilor pilot
effectuate (dacă este cazul) ar trebui să fie incluse. Dacă este necesar, referințe la
date sau informații suplimentare pot fi incluse într-o anexă.
5.9. Obiective
Secțiunea ar trebui să prezinte concis ipotezele de cercetare. Această secțiune ar trebui să

precizeze dacă protocolul este pentru un studiu de fezabilitate/studiu descriptiv.
Exemplu:
 Pentru a testa un instrument ...
 Pentru a descrie ...
Designul studiului trebuie să permită investigatorului să răspundă obiectivelor de cercetare iar

sectiunea de analiza statistică va trebui să evidențieze în mod clar modul în care datele vor fi
evaluate în raport cu fiecare dintre aceste obiective.
5.10. Selectia participantilor 3
Această secțiune ar trebui să ofere o descriere detaliată a populației ce reprezinta subiectul

cercetării prezentate in protocol. Trebuie luati în considerare următorii factori:
1) populatia (problema specifica (de ex. un anumit tip de patologie);
2) adecvarea pentru interventia propusa
3) determinarea unui grup de risc in urma expunerii la interventie
Toate cerintele legate de gen, ocuparea forței de muncă, arie geografica, limbă, etc trebuie
precizate și justificate în mod clar.
5.11. Recrutare si randomizare

Această secțiune trebuie să descrie procedurile de recrutare, înregistrare și/sau randomizare a
subiectilor. Mijloacele de obținere a consimțământului informat ar trebui să fie descrise în
25
întregime. Această secțiune poate include, de asemenea, o declarație cu privire la modalitatile
de contactare a cercetătorului principal înainte de a participa la studiu. Numele și numărul de
telefon al persoanei care conduce studiul, ar trebui specificate.
5.12. Designul si metodele studiului

Această secțiune ar trebui să ofere o descriere detaliată a procesului de studiu.
5.12.1. Design / Tipul de studiu
Acest segment ar trebui să descrie tipul designului descris în protocol (de exemplu,
randomizat, cohortă, caz-control, etc.)
5.12.2. Selectarea instrumentelor
Această secțiune ar trebui să ofere informații specifice despre instrumentele care vor fi
utilizate în cadrul studiului. Trebuie luati în considerare următorii factori:
1) justificarea selectarii anumitor instrumente;
2) proprietăți psihometrice ale instrumentelor;
3) pre-testarea prealabila a instrumentelor;
4) utilizarea instrumentelor selectate în studii anterioare;
5) timp aproximativ necesar pentru completarea fiecarui instrument de catre populația
selectata
6) durata estimată pentru fiecare subiect.
5.12.3. Descrierea intervenției

Natura oricărei intervenții comportamentale utilizate în studiu trebuie să fie descrisa în
detaliu, inclusiv procedurile utilizate în dezvoltarea, si pilotarea intervenției.
5.12.4. Colectarea datelor
Această secțiune ar trebui să specifice datele care vor fi colectate (inclusiv in forma
tabelara). În cazul în care există diferențe în datele colectate pentru diferite grupuri
participanti, acest lucru ar trebui prezentat în mod clar într-unul sau mai multe tabele.
5.12.5. Descrierea procesului/procedurii
Această secțiune trebuie să prezinte o descriere detaliată a procedurilor care trebuie urmate în
efectuarea studiului. Trebuie luate în considerare elementele enumerate mai jos.
Administrarea instrumentului
Explicatii clare ale modului în care vor fi administrate instrumentele (de exemplu,
auto-administrat, interviu administrat, etc.) trebuie incluse in aceasta sectiune. Informații
26
specifice privind contextul administrarii instrumentelor si supravegherea testarii (de ex. in
cazul experimentelor trebuie sa include si modul de utilizare a surogatelor/interventiilor
placebo) calendarul și procedurile de minimizare a datelor lipsă. În plus, această secțiune ar
trebui să ofere detalii cu privire la temporizarea utilizarii instrumentelor, cum ar fi o notificare
prealabilă, perioadă de pregătire, timp de finalizare, etc.
Administrarea intervenției
Această secțiune ar trebui să abordeze modul în care intervenția va fi
executata. Informații privind frecvența intervenției, contextul, și calificarea persoanelor care
administrează intervenția ar trebui incluse.
Aspecte particulare
Ar trebui descrise complicațiile anticipate precum și strategiile de gestionare și
soluționare propuse.
Compensarea participarii
Problema compensarii ar trebui abordata în această secțiune. Informații despre
compensare ar trebui să fie incluse si în formularul de consimțământ.
5.12.6. Reactii adverse și gestionarea lor
Această secțiune trebuie să includă următoarele segmente:
Raportarea evenimentelor adverse sau neprevăzute
Acest segment trebuie să definească posibilele evenimente adverse care ar putea sa
apara precum si un plan de gestionare a acestora
Reacții anticipate
O descriere a reacțiilor care pot fi așteptate ca urmare a participarii la studiu, cum ar fi
stres sau furie, ar trebui menționate.
Managementul reacțiilor
Ar trebui să se prevadă modalitatile prevazute de management al reacțielor
participantilor precum si posibilati de răspuns la distress-ul acestora. Informații privind
resursele disponibile de ajutor, precum și numele și numerele de telefon ale unor psihologi
care nu sunt asociati cu studiul, dar care pot fi contactate în caz de distres trebuie să fie
listate. Toate aranjamentele necesare cu privire la utilizarea resurselor menționate mai sus
trebuie să se facă înainte de începerea studiului si ar trebui să fie menționate în protocol.
5.13. Analiza statistică
Secțiunea de analiză statistică ar trebui să rezume desigul si justificarea studiului. Acesta ar
trebui să furnizeze dovezi că proiectul propus va permite anchetatorilor sa atinga obiectivele
27
principale ale studiului și ar trebui să descrie planul analitic pentru fiecare obiectiv. Acesta ar
trebui să discute în mod explicit modul în care vor fi analizate datele de la fiecare dintre
instrumentele utilizate.
5.14. Referințe
Fiecare studiu trebuie să conțină o listă de referințe. Referințele vor fi numerotate în funcție
de ordinea apariției lor în text și citate în text cu numărul din paranteze
5.15. Anexe
Copii ale tuturor instrumentelor care vor fi utilizate, scrisori către potențiali participanți,
script-uri, precum și orice alte materiale de studiu care vor fi utilizate in interactiunea cu
participantii trebuie să fie anexate protocolului.
28
6. Selectia participantilor si determinarea volumului esantionului
6.1. Volumul eşantionului recomandat în diferite procedurilor statistice
Recomandările de mai jos au un caracter practic, dar se bazează pe două concept

fundamentale ale statisticii inferenţiale:
- mărimea efectului se referă la intensitatea asocierii (diferenţei) dintre variabilele
cercetării (Kraemer & Thiemann, 1987).
- puterea testului (probabilitatea de a obţine un rezultat statistic semnificativ).
Aceste recomandări oferă un cadru empiric, suficient pentru orientarea în situaţiile în care nu
apelăm la analize cantitative riguroase de dimensionarea eşantioanelor, cu ajutorul softurilor
online (de ex. .
6.1.1. Volumul celulelor (grupurilor) pentru testele utilizate în detectarea diferenţelor

dintre medii
Toate testele statistice care detectează diferenţele dintre grupuri se bazează pe o anume
distribuţie de eşantionare. Ca urmare, numărul subiecţilor din fiecare eşantion are o legătură
directă cu împrăştierea distribuţiei de eşantionare (eroarea standard). Cu cât mai mulţi subiecţi
în eşantion, cu atât împrăştierea distribuţiei de eşantionare este mai mică şi şansa de a
descoperi o diferenţă semnificativă este mai mare (ceea ce înseamnă şi o putere a testului mai
mare). Dar puterea nu este legată numai de mărimea eşantionului, ci şi de mărimea efectului.
Pe măsură ce mărimea efectului creşte, creşte şi puterea testului. De exemplu, dacă dorim să
testăm efectul unei psihoterapii după două şedinţe, când efectul este mic, testul statistic va
avea „putere mică”, adică va avea şanse mai reduse să releve un efect semnificativ decât, să
zicem, după 12 şedinţe, când efectul terapeutic va fi mai pronunţat.
Testul t pentru eşantioane independente, pentru eşantioane dependente, analiza de varianţă
(ANOVA one-way sau factorială), la fel ca şi analiza de varianţă multivariată (MANOVA),
sunt concepute pentru testa semnificaţia diferenţelor dintre mediile unor grupuri. Pentru a
menţine un nivel acceptabil pentru puterea testului, fiecare dintre grupurile comparate trebuie
să aibă un volum minimal, pentru a avea suficientă putere în detectarea diferenţelor şi, în
acelaşi timp, o nivel mediu ridicat al mărimii efectului (VanVoorhis & Morgan, 2001).
Concret, pentru a avea o putere acceptabilă a testului:
29
- atunci când sunt comparate mediile a două grupuri independente, se vor utiliza cel puţin
60 de subiecţi (minim 30 pentru fiecare grup).
- atunci când este utilizat testul ANOVA pentru o variabilă independentă cu trei valori,
eşantionul cercetării trebuie să fie compus din cel puţin 3x30=90 de subiecţi.
- în cazul analizei de varianţă multivariate (MANOVA) este important să existe mai multe
cazuri decât variabile independente în fiecare celulă definită de valorile variabilei
independente (Tabachnick & Fidell, 1996).
6.1.2. Mărimea eşantionului atunci când se studiază asocierea variabilelor
Deşi calcularea mărimii eşantionului în astfel de situaţii face obiectul unor formule
complexe,
regula empirică generală este de a nu utiliza eşantioane mai mici de 50 de subiecţi în cazul
analizei de corelaţie sau de regresie simplă. În cazul corelaţiei şi regresiei multiple, în care
sunt mai multe variabile independente (criteriu), Green (1991) sugerează ca volumul
eşantionului cercetării să fie !>50+8m, unde m este numărul variabilelor independente, pentru
corelaţii multiple şi ! > 104+m, pentru regresia multiplă.
Concret, pentru o analiză de corelaţie multiplă cu patru variabile se vor utiliza 50+8x4=82
subiecţi, iar pentru o regresie cu 4 variabile criteriu, se va asigura un eşantion de minim
104+4=108 subiecţi. Atunci când se urmăreşte atât testarea corelaţiei cât şi a regresiei se
recomandă eşantioane mai mari decât acestea. În acelaşi context sunt recomandate şi alte
reguli empirice, astfel:
- Pentru 5 sau mai mulţi predictori (sau variabile multiplu corelate) numărul participanţilor va
depăşi numărul predictorilor cu cel puţin 50. Altfel spus, totalul participanţilor trebuie să fie
mai mare numărul predictorilor cu cel puţin 50 (Harris, 1985);
- Pentru ecuaţiile de regresie cu şase sau mai mulţi predictori se impune un minim de 10
participanţi pentru fiecare predictor dar, dacă situaţia o permite, şi mai bine este ca să existe în
jur de 30 de subiecţi pentru fiecare variabilă. Cohen şi Cohen (1975) demonstrează că în cazul
unei regresii cu un singur predictor care are o corelaţie cu variabila predictor de 0.30, sunt
necesari 124 subiecţi pentru a menţine o putere de 0.80. Cu cinci predictori şi o corelaţie
multiplă de 0.30, aceeaşi putere este atinsă pe un eşantion de 187 subiecţi.
O atenţie specială se va acorda simetriei variabilei dependente, deoarece în cazul existenţei
unei asimetrii, mărimea aşteptată a efectului este mică şi, implicit, puterea testului este mai
mică şi ea (Tabachnick & Fidell, 1996).
30
6.1.3. Volumul eşantionului pentru testul chi-pătrat
O regulă de siguranţă este ca în nici una din celulele tabelului de corespondenţă frecvenţa
teoretică să nu fie mai mică de 5, iar volumul total al eşantionului să nu fie mai mic de 20. În
cazul testului chi-pătrat, spre deosebire de alte teste statistice, creşterea numărului subiecţilor
nu are un impact asupra valorii critice de respingere a ipotezei de nul. Totuşi, volumul
eşantionului are un effect asupra puterii testului. Existenţa unor frecvenţe teoretice (aşteptate)
într-una sau mai multe celule ale tabelului de corespondenţă limitează considerabil puterea
testului. De asemenea, valori reduse ale frecvenţelor aşteptate cresc nivelul erorii de tip I.
Acesta este şi motivul pentru care se recomandă un eşantion de cel puţin 20 de subiecţi
(Howell, 1997).
Testul chi-pătrat este utilizat pentru testarea gradului de independenţă (asociere) dintre
variabile categoriale. Ca urmare, nici un subiect nu trebuie să contribuie cu mai mult de o
singură valoare. La rândul lor, gradele de libertate au un anumit impact asupra puterii testului.
Cu cât numărul celulelor tabelului de corespondenţă creşte (ceea ce conduce la creşterea
gradelor de libertate), se reduc frecvenţele teoretice din celulele tabelului de corespondenţă şi,
implicit, are loc o reducere a puterii (Cohen, 1988). Şi totuşi, atunci când se aşteaptă o
mărime importantă a efectului, se consider că poate fi tolerată şi o valoare mai mică pentru
puterea testului, implicit un volum mai redus al eşantionului (minim 8).
6.2. Metode de esantionare

6.2.1. Esantioane Probabilistice
Esantioanele probabilistice sunt acelea in care membrii populatiei au o sansa (probabilitate)

cunoscuta de a fi selectati in esantion. Aceste esantioane asigura reprezentativitatea statistica
a datelor pentru populatia aleasa si permit calcularea erorii de esantionare.
Metodele de selectie probabilistica sunt:

a) selectia aleatoare simpla,
31
b) selectia sistematica,
c) selectie cluster (multistadiala),
d) selectie aleatoare stratificata
32
6.2.2. Esantioanele Non-probabilistice:
Apar in situatiile in care probabilitatea sau sansa unui membru al populatiei selectate de a fi
ales in esantion nu poate fi determinata. Aceste esantioane nu asigura reprezentativitatea
datelor si eroarea de esantionare nu poate fi calculata.

a) Selectia arbitrara (Convenience samples): In acest caz esantioanele se alcatuiesc din
persoane alese arbitrar de catre operatorul de interviu sau din persoane care se ofera
voluntar.
b) Selectie Rationala (Judgment samples): Esantionarea se bazeaza pe rationamentul sau pe

presupunerea controlata a operatorului de interviu ca respondentul reprezinta populatia de
interes.
c) Selectia in Lant (metoda bulgarelui de zapada): Esantionarea presupune ca respondentii

sa ofere numele altor respondenti care fac parte din populatia de interes.
d) Esantionarea pe cote: Esantioanele au un numar precis de indivizi din fiecare categorie de

interes care trebuie chestionati.
33

Procesul de Analiza A Datelor

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Procesul de Analiza A Datelor

Încărcat de

Drepturi de autor:

Formate disponibile

SINTEZA ANALIZA DATELOR

2. FORMULAREA INTREBARILOR DE CERCETARE SI ANALIZA DATELOR 5

3. ANALIZA EXPLORATORIE A DATELOR (STATISTICI DESCTIPTIVE) 10

4. CONSTRUIREA MODELELOR STATISTICE (STATISTICI INFERENTIALE) 16

1. STRUCTURA UNUI PROTOCOL DE CERCETARE 24

2. SELECTIA PARTICIPANTILOR SI DETERMINAREA VOLUMULUI ESANTIONULUI 28

1.1. Activități principale de analiza a datelor

Există 5 activități principale de analiză a datelor:

1.2. Epiciclul de analiza a datelor

1.2.1. Stabilirea așteptărilor

1.2.2. Colectarea informațiilor (datelor) si compararea cu așteptările

1.2.3. Revizuirea așteptărilor dvs. sau a procesului de colectare a datelor

Tabel 1 – Activitati si etape de cercetare

Stabileste Colecteaza date Revizuiste asteptari

2. Formularea intrebarilor de cercetare si analiza datelor

2.1. Tipuri de întrebări

2.1.1. Intrebarile descriptive

2.1.2. Intrebarile exploratorii

2.1.3. Intrebarile inferențiale

2.1.4. Intrebarile predictive

2.1.5. Intrebarile cauzale

2.1.6. Intrebarile mecaniciste

2.2. Caracteristicile unei bune întrebări

In al patrulea rand, la intrebarea formulata trebuie sa poata fi oferit un raspuns. Cu toate ca

2.3. Sfaturi practice pentru formularea unei intrebari

Exemplu de lista de verificare pentru formularea intrebarilor de cercetare in stiinte umaniste

3. Analiza exploratorie a datelor (statistici desctiptive)

3.1. Analiza de frecvente

3.2. Prezentarea grafica a datelor

Prezentarea grafică a datelor statistice depinde de necesitatile de evidentiere a rezultatelor.

 poligonul de frecvenţe: este o reprezentare alternativă la histogramă. Punctele centrale

Modul (Mo) = valoarea cu frecvenţa cea mai mare de apariţie

Abaterea medie (d de la deviaţie medie) = distanţa dintre o valoare anumită şi media

Dispersia (varianţa, abaterea medie pătratică) = pentru a elimina inconvenientul abaterilor

4. Construirea modelelor statistice (statistici inferentiale)

4.1.1. Testul t pentru un eșantion

Astfel, pentru a aplica testul t pentru un esantion este nevoie ca :

Testul t (Student) pentru un singur eşantion

Exemple de cercetari care necesita apelul la testul t pentru 2 esantioane independente:

4.1.3. Testul t pentru eşantioane perechi

Astfel exista trei situatii in care vorbim de esantioane perechi :

Cazul masuratorilor repetate

Cazul perechilor natural

Cazul perechilor „artificiale”

5. Analiza de varianta ANOVA

5.2. Clasificarea tehnicilor ANOVA

5.3. ANOVA simplă sau unifactorială

Exemplu:Un cercetător doreşte să vadă dacă profesia influenţează competitivitatea

5.4. ANOVA cu măsurători repetate

Intr-un studiu de psihologia muncii vrem să evidenţiem efectul zgomotului asupra

5.5. ANOVA factorială

5.6. ANOVA mixtă

5.7. Condiţii pentru aplicarea ANOVA

• Independenţa observaţiilor (valorilor) pentru fiecare grup comparat

Introducerea ar trebui să fie un rezumat succint al studiului și include următoarele elemente:

5.8.1. Prezentare generala

Secțiunea ar trebui să prezinte concis ipotezele de cercetare. Această secțiune ar trebui să

 Pentru a testa un instrument ...

 Pentru a descrie ...

Designul studiului trebuie să permită investigatorului să răspundă obiectivelor de cercetare iar

5.10. Selectia participantilor 3

Această secțiune ar trebui să ofere o descriere detaliată a populației ce reprezinta subiectul

5.11. Recrutare si randomizare