Documente Academic
Documente Profesional
Documente Cultură
2017-2018
1
1. PROCESUL DE ANALIZA A DATELOR: ACTIVITĂȚI SI ETAPE 4
1.1. ACTIVITĂȚI PRINCIPALE DE ANALIZA A DATELOR 4
1.2. EPICICLUL DE ANALIZA A DATELOR 4
1.2.1. STABILIREA AȘTEPTĂRILOR 4
1.2.2. COLECTAREA INFORMAȚIILOR (DATELOR) SI COMPARAREA CU AȘTEPTĂRILE 4
1.2.3. REVIZUIREA AȘTEPTĂRILOR DVS. SAU A PROCESULUI DE COLECTARE A DATELOR 5
SE REALIZEAZĂ IN FUNCȚIE DE CONCLUZIILE EXTRASE DIN ETAPA 2. 5
2
1.5.2. SELECTAREA INSTRUMENTELOR 25
1.5.3. DESCRIEREA INTERVENȚIEI 26
1.5.4. COLECTAREA DATELOR 26
1.5.5. DESCRIEREA PROCESULUI/PROCEDURII 26
1.5.6. REACTII ADVERSE ȘI GESTIONAREA LOR 27
1.6. ANALIZA STATISTICĂ 27
1.7. REFERINȚE 27
1.8. ANEXE 27
3
A. ELEMENTE TEORETICE DE ANALIZA
DATELOR
1. Procesul de analiza a datelor: activități si etape
Deși există multe tipuri diferite de activități ce apar în timp ce facem analiza datelor, fiecare
aspect din întregul proces poate fi abordat printr-un proces interactiv pe care îl numim
"epiciclul analizei datelor" si care este alcătuit din trei etape distincte.
In mod specific, pentru fiecare din cele cinci activități principale, este critic să vă angajați în
următorii pași: 1) stabilirea așteptărilor, 2) colectarea datelor comparând datele cu datele
așteptările dvs. și - dacă așteptările nu se potrivesc-, 3) revizuirea așteptărilor sau ajustarea
procesului de colectare a datelor astfel încât datele și așteptările dvs. se potrivesc.
4
Acest pas presupune colectarea de informații despre întrebarea sau datele dvs. Pentru
întrebare puteți sa colectați informații prin efectuarea unei căutări de literatură sau solicitarea
unor experți pentru a vă asigura că întrebarea dvs. este una bună.
Veți descoperi daca datele se potrivesc cu așteptările atunci când inspectați datele sau
efectuați anumite proceduri de analiză statistica. Prin comparare cu așteptările inițiale puteți
stabili apoi daca este au apărut discrepante prea mari ca sa fie credibile. Există două explicații
posibile pentru o astfel de discordanță: a) așteptările dvs. au fost greșite și trebuie revizuite,
sau b) colectarea datelor a fost greșită sau in procesul de colectare a apărut o eroare.
In tabelul 1 de mai jos sunt oferite exemple concrete pentru modul in care epiciclul de analiza
a datelor poate apare in fiecare dintre cele 5 activități de cercetare.
5
Înainte de a începe să formulam întrebări, este util să luam în considerare diferitele tipuri de
întrebări posibile.
In cercetare există șase tipuri de întrebări de bază iar înțelegerea acestora poate fi cel mai
important pas in cercetare si procesul de analiza a datelor deoarece tipul de întrebare pe care îl
alegeți îl influențează direct modul în care interpretați rezultatele.
Cele șase tipuri de întrebări sunt: descriptive, exploratorii, inferentiale, predictive, cauzale,
mecaniciste
6
masline, brocoli, kale) au mai putine episoade depresive decat cei care nu le includ in
alimentatie
• Formulezi ipoteza ca in randul adultilor consumul de alimente cu potential anti-
inflamator este asociat cu scaterea numarului anul de episoade depresive in randul
populatiei studiate
7
• In general datele sunt colectate in mod expres pentru a raspunde la aceasta intrebare,
de exemplu in cadrul unui studiu de tip RCT
• In multe situatii unde un RCT nu este posibil, o intrebare cauzala poate fi adresata
indirect prin utilizarea datelor observationale
Există cinci caracteristici cheie ale unei întrebări bune pentru analiza datelor si vom discuta
cum să evaluăm acest lucru în mai multe detalii in cele ce urmează.
Pentru început, întrebarea ar trebui să fie de interes pentru publicul dvs., a căror identitate va
depinde de contextul și mediul în care lucrați cu date. Dacă sunteți în mediul academic,
publicul poate fi colaboratorii dvs., comunitatea științifică, autoritățile de reglementare
guvernamentale, finantatorii sau publicul general.
De asemenea, trebuie să verificați dacă nu s-a răspuns deja la întrebarea care va interesează.
Cu explozia recentă a datelor, cantitatea tot mai mare de date disponibile publicului și
literatura științifică nesfârșită precum și disponibilitatea altor resurse, ați putea sa descoperiți
ca deja s-a răspuns la întrebarea inițiala pe care ați formulat-o. Verificările preliminarii și
discuțiile cu experții va pot ajuta să rezolvati aceasta situatie deoarece chiar dacă întrebarea
specifică pe care o aveți în minte are un răspuns, s-ar putea să fi existe întrebări înrudite la
care nu exista răspunsuri incă.
8
In al treilea rand, intrebarea ar trebui să fie plauzibila. Dacă formulati o întrebare care nu este
plauzibila, este posibil să ajungeți la un răspuns dificil de interpretat sau in care sa aveți
încredere limitata. Puteți să vă asigurați că întrebarea dvs. este plauzibilă prin utilizarea
propriilor cunoștințe despre subiectul abordat și printr-o mica cercetare preliminara (pilot),
care împreună pot sa vă ajute să stabiliți dacă întrebarea formulata este plauzibile.
In cele din urma, specificitatea este - de asemenea - o caracteristică importantă a unei întrebări
bune. Un exemplu de întrebare generală este: Este a o dieta mai sănătoasă mai buna pentru
tine? Pentru a formula o întrebare mai specifica ar trebui sa clarificam ce înseamnă
o dietă "mai sănătoasă" și ca ceva este "mai bun pentru tine"? Procesul de creștere a
specificității ar trebui să conducă la o întrebare finală, rafinată, cum ar fi: "O dieta ce contine
cel putin 5 porții pe zi de fructe și legume proaspete conduce la mai puține infecții ale
tractului respirator superior (răceli)? Cu acest grad de specificitate, planul dvs. de atac este
mult mai clar și răspunsul pe care îl veți primi la sfârșitul analizei datelor va fi mai
interpretabil. De asemenea veți putea recomanda sau nu acțiunea specifică de a mânca cel
puțin 5 porții din fructe și legume proaspete pe zi ca mijloc de protecție împotriva infecțiilor
tractului respirator superior.
Mnemonica PICO- detaliata mai jos- este adesea utilizata pentru a formula întrebari de
cercetare mai specifice.
P = Populație/ pacient
I = Intervenție/ indicator
C = Comparator/ control
O = Outcome/ rezultat
9
Alege un subiect de interes și initiaza o cercetare preliminara cu privire la modul in care acest
subiect a fost abordat în literature de specialitate pentru a vedea ce arii de cercetare au fost
deja acoperite. Acest lucru va ajuta si la a determina ce tipuri de întrebări acest subiect
generează cu preponderenta. După ce ați efectuat cercetarea preliminara, începeti prin
formularea unor intrebari deschise de tipul " Cum ? " Ce ? " si " De ce? ". Apoi evaluati
posibilele răspunsuri la aceste întrebări.
Cel mai comun tip de întrebare clinica este despre cum se trateaza o boală sau o stare si astfel
de întrebări stau la baza unor studii de “interventie”. Nu toate întrebările de cercetare sunt insa
despre eficienta anumitor intervenții. Adesea pot apărea si alte tipuri de întrebări :
Care sunt cauzele problemei? => Studii etiologice, cercetari ale factorilor de risc
Care este frecvența problemei? => Studii de frecventa
Are o anumita persoană problema investigata? => Studii de diagnostic
Cine este la risc sa dezvolte problema? => Studii de prognoza, predictie
Mai multe variante de raportare a frecventelor apar in practica. Mai jos sunt listate si definite
cel mai frecvent intalnite variante.
Frecventa simpla: frecvenţa de apariţie a fiecărei valori dintr-o distribuţie
10
Frecvenţa cumulată (fc). Totalul valorilor care se cumulează începând de la valoarea
cea mai mare până la valoarea cea mai mică din tabel.
Frecvenţa relativă raportată la unitate fr(1). Este raportul dintre frecvenţa absolută
şi suma frecvenţelor absolute (fa/Σfa).
Frecvenţa relativă cumulată, raportată la unitate fr(1): Este similară frecvenţei
cumulate absolute, cu deosebirea că în acest caz se cumulează frecvenţele relative.
Frecvenţa relativă procentuală fr(%): Exprimă procentul valorilor care se situează
până la o anumită valoare din cadrul distribuţiei. Se calculează fie prin înmulţirea fr(1)
cu 100, fie prin calcularea direct procentului pe care îl reprezintă o anumită valoare
raportat la totalul valorilor dintr-o distribuţie. Suma frecvenţelor relative procentuale
este întotdeauna egală cu 100.
Frecvenţa relativă cumulată procentuală (frc%): Exprimă procentul valorilor dintr-
o distribuţie care se plasează până la o anumită valoare (inclusiv aceasta). Frecvenţa
relativă procentuală cumulată se numeşte si rang percentil.
11
histograma: la prima vedere, histograma este asemănătoare cu graficul de tip bar; ea
este insa mai adecvată pentru situaţiile când variabila pe care dorim să o reprezentăm
este de tip „continuu” (adică poate lua orice valoare pe o scală numerică, de ex.,
număr de răspunsuri corecte, timpul de reacţie, lungimea).
graficul frecvenţei cumulate: este un grafic de tip liniar care reprezintă valorile
frecvenţei absolute cumulate
12
graficul circular: este utilizat în situaţiile în care valorile sunt „parte a unui întreg”. De
exemplu, poate fi utilizat la reprezentarea distribuţiei de frecvenţe grupate, pentru a
avea o imagine directă a ponderii frecvenţei fiecărei clase de interval în raport cu
celelalte.
graficul de tip „stem and leaf” („tulpină şi frunze”); atunci când utilizăm o distribuţie
de frecvenţe grupate, cazurile individuale „se pierd” la nivelul fiecărei clase de
interval fără a mai putea şti unde se plasează fiecare valoare iniţială în interiorul
fiecărui interval. Reprezentarea de tip stem-and-leaf (pe scurt stem plot), are tocmai
avantajul de a realiza graficul distribuţiei cu păstrarea valorilor individuale
13
3.3. Indicatori ai tendintei centrale
Mediana (Me) = valoarea „din mijlocul” unei distribuţii, adică aceea care are 50% dintre
valori deasupra ei şi 50% dintre valori dedesubtul ei
Media aritmetică (m) = raportul dintre suma valorilor distribuţiei şi numărul acestora
Notaţii uzuale:
μ (miu), atunci când este media întregii populaţii de referinţă
m, atunci când se calculează pentru un eşantion (cazul cel mai frecvent)
14
σ2 (când se calculează pentru întreaga populaţie)
Abaterea standard = Abaterea standard se obţine prin extragerea radicalului din expresia
abaterii medii pătratice (dispersiei).
Notaţii uzuale:
s (pentru eşantioane)
σ (pentru populaţie)
SD (Standard Deviation, în standardul APA ) ab.std.
Distributia normala
Reprezentarea grafică a rezultatelor măsurărilor reale poate lua diverse forme, curba
distribuţiei putând fi unimodală sau multimodală, aplatizată sau înaltă, simetrică sau
asimetrică. În statistică există însă un tip special de distribuţie, numită „distribuţie
normală”, care corespunde reprezentării grafice a unei caracteristici pentru care există
un mare număr de măsurări, tinzând spre infinit
Conceptul de „curbă normală” (expresia grafică a „distribuţiei normale”) se referă la
un anumit tip de distribuţie teoretică care are câteva proprietăţi caracteristice:
o are formă de „clopot”. Cea mai mare parte a valorilor se concentrează în zona
centrală (medie);
o este perfect simetrică pe ambele laturi ale sale;
o linia curbei se apropie la infinit de axa OX (orizontală), fără a o atinge
vreodată;
o în conformitate cu proprietatea 2, de fiecare parte a mediei se află exact
jumătate dintre valorile distribuţiei.
Distribuţia normală z
Curba normală în care valorile sunt exprimate în scoruri z se numeşte curba normal
standardizată. Ea are toate proprietăţile enunţate mai sus, având însă şi parametrii
oricărei distribuţii z: m=0 şi s=1. Rezultă astfel că distribuţia normală standardizată (z)
este este simetrică în jurul lui 0.
Curba normal standardizată are câteva caracteristici pe care este important să le
reţinem:
15
o Aproximativ 34% dintre scorurile distribuţiei normale se află între medie şi o
abatere
o standard deasupra mediei (z=+1)
o Între – 1z şi +1z se află aproximativ 68% dintre valorile distribuţiei
o Aproximativ 96% dintre scoruri se află între –2z şi +2z
4.1. Testele t
Testele t = procedură de testare a semnificației statistice a diferenței dintre două medii –
variabila dependentă este măsurată pe scală cantitativă (interval-raport)
Distribuția teoretică de referință (distribuția de nul)
normală, pentru eșantioane mai mari de 30 de subiecți
t - Student, pentru eșantioane mai mici de 30 de subiecți
16
Uneori interesul nostru nu este de a compara doua grupe, ci doar de a compara rezultatele unei
grupe fata de o anumita valoare standard, reprezentata cel mai frecvent de media populatiei de
interes. In aceste situatii se aplica testul t pentru un esantion, precum in exemplul urmator:
„Un test de empatie a fost administrat pe o populatie de elevi proaspat intrati la liceu (N =
1250), obtinandu-se un scor mediu de 25.00 si o abatere standard de 7.00. La aceeasi proba, la
una dintre clasele testate (n = 28), s-a obtinut un scor mediu de 28.00 si o abatere standard de
7.06. Are aceasta clasa un nivel de empatie mai ridicat decat media populatiei de elevi?”.
Raportare
Media și abaterea standard a eșantionului
Media populației (valoarea de referință)
Intervalul de încredere pentru diferența dintre medii
Mărimea efectului: d m /
17
4.1.2. Testul t pentru eşantioane independente
Atunci cand criteriul (variabila dependenta) este masurat printr-o scala numerica, iar noi
suntem interesati sa comparam rezultatele obtinute de doua grupe diferite de subiecti vom
utiliza testul t pentru 2 esantioane independente.
(1) Un cercetator crede ca strategiile sintetice conduc mai repede la deprinderea cititului
decat strategiile analitice. Pentru a testa ipoteza el selecteaza doua clase paralele de
elevi aflati in clasa I, fiecare dintre ele avand cate 20 de elevi. Primul grup a fost
invatat sa citeasca analitic (începand cu literele, trecand apoi la cuvinte), in timp ce al
doilea grup a invatat sa citeasca sintetic (pornind de la asocierea cuvintelor cu imagini,
pentru a deprinde ulterior literele). Variabila dependenta a constat intr-o proba de
citire contra cronometru, obtinandu-se un indicator pe baza formulei: numărul de
cuvinte citite intr-un minut / numarul de erori.
(2) Un alt cercetator este interesat sa studieze daca exista diferente la nivelul increderii in
fortele proprii intre copiii institutionalizati (n = 35) si o grupa de copii proveniti din
familii normale (n = 32). Pentru masurarea nivelului de incredere in sine a folosit
scorul total obtinut de cei 67 de participanti inclusi in cercetare la o scala ce masura
perceptia eficientei de sine (Self-efficacy).
(3) ntr-un alt studiu se urmareste daca exista diferente intre persoanele introvertite si cele
extrovertite cu privire la performanta lor in vanzarile de automobile. Pentru aceasta,
cercetatorul aplica mai intai o proba de personalitate pentru a masura locul fiecarui
participant pe axa introversiune-extroversiune. Toti participantii inclusi in studiu erau
angajati la departamentul vanzari la o companie de automobile. Pe baza rezultatelor
initiale, el imparte lotul de subiecti in doua grupe egale : cei care au obtinut rezultate
mai mari decat valoarea medianei sunt inclusi in grupa persoanelor « extravertite », in
timp ce persoanele care au obtinut un rezultat sub valoarea medianei au fost incluse in
grupa persoanelor « introvertite ». In pasul urmator, cercetatorul a cules date despre
performantele obtinute in vanzari de catre cele doua grupe, pornind de la registrul de
vanzari. Datele respective sunt folosite pentru a vedea daca exista diferente intre
introvertiti si extrovertiti cu privire la performantele lor in vanzari.
18
Conditii necesare pentru a folosi testul t pentru esantioane independente:
sa fie vorba de compararea a doua grupe ;
cele doua grupe sa fie independente (sa nu existe vreo legatura intre ordinea de
introducere a datelor pentru subiectii dintr-o grupa si cea de introducere a datelor din
cealalata grupa) ;
Variabila supusă măsurării să se distribuie normal în ambele populaţii. Aceasta ne
garantează că şi distribuţia diferenţelor dintre medii se distribuie normal. Totuşi,
teorema limitei centrale ne permite asumarea normalităţii distribuţiei mediei de
eşantionare chiar şi în cazul variabilelor care nu se distribuie normal la nivelul
populaţiei, pentru eşantioane mari. Dacă însă, analiza distribuţiilor indică forme
aberante, iar volumul grupurilor comparate este foarte mic, se va allege soluţia unui
test neparametric.
Dispersia celor două eşantioane să fie omogenă. Testul t poate fi aplicat strict în
cazurile în care dispersiile celor două populaţii („practicanţi”, „nepracticanţi”) au
aceeaşi dispersie (omogenitatea dispersiei). Din fericire, există trei situaţii în care
această condiţie nu trebuie să ne preocupe:
o când eşantioanele sunt suficient de mari (cel puţin 100 fiecare)
o când cele două eşantioane au acelaşi volum (N1=N2)
o când dispersiile celor două eşantioane nu diferă semnificativ (dar, chiar şi
pentru acest caz, există formule care ţin cont de diferenţa dispersiilor).
In momentul in care criteriul (variabila dependenta) este masurata printr-o scala numerica, iar
noi suntem interesati sa comparam rezultatele obtinute de doua grupe, in conditiile in care
cele doua grupe sunt in relatie una cu cealalta prin interventia experimentatorului sau prin
corespondenta naturala a elementelor din cele doua grupe, vom utiliza testele pentru
esantioane perechi (corelate / dependente).
19
Exemple de cercetari care necesita apelul la testul t pentru doua esantioane perechi:
(1) Obiectivul cercetarii este de a studia influenta metodelor de relaxare asupra reducerii
conduitelor agresive la adolescenti. O grupa de 15 adolescenti cu tulburari comportamentale
este testata initial (pre-test) in ceea ce priveste nivelul agresivitatii printr-un inventar de
personalitate. Dupa testare, cei 15 urmeaza un program de relaxare, constituit din cinci sedinte
de relaxare saptamanale, fiecare durand o ora. Dupa o perioada de doua luni, participantii sunt
retestati (post-test) pentru a se observa daca nivelul lor de agresivitate a scazut in urma
practicarii tehnicilor de relaxare invatate.
(2) Un cercetator norocos gaseste 20 de perechi de gemeni univitelini, dar crescuti in familii
diferite, fiind despartiti de la nastere. Mai mult, diferenta era de ordin calitativ, unii crescand
in familii „normale”, iar ceilalti in familii cu „probleme”. Obiectivul studiului era de a stabili
in ce masura agresivitatea este invatata social, dovedita prin existenta unor diferente
semnificative in manifestarile agresive ale gemenilor din cele doua grupe. Agresivitatea a fost
codata pe baza unui protocol de observatie, scorurile variind intre 4 si 20.
(3) Obiectivul cercetarii este de a studia efectul atmosferei de lucru asupra rezolvarii
problemelor de matematica. Cercetatorul decide sa imparta subiectii in cele doua grupe de
lucru pe baza unui criteriu prestabilit. Astfel, sunt testate initial cunostintele de matematica ale
elevilor, iar pe baza rezultatelor obtinute are loc distribuirea elevilor in cele doua grupe,
pentru a controla (elimina) influenta acestora asupra relatiei dintre variabilele studiate. Pentru
a echivala cele doua grupe, cercetatorul ia primii doi subiecti, care au obtinut rezultatele cele
mai bune la testul initial, si ii distribuie in grupe diferite. Apoi trece la urmatorii doi pe care ii
distribuie, de asemenea, in grupe diferite. Se continua algoritmul pana sunt divizati toti
participantii. Apoi, una dintre cele doua grupe nou-formate va rezolva probleme de
matematica intr-o atmosfera calma, relaxanta, in timp ce al doilea grup va rezolva probleme
de matematica intr-o atmosfera tensionata, conflictuala. Variabila dependenta este
20
performanta obtinuta de fiecare elev, exprimata in numarul de probleme rezolvate corect,
maximum fiind 10.
Dupa cum se observa, testul t pentru doua esantioane independente necesita trei conditii
esentiale :
• sa fie vorba de compararea a doua grupe ;
• cele doua grupe sa fie dependente (sa existe o legatura intre ordinea de introducere a datelor
pentru subiectii dintr-o grupa si cea de introducere a datelor din cealalta grupa);
• variabila (dependenta) supusa compararii sa fie exprimata numeric.
5.1. Definitie
ANOVA este o generalizare a testului t pentru mai mult de doua medii, pentru c deseori în
cercetarea psihologica studiem mai mult de doua grupuri în acelasi timp. De subliniat este
faptul ca ANOVA poate fi folosita si la compararea dintre doua medii insa este mai eficient
utilizata cand comparam 3 sau mai multe medii.
21
profesori de colegiu şi manageri care sunt evaluaţi pentu a se determina cat de mult le place
competiţia interpersonală. Scorurile mari indică nivele ridicate ale competitivităţii.
ANOVA factorială este un model mai complex, testand efectele mai multor variabile
independente (factori) asupra unei variabile dependente.
Exemplu: Deoarece diverse parţi ale creierului sunt specializate pentru comportamente
specifice, studiile au arătata că diferenţele intre stîngaci şi dreptaci se datorează diferenţelor
în ce priveşte emisfera dominantă. Pornind de a acest fapt cercetătorii au presupus că dreptacii
şi stîngacii au abilităţi şi talente diferite. În vederea testării acestei ipoteze un psiholog a
evaluat discriminarea de acord -componentă a abilităţilor muzicale- pentru trei grupuri de
subiecţi: stîngaci, dreptatci şi ambidecştri în două condiţii experimentale: cand subiecţii sunt
odihniti si dupa 24 de ore in condiţiile privării de somn. Performanţa discriminativă a
subiecţilor a fost măsurată cu o probă specifică.
ANOVA factorială poate fi utilizată în cazul măsurătorilor repetate dacă sunt manipulaţi cel
puţin doi actori.
22
Exemplu:Un psiholog educaţional studiază motivaţia elevilor. Un lot de 7 subiecţi sunt
urmăriţi timp de 3 ani din clasa a patra până în clasa a şasea. În fiecare an elevii conpletează
un chestionar măsurînd motivaţia şi entuziasmul pentru şcoală centrat pe 3 discipline:
matematica, romana, muzica.Psihologul vrea să ştie dacă apar schimbări semnificative între
nivelurile de motivaţie de-a ungul celor 3 ani si intre interesul pentru diferite discipline.
ANOVA mixtă este o combinaţie intre ANOVA simplă şi ANOVA cu măsurători repetate.
Exemplu: Intr-o cercetare care vizează efectul imaginilor mentale un grup de 16 studenţi
-dintre care 50% sunt fete şi restul băieţi.-este upus la trei condiţii experimentale la interval de
două săptămîni. Prima condiţie presupune invăţarea fiecarui cuvînt însoţit de desenarea
acestuia – „imagine mentală construită”, a doua condiţie presupune învăţarea cuvîntului
însoţită de copierea imaginii acestuia care îi este prezentată împreună cu cuvîntul– „imagine
mentală dată” . Al treilea grup învaţă cuvintele pur şi simplu „ condiţia de control”. Ce se
poate spune cu privire la efectele tipului învăţării asupra umărului de cuvinte reamintite la
fete şi băieţi?
23
– ANOVA este mai vulnerabilă dacă distribuţia variabilei dependente este prea
aplatizată
sau prea înaltă (kurtosis≠0) decât în cazul asimetriei (skewness≠0).
– Cu cât volumul grupurilor supuse comparaţiei este mai mare, cu atât aspectele legate
de
normalitatea distribuţiei au un efect mai mic asupra ANOVA.
• Omogenitatea dispersiei la nivelul fiecărui grup
– Împrăştierea valorilor variabilei dependente în interiorul grupurilor definite prin
valorile
variabilei independente trebuie să fie egală.
– încălcarea acestei condiţii nu invalidează testul ANOVA, care este destul de robust şi
în
acest caz
– se vor analiza cu atenţie cazurile care prezintă valori extreme, care au un efect
important
asupra varianţei. Egalitatea (omogenitatea) varianţei poate fi testată cu testul Levene
– Teste alternative: Brown, Forsythe sau Welch
B.PROTOCOL DE CERCETARE
1. Structura unui protocol de cercetare
5.8. Introducere
24
5.8.2. Context și argumente
Această secțiune ar trebui să ofere contextul și motivația pentru inițierea
studiului. Rezultatele revizuirii literaturii de specialitate trebuie să fie descrise,
inclusiv referiri detaliate ale studiilor anterioare. Rezultatele studiilor pilot
effectuate (dacă este cazul) ar trebui să fie incluse. Dacă este necesar, referințe la
date sau informații suplimentare pot fi incluse într-o anexă.
5.9. Obiective
25
întregime. Această secțiune poate include, de asemenea, o declarație cu privire la modalitatile
de contactare a cercetătorului principal înainte de a participa la studiu. Numele și numărul de
telefon al persoanei care conduce studiul, ar trebui specificate.
26
specifice privind contextul administrarii instrumentelor si supravegherea testarii (de ex. in
cazul experimentelor trebuie sa include si modul de utilizare a surogatelor/interventiilor
placebo) calendarul și procedurile de minimizare a datelor lipsă. În plus, această secțiune ar
trebui să ofere detalii cu privire la temporizarea utilizarii instrumentelor, cum ar fi o notificare
prealabilă, perioadă de pregătire, timp de finalizare, etc.
Administrarea intervenției
Această secțiune ar trebui să abordeze modul în care intervenția va fi
executata. Informații privind frecvența intervenției, contextul, și calificarea persoanelor care
administrează intervenția ar trebui incluse.
Aspecte particulare
Ar trebui descrise complicațiile anticipate precum și strategiile de gestionare și
soluționare propuse.
Compensarea participarii
Problema compensarii ar trebui abordata în această secțiune. Informații despre
compensare ar trebui să fie incluse si în formularul de consimțământ.
5.12.6. Reactii adverse și gestionarea lor
Această secțiune trebuie să includă următoarele segmente:
Raportarea evenimentelor adverse sau neprevăzute
Acest segment trebuie să definească posibilele evenimente adverse care ar putea sa
apara precum si un plan de gestionare a acestora
Reacții anticipate
O descriere a reacțiilor care pot fi așteptate ca urmare a participarii la studiu, cum ar fi
stres sau furie, ar trebui menționate.
Managementul reacțiilor
Ar trebui să se prevadă modalitatile prevazute de management al reacțielor
participantilor precum si posibilati de răspuns la distress-ul acestora. Informații privind
resursele disponibile de ajutor, precum și numele și numerele de telefon ale unor psihologi
care nu sunt asociati cu studiul, dar care pot fi contactate în caz de distres trebuie să fie
listate. Toate aranjamentele necesare cu privire la utilizarea resurselor menționate mai sus
trebuie să se facă înainte de începerea studiului si ar trebui să fie menționate în protocol.
5.13. Analiza statistică
Secțiunea de analiză statistică ar trebui să rezume desigul si justificarea studiului. Acesta ar
trebui să furnizeze dovezi că proiectul propus va permite anchetatorilor sa atinga obiectivele
27
principale ale studiului și ar trebui să descrie planul analitic pentru fiecare obiectiv. Acesta ar
trebui să discute în mod explicit modul în care vor fi analizate datele de la fiecare dintre
instrumentele utilizate.
5.14. Referințe
Fiecare studiu trebuie să conțină o listă de referințe. Referințele vor fi numerotate în funcție
de ordinea apariției lor în text și citate în text cu numărul din paranteze
5.15. Anexe
Copii ale tuturor instrumentelor care vor fi utilizate, scrisori către potențiali participanți,
script-uri, precum și orice alte materiale de studiu care vor fi utilizate in interactiunea cu
participantii trebuie să fie anexate protocolului.
28
6. Selectia participantilor si determinarea volumului esantionului
6.1. Volumul eşantionului recomandat în diferite procedurilor statistice
Aceste recomandări oferă un cadru empiric, suficient pentru orientarea în situaţiile în care nu
apelăm la analize cantitative riguroase de dimensionarea eşantioanelor, cu ajutorul softurilor
online (de ex. .
Toate testele statistice care detectează diferenţele dintre grupuri se bazează pe o anume
distribuţie de eşantionare. Ca urmare, numărul subiecţilor din fiecare eşantion are o legătură
directă cu împrăştierea distribuţiei de eşantionare (eroarea standard). Cu cât mai mulţi subiecţi
în eşantion, cu atât împrăştierea distribuţiei de eşantionare este mai mică şi şansa de a
descoperi o diferenţă semnificativă este mai mare (ceea ce înseamnă şi o putere a testului mai
mare). Dar puterea nu este legată numai de mărimea eşantionului, ci şi de mărimea efectului.
Pe măsură ce mărimea efectului creşte, creşte şi puterea testului. De exemplu, dacă dorim să
testăm efectul unei psihoterapii după două şedinţe, când efectul este mic, testul statistic va
avea „putere mică”, adică va avea şanse mai reduse să releve un efect semnificativ decât, să
zicem, după 12 şedinţe, când efectul terapeutic va fi mai pronunţat.
Testul t pentru eşantioane independente, pentru eşantioane dependente, analiza de varianţă
(ANOVA one-way sau factorială), la fel ca şi analiza de varianţă multivariată (MANOVA),
sunt concepute pentru testa semnificaţia diferenţelor dintre mediile unor grupuri. Pentru a
menţine un nivel acceptabil pentru puterea testului, fiecare dintre grupurile comparate trebuie
să aibă un volum minimal, pentru a avea suficientă putere în detectarea diferenţelor şi, în
acelaşi timp, o nivel mediu ridicat al mărimii efectului (VanVoorhis & Morgan, 2001).
Concret, pentru a avea o putere acceptabilă a testului:
29
- atunci când sunt comparate mediile a două grupuri independente, se vor utiliza cel puţin
60 de subiecţi (minim 30 pentru fiecare grup).
- atunci când este utilizat testul ANOVA pentru o variabilă independentă cu trei valori,
eşantionul cercetării trebuie să fie compus din cel puţin 3x30=90 de subiecţi.
- în cazul analizei de varianţă multivariate (MANOVA) este important să existe mai multe
cazuri decât variabile independente în fiecare celulă definită de valorile variabilei
independente (Tabachnick & Fidell, 1996).
Deşi calcularea mărimii eşantionului în astfel de situaţii face obiectul unor formule
complexe,
regula empirică generală este de a nu utiliza eşantioane mai mici de 50 de subiecţi în cazul
analizei de corelaţie sau de regresie simplă. În cazul corelaţiei şi regresiei multiple, în care
sunt mai multe variabile independente (criteriu), Green (1991) sugerează ca volumul
eşantionului cercetării să fie !>50+8m, unde m este numărul variabilelor independente, pentru
corelaţii multiple şi ! > 104+m, pentru regresia multiplă.
Concret, pentru o analiză de corelaţie multiplă cu patru variabile se vor utiliza 50+8x4=82
subiecţi, iar pentru o regresie cu 4 variabile criteriu, se va asigura un eşantion de minim
104+4=108 subiecţi. Atunci când se urmăreşte atât testarea corelaţiei cât şi a regresiei se
recomandă eşantioane mai mari decât acestea. În acelaşi context sunt recomandate şi alte
reguli empirice, astfel:
- Pentru 5 sau mai mulţi predictori (sau variabile multiplu corelate) numărul participanţilor va
depăşi numărul predictorilor cu cel puţin 50. Altfel spus, totalul participanţilor trebuie să fie
mai mare numărul predictorilor cu cel puţin 50 (Harris, 1985);
- Pentru ecuaţiile de regresie cu şase sau mai mulţi predictori se impune un minim de 10
participanţi pentru fiecare predictor dar, dacă situaţia o permite, şi mai bine este ca să existe în
jur de 30 de subiecţi pentru fiecare variabilă. Cohen şi Cohen (1975) demonstrează că în cazul
unei regresii cu un singur predictor care are o corelaţie cu variabila predictor de 0.30, sunt
necesari 124 subiecţi pentru a menţine o putere de 0.80. Cu cinci predictori şi o corelaţie
multiplă de 0.30, aceeaşi putere este atinsă pe un eşantion de 187 subiecţi.
O atenţie specială se va acorda simetriei variabilei dependente, deoarece în cazul existenţei
unei asimetrii, mărimea aşteptată a efectului este mică şi, implicit, puterea testului este mai
mică şi ea (Tabachnick & Fidell, 1996).
30
6.1.3. Volumul eşantionului pentru testul chi-pătrat
O regulă de siguranţă este ca în nici una din celulele tabelului de corespondenţă frecvenţa
teoretică să nu fie mai mică de 5, iar volumul total al eşantionului să nu fie mai mic de 20. În
cazul testului chi-pătrat, spre deosebire de alte teste statistice, creşterea numărului subiecţilor
nu are un impact asupra valorii critice de respingere a ipotezei de nul. Totuşi, volumul
eşantionului are un effect asupra puterii testului. Existenţa unor frecvenţe teoretice (aşteptate)
într-una sau mai multe celule ale tabelului de corespondenţă limitează considerabil puterea
testului. De asemenea, valori reduse ale frecvenţelor aşteptate cresc nivelul erorii de tip I.
Acesta este şi motivul pentru care se recomandă un eşantion de cel puţin 20 de subiecţi
(Howell, 1997).
Testul chi-pătrat este utilizat pentru testarea gradului de independenţă (asociere) dintre
variabile categoriale. Ca urmare, nici un subiect nu trebuie să contribuie cu mai mult de o
singură valoare. La rândul lor, gradele de libertate au un anumit impact asupra puterii testului.
Cu cât numărul celulelor tabelului de corespondenţă creşte (ceea ce conduce la creşterea
gradelor de libertate), se reduc frecvenţele teoretice din celulele tabelului de corespondenţă şi,
implicit, are loc o reducere a puterii (Cohen, 1988). Şi totuşi, atunci când se aşteaptă o
mărime importantă a efectului, se consider că poate fi tolerată şi o valoare mai mică pentru
puterea testului, implicit un volum mai redus al eşantionului (minim 8).
31
b) selectia sistematica,
32
6.2.2. Esantioanele Non-probabilistice:
Apar in situatiile in care probabilitatea sau sansa unui membru al populatiei selectate de a fi
ales in esantion nu poate fi determinata. Aceste esantioane nu asigura reprezentativitatea
datelor si eroarea de esantionare nu poate fi calculata.
a) Selectia arbitrara (Convenience samples): In acest caz esantioanele se alcatuiesc din
persoane alese arbitrar de catre operatorul de interviu sau din persoane care se ofera
voluntar.
33