Documente Academic
Documente Profesional
Documente Cultură
Deși există multe tipuri diferite de activități ce apar în timp ce facem analiza datelor, fiecare aspect din întregul
proces poate fi abordat printr-un proces interactiv pe care îl numim "epiciclul analizei datelor" si care este alcătuit
din trei etape distincte.
1.2.3. Revizuirea așteptărilor dvs. sau a procesului de colectare a datelor Se realizează in funcție de concluziile
extrase din etapa 2.
1
In tabelul 1 de mai jos sunt oferite exemple concrete pentru modul in care epiciclul de analiza a datelor poate apare
in fiecare dintre cele 5 activități de cercetare.
Înainte de a începe să formulam întrebări, este util să luam în considerare diferitele tipuri de întrebări posibile.
In cercetare există șase tipuri de întrebări de bază iar înțelegerea acestora poate fi cel mai important pas in
cercetare si procesul de analiza a datelor deoarece tipul de întrebare pe care îl alegeți îl influențează direct modul
în care interpretați rezultatele.
2.1.1. Intrebarile descriptive • Sumarizeaza caracteristicile unui set de date • Proportia de barbati dintr-o
populatie studiata • Numarul mediu de fructe si legume consumate pe zi • Frecventa unei anumite patologii intr-
un set de date • Nu exista interpretare a rezultatului in sine • Rezultatul reprezinta un adevar, un atribut al unui
set de date
2
2.1.2. Intrebarile exploratorii • Analizam datele pentru a descoperi daca apar: • patternuri (modele) = un set de
itemi, subsecvente sau substructuri care apar frecvent impreuna intr-un set de date; proprietati intriseci si
importante ale datelor • trenduri sau • relatii intre variabile • Acest tip de analize se mai numesc si
“generatoare de ipoteze” deoarece mai degraba decat sa testam o ipoteza, incercam sa identific patternuri care ar
sustine propunerea unei ipoteze • De ex. daca banuiesti ca o anumita patologie (e.g. depresia) este asociata cu
dieta intrun anumit fel, se poate examina relatia dintre un anumit set de factori legati de dieta si patologia
respectiva • In analiza exploratorie descoperi ca indivizii care consuma mananca un anumit tip de alimente (cu
potential anti-inflamator sau inflamator scazut cum ar fi uleiul de masline, brocoli, kale) au mai putine episoade
depresive decat cei care nu le includ in alimentatie
• Formulezi ipoteza ca in randul adultilor consumul de alimente cu potential antiinflamator este asociat cu
scaterea numarului anul de episoade depresive in randul populatiei studiate
2.1.3. Intrebarile inferențiale • O intrebare inferentiala face o asumptie despre ceva din afara setului de date in
baza datelor colectate • Reprezinta o reformulare a ipotezei generate prin analiza exploratorie sub forma unei
intrebari la care raspundem prin analiza unui nou set de date • prin acesta noua analiza putem determina • Daca
asociatia observata in analiza exploratorie se pastreaza intr-un esantion diferit • Si daca se pastreaza intr-un
esantion reprezentativ pentru populatia studiata
2.1.4. Intrebarile predictive • Predictia unui set de trasaturi in baza unui alt set de trasaturi; NU ne ofera
informatii despre cum au loc anumite fenomene • De ex. nu ne intereseaza de ce cineva consuma o anumita dieta
(cauza) ci care sunt factorii care prezic o anumita dieta • Venituri mai ridicate • Statut socio-economic
• Educatie • Etc.
2.1.5. Intrebarile cauzale • Prin care ne dorim sa determinam modul in care un anumit set de variabile are impact
asupra unui alt set de variabile • De exemplu: daca o anumita dieta determina un impact in numarul de cazuri de
depresie • Intrebarile cauzale intreaba daca prin modificarea unui factor determinam schimbarea unui alt factor
• In general datele sunt colectate in mod expres pentru a raspunde la aceasta intrebare, de exemplu in cadrul unui
studiu de tip RCT • In multe situatii unde un RCT nu este posibil, o intrebare cauzala poate fi adresata indirect
prin utilizarea datelor observationale
2.1.6. Intrebarile mecaniciste • Testeaza legatura deterministica intre 2 seturi de trasaturi; ori de cate ori modifici
A in procent de X, o schimbare de Y va avea loc in B • Aceste intrebari raspund la intrebarea CUM impacteaza
un factor modificarea celui de al doilea • De exemplu, cum un anumit tip de dieta conduce la un numar mai
scazut de depresii • Foarte dificil de raspuns in afara unui mediu controlat
3
Pentru început, întrebarea ar trebui să fie de interes pentru publicul dvs., a căror identitate va depinde de contextul
și mediul în care lucrați cu date. Dacă sunteți în mediul academic, publicul poate fi colaboratorii dvs., comunitatea
științifică, autoritățile de reglementare guvernamentale, finantatorii sau publicul general.
De asemenea, trebuie să verificați dacă nu s-a răspuns deja la întrebarea care va interesează. Cu explozia recentă a
datelor, cantitatea tot mai mare de date disponibile publicului și literatura științifică nesfârșită precum și
disponibilitatea altor resurse, ați putea sa descoperiți ca deja s-a răspuns la întrebarea inițiala pe care ați formulat-
o. Verificările preliminarii și discuțiile cu experții va pot ajuta să rezolvati aceasta situatie deoarece chiar dacă
întrebarea specifică pe care o aveți în minte are un răspuns, s-ar putea să fi existe întrebări înrudite la care nu
exista răspunsuri incă.
In al treilea rand, intrebarea ar trebui să fie plauzibila. Dacă formulati o întrebare care nu este plauzibila, este
posibil să ajungeți la un răspuns dificil de interpretat sau in care sa aveți încredere limitata. Puteți să vă asigurați că
întrebarea dvs. este plauzibilă prin utilizarea propriilor cunoștințe despre subiectul abordat și printr-o mica
cercetare preliminara (pilot), care împreună pot sa vă ajute să stabiliți dacă întrebarea formulata este plauzibile.
In al patrulea rand, la intrebarea formulata trebuie sa poata fi oferit un raspuns. Cu toate ca poate că acest lucru nu
are nevoie să fie precizat, merită atins faptul că la unele dintre cele mai bune întrebări posibile nu poate fi oferit un
raspuns fie pentru că datele nu există sau nu există nici un mijloc de a colecta datele din cauza lipsei de resurse,
probleme de fezabilitate, sau probleme etice.
In cele din urma, specificitatea este - de asemenea - o caracteristică importantă a unei întrebări bune. Un exemplu
de întrebare generală este: Este a o dieta mai sănătoasă mai buna pentru tine? Pentru a formula o întrebare mai
specifica ar trebui sa clarificam ce înseamnă o dietă "mai sănătoasă" și ca ceva este "mai bun pentru tine"?
Procesul de creștere a specificității ar trebui să conducă la o întrebare finală, rafinată, cum ar fi: "O dieta ce contine
cel putin 5 porții pe zi de fructe și legume proaspete conduce la mai puține infecții ale tractului respirator superior
(răceli)? Cu acest grad de specificitate, planul dvs. de atac este mult mai clar și răspunsul pe care îl veți primi la
sfârșitul analizei datelor va fi mai interpretabil. De asemenea veți putea recomanda sau nu acțiunea specifică de a
mânca cel puțin 5 porții din fructe și legume proaspete pe zi ca mijloc de protecție împotriva infecțiilor tractului
respirator superior. Mnemonica PICO- detaliata mai jos- este adesea utilizata pentru a formula întrebari de
cercetare mai specifice. • P = Populație/ pacient • I = Intervenție/ indicator • C = Comparator/ control • O =
Outcome/ rezultat
Alege un subiect de interes și initiaza o cercetare preliminara cu privire la modul in care acest subiect a fost
abordat în literature de specialitate pentru a vedea ce arii de cercetare au fost deja acoperite. Acest lucru va ajuta si
la a determina ce tipuri de întrebări acest subiect generează cu preponderenta. După ce ați efectuat cercetarea
preliminara, începeti prin formularea unor
4
intrebari deschise de tipul " Cum ? " Ce ? " si " De ce? ". Apoi evaluati posibilele răspunsuri la aceste întrebări.
Exemplu de lista de verificare pentru formularea intrebarilor de cercetare in stiinte umaniste (Universitatea
Vanderbilt):
1 ) Este întrebarea de cercetare ceva ce ma intereseaza pe mine/ii intereseaza pe altii? 2 ) Este întrebarea de
cercetare o abordare noue pe o problema veche sau rezolva problema?
3 ) Este prea vasta sau prea limitata?
4 ) Este întrebarea de cercetare cercetabila în intervalul de timp si locatia disponibile?
5 ) Ce informații sunt necesare ?
Cel mai comun tip de întrebare clinica este despre cum se trateaza o boală sau o stare si astfel de întrebări stau la
baza unor studii de “interventie”. Nu toate întrebările de cercetare sunt insa despre eficienta anumitor intervenții.
Adesea pot apărea si alte tipuri de întrebări :
• Care sunt cauzele problemei? => Studii etiologice, cercetari ale factorilor de risc • Care este frecvența
problemei? => Studii de frecventa • Are o anumita persoană problema investigata? => Studii de diagnostic
• Cine este la risc sa dezvolte problema? => Studii de prognoza, predictie
Mai multe variante de raportare a frecventelor apar in practica. Mai jos sunt listate si definite cel mai frecvent
intalnite variante. • Frecventa simpla: frecvenţa de apariţie a fiecărei valori dintr-o distribuţie • Frecvenţa
cumulată (fc). Totalul valorilor care se cumulează începând de la valoarea cea mai mare până la valoarea cea mai
mică din tabel. • Frecvenţa relativă raportată la unitate fr(1). Este raportul dintre frecvenţa absolută şi suma
frecvenţelor absolute (fa/Σfa).
• Frecvenţa relativă cumulată, raportată la unitate fr(1): Este similară frecvenţei cumulate absolute, cu deosebirea
că în acest caz se cumulează frecvenţele relative. • Frecvenţa relativă procentuală fr(%): Exprimă procentul
valorilor care se situează până la o anumită valoare din cadrul distribuţiei. Se calculează fie prin înmulţirea fr(1) cu
100, fie prin calcularea direct procentului pe care îl reprezintă o anumită valoare raportat la totalul valorilor dintr-o
distribuţie. Suma frecvenţelor relative procentuale este întotdeauna egală cu 100. • Frecvenţa relativă cumulată
procentuală (frc%): Exprimă procentul valorilor dintro distribuţie care se plasează până la o anumită valoare
(inclusiv aceasta). Frecvenţa relativă procentuală cumulată se numeşte si rang percentil.
Prezentarea grafică a datelor statistice depinde de necesitatile de evidentiere a rezultatelor. Cel mai frecvent
utilizate grafice sunt • graficul de tip bară: este cel mai simplu mod de reprezentare grafică a datelor. Se utilizează
5
atunci când dorim să reprezentăm o variabilă „discretă” (care prezintă valori întregi, de exemplu, numărul de
răspunsuri corecte la un test în funcţie de nivelul de instruire al subiecţilor).
• histograma: la prima vedere, histograma este asemănătoare cu graficul de tip bar; ea este insa mai adecvată
pentru situaţiile când variabila pe care dorim să o reprezentăm este de tip „continuu” (adică poate lua orice valoare
pe o scală numerică, de ex., număr de răspunsuri corecte, timpul de reacţie, lungimea).
• poligonul de frecvenţe: este o reprezentare alternativă la histogramă. Punctele centrale ale suprafeţelor
rectangulare care reprezintă frecvenţa sunt unite cu o linie care delimitează suprafaţa poligonului.
• graficul frecvenţei cumulate: este un grafic de tip liniar care reprezintă valorile frecvenţei absolute cumulate
• graficul circular: este utilizat în situaţiile în care valorile sunt „parte a unui întreg”. De exemplu, poate fi utilizat
la reprezentarea distribuţiei de frecvenţe grupate, pentru a avea o imagine directă a ponderii frecvenţei fiecărei
clase de interval în raport cu celelalte.
• graficul de tip „stem and leaf” („tulpină şi frunze”); atunci când utilizăm o distribuţie de frecvenţe grupate,
cazurile individuale „se pierd” la nivelul fiecărei clase de interval fără a mai putea şti unde se plasează fiecare
valoare iniţială în interiorul fiecărui interval. Reprezentarea de tip stem-and-leaf (pe scurt stem plot), are tocmai
avantajul de a realiza graficul distribuţiei cu păstrarea valorilor individuale
Mediana (Me) = valoarea „din mijlocul” unei distribuţii, adică aceea care are 50% dintre valori deasupra ei şi 50%
dintre valori dedesubtul ei
Media aritmetică (m) = raportul dintre suma valorilor distribuţiei şi numărul acestora Notaţii uzuale: • µ (miu),
atunci când este media întregii populaţii de referinţă • m, atunci când se calculează pentru un eşantion (cazul cel
mai frecvent)
Abaterea medie (d de la deviaţie medie) = distanţa dintre o valoare anumită şi media distribuţiei se numeşte
abaterea valorii (Xi-m); media abaterilor într-o distribuţie este întotdeauna egală cu zero
Dispersia (varianţa, abaterea medie pătratică) = pentru a elimina inconvenientul abaterilor de la medie de a avea
suma egală cu zero, se operează ridicarea la pătrat a abaterilor valorilor individuale Notaţii uzuale: • s2 (când se
calculează pentru eşantion)
6
• σ2 (când se calculează pentru întreaga populaţie)
Abaterea standard = Abaterea standard se obţine prin extragerea radicalului din expresia abaterii medii pătratice
(dispersiei). Notaţii uzuale: • s (pentru eşantioane) • σ (pentru populaţie) • SD (Standard Deviation, în
standardul APA ) ab.std.
Distributia normala • Reprezentarea grafică a rezultatelor măsurărilor reale poate lua diverse forme, curba
distribuţiei putând fi unimodală sau multimodală, aplatizată sau înaltă, simetrică sau asimetrică. În statistică există
însă un tip special de distribuţie, numită „distribuţie normală”, care corespunde reprezentării grafice a unei
caracteristici pentru care există un mare număr de măsurări, tinzând spre infinit • Conceptul de „curbă normală”
(expresia grafică a „distribuţiei normale”) se referă la un anumit tip de distribuţie teoretică care are câteva
proprietăţi caracteristice:
are formă de „clopot”. Cea mai mare parte a valorilor se concentrează în zona centrală (medie);
este perfect simetrică pe ambele laturi ale sale;
linia curbei se apropie la infinit de axa OX (orizontală), fără a o atinge vreodată;
în conformitate cu proprietatea 2, de fiecare parte a mediei se află exact jumătate dintre valorile distribuţiei.
Distribuţia normală z • Curba normală în care valorile sunt exprimate în scoruri z se numeşte curba normal
standardizată. Ea are toate proprietăţile enunţate mai sus, având însă şi parametrii oricărei distribuţii z: m=0 şi s=1.
Rezultă astfel că distribuţia normală standardizată (z) este este simetrică în jurul lui 0. • Curba normal
standardizată are câteva caracteristici pe care este important să le reţinem: o Aproximativ 34% dintre scorurile
distribuţiei normale se află între medie şi o abatere o standard deasupra mediei (z=+1)
4.1. Testele t
Testele t = procedură de testare a semnificației statistice a diferenței dintre două medii – variabila dependentă este
măsurată pe scală cantitativă (interval-raport) Distribuția teoretică de referință (distribuția de nul) • normală,
pentru eșantioane mai mari de 30 de subiecți • t - Student, pentru eșantioane mai mici de 30 de subiecți
4.1.1. Testul t pentru un eșantion
Uneori interesul nostru nu este de a compara doua grupe, ci doar de a compara rezultatele unei grupe fata de o
anumita valoare standard, reprezentata cel mai frecvent de media populatiei de
7
interes. In aceste situatii se aplica testul t pentru un esantion, precum in exemplul urmator: „Un test de empatie a
fost administrat pe o populatie de elevi proaspat intrati la liceu (N = 1250), obtinandu-se un scor mediu de 25.00 si
o abatere standard de 7.00. La aceeasi proba, la una dintre clasele testate (n = 28), s-a obtinut un scor mediu de
28.00 si o abatere standard de 7.06. Are aceasta clasa un nivel de empatie mai ridicat decat media populatiei de
elevi?”.
Astfel, pentru a aplica testul t pentru un esantion este nevoie ca : • variabila comparata sa fie exprimata numeric,
fiind vorba de comparatii intre medii; • una dintre mediile comparate sa reprezinte populatia de interes sau o
valoare standard a priori stabilita; • cealalta grupa sa fie constituita dintr-un lot de participanti a caror medie si
abatere standard la variabila comparata sunt cunoscute. Pe scurt, testul t pentru un singur esantion: • Testează
diferența dintre media unui eșantion și media populației • Mai general, diferența dintre media eșantionului și o
valoare de referință… • Procedura SPSS – Analyze/Compare means/One Sample T Test…
Raportare • Media și abaterea standard a eșantionului • Media populației (valoarea de referință) • Intervalul
de încredere pentru diferența dintre medii • Mărimea efectului: d= m- µ/s
Testul t (Student) pentru un singur eşantion • testul t poate fi utilizat doar atunci când cunoaştem media populaţiei
de referinţă şi avem la dispoziţie un eşantion „mare” (adică de cel puţin 30 de subiecţi, în cazul unei variabile
despre care avem motive să credem că se distribuie normal). • distribuţia mediei de eşantionare urmează legea
curbei normale standardizate doar pentru eşantioane de minim 30 de subiecţi, conform teoremei limitei centrale.
(1) Un cercetator crede ca strategiile sintetice conduc mai repede la deprinderea cititului decat strategiile analitice.
Pentru a testa ipoteza el selecteaza doua clase paralele de elevi aflati in clasa I, fiecare dintre ele avand cate 20 de
elevi. Primul grup a fost invatat sa citeasca analitic (începand cu literele, trecand apoi la cuvinte), in timp ce al
doilea grup a invatat sa citeasca sintetic (pornind de la asocierea cuvintelor cu imagini, pentru a deprinde ulterior
literele). Variabila dependenta a constat intr-o proba de citire contra cronometru, obtinandu-se un indicator pe baza
formulei: numărul de cuvinte citite intrun minut / numarul de erori. (2) Un alt cercetator este interesat sa studieze
daca exista diferente la nivelul increderii in fortele proprii intre copiii institutionalizati (n = 35) si o grupa de copii
proveniti din familii normale (n = 32). Pentru masurarea nivelului de incredere in sine a folosit scorul total obtinut
de cei 67 de participanti inclusi in cercetare la o scala ce masura perceptia eficientei de sine (Self-efficacy).
(3) ntr-un alt studiu se urmareste daca exista diferente intre persoanele introvertite si cele extrovertite cu privire la
performanta lor in vanzarile de automobile. Pentru aceasta, cercetatorul aplica mai intai o proba de personalitate
pentru a masura locul fiecarui participant pe axa introversiune-extroversiune. Toti participantii inclusi in studiu
erau angajati la departamentul vanzari la o companie de automobile. Pe baza rezultatelor initiale, el imparte lotul
8
de subiecti in doua grupe egale : cei care au obtinut rezultate mai mari decat valoarea medianei sunt inclusi in
grupa persoanelor « extravertite », in timp ce persoanele care au obtinut un rezultat sub valoarea medianei au fost
incluse in grupa persoanelor « introvertite ». In pasul urmator, cercetatorul a cules date despre performantele
obtinute in vanzari de catre cele doua grupe, pornind de la registrul de vanzari. Datele respective sunt folosite
pentru a vedea daca exista diferente intre introvertiti si extrovertiti cu privire la performantele lor in vanzari.
Conditii necesare pentru a folosi testul t pentru esantioane independente: • sa fie vorba de compararea a doua
grupe ; • cele doua grupe sa fie independente (sa nu existe vreo legatura intre ordinea de introducere a datelor
pentru subiectii dintr-o grupa si cea de introducere a datelor din cealalata grupa) ; • Variabila supusă măsurării să
se distribuie normal în ambele populaţii. Aceasta ne garantează că şi distribuţia diferenţelor dintre medii se
distribuie normal. Totuşi, teorema limitei centrale ne permite asumarea normalităţii distribuţiei mediei de
eşantionare chiar şi în cazul variabilelor care nu se distribuie normal la nivelul populaţiei, pentru eşantioane mari.
Dacă însă, analiza distribuţiilor indică forme aberante, iar volumul grupurilor comparate este foarte mic, se va
allege soluţia unui test neparametric. • Dispersia celor două eşantioane să fie omogenă. Testul t poate fi aplicat
strict în cazurile în care dispersiile celor două populaţii („practicanţi”, „nepracticanţi”) au aceeaşi dispersie
(omogenitatea dispersiei). Din fericire, există trei situaţii în care această condiţie nu trebuie să ne preocupe:
- când eşantioanele sunt suficient de mari (cel puţin 100 fiecare)
- când cele două eşantioane au acelaşi volum (N1=N2) o când dispersiile celor două eşantioane nu diferă
semnificativ (dar, chiar şi pentru acest caz, există formule care ţin cont de diferenţa dispersiilor).
Astfel exista trei situatii in care vorbim de esantioane perechi : • cazul masuratorilor repetate ; • cazul perechilor
naturale ; • cazul perechilor artificiale. Exemple de cercetari care necesita apelul la testul t pentru doua esantioane
perechi:
Cazul perechilor natural (2) Un cercetator norocos gaseste 20 de perechi de gemeni univitelini, dar crescuti in
familii diferite, fiind despartiti de la nastere. Mai mult, diferenta era de ordin calitativ, unii crescand in familii
9
„normale”, iar ceilalti in familii cu „probleme”. Obiectivul studiului era de a stabili in ce masura agresivitatea este
invatata social, dovedita prin existenta unor diferente semnificative in manifestarile agresive ale gemenilor din cele
doua grupe. Agresivitatea a fost codata pe baza unui protocol de observatie, scorurile variind intre 4 si 20.
5.1. Definitie ANOVA este o generalizare a testului t pentru mai mult de doua medii, pentru c deseori în
cercetarea psihologica studiem mai mult de doua grupuri în acelasi timp. De subliniat este faptul ca ANOVA poate
fi folosita si la compararea dintre doua medii insa este mai eficient utilizata cand comparam 3 sau mai multe
medii.
5.2. Clasificarea tehnicilor ANOVA Cele mai întâlnite design-uri de cercetare experimentală utilizează una
dintre următoarele patru forme de analiză de varianţă:
1. ANOVA simplă sau unifactorială
2. ANOVA cu măsurători repetate;
3. ANOVA factorială cel mai utilizat fiind bifactorială
4. ANOVA mixtă
5.3. ANOVA simplă sau unifactorială ANOVA unifactorială este modelul cel mai simplu dintre tehnicile
ANOVA, fiind un corespondent al testului t pentru două eşantioane independente.
Exemplu:Un cercetător doreşte să vadă dacă profesia influenţează competitivitatea interpersonală. În acest sens
selectează aleator trei grupuri de bărbaţi: fotbalişti profesionişti, profesori de colegiu şi manageri care sunt evaluaţi
10
pentu a se determina cat de mult le place competiţia interpersonală. Scorurile mari indică nivele ridicate ale
competitivităţii.
Intr-un studiu de psihologia muncii vrem să evidenţiem efectul zgomotului asupra discriminării perceptive. În
acest scop, subiecţii sunt supuşi unui număr de trei condiţii experimentaledimineaţa la începutul zilei de muncă. În
prima realizează o sarcină de discriminare perceptivă în absenţa zgomotului, in a doua sarcină zgomotul este
intermitent iar în a treia sarcină zgomotul este continuu. Se monitorizează erorile efectuate
ANOVA factorială poate fi utilizată în cazul măsurătorilor repetate dacă sunt manipulaţi cel puţin doi actori.
Exemplu:Un psiholog educaţional studiază motivaţia elevilor. Un lot de 7 subiecţi sunt urmăriţi timp de 3 ani din
clasa a patra până în clasa a şasea. În fiecare an elevii conpletează un chestionar măsurînd motivaţia şi entuziasmul
pentru şcoală centrat pe 3 discipline: matematica, romana, muzica.Psihologul vrea să ştie dacă apar schimbări
semnificative între nivelurile de motivaţie de-a ungul celor 3 ani si intre interesul pentru diferite discipline.
11
5.7. Condiţii pentru aplicarea ANOVA
• Independenţa observaţiilor (valorilor) pentru fiecare grup comparat – valorile măsurate pe subiecţii unui grup
să nu fie în nici un fel influenţate de valorile măsurate pe celelalte grupuri. • Distribuţie normală a valorilor
fiecărui grup comparat – distribuţiile comparate trebuie să fie simetrice sau... – asimetriile să fie în aceeaşi
direcţie – testul F este considerat remarcabil de robust în cazul încălcării condiţiei de normalitate. – ANOVA
este mai vulnerabilă dacă distribuţia variabilei dependente este prea aplatizată sau prea înaltă (kurtosis≠0) decât în
cazul asimetriei (skewness≠0). – Cu cât volumul grupurilor supuse comparaţiei este mai mare, cu atât aspectele
legate de normalitatea distribuţiei au un efect mai mic asupra ANOVA. • Omogenitatea dispersiei la nivelul
fiecărui grup – Împrăştierea valorilor variabilei dependente în interiorul grupurilor definite prin valorile
variabilei independente trebuie să fie egală.
– încălcarea acestei condiţii nu invalidează testul ANOVA, care este destul de robust şi în acest caz – se vor
analiza cu atenţie cazurile care prezintă valori extreme, care au un efect important asupra varianţei. Egalitatea
(omogenitatea) varianţei poate fi testată cu testul Levene – Teste alternative: Brown, Forsythe sau Welch
B. PROTOCOL DE CERCETARE
1.1. Introducere
Introducerea ar trebui să fie un rezumat succint al studiului și include următoarele elemente:
1.1.1. Prezentare generala Primul paragraf trebuie să sumarizeze studiul propus. Acesta ar trebui să descrie scopul
de studiului și răspunda la următoarele întrebări: 1) Incearcă studiul să testeze o ipoteză pilot pentru un proiect
viitor? 2) Incearcă studiul să valideze un instrument? 3) Vor fi proiectate intervenții viitoare in baza rezultatelor?
Dacă este cazul, acest alineat ar trebui să menționeze, de asemenea, informații legate de finanțare.
1.1.2. Context și argumente Această secțiune ar trebui să ofere contextul și motivația pentru inițierea studiului.
Rezultatele revizuirii literaturii de specialitate trebuie să fie descrise, inclusiv referiri detaliate ale studiilor
anterioare. Rezultatele studiilor pilot effectuate (dacă este cazul) ar trebui să fie incluse. Dacă este necesar,
referințe la date sau informații suplimentare pot fi incluse într-o anexă.
1.2. Obiective
Secțiunea ar trebui să prezinte concis ipotezele de cercetare. Această secțiune ar trebui să precizeze dacă
protocolul este pentru un studiu de fezabilitate/studiu descriptiv. Exemplu:
• Pentru a testa un instrument ...
• Pentru a descrie ...
12
Designul studiului trebuie să permită investigatorului să răspundă obiectivelor de cercetare iar sectiunea de analiza
statistică va trebui să evidențieze în mod clar modul în care datele vor fi evaluate în raport cu fiecare dintre aceste
obiective.
1.4. Recrutare si randomizare Această secțiune trebuie să descrie procedurile de recrutare, înregistrare și/sau
randomizare a subiectilor. Mijloacele de obținere a consimțământului informat ar trebui să fie descrise în
întregime. Această secțiune poate include, de asemenea, o declarație cu privire la modalitatile de contactare a
cercetătorului principal înainte de a participa la studiu. Numele și numărul de telefon al persoanei care conduce
studiul, ar trebui specificate.
1.5. Designul si metodele studiului Această secțiune ar trebui să ofere o descriere detaliată a procesului de
studiu.
1.5.1. Design / Tipul de studiu Acest segment ar trebui să descrie tipul designului descris în protocol (de
exemplu, randomizat, cohortă, caz-control, etc.)
1.5.2. Selectarea instrumentelor
Această secțiune ar trebui să ofere informații specifice despre instrumentele care vor fi utilizate în cadrul
studiului. Trebuie luati în considerare următorii factori: 1) justificarea selectarii anumitor instrumente; 2)
proprietăți psihometrice ale instrumentelor; 3) pre-testarea prealabila a instrumentelor; 4) utilizarea instrumentelor
selectate în studii anterioare; 5) timp aproximativ necesar pentru completarea fiecarui instrument de catre
populația selectata 6) durata estimată pentru fiecare subiect.
1.5.3. Descrierea intervenției Natura oricărei intervenții comportamentale utilizate în studiu trebuie să fie descrisa
în detaliu, inclusiv procedurile utilizate în dezvoltarea, si pilotarea intervenției.
1.5.4. Colectarea datelor Această secțiune ar trebui să specifice datele care vor fi colectate (inclusiv in forma
tabelara). În cazul în care există diferențe în datele colectate pentru diferite grupuri participanti, acest lucru ar
trebui prezentat în mod clar într-unul sau mai multe tabele.
1.5.5. Descrierea procesului/procedurii Această secțiune trebuie să prezinte o descriere detaliată a procedurilor
care trebuie urmate în efectuarea studiului. Trebuie luate în considerare elementele enumerate mai jos.
Administrarea instrumentului Explicatii clare ale modului în care vor fi administrate instrumentele (de exemplu,
autoadministrat, interviu administrat, etc.) trebuie incluse in aceasta sectiune. Informații specifice privind
contextul administrarii instrumentelor si supravegherea testarii (de ex. in cazul experimentelor trebuie sa include si
modul de utilizare a surogatelor/interventiilor placebo) calendarul și procedurile de minimizare a datelor lipsă. În
plus, această secțiune ar trebui să ofere detalii cu privire la temporizarea utilizarii instrumentelor, cum ar fi o
13
notificare prealabilă, perioadă de pregătire, timp de finalizare, etc. Administrarea intervenției Această secțiune ar
trebui să abordeze modul în care intervenția va fi executata. Informații privind frecvența intervenției, contextul, și
calificarea persoanelor care administrează intervenția ar trebui incluse. Aspecte particulare Ar trebui descrise
complicațiile anticipate precum și strategiile de gestionare și soluționare propuse.
Compensarea participarii Problema compensarii ar trebui abordata în această secțiune. Informații despre
compensare ar trebui să fie incluse si în formularul de consimțământ.
1.5.6. Reactii adverse și gestionarea lor
Această secțiune trebuie să includă următoarele segmente: Raportarea evenimentelor adverse sau neprevăzute
Acest segment trebuie să definească posibilele evenimente adverse care ar putea sa apara precum si un plan de
gestionare a acestora Reacții anticipate O descriere a reacțiilor care pot fi așteptate ca urmare a participarii la
studiu, cum ar fi stres sau furie, ar trebui menționate. Managementul reacțiilor Ar trebui să se prevadă modalitatile
prevazute de management al reacțielor participantilor precum si posibilati de răspuns la distress-ul acestora.
Informații privind resursele disponibile de ajutor, precum și numele și numerele de telefon ale unor psihologi care
nu sunt asociati cu studiul, dar care pot fi contactate în caz de distres trebuie să fie listate. Toate aranjamentele
necesare cu privire la utilizarea resurselor menționate mai sus trebuie să se facă înainte de începerea studiului si ar
trebui să fie menționate în protocol.
1.6. Analiza statistică Secțiunea de analiză statistică ar trebui să rezume desigul si justificarea studiului. Acesta
ar trebui să furnizeze dovezi că proiectul propus va permite anchetatorilor sa atinga obiectivele principale ale
studiului și ar trebui să descrie planul analitic pentru fiecare obiectiv. Acesta ar trebui să discute în mod explicit
modul în care vor fi analizate datele de la fiecare dintre instrumentele utilizate.
1.7. Referințe Fiecare studiu trebuie să conțină o listă de referințe. Referințele vor fi numerotate în funcție de
ordinea apariției lor în text și citate în text cu numărul din paranteze
1.8. Anexe Copii ale tuturor instrumentelor care vor fi utilizate, scrisori către potențiali participanți, scripturi,
precum și orice alte materiale de studiu care vor fi utilizate in interactiunea cu participantii trebuie să fie anexate
protocolului.
2.1.1. Volumul celulelor (grupurilor) pentru testele utilizate în detectarea diferenţelor dintre medii
Toate testele statistice care detectează diferenţele dintre grupuri se bazează pe o anume distribuţie de eşantionare.
Ca urmare, numărul subiecţilor din fiecare eşantion are o legătură directă cu împrăştierea distribuţiei de
eşantionare (eroarea standard). Cu cât mai mulţi subiecţi în eşantion, cu atât împrăştierea distribuţiei de
14
eşantionare este mai mică şi şansa de a descoperi o diferenţă semnificativă este mai mare (ceea ce înseamnă şi o
putere a testului mai mare). Dar puterea nu este legată numai de mărimea eşantionului, ci şi de mărimea efectului.
Pe măsură ce mărimea efectului creşte, creşte şi puterea testului. De exemplu, dacă dorim să testăm efectul unei
psihoterapii după două şedinţe, când efectul este mic, testul statistic va avea „putere mică”, adică va avea şanse
mai reduse să releve un efect semnificativ decât, să zicem, după 12 şedinţe, când efectul terapeutic va fi mai
pronunţat. Testul t pentru eşantioane independente, pentru eşantioane dependente, analiza de varianţă (ANOVA
one-way sau factorială), la fel ca şi analiza de varianţă multivariată (MANOVA), sunt concepute pentru testa
semnificaţia diferenţelor dintre mediile unor grupuri. Pentru a menţine un nivel acceptabil pentru puterea testului,
fiecare dintre grupurile comparate trebuie să aibă un volum minimal, pentru a avea suficientă putere în detectarea
diferenţelor şi, în acelaşi timp, o nivel mediu ridicat al mărimii efectului (VanVoorhis & Morgan, 2001). Concret,
pentru a avea o putere acceptabilă a testului: - atunci când sunt comparate mediile a două grupuri independente, se
vor utiliza cel puţin
60 de subiecţi (minim 30 pentru fiecare grup). - atunci când este utilizat testul ANOVA pentru o variabilă
independentă cu trei valori, eşantionul cercetării trebuie să fie compus din cel puţin 3x30=90 de subiecţi. - în cazul
analizei de varianţă multivariate (MANOVA) este important să existe mai multe cazuri decât variabile
independente în fiecare celulă definită de valorile variabilei independente (Tabachnick & Fidell, 1996).
15
O regulă de siguranţă este ca în nici una din celulele tabelului de corespondenţă frecvenţa teoretică să nu fie mai
mică de 5, iar volumul total al eşantionului să nu fie mai mic de 20. În cazul testului chi-pătrat, spre deosebire de
alte teste statistice, creşterea numărului subiecţilor nu are un impact asupra valorii critice de respingere a ipotezei
de nul. Totuşi, volumul eşantionului are un effect asupra puterii testului. Existenţa unor frecvenţe teoretice
(aşteptate) într-una sau mai multe celule ale tabelului de corespondenţă limitează considerabil puterea testului. De
asemenea, valori reduse ale frecvenţelor aşteptate cresc nivelul erorii de tip I. Acesta este şi motivul pentru care se
recomandă un eşantion de cel puţin 20 de subiecţi (Howell, 1997). Testul chi-pătrat este utilizat pentru testarea
gradului de independenţă (asociere) dintre variabile categoriale. Ca urmare, nici un subiect nu trebuie să contribuie
cu mai mult de o singură valoare. La rândul lor, gradele de libertate au un anumit impact asupra puterii testului. Cu
cât numărul celulelor tabelului de corespondenţă creşte (ceea ce conduce la creşterea gradelor de libertate), se
reduc frecvenţele teoretice din celulele tabelului de corespondenţă şi, implicit, are loc o reducere a puterii (Cohen,
1988). Şi totuşi, atunci când se aşteaptă o mărime importantă a efectului, se consider că poate fi tolerată şi o
valoare mai mică pentru puterea testului, implicit un volum mai redus al eşantionului (minim 8).
c) Selectia in Lant (metoda bulgarelui de zapada): Esantionarea presupune ca respondentii sa ofere numele altor
respondenti care fac parte din populatia de interes.
16
d) Esantionarea pe cote: Esantioanele au un numar precis de indivizi din fiecare categorie de interes care trebuie
chestionati.
17