Examen Analiza Datelor - An 3.sem. 1

A.
ELEMENT TEORETICE DE ANALIZA DATELOR
1. Procesul de analiza a datelor: activități si etape
1.1. Activități principale de analiza a datelor

Există 5 activități principale de analiză a datelor:
1. Formularea și rafinarea întrebării
2. Explorarea datelor (Analiza exploratorie a datelor = ADE)
3. Construirea modelelor statistice
4. Interpretarea rezultatelor
5. Comunicarea rezultatelor
Deși există multe tipuri diferite de activități ce apar în timp ce facem analiza datelor, fiecare aspect din întregul
proces poate fi abordat printr-un proces interactiv pe care îl numim "epiciclul analizei datelor" si care este alcătuit
din trei etape distincte.
1.2. Epiciclul de analiza a datelor

In mod specific, pentru fiecare din cele cinci activități principale, este critic să vă angajați în următorii pași:
1) stabilirea așteptărilor,
2) colectarea datelor comparând datele cu datele așteptările dvs. și - dacă așteptările nu se potrivesc-,
3) revizuirea așteptărilor sau ajustarea procesului de colectare a datelor astfel încât datele și așteptările dvs. se
potrivesc.
1.2.1. Stabilirea așteptărilor

Stabilirea așteptărilor este procesul de gândire deliberată despre ceea ce vă așteptați sa obțineți înainte de a iniția o
acțiune (de ex. sa inspectați datele, să efectuați o procedură sau să introduceți o comandă). Pentru analiștii cu
experiență, în anumite circumstanțe, stabilirea așteptărilor poate fi automata, aproape subconștienta, dar pentru
novici aceasta este o activitate importantă care trebuie cultivata in mod deliberat.
1.2.2. Colectarea informațiilor (datelor) si compararea cu așteptările

Acest pas presupune colectarea de informații despre întrebarea sau datele dvs. Pentru întrebare puteți sa colectați
informații prin efectuarea unei căutări de literatură sau solicitarea unor experți pentru a vă asigura că întrebarea
dvs. este una bună. Veți descoperi daca datele se potrivesc cu așteptările atunci când inspectați datele sau efectuați
anumite proceduri de analiză statistica. Prin comparare cu așteptările inițiale puteți stabili apoi daca este au apărut
discrepante prea mari ca sa fie credibile. Există două explicații posibile pentru o astfel de discordanță:
a) așteptările dvs. au fost greșite și trebuie revizuite, sau
b) colectarea datelor a fost greșită sau in procesul de colectare a apărut o eroare.
1.2.3. Revizuirea așteptărilor dvs. sau a procesului de colectare a datelor Se realizează in funcție de concluziile
extrase din etapa 2.
1
In tabelul 1 de mai jos sunt oferite exemple concrete pentru modul in care epiciclul de analiza a datelor poate apare
in fiecare dintre cele 5 activități de cercetare.
Tabel 1 – Activitati si etape de cercetare

2. Formularea intrebarilor de cercetare si analiza datelor
2.1. Tipuri de întrebări
Stabileste asteptari
Colecteaza date Revizuiste asteptari
Formularea intrebarii
Intrebarea este de interes pentru audienta
Literatura de specialitate/Experti
O intrebare mai tintita
Analiza exploratorie a datelor
Datele sunt adecvate pentru intrebare
Distributii exploratorii ale datelor (reprezentare grafica)
Revizuieste intrebarea sau colecteaza mai multe date
Modelare formala
Modelul primar raspunde intrebarii
Testeaza modelul secundar
Revizuieste modelul formal
Înainte de a începe să formulam întrebări, este util să luam în considerare diferitele tipuri de întrebări posibile.
In cercetare există șase tipuri de întrebări de bază iar înțelegerea acestora poate fi cel mai important pas in
cercetare si procesul de analiza a datelor deoarece tipul de întrebare pe care îl alegeți îl influențează direct modul
în care interpretați rezultatele.
Cele șase tipuri de întrebări sunt:

descriptive,
exploratorii,
inferentiale,
predictive,
cauzale,
mecaniciste
2.1.1. Intrebarile descriptive • Sumarizeaza caracteristicile unui set de date • Proportia de barbati dintr-o
populatie studiata • Numarul mediu de fructe si legume consumate pe zi • Frecventa unei anumite patologii intr-
un set de date • Nu exista interpretare a rezultatului in sine • Rezultatul reprezinta un adevar, un atribut al unui
set de date
2
2.1.2. Intrebarile exploratorii • Analizam datele pentru a descoperi daca apar: • patternuri (modele) = un set de
itemi, subsecvente sau substructuri care apar frecvent impreuna intr-un set de date; proprietati intriseci si
importante ale datelor • trenduri sau • relatii intre variabile • Acest tip de analize se mai numesc si
“generatoare de ipoteze” deoarece mai degraba decat sa testam o ipoteza, incercam sa identific patternuri care ar
sustine propunerea unei ipoteze • De ex. daca banuiesti ca o anumita patologie (e.g. depresia) este asociata cu
dieta intrun anumit fel, se poate examina relatia dintre un anumit set de factori legati de dieta si patologia
respectiva • In analiza exploratorie descoperi ca indivizii care consuma mananca un anumit tip de alimente (cu
potential anti-inflamator sau inflamator scazut cum ar fi uleiul de masline, brocoli, kale) au mai putine episoade
depresive decat cei care nu le includ in alimentatie
• Formulezi ipoteza ca in randul adultilor consumul de alimente cu potential antiinflamator este asociat cu
scaterea numarului anul de episoade depresive in randul populatiei studiate
2.1.3. Intrebarile inferențiale • O intrebare inferentiala face o asumptie despre ceva din afara setului de date in
baza datelor colectate • Reprezinta o reformulare a ipotezei generate prin analiza exploratorie sub forma unei
intrebari la care raspundem prin analiza unui nou set de date • prin acesta noua analiza putem determina • Daca
asociatia observata in analiza exploratorie se pastreaza intr-un esantion diferit • Si daca se pastreaza intr-un
esantion reprezentativ pentru populatia studiata
2.1.4. Intrebarile predictive • Predictia unui set de trasaturi in baza unui alt set de trasaturi; NU ne ofera
informatii despre cum au loc anumite fenomene • De ex. nu ne intereseaza de ce cineva consuma o anumita dieta
(cauza) ci care sunt factorii care prezic o anumita dieta • Venituri mai ridicate • Statut socio-economic
• Educatie • Etc.
2.1.5. Intrebarile cauzale • Prin care ne dorim sa determinam modul in care un anumit set de variabile are impact
asupra unui alt set de variabile • De exemplu: daca o anumita dieta determina un impact in numarul de cazuri de
depresie • Intrebarile cauzale intreaba daca prin modificarea unui factor determinam schimbarea unui alt factor
• In general datele sunt colectate in mod expres pentru a raspunde la aceasta intrebare, de exemplu in cadrul unui
studiu de tip RCT • In multe situatii unde un RCT nu este posibil, o intrebare cauzala poate fi adresata indirect
prin utilizarea datelor observationale
2.1.6. Intrebarile mecaniciste • Testeaza legatura deterministica intre 2 seturi de trasaturi; ori de cate ori modifici
A in procent de X, o schimbare de Y va avea loc in B • Aceste intrebari raspund la intrebarea CUM impacteaza
un factor modificarea celui de al doilea • De exemplu, cum un anumit tip de dieta conduce la un numar mai
scazut de depresii • Foarte dificil de raspuns in afara unui mediu controlat
2.2. Caracteristicile unei bune întrebări

Există cinci caracteristici cheie ale unei întrebări bune pentru analiza datelor si vom discuta cum să evaluăm acest
lucru în mai multe detalii in cele ce urmează.
3
Pentru început, întrebarea ar trebui să fie de interes pentru publicul dvs., a căror identitate va depinde de contextul
și mediul în care lucrați cu date. Dacă sunteți în mediul academic, publicul poate fi colaboratorii dvs., comunitatea
științifică, autoritățile de reglementare guvernamentale, finantatorii sau publicul general.
De asemenea, trebuie să verificați dacă nu s-a răspuns deja la întrebarea care va interesează. Cu explozia recentă a
datelor, cantitatea tot mai mare de date disponibile publicului și literatura științifică nesfârșită precum și
disponibilitatea altor resurse, ați putea sa descoperiți ca deja s-a răspuns la întrebarea inițiala pe care ați formulat-
o. Verificările preliminarii și discuțiile cu experții va pot ajuta să rezolvati aceasta situatie deoarece chiar dacă
întrebarea specifică pe care o aveți în minte are un răspuns, s-ar putea să fi existe întrebări înrudite la care nu
exista răspunsuri incă.
In al treilea rand, intrebarea ar trebui să fie plauzibila. Dacă formulati o întrebare care nu este plauzibila, este
posibil să ajungeți la un răspuns dificil de interpretat sau in care sa aveți încredere limitata. Puteți să vă asigurați că
întrebarea dvs. este plauzibilă prin utilizarea propriilor cunoștințe despre subiectul abordat și printr-o mica
cercetare preliminara (pilot), care împreună pot sa vă ajute să stabiliți dacă întrebarea formulata este plauzibile.
In al patrulea rand, la intrebarea formulata trebuie sa poata fi oferit un raspuns. Cu toate ca poate că acest lucru nu
are nevoie să fie precizat, merită atins faptul că la unele dintre cele mai bune întrebări posibile nu poate fi oferit un
raspuns fie pentru că datele nu există sau nu există nici un mijloc de a colecta datele din cauza lipsei de resurse,
probleme de fezabilitate, sau probleme etice.
In cele din urma, specificitatea este - de asemenea - o caracteristică importantă a unei întrebări bune. Un exemplu
de întrebare generală este: Este a o dieta mai sănătoasă mai buna pentru tine? Pentru a formula o întrebare mai
specifica ar trebui sa clarificam ce înseamnă o dietă "mai sănătoasă" și ca ceva este "mai bun pentru tine"?
Procesul de creștere a specificității ar trebui să conducă la o întrebare finală, rafinată, cum ar fi: "O dieta ce contine
cel putin 5 porții pe zi de fructe și legume proaspete conduce la mai puține infecții ale tractului respirator superior
(răceli)? Cu acest grad de specificitate, planul dvs. de atac este mult mai clar și răspunsul pe care îl veți primi la
sfârșitul analizei datelor va fi mai interpretabil. De asemenea veți putea recomanda sau nu acțiunea specifică de a
mânca cel puțin 5 porții din fructe și legume proaspete pe zi ca mijloc de protecție împotriva infecțiilor tractului
respirator superior. Mnemonica PICO- detaliata mai jos- este adesea utilizata pentru a formula întrebari de
cercetare mai specifice. • P = Populație/ pacient • I = Intervenție/ indicator • C = Comparator/ control • O =
Outcome/ rezultat
2.3. Sfaturi practice pentru formularea unei intrebari
Alege un subiect de interes și initiaza o cercetare preliminara cu privire la modul in care acest subiect a fost
abordat în literature de specialitate pentru a vedea ce arii de cercetare au fost deja acoperite. Acest lucru va ajuta si
la a determina ce tipuri de întrebări acest subiect generează cu preponderenta. După ce ați efectuat cercetarea
preliminara, începeti prin formularea unor
4
intrebari deschise de tipul " Cum ? " Ce ? " si " De ce? ". Apoi evaluati posibilele răspunsuri la aceste întrebări.
Exemplu de lista de verificare pentru formularea intrebarilor de cercetare in stiinte umaniste (Universitatea
Vanderbilt):
1 ) Este întrebarea de cercetare ceva ce ma intereseaza pe mine/ii intereseaza pe altii? 2 ) Este întrebarea de
cercetare o abordare noue pe o problema veche sau rezolva problema?
3 ) Este prea vasta sau prea limitata?
4 ) Este întrebarea de cercetare cercetabila în intervalul de timp si locatia disponibile?
5 ) Ce informații sunt necesare ?
Cel mai comun tip de întrebare clinica este despre cum se trateaza o boală sau o stare si astfel de întrebări stau la
baza unor studii de “interventie”. Nu toate întrebările de cercetare sunt insa despre eficienta anumitor intervenții.
Adesea pot apărea si alte tipuri de întrebări :
• Care sunt cauzele problemei? => Studii etiologice, cercetari ale factorilor de risc • Care este frecvența
problemei? => Studii de frecventa • Are o anumita persoană problema investigata? => Studii de diagnostic
• Cine este la risc sa dezvolte problema? => Studii de prognoza, predictie
3. Analiza exploratorie a datelor (statistici desctiptive)
3.1. Analiza de frecvente
Mai multe variante de raportare a frecventelor apar in practica. Mai jos sunt listate si definite cel mai frecvent
intalnite variante. • Frecventa simpla: frecvenţa de apariţie a fiecărei valori dintr-o distribuţie • Frecvenţa
cumulată (fc). Totalul valorilor care se cumulează începând de la valoarea cea mai mare până la valoarea cea mai
mică din tabel. • Frecvenţa relativă raportată la unitate fr(1). Este raportul dintre frecvenţa absolută şi suma
frecvenţelor absolute (fa/Σfa).
• Frecvenţa relativă cumulată, raportată la unitate fr(1): Este similară frecvenţei cumulate absolute, cu deosebirea
că în acest caz se cumulează frecvenţele relative. • Frecvenţa relativă procentuală fr(%): Exprimă procentul
valorilor care se situează până la o anumită valoare din cadrul distribuţiei. Se calculează fie prin înmulţirea fr(1) cu
100, fie prin calcularea direct procentului pe care îl reprezintă o anumită valoare raportat la totalul valorilor dintr-o
distribuţie. Suma frecvenţelor relative procentuale este întotdeauna egală cu 100. • Frecvenţa relativă cumulată
procentuală (frc%): Exprimă procentul valorilor dintro distribuţie care se plasează până la o anumită valoare
(inclusiv aceasta). Frecvenţa relativă procentuală cumulată se numeşte si rang percentil.
3.2. Prezentarea grafica a datelor
Prezentarea grafică a datelor statistice depinde de necesitatile de evidentiere a rezultatelor. Cel mai frecvent
utilizate grafice sunt • graficul de tip bară: este cel mai simplu mod de reprezentare grafică a datelor. Se utilizează
5
atunci când dorim să reprezentăm o variabilă „discretă” (care prezintă valori întregi, de exemplu, numărul de
răspunsuri corecte la un test în funcţie de nivelul de instruire al subiecţilor).
• histograma: la prima vedere, histograma este asemănătoare cu graficul de tip bar; ea este insa mai adecvată
pentru situaţiile când variabila pe care dorim să o reprezentăm este de tip „continuu” (adică poate lua orice valoare
pe o scală numerică, de ex., număr de răspunsuri corecte, timpul de reacţie, lungimea).
• poligonul de frecvenţe: este o reprezentare alternativă la histogramă. Punctele centrale ale suprafeţelor
rectangulare care reprezintă frecvenţa sunt unite cu o linie care delimitează suprafaţa poligonului.
• graficul frecvenţei cumulate: este un grafic de tip liniar care reprezintă valorile frecvenţei absolute cumulate
• graficul circular: este utilizat în situaţiile în care valorile sunt „parte a unui întreg”. De exemplu, poate fi utilizat
la reprezentarea distribuţiei de frecvenţe grupate, pentru a avea o imagine directă a ponderii frecvenţei fiecărei
clase de interval în raport cu celelalte.
• graficul de tip „stem and leaf” („tulpină şi frunze”); atunci când utilizăm o distribuţie de frecvenţe grupate,
cazurile individuale „se pierd” la nivelul fiecărei clase de interval fără a mai putea şti unde se plasează fiecare
valoare iniţială în interiorul fiecărui interval. Reprezentarea de tip stem-and-leaf (pe scurt stem plot), are tocmai
avantajul de a realiza graficul distribuţiei cu păstrarea valorilor individuale
3.3. Indicatori ai tendintei centrale
Modul (Mo) = valoarea cu frecvenţa cea mai mare de apariţie
Mediana (Me) = valoarea „din mijlocul” unei distribuţii, adică aceea care are 50% dintre valori deasupra ei şi 50%
dintre valori dedesubtul ei
Media aritmetică (m) = raportul dintre suma valorilor distribuţiei şi numărul acestora Notaţii uzuale: • µ (miu),
atunci când este media întregii populaţii de referinţă • m, atunci când se calculează pentru un eşantion (cazul cel
mai frecvent)
Abaterea medie (d de la deviaţie medie) = distanţa dintre o valoare anumită şi media distribuţiei se numeşte
abaterea valorii (Xi-m); media abaterilor într-o distribuţie este întotdeauna egală cu zero
Dispersia (varianţa, abaterea medie pătratică) = pentru a elimina inconvenientul abaterilor de la medie de a avea
suma egală cu zero, se operează ridicarea la pătrat a abaterilor valorilor individuale Notaţii uzuale: • s2 (când se
calculează pentru eşantion)
6
• σ2 (când se calculează pentru întreaga populaţie)
Abaterea standard = Abaterea standard se obţine prin extragerea radicalului din expresia abaterii medii pătratice
(dispersiei). Notaţii uzuale: • s (pentru eşantioane) • σ (pentru populaţie) • SD (Standard Deviation, în
standardul APA ) ab.std.
Distributia normala • Reprezentarea grafică a rezultatelor măsurărilor reale poate lua diverse forme, curba
distribuţiei putând fi unimodală sau multimodală, aplatizată sau înaltă, simetrică sau asimetrică. În statistică există
însă un tip special de distribuţie, numită „distribuţie normală”, care corespunde reprezentării grafice a unei
caracteristici pentru care există un mare număr de măsurări, tinzând spre infinit • Conceptul de „curbă normală”
(expresia grafică a „distribuţiei normale”) se referă la un anumit tip de distribuţie teoretică care are câteva
proprietăţi caracteristice:
 are formă de „clopot”. Cea mai mare parte a valorilor se concentrează în zona centrală (medie);
 este perfect simetrică pe ambele laturi ale sale;
 linia curbei se apropie la infinit de axa OX (orizontală), fără a o atinge vreodată;
 în conformitate cu proprietatea 2, de fiecare parte a mediei se află exact jumătate dintre valorile distribuţiei.
Distribuţia normală z • Curba normală în care valorile sunt exprimate în scoruri z se numeşte curba normal
standardizată. Ea are toate proprietăţile enunţate mai sus, având însă şi parametrii oricărei distribuţii z: m=0 şi s=1.
Rezultă astfel că distribuţia normală standardizată (z) este este simetrică în jurul lui 0. • Curba normal
standardizată are câteva caracteristici pe care este important să le reţinem: o Aproximativ 34% dintre scorurile
distribuţiei normale se află între medie şi o abatere o standard deasupra mediei (z=+1)
 Între – 1z şi +1z se află aproximativ 68% dintre valorile distribuţiei

 Aproximativ 96% dintre scoruri se află între –2z şi +2z
4. Construirea modelelor statistice (statistici inferentiale)
4.1. Testele t
Testele t = procedură de testare a semnificației statistice a diferenței dintre două medii – variabila dependentă este
măsurată pe scală cantitativă (interval-raport) Distribuția teoretică de referință (distribuția de nul) • normală,
pentru eșantioane mai mari de 30 de subiecți • t - Student, pentru eșantioane mai mici de 30 de subiecți
4.1.1. Testul t pentru un eșantion
Uneori interesul nostru nu este de a compara doua grupe, ci doar de a compara rezultatele unei grupe fata de o
anumita valoare standard, reprezentata cel mai frecvent de media populatiei de
7
interes. In aceste situatii se aplica testul t pentru un esantion, precum in exemplul urmator: „Un test de empatie a
fost administrat pe o populatie de elevi proaspat intrati la liceu (N = 1250), obtinandu-se un scor mediu de 25.00 si
o abatere standard de 7.00. La aceeasi proba, la una dintre clasele testate (n = 28), s-a obtinut un scor mediu de
28.00 si o abatere standard de 7.06. Are aceasta clasa un nivel de empatie mai ridicat decat media populatiei de
elevi?”.
Astfel, pentru a aplica testul t pentru un esantion este nevoie ca : • variabila comparata sa fie exprimata numeric,
fiind vorba de comparatii intre medii; • una dintre mediile comparate sa reprezinte populatia de interes sau o
valoare standard a priori stabilita; • cealalta grupa sa fie constituita dintr-un lot de participanti a caror medie si
abatere standard la variabila comparata sunt cunoscute. Pe scurt, testul t pentru un singur esantion: • Testează
diferența dintre media unui eșantion și media populației • Mai general, diferența dintre media eșantionului și o
valoare de referință… • Procedura SPSS – Analyze/Compare means/One Sample T Test…
Raportare • Media și abaterea standard a eșantionului • Media populației (valoarea de referință) • Intervalul
de încredere pentru diferența dintre medii • Mărimea efectului: d= m- µ/s
Testul t (Student) pentru un singur eşantion • testul t poate fi utilizat doar atunci când cunoaştem media populaţiei
de referinţă şi avem la dispoziţie un eşantion „mare” (adică de cel puţin 30 de subiecţi, în cazul unei variabile
despre care avem motive să credem că se distribuie normal). • distribuţia mediei de eşantionare urmează legea
curbei normale standardizate doar pentru eşantioane de minim 30 de subiecţi, conform teoremei limitei centrale.
4.1.2. Testul t pentru eşantioane independente

Atunci cand criteriul (variabila dependenta) este masurat printr-o scala numerica, iar noi suntem
interesati sa comparam rezultatele obtinute de doua grupe diferite de subiecti vom utiliza testul t pentru 2
esantioane independente.
Exemple de cercetari care necesita apelul la testul t pentru 2 esantioane independente:
(1) Un cercetator crede ca strategiile sintetice conduc mai repede la deprinderea cititului decat strategiile analitice.
Pentru a testa ipoteza el selecteaza doua clase paralele de elevi aflati in clasa I, fiecare dintre ele avand cate 20 de
elevi. Primul grup a fost invatat sa citeasca analitic (începand cu literele, trecand apoi la cuvinte), in timp ce al
doilea grup a invatat sa citeasca sintetic (pornind de la asocierea cuvintelor cu imagini, pentru a deprinde ulterior
literele). Variabila dependenta a constat intr-o proba de citire contra cronometru, obtinandu-se un indicator pe baza
formulei: numărul de cuvinte citite intrun minut / numarul de erori. (2) Un alt cercetator este interesat sa studieze
daca exista diferente la nivelul increderii in fortele proprii intre copiii institutionalizati (n = 35) si o grupa de copii
proveniti din familii normale (n = 32). Pentru masurarea nivelului de incredere in sine a folosit scorul total obtinut
de cei 67 de participanti inclusi in cercetare la o scala ce masura perceptia eficientei de sine (Self-efficacy).
(3) ntr-un alt studiu se urmareste daca exista diferente intre persoanele introvertite si cele extrovertite cu privire la
performanta lor in vanzarile de automobile. Pentru aceasta, cercetatorul aplica mai intai o proba de personalitate
pentru a masura locul fiecarui participant pe axa introversiune-extroversiune. Toti participantii inclusi in studiu
erau angajati la departamentul vanzari la o companie de automobile. Pe baza rezultatelor initiale, el imparte lotul
8
de subiecti in doua grupe egale : cei care au obtinut rezultate mai mari decat valoarea medianei sunt inclusi in
grupa persoanelor « extravertite », in timp ce persoanele care au obtinut un rezultat sub valoarea medianei au fost
incluse in grupa persoanelor « introvertite ». In pasul urmator, cercetatorul a cules date despre performantele
obtinute in vanzari de catre cele doua grupe, pornind de la registrul de vanzari. Datele respective sunt folosite
pentru a vedea daca exista diferente intre introvertiti si extrovertiti cu privire la performantele lor in vanzari.
Conditii necesare pentru a folosi testul t pentru esantioane independente: • sa fie vorba de compararea a doua
grupe ; • cele doua grupe sa fie independente (sa nu existe vreo legatura intre ordinea de introducere a datelor
pentru subiectii dintr-o grupa si cea de introducere a datelor din cealalata grupa) ; • Variabila supusă măsurării să
se distribuie normal în ambele populaţii. Aceasta ne garantează că şi distribuţia diferenţelor dintre medii se
distribuie normal. Totuşi, teorema limitei centrale ne permite asumarea normalităţii distribuţiei mediei de
eşantionare chiar şi în cazul variabilelor care nu se distribuie normal la nivelul populaţiei, pentru eşantioane mari.
Dacă însă, analiza distribuţiilor indică forme aberante, iar volumul grupurilor comparate este foarte mic, se va
allege soluţia unui test neparametric. • Dispersia celor două eşantioane să fie omogenă. Testul t poate fi aplicat
strict în cazurile în care dispersiile celor două populaţii („practicanţi”, „nepracticanţi”) au aceeaşi dispersie
(omogenitatea dispersiei). Din fericire, există trei situaţii în care această condiţie nu trebuie să ne preocupe:
- când eşantioanele sunt suficient de mari (cel puţin 100 fiecare)
- când cele două eşantioane au acelaşi volum (N1=N2) o când dispersiile celor două eşantioane nu diferă
semnificativ (dar, chiar şi pentru acest caz, există formule care ţin cont de diferenţa dispersiilor).
4.1.3. Testul t pentru eşantioane perechi

In momentul in care criteriul (variabila dependenta) este masurata printr-o scala numerica, iar noi suntem interesati
sa comparam rezultatele obtinute de doua grupe, in conditiile in care cele doua grupe sunt in relatie una cu cealalta
prin interventia experimentatorului sau prin corespondenta naturala a elementelor din cele doua grupe, vom utiliza
testele pentru esantioane perechi (corelate / dependente).
Astfel exista trei situatii in care vorbim de esantioane perechi : • cazul masuratorilor repetate ; • cazul perechilor
naturale ; • cazul perechilor artificiale. Exemple de cercetari care necesita apelul la testul t pentru doua esantioane
perechi:
Cazul masuratorilor repetate

(1) Obiectivul cercetarii este de a studia influenta metodelor de relaxare asupra reducerii conduitelor agresive la
adolescenti. O grupa de 15 adolescenti cu tulburari comportamentale este testata initial (pre-test) in ceea ce
priveste nivelul agresivitatii printr-un inventar de personalitate. Dupa testare, cei 15 urmeaza un program de
relaxare, constituit din cinci sedinte de relaxare saptamanale, fiecare durand o ora. Dupa o perioada de doua luni,
participantii sunt retestati (post-test) pentru a se observa daca nivelul lor de agresivitate a scazut in urma practicarii
tehnicilor de relaxare invatate.
Cazul perechilor natural (2) Un cercetator norocos gaseste 20 de perechi de gemeni univitelini, dar crescuti in
familii diferite, fiind despartiti de la nastere. Mai mult, diferenta era de ordin calitativ, unii crescand in familii
9
„normale”, iar ceilalti in familii cu „probleme”. Obiectivul studiului era de a stabili in ce masura agresivitatea este
invatata social, dovedita prin existenta unor diferente semnificative in manifestarile agresive ale gemenilor din cele
doua grupe. Agresivitatea a fost codata pe baza unui protocol de observatie, scorurile variind intre 4 si 20.
Cazul perechilor „artificiale”

(3) Obiectivul cercetarii este de a studia efectul atmosferei de lucru asupra rezolvarii problemelor de matematica.
Cercetatorul decide sa imparta subiectii in cele doua grupe de lucru pe baza unui criteriu prestabilit. Astfel, sunt
testate initial cunostintele de matematica ale elevilor, iar pe baza rezultatelor obtinute are loc distribuirea elevilor
in cele doua grupe, pentru a controla (elimina) influenta acestora asupra relatiei dintre variabilele studiate. Pentru a
echivala cele doua grupe, cercetatorul ia primii doi subiecti, care au obtinut rezultatele cele mai bune la testul
initial, si ii distribuie in grupe diferite. Apoi trece la urmatorii doi pe care ii distribuie, de asemenea, in grupe
diferite. Se continua algoritmul pana sunt divizati toti participantii. Apoi, una dintre cele doua grupe nou-formate
va rezolva probleme de matematica intr-o atmosfera calma, relaxanta, in timp ce al doilea grup va rezolva
probleme de matematica intr-o atmosfera tensionata, conflictuala. Variabila dependenta este performanta obtinuta
de fiecare elev, exprimata in numarul de probleme rezolvate corect, maximum fiind 10. Dupa cum se observa,
testul t pentru doua esantioane independente necesita trei conditii esentiale : • sa fie vorba de compararea a doua
grupe ;
• cele doua grupe sa fie dependente (sa existe o legatura intre ordinea de introducere a datelor pentru subiectii
dintr-o grupa si cea de introducere a datelor din cealalta grupa); • variabila (dependenta) supusa compararii sa fie
exprimata numeric.
5. Analiza de varianta ANOVA
5.1. Definitie ANOVA este o generalizare a testului t pentru mai mult de doua medii, pentru c deseori în
cercetarea psihologica studiem mai mult de doua grupuri în acelasi timp. De subliniat este faptul ca ANOVA poate
fi folosita si la compararea dintre doua medii insa este mai eficient utilizata cand comparam 3 sau mai multe
medii.
5.2. Clasificarea tehnicilor ANOVA Cele mai întâlnite design-uri de cercetare experimentală utilizează una
dintre următoarele patru forme de analiză de varianţă:
1. ANOVA simplă sau unifactorială
2. ANOVA cu măsurători repetate;
3. ANOVA factorială cel mai utilizat fiind bifactorială
4. ANOVA mixtă
5.3. ANOVA simplă sau unifactorială ANOVA unifactorială este modelul cel mai simplu dintre tehnicile
ANOVA, fiind un corespondent al testului t pentru două eşantioane independente.
Exemplu:Un cercetător doreşte să vadă dacă profesia influenţează competitivitatea interpersonală. În acest sens
selectează aleator trei grupuri de bărbaţi: fotbalişti profesionişti, profesori de colegiu şi manageri care sunt evaluaţi
10
pentu a se determina cat de mult le place competiţia interpersonală. Scorurile mari indică nivele ridicate ale
competitivităţii.
5.4. ANOVA cu măsurători repetate

ANOVA cu măsurători repetate este un model corespondent al testului t pentru două eşantioane perechi. Exemplu:
Intr-un studiu de psihofarmacologie vrem să studiem efectul a două substante de tipul amfetaminei asupra
timpilor de reacţie la un test de psihomotricitate. Pentru a controla o posibilă sursă de eroare, se folosesc aceiaşi
subiecţi cărora li se aplică, la intervale de două săptămîni, trei tratamente diferite: cu substanţa α , cu subsatnţa β şi
placebo. Se măsoară de fiecare dată timpii de reacţie ai subiecţilor exprimaţi în milisecunde.
Intr-un studiu de psihologia muncii vrem să evidenţiem efectul zgomotului asupra discriminării perceptive. În
acest scop, subiecţii sunt supuşi unui număr de trei condiţii experimentaledimineaţa la începutul zilei de muncă. În
prima realizează o sarcină de discriminare perceptivă în absenţa zgomotului, in a doua sarcină zgomotul este
intermitent iar în a treia sarcină zgomotul este continuu. Se monitorizează erorile efectuate
5.5. ANOVA factorială

ANOVA factorială este un model mai complex, testand efectele mai multor variabile independente (factori)
asupra unei variabile dependente. Exemplu: Deoarece diverse parţi ale creierului sunt specializate pentru
comportamente specifice, studiile au arătata că diferenţele intre stîngaci şi dreptaci se datorează diferenţelor în ce
priveşte emisfera dominantă. Pornind de a acest fapt cercetătorii au presupus că dreptacii şi stîngacii au abilităţi şi
talente diferite. În vederea testării acestei ipoteze un psiholog a evaluat discriminarea de acord -componentă a
abilităţilor muzicale- pentru trei grupuri de subiecţi: stîngaci, dreptatci şi ambidecştri în două condiţii
experimentale: cand subiecţii sunt odihniti si dupa 24 de ore in condiţiile privării de somn. Performanţa
discriminativă a subiecţilor a fost măsurată cu o probă specifică.
ANOVA factorială poate fi utilizată în cazul măsurătorilor repetate dacă sunt manipulaţi cel puţin doi actori.
Exemplu:Un psiholog educaţional studiază motivaţia elevilor. Un lot de 7 subiecţi sunt urmăriţi timp de 3 ani din
clasa a patra până în clasa a şasea. În fiecare an elevii conpletează un chestionar măsurînd motivaţia şi entuziasmul
pentru şcoală centrat pe 3 discipline: matematica, romana, muzica.Psihologul vrea să ştie dacă apar schimbări
semnificative între nivelurile de motivaţie de-a ungul celor 3 ani si intre interesul pentru diferite discipline.
5.6. ANOVA mixtă

ANOVA mixtă este o combinaţie intre ANOVA simplă şi ANOVA cu măsurători repetate. Exemplu: Intr-o
cercetare care vizează efectul imaginilor mentale un grup de 16 studenţi dintre care 50% sunt fete şi restul băieţi.-
este upus la trei condiţii experimentale la interval de două săptămîni. Prima condiţie presupune invăţarea fiecarui
cuvînt însoţit de desenarea acestuia – „imagine mentală construită”, a doua condiţie presupune învăţarea cuvîntului
însoţită de copierea imaginii acestuia care îi este prezentată împreună cu cuvîntul– „imagine mentală dată” . Al
treilea grup învaţă cuvintele pur şi simplu „ condiţia de control”. Ce se poate spune cu privire la efectele tipului
învăţării asupra umărului de cuvinte reamintite la fete şi băieţi?
11
5.7. Condiţii pentru aplicarea ANOVA
• Independenţa observaţiilor (valorilor) pentru fiecare grup comparat – valorile măsurate pe subiecţii unui grup
să nu fie în nici un fel influenţate de valorile măsurate pe celelalte grupuri. • Distribuţie normală a valorilor
fiecărui grup comparat – distribuţiile comparate trebuie să fie simetrice sau... – asimetriile să fie în aceeaşi
direcţie – testul F este considerat remarcabil de robust în cazul încălcării condiţiei de normalitate. – ANOVA
este mai vulnerabilă dacă distribuţia variabilei dependente este prea aplatizată sau prea înaltă (kurtosis≠0) decât în
cazul asimetriei (skewness≠0). – Cu cât volumul grupurilor supuse comparaţiei este mai mare, cu atât aspectele
legate de normalitatea distribuţiei au un efect mai mic asupra ANOVA. • Omogenitatea dispersiei la nivelul
fiecărui grup – Împrăştierea valorilor variabilei dependente în interiorul grupurilor definite prin valorile
variabilei independente trebuie să fie egală.
– încălcarea acestei condiţii nu invalidează testul ANOVA, care este destul de robust şi în acest caz – se vor
analiza cu atenţie cazurile care prezintă valori extreme, care au un efect important asupra varianţei. Egalitatea
(omogenitatea) varianţei poate fi testată cu testul Levene – Teste alternative: Brown, Forsythe sau Welch
B. PROTOCOL DE CERCETARE
1. Structura unui protocol de cercetare
1.1. Introducere
Introducerea ar trebui să fie un rezumat succint al studiului și include următoarele elemente:
1.1.1. Prezentare generala Primul paragraf trebuie să sumarizeze studiul propus. Acesta ar trebui să descrie scopul
de studiului și răspunda la următoarele întrebări: 1) Incearcă studiul să testeze o ipoteză pilot pentru un proiect
viitor? 2) Incearcă studiul să valideze un instrument? 3) Vor fi proiectate intervenții viitoare in baza rezultatelor?
Dacă este cazul, acest alineat ar trebui să menționeze, de asemenea, informații legate de finanțare.
1.1.2. Context și argumente Această secțiune ar trebui să ofere contextul și motivația pentru inițierea studiului.
Rezultatele revizuirii literaturii de specialitate trebuie să fie descrise, inclusiv referiri detaliate ale studiilor
anterioare. Rezultatele studiilor pilot effectuate (dacă este cazul) ar trebui să fie incluse. Dacă este necesar,
referințe la date sau informații suplimentare pot fi incluse într-o anexă.
1.2. Obiective
Secțiunea ar trebui să prezinte concis ipotezele de cercetare. Această secțiune ar trebui să precizeze dacă
protocolul este pentru un studiu de fezabilitate/studiu descriptiv. Exemplu:
• Pentru a testa un instrument ...
• Pentru a descrie ...
12
Designul studiului trebuie să permită investigatorului să răspundă obiectivelor de cercetare iar sectiunea de analiza
statistică va trebui să evidențieze în mod clar modul în care datele vor fi evaluate în raport cu fiecare dintre aceste
obiective.
1.3. Selectia participantilor 3

Această secțiune ar trebui să ofere o descriere detaliată a populației ce reprezinta subiectul cercetării prezentate
in protocol. Trebuie luati în considerare următorii factori: 1) populatia (problema specifica (de ex. un anumit tip de
patologie); 2) adecvarea pentru interventia propusa 3) determinarea unui grup de risc in urma expunerii la
interventie Toate cerintele legate de gen, ocuparea forței de muncă, arie geografica, limbă, etc trebuie precizate și
justificate în mod clar.
1.4. Recrutare si randomizare Această secțiune trebuie să descrie procedurile de recrutare, înregistrare și/sau
randomizare a subiectilor. Mijloacele de obținere a consimțământului informat ar trebui să fie descrise în
întregime. Această secțiune poate include, de asemenea, o declarație cu privire la modalitatile de contactare a
cercetătorului principal înainte de a participa la studiu. Numele și numărul de telefon al persoanei care conduce
studiul, ar trebui specificate.
1.5. Designul si metodele studiului Această secțiune ar trebui să ofere o descriere detaliată a procesului de
studiu.
1.5.1. Design / Tipul de studiu Acest segment ar trebui să descrie tipul designului descris în protocol (de
exemplu, randomizat, cohortă, caz-control, etc.)
1.5.2. Selectarea instrumentelor
Această secțiune ar trebui să ofere informații specifice despre instrumentele care vor fi utilizate în cadrul
studiului. Trebuie luati în considerare următorii factori: 1) justificarea selectarii anumitor instrumente; 2)
proprietăți psihometrice ale instrumentelor; 3) pre-testarea prealabila a instrumentelor; 4) utilizarea instrumentelor
selectate în studii anterioare; 5) timp aproximativ necesar pentru completarea fiecarui instrument de catre
populația selectata 6) durata estimată pentru fiecare subiect.
1.5.3. Descrierea intervenției Natura oricărei intervenții comportamentale utilizate în studiu trebuie să fie descrisa
în detaliu, inclusiv procedurile utilizate în dezvoltarea, si pilotarea intervenției.
1.5.4. Colectarea datelor Această secțiune ar trebui să specifice datele care vor fi colectate (inclusiv in forma
tabelara). În cazul în care există diferențe în datele colectate pentru diferite grupuri participanti, acest lucru ar
trebui prezentat în mod clar într-unul sau mai multe tabele.
1.5.5. Descrierea procesului/procedurii Această secțiune trebuie să prezinte o descriere detaliată a procedurilor
care trebuie urmate în efectuarea studiului. Trebuie luate în considerare elementele enumerate mai jos.
Administrarea instrumentului Explicatii clare ale modului în care vor fi administrate instrumentele (de exemplu,
autoadministrat, interviu administrat, etc.) trebuie incluse in aceasta sectiune. Informații specifice privind
contextul administrarii instrumentelor si supravegherea testarii (de ex. in cazul experimentelor trebuie sa include si
modul de utilizare a surogatelor/interventiilor placebo) calendarul și procedurile de minimizare a datelor lipsă. În
plus, această secțiune ar trebui să ofere detalii cu privire la temporizarea utilizarii instrumentelor, cum ar fi o
13
notificare prealabilă, perioadă de pregătire, timp de finalizare, etc. Administrarea intervenției Această secțiune ar
trebui să abordeze modul în care intervenția va fi executata. Informații privind frecvența intervenției, contextul, și
calificarea persoanelor care administrează intervenția ar trebui incluse. Aspecte particulare Ar trebui descrise
complicațiile anticipate precum și strategiile de gestionare și soluționare propuse.
Compensarea participarii Problema compensarii ar trebui abordata în această secțiune. Informații despre
compensare ar trebui să fie incluse si în formularul de consimțământ.
1.5.6. Reactii adverse și gestionarea lor
Această secțiune trebuie să includă următoarele segmente: Raportarea evenimentelor adverse sau neprevăzute
Acest segment trebuie să definească posibilele evenimente adverse care ar putea sa apara precum si un plan de
gestionare a acestora Reacții anticipate O descriere a reacțiilor care pot fi așteptate ca urmare a participarii la
studiu, cum ar fi stres sau furie, ar trebui menționate. Managementul reacțiilor Ar trebui să se prevadă modalitatile
prevazute de management al reacțielor participantilor precum si posibilati de răspuns la distress-ul acestora.
Informații privind resursele disponibile de ajutor, precum și numele și numerele de telefon ale unor psihologi care
nu sunt asociati cu studiul, dar care pot fi contactate în caz de distres trebuie să fie listate. Toate aranjamentele
necesare cu privire la utilizarea resurselor menționate mai sus trebuie să se facă înainte de începerea studiului si ar
trebui să fie menționate în protocol.
1.6. Analiza statistică Secțiunea de analiză statistică ar trebui să rezume desigul si justificarea studiului. Acesta
ar trebui să furnizeze dovezi că proiectul propus va permite anchetatorilor sa atinga obiectivele principale ale
studiului și ar trebui să descrie planul analitic pentru fiecare obiectiv. Acesta ar trebui să discute în mod explicit
modul în care vor fi analizate datele de la fiecare dintre instrumentele utilizate.
1.7. Referințe Fiecare studiu trebuie să conțină o listă de referințe. Referințele vor fi numerotate în funcție de
ordinea apariției lor în text și citate în text cu numărul din paranteze
1.8. Anexe Copii ale tuturor instrumentelor care vor fi utilizate, scrisori către potențiali participanți, scripturi,
precum și orice alte materiale de studiu care vor fi utilizate in interactiunea cu participantii trebuie să fie anexate
protocolului.
2. Selectia participantilor si determinarea volumului esantionului

2.1. Volumul eşantionului recomandat în diferite procedurilor statistice
Recomandările de mai jos au un caracter practic, dar se bazează pe două concept fundamentale ale statisticii
inferenţiale: - mărimea efectului se referă la intensitatea asocierii (diferenţei) dintre variabilele cercetării
(Kraemer & Thiemann, 1987). - puterea testului (probabilitatea de a obţine un rezultat statistic semnificativ).
Aceste recomandări oferă un cadru empiric, suficient pentru orientarea în situaţiile în care nu apelăm la analize
cantitative riguroase de dimensionarea eşantioanelor, cu ajutorul softurilor online (de ex. .
2.1.1. Volumul celulelor (grupurilor) pentru testele utilizate în detectarea diferenţelor dintre medii
Toate testele statistice care detectează diferenţele dintre grupuri se bazează pe o anume distribuţie de eşantionare.
Ca urmare, numărul subiecţilor din fiecare eşantion are o legătură directă cu împrăştierea distribuţiei de
eşantionare (eroarea standard). Cu cât mai mulţi subiecţi în eşantion, cu atât împrăştierea distribuţiei de
14
eşantionare este mai mică şi şansa de a descoperi o diferenţă semnificativă este mai mare (ceea ce înseamnă şi o
putere a testului mai mare). Dar puterea nu este legată numai de mărimea eşantionului, ci şi de mărimea efectului.
Pe măsură ce mărimea efectului creşte, creşte şi puterea testului. De exemplu, dacă dorim să testăm efectul unei
psihoterapii după două şedinţe, când efectul este mic, testul statistic va avea „putere mică”, adică va avea şanse
mai reduse să releve un efect semnificativ decât, să zicem, după 12 şedinţe, când efectul terapeutic va fi mai
pronunţat. Testul t pentru eşantioane independente, pentru eşantioane dependente, analiza de varianţă (ANOVA
one-way sau factorială), la fel ca şi analiza de varianţă multivariată (MANOVA), sunt concepute pentru testa
semnificaţia diferenţelor dintre mediile unor grupuri. Pentru a menţine un nivel acceptabil pentru puterea testului,
fiecare dintre grupurile comparate trebuie să aibă un volum minimal, pentru a avea suficientă putere în detectarea
diferenţelor şi, în acelaşi timp, o nivel mediu ridicat al mărimii efectului (VanVoorhis & Morgan, 2001). Concret,
pentru a avea o putere acceptabilă a testului: - atunci când sunt comparate mediile a două grupuri independente, se
vor utiliza cel puţin
60 de subiecţi (minim 30 pentru fiecare grup). - atunci când este utilizat testul ANOVA pentru o variabilă
independentă cu trei valori, eşantionul cercetării trebuie să fie compus din cel puţin 3x30=90 de subiecţi. - în cazul
analizei de varianţă multivariate (MANOVA) este important să existe mai multe cazuri decât variabile
independente în fiecare celulă definită de valorile variabilei independente (Tabachnick & Fidell, 1996).
2.1.2. Mărimea eşantionului atunci când se studiază asocierea variabilelor

Deşi calcularea mărimii eşantionului în astfel de situaţii face obiectul unor formule complexe, regula empirică
generală este de a nu utiliza eşantioane mai mici de 50 de subiecţi în cazul analizei de corelaţie sau de regresie
simplă. În cazul corelaţiei şi regresiei multiple, în care sunt mai multe variabile independente (criteriu), Green
(1991) sugerează ca volumul eşantionului cercetării să fie !>50+8m, unde m este numărul variabilelor
independente, pentru corelaţii multiple şi ! > 104+m, pentru regresia multiplă. Concret, pentru o analiză de
corelaţie multiplă cu patru variabile se vor utiliza 50+8x4=82 subiecţi, iar pentru o regresie cu 4 variabile criteriu,
se va asigura un eşantion de minim 104+4=108 subiecţi. Atunci când se urmăreşte atât testarea corelaţiei cât şi a
regresiei se recomandă eşantioane mai mari decât acestea. În acelaşi context sunt recomandate şi alte reguli
empirice, astfel: - Pentru 5 sau mai mulţi predictori (sau variabile multiplu corelate) numărul participanţilor va
depăşi numărul predictorilor cu cel puţin 50. Altfel spus, totalul participanţilor trebuie să fie mai mare numărul
predictorilor cu cel puţin 50 (Harris, 1985); - Pentru ecuaţiile de regresie cu şase sau mai mulţi predictori se
impune un minim de 10 participanţi pentru fiecare predictor dar, dacă situaţia o permite, şi mai bine este ca să
existe în jur de 30 de subiecţi pentru fiecare variabilă. Cohen şi Cohen (1975) demonstrează că în cazul unei
regresii cu un singur predictor care are o corelaţie cu variabila predictor de 0.30, sunt necesari 124 subiecţi pentru
a menţine o putere de 0.80. Cu cinci predictori şi o corelaţie multiplă de 0.30, aceeaşi putere este atinsă pe un
eşantion de 187 subiecţi. O atenţie specială se va acorda simetriei variabilei dependente, deoarece în cazul
existenţei unei asimetrii, mărimea aşteptată a efectului este mică şi, implicit, puterea testului este mai mică şi ea
(Tabachnick & Fidell, 1996).
2.1.3. Volumul eşantionului pentru testul chi-pătrat
15
O regulă de siguranţă este ca în nici una din celulele tabelului de corespondenţă frecvenţa teoretică să nu fie mai
mică de 5, iar volumul total al eşantionului să nu fie mai mic de 20. În cazul testului chi-pătrat, spre deosebire de
alte teste statistice, creşterea numărului subiecţilor nu are un impact asupra valorii critice de respingere a ipotezei
de nul. Totuşi, volumul eşantionului are un effect asupra puterii testului. Existenţa unor frecvenţe teoretice
(aşteptate) într-una sau mai multe celule ale tabelului de corespondenţă limitează considerabil puterea testului. De
asemenea, valori reduse ale frecvenţelor aşteptate cresc nivelul erorii de tip I. Acesta este şi motivul pentru care se
recomandă un eşantion de cel puţin 20 de subiecţi (Howell, 1997). Testul chi-pătrat este utilizat pentru testarea
gradului de independenţă (asociere) dintre variabile categoriale. Ca urmare, nici un subiect nu trebuie să contribuie
cu mai mult de o singură valoare. La rândul lor, gradele de libertate au un anumit impact asupra puterii testului. Cu
cât numărul celulelor tabelului de corespondenţă creşte (ceea ce conduce la creşterea gradelor de libertate), se
reduc frecvenţele teoretice din celulele tabelului de corespondenţă şi, implicit, are loc o reducere a puterii (Cohen,
1988). Şi totuşi, atunci când se aşteaptă o mărime importantă a efectului, se consider că poate fi tolerată şi o
valoare mai mică pentru puterea testului, implicit un volum mai redus al eşantionului (minim 8).
2.2. Metode de esantionare
2.2.1. Esantioane Probabilistice

Esantioanele probabilistice sunt acelea in care membrii populatiei au o sansa (probabilitate) cunoscuta de a fi
selectati in esantion. Aceste esantioane asigura reprezentativitatea statistica a datelor pentru populatia aleasa si
permit calcularea erorii de esantionare.
Metodele de selectie probabilistica sunt:

a) selectia aleatoare simpla,
b) selectia sistematica,
c) selectie cluster (multistadiala),
d) selectie aleatoare stratificata
2.2.2. Esantioanele Non-probabilistice:

Apar in situatiile in care probabilitatea sau sansa unui membru al populatiei selectate de a fi ales in esantion nu
poate fi determinata. Aceste esantioane nu asigura reprezentativitatea datelor si eroarea de esantionare nu poate fi
calculata.
a) Selectia arbitrara (Convenience samples): In acest caz esantioanele se alcatuiesc din persoane alese arbitrar de
catre operatorul de interviu sau din persoane care se ofera voluntar.
b) Selectie Rationala (Judgment samples): Esantionarea se bazeaza pe rationamentul sau pe presupunerea

controlata a operatorului de interviu ca respondentul reprezinta populatia de interes.
c) Selectia in Lant (metoda bulgarelui de zapada): Esantionarea presupune ca respondentii sa ofere numele altor
respondenti care fac parte din populatia de interes.
16
d) Esantionarea pe cote: Esantioanele au un numar precis de indivizi din fiecare categorie de interes care trebuie
chestionati.
17

Examen Analiza Datelor - An 3.sem. 1

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Examen Analiza Datelor - An 3.sem. 1

Încărcat de

Drepturi de autor:

Formate disponibile

A.

ELEMENT TEORETICE DE ANALIZA DATELOR

1. Procesul de analiza a datelor: activități si etape

1.1. Activități principale de analiza a datelor

1.2. Epiciclul de analiza a datelor

1.2.1. Stabilirea așteptărilor

1.2.2. Colectarea informațiilor (datelor) si compararea cu așteptările

Tabel 1 – Activitati si etape de cercetare

Cele șase tipuri de întrebări sunt:

2.2. Caracteristicile unei bune întrebări

2.3. Sfaturi practice pentru formularea unei intrebari

3. Analiza exploratorie a datelor (statistici desctiptive)

3.1. Analiza de frecvente

3.2. Prezentarea grafica a datelor

3.3. Indicatori ai tendintei centrale

Modul (Mo) = valoarea cu frecvenţa cea mai mare de apariţie

 Între – 1z şi +1z se află aproximativ 68% dintre valorile distribuţiei

4. Construirea modelelor statistice (statistici inferentiale)

4.1.2. Testul t pentru eşantioane independente

Exemple de cercetari care necesita apelul la testul t pentru 2 esantioane independente:

4.1.3. Testul t pentru eşantioane perechi

Cazul masuratorilor repetate

Cazul perechilor „artificiale”

5. Analiza de varianta ANOVA

5.4. ANOVA cu măsurători repetate

5.5. ANOVA factorială

5.6. ANOVA mixtă

1. Structura unui protocol de cercetare

1.3. Selectia participantilor 3

2. Selectia participantilor si determinarea volumului esantionului

2.1.2. Mărimea eşantionului atunci când se studiază asocierea variabilelor

2.1.3. Volumul eşantionului pentru testul chi-pătrat

2.2. Metode de esantionare

2.2.1. Esantioane Probabilistice

Metodele de selectie probabilistica sunt:

2.2.2. Esantioanele Non-probabilistice:

b) Selectie Rationala (Judgment samples): Esantionarea se bazeaza pe rationamentul sau pe presupunerea

S-ar putea să vă placă și