Sunteți pe pagina 1din 25

Principiile unei teorii tiinifice valide:

Caracterul empiric = suportul factual al Testabilitate (verificabilitate) = prediciile ei pot


acesteia, toate datele tiinifice (observaii, fi enunate ntr-o form msurabil; presupune:
msurtori) care stau la baza ei. a. alegerea unui caz particular din domeniul de
Orice teorie tiinific pornete de la date aplicabilitate al teoriei (o ipotez) care permite
obiective msurate care trebuie s fie: realizarea unei msurtori experimentale n
a. verificabile; condiii strict controlate;
b. replicabile b. msurtorile tiinifice s poat fi realizate cu
Caracterul raional = suportul logicii formale suficient precizie pentru a putea fi comparate cu
Teoria reprezint o serie de enunuri deduse pe predicia.
cale logic din faptele tiinifice i cunotinele
Falsificabilitatea = pot fi testate ipoteze
considerate valide
generate de teorie care ar dovedi c teoria este
incorect
Simplitatea (parcimonitatea): o condiie n Generalitatea: o teorie mai general este
procesul de evaluare al teoriilor: dintre mai multe preferat uneia specifice pt. c exprim doar
teorii concurente este preferat cea mai simpl relaiile general valabile dintre datele tiinifice,
(lama lui Occan) neglijnd aspectele particulare;
- n practic se trece de la o teorie particular la
una general
Primul principiu fundamental al tiinei: Etapele unei cercetri tiinifice
orice afirmaie trebui supus unei verificri aplicative
critice; nu se accept ca argument decisiv Identificare problemei
prerea nici unei autoriti (expert) fr ca ea s Construcia modelului descriptiv
fie testat Soluia
Testarea soluiei gsite
Principiul al doilea: dac o afirmaie este Interpretarea rezultatelor empirice
contrazis de un rezultat empiric, ea este Analiza erorilor
considerat greit
Piramida lui Anderson
1. Cadrul conceptual 2. Fenomenul
Un cadru conceptual este un complex de Msura fenomenului este comportamentul
sisteme de cunotine cu nivele observabil. Se pune ntrebarea dac
interconectate de generalitate. El influeneaz comportamentul observat este util n msurarea
puternic fenomenul studiat: este determinantul fenomenului, acesta din urm venind cu o
principal al judecilor i deciziilor n orice interpretare conceptual a comportamentului.
cercetare. Nimic nu garanteaz c fenomenul i
Cadrele conceptuale sunt sisteme personale de comportamentul reprezint acelai lucru.
cunotine, aflate n continu schimbare i Un motiv este reprezentat de faptul c aciunea
dezvoltare. Lrgirea cadrului conceptual conduce urmrit ntr-un cadru experimental implic alte
la progrese importante. abiliti pe lng comportamentul avut n vedere.
Tehnicile de proiectare statistic pot ndeprta o
- natura problemei identificate , determin parte din aceste confuzii.
valoarea cercetrii; Un alt aspect al distinciei dintre comportament
- implic faza de documentare i fenomen ine de generalizare. Se poate

1
3. Comportamentul generaliza pe baza comportamentului observat?
Comportamentul este creat parial de opiunile
cercettorului n ceea ce privete construcia - analiza fenomenului se face prin construirea de
cadrului experimental. Un cadru experimental modele ale realitii, pe baza elementelor care au
bun este dat de importana o pondere crescut n structura fenomenului;
comportamentului observat, simplitatea i trebuie evitat:
potenialul de generalizare al acestuia, a. subspecificarea modelului = omiterea
proprietile statistice ale rspunsului msurat factorilor care sunt relevani dpdv al determinrii
i costul, inclusiv timpul i nivelul de resurse fenomenului studiat
implicate. b. supraspecificarea modelului = includerea
Cadrul experimental trebui vzut n continu factorilor irelevani dpdv al fenomenului studiat
schimbare, urmare a problemelor legate de
confuziile ce pot aprea, precum i a celor de
validitate i fiabilitate.

-operaionalizarea: un proces de definire


comportamental a constructului; are loc o
conversie a constructelor care alctuiesc modelul
ntr-un set de comportamente observabile, care
permit msurarea acelor constructe i implicit
testarea relaiei lor n cadrul modelului

2
4. Msurarea 5. Designul de cercetare
Este legtura dintre lumea real i lumea Cea mai simpl cercetare implic un grup
tiinei. Reprezint transformarea lumii reale a experimental i un grup de control, ntrebarea
obiectelor ntr-o lume conceptual a ideilor i fiind dac tratamentul aplicat grupului
simbolurilor. experimental influeneaz comportamentul. Cel
Validitatea i fiabilitatea guverneaz toate mai important rol al statisticii n aceast etapa
msurtorilor. este
Distorsiunea de msurare apare atunci - controlul variabilelor care ar putea distorsiona
cnd un instrument msoar mai bine constructul interpretarea.
ntr-o anumit populaie dect n alta. Alt roluri sunt:
-pentru msurare se folosesc scale: - calcularea probabilitii de succes/eec,
A. Variabile sau scale categoriale denumit n mod formal puterea
1. scala binar/dihotomic: exist doar dou experimentului;
categorii, iar variabila face parte dintr-una dintre - analiza determinrilor multiple (majoritatea
ele (pozitiv/negativ; da/nu); comportamentelor depind de aciunea combinat
2. scala nominal: presupune categorizarea pe a doua sau mai multe variabile; ntrebri: Dou
criterii calitative; datele nominale sunt folosite variabile interacioneaz? Dac da, n ce mod?);
pentru stabilirea frecvenelor (de cte ori apare
cuvntul mr ntr-o niruire de fructe consumate Validitatea
ntr-o sptmn); se atribuie numere doar a. validitatea intern SAU VALIDITATEA
pentru a denumi clase de echivalen; CONSTRUCTULUI: msurtorile constituie o
3. scala ordinal; presupune ordonarea reprezentare veridic a fenomenului sau
indivizilor pe baza unui criteriu cantitativ (sau procesului care se dorete a fi studiat =
calitativ); categoriile sunt ordonate A > B > C, (variabilele msoar ceea ce ar trebui s
ns nu tim cu ct A > B > C : nu cunoatem msoare?).
diferenele dintre A, B i C; orice situaie n care b. validitatea extern = capacitatea de
persoanele noteaz sau ordoneaz ceva subiectiv generalizare a rezultatelor
ar trebui tratat ca furniznd variabile ordinale; - diferite contexte afecteaz n mod diferit
3b. scale hiperordinale: sunt caracterizate nu rspunsurile subiecilor = afecteaz
numai printr-o relaie de ordine ntre elemente, ci comparabilitatea datelor
i ntre intervalele care le separ.
- controlul de cercetare se manifest prin
B. Variabile sau scale cantitative =
posibilitatea cercettorului de a controla i
continue = numerice
4. scala interval: presupune existena unei uniformiza condiiile de participare la studiu,
uniti de msur; intervale egale de pe scal astfel nct scorurile obinute s fie
reprezint diferene egale ale proprietilor comparabile;
msurate - un nivel ridicat al controlului ofer studiului
5. scala raport: presupune existena unui punct validitate intern
zero real = punct unde scorul zero indic lipsa - validitatea intern: eventualele diferene
complet a constructului; raportul dintre punctele observate ntre diferitele categorii de
de pe scal reprezint o oglindire a realitii, are
sens; variabilele pot fi participani se datoreaz ntr-adevr
a. discrete: pot avea anumite valori fixe variabilelor incluse n studiu i nu altor
(numere ntregi) sau variabile externe
b. continue: pot fi msurate la orice nivel de ----------------------------------------------------------------------
precizie (vrsta poate fi msurat n ani, luni, zile, ------------
ore, minute, etc. ) 7. Inferena tiinific
- const ntr-o concluzie sau afirmaie verificat
prin intermediul metodei tiinifice

3
6. Inferena statistic b. validitate relativ la coninut: ntrebrile
Testul de semnificaie reprezint o funcie incluse n test/chestionar acoper ntreg domeniul
necesar, dar minor n inferena tiinific. conceptual al constructului;
Prezint dovada existenei unui rezultat care s c. validitatea relativ la construct:
fie interpretat, a faptului c rezultatele obinute - convergena: scorurile instrumentului
sunt reale i nu obinute din ntmplare . Ea propriu se asociaz cu scoruri ale instrumentelor
are loc la final i joac un rol limitat n proiectarea care msoar constructe similare i divergente
cercetrii. sau
- are rolul de a disocia ceea ce poate fi - divergena: scorurile instrumentului nu se
ntmpltor de ceea ce este (foarte probabil) asociaz cu cu scorurile instrumentelor care
sistematic msoar constructe diferite;
d. validitatea relativ la criteriu: scorurile
Validitatea n cazul instrumentelor de instrumentului se asociaz cu comportamente
evaluare psihologic: externe constructului, dar determinate/relaionate
cu acesta; ex: testul de admitere se asociaz cu
a. validitate de aspect: sarcinile unui test de
performana academic ulterioar)
inteligen arat aa cum ar trebui s arate un
test de inteligen;
Fidelitatea msurrii: instrumentul msoar Testarea fidelitii:
CORECT ceea ce-i propune s msoare? Fidelitatea test-retest a unui instrument:
Fiabilitatea datelor: msurtoarea este stabil testat prin aplicarea instrumentului de msurare
i consistent n timp de mai multe ori acelorai subieci;
Acurateea datelor: msura n care Fidelitatea inter-item a unui instrument:
msurtoare este liber de eroare testat prin msurarea n repetate rnduri ale
Eroare poate fi: aceluiai comportament n cadrul unei singuri
a. aleatoare sau nesistematic: gradul erorii evaluri;
variaz n timp => tinde s produc o medie i e
Fidelitatea inter-evaluator a unui
mai puin probabil s produc date neexacte;
este caracterizat de o distribuie n form de instrument: msurarea se face o singur dat,
clopot (distribuie normal) simultan de ctre mai muli evaluatori
b. sistematic sau condiionat: eroare
introdus cu fiecare msurtoare este constant. Cretere fidelitii prin:
Eroarea general poate fi redus prin: a. standardizarea procesului de culegere i
a. identificarea cauzelor i mrimii erorilor administrare a datelor = standardizare
sistematice; procedural;
b. reducerea efectului erorilor aleatoare ( se poate b. formularea clar a instruciunilor i ntrebrilor
face prin nlocuirea valorii individuale (o singur (itemilor);
msurtoare) cu valoarea medie a distribuiei unui
c. antrenarea operatorilor de cercetare;
numr mare de msurtori identice)
d. reducerea erorilor de codare a rspunsurilor.
Construct: o trstur de personalitate, o stare Definiia conceptual: o descriere a
emoional, atitudine, abilitate, etc. care nu poate proceselor interne care formeaz constructul
fi observat direct/nemijlocit deoarece aceasta
reprezint o tendin de comportament (ex: ----------------------------------------------------------------------
agresivitate, extraversiune) sau implic -------------
mecanisme de procesare intern (ex: inteligen, Definiia operaional: totalitatea
stil decizional, stil de nvare); comportamentelor (deschise sau ascunse; overt
- un concept teoretic care nu este vizibil n or covert) prin care constructul devine
realitate prin sine nsui, ci prin elementele msurabil (subiective obiective)
lui componente vizibile
Scorul: valoarea numeric pe care o obinem ca Tipuri de cercetri:
urmare a procesului de msurare, a.. diferenele 1. Cercetri aplicative vs. Cercetri
de scor dintre doi indivizi (dac msurarea a fost fundamentale

4
corect efectuat) s reflecte diferenele 2. Cercetri cantitative (If anything exists, it
cantitative existente ntre trsturile msurate exists in some amount. If it exists in some
ale acelorai doi indivizi amount, it can be measured Thorndike, 1926)
vs.
Orice scor notat cu X = T + e (unde T este Cercetri calitative (fenomenele sunt
scorul msurat i e este eroarea
construite i reconstruite n mod particular de
fiecare subiect sau cercettor cu ocazia fiecrei
testri)
Msurarea: procesul prin care un set de Studii descriptive: au ca obiectiv
caracteristici psihologice, de obicei exprimate sub surprinderea i descrierea cantitativ a unui
forma unui comportament sunt transformate ntr- fenomen;
un set de numere; - pot fi bivariate sau multivariate = atunci
Codarea: datele obinute prin diferite forme de stabilesc relaii ntre fenomenul studiat i alte
investigaie psihologic sunt aduse la o form relaii conexe acestuia (corelri);
numeric; - studiul observaional i de tip Survey sunt
Variabilele brute: rezult descriptive
- fie n mod direct din citirea aparatelor; Studii predictive: sunt intim legate de studii
- fie din nsumarea de puncte (ex: testele creion descriptive;
hrtie) - pe baza relaiile stabilite ntre fenomenul
Grila de observaie: strngerea unor observat i diferite variabile se pot face predicii;
informaii mai mult calitative => frecvenele - scopul: predicia unui comportament viitor;
anumitor rspunsuri, date Studiile explicative: i propun s treac
Protocol: documentul care consemneaz dincolo de simpla descriere, ncercnd s
informaiile obinute i modul de recoltare; neleag relaiile cauzale care duc la apariia
- este o particularitate a variabilei = mulimea de fenomenului;
observaii (date) efective (Variabila poate fi o Studiile aplicative: au ca obiectiv rezolvarea
mulime de observaii poteniale) direct a unei probleme i testarea validitii
protocoalelor de diagnostic i intervenie.
Domeniul de variaie: registrul de valori Teorema limitei centrale: distribuia mediilor
posibile tuturor eantioanelor ce pot fi extrase aleator
vs. dintr-o populaie este de form gaussian
Domeniul de definiie: mulimea de indivizi
susceptibili de a prezenta aceste modaliti
(populaia)
Testul: un gen de experiment standardizat; Distorsiune: un artefact care face ca ceea ce
- pune n eviden diferenele individuale dintre vd la nivelul eantionului s nu fie reprezentativ
oameni i permite evaluarea acestor diferene; pentru populaia din care a fost extras acesta
- msoar doar un eantion de comportament;
- ca mijloc de evaluare a prestaiei sau conduitei
umane se elaboreaz pe baz statistic;
- trebuie s existe un grup de referin care
conduce la stabilirea unui tabel de norme sau
o tipologie.
Studiul observaional: Coeficientul de concordan
- grila de observaie = instrumentul: o list de interevaluatori K (Cohen)
rubrici care ofer cadrul de clasificare a datelor - verific fidelitatea evalurii unui
brute; comportament prin grile de observaie n
- nu este indicat s cuprind mai mult de 10 situaia n care grilele au la baz o scal
categorii,
nominal;
- categoriile trebuie s fie disjuncte i s epuizeze

5
aspectele principale ale fenomenului K = (P - P) / (1 - P)
Eantionarea comportamentului: o P = proporia concordanelor observate dintre
secven de comportament care apare (spontan categoriile celor doi observatori;
sau generat de cercettor) ntr-un anumit context P = numr total de concordane /
(timp i spaiu) la anumii participani numrul total de observaii realizate
(participanii la studiu) P = proporia concordanelor care ar putea
Eantionarea: aprea ntmpltor n cazul rezultatelor date
- secvenelor de timp (sistematic, aleatoare, P = (numrul de observaii realizate de A pt
mixt); comportamentul X / numrul total de observaii) *
- evenimentelor; (numrul de observaii realizate de B pt.
- eantionarea situaiilor: comportamentul este comportamentul X / numrul total de observaiie)
observat n diferite situaii; + (numrul de observaii realizate de A pt.
- eantionarea subiecilor: n situaii complexe, comportamentul Y / numrul total de observaii) *
pot fi mai muli potenial participani; (numrul de observaii realizate de B pt.
Observaia direct: poate fi cu intervenie comportamentul Y / numrul total de observaii)
sau fr intervenie - se folosete matricea concordanelor
vs. - valorile negative indic o concordan inferioar
Observaie indirect (neintruziv, celei ntmpltoare
nonreactiv): studiul urmelor fizice sau studiul - o valoare a lui K 0,7 echivaleaz cu o bun
nregistrrilor din arhive fidelitatea a grilei de observaie

Observaia cu intervenie: observaia Observaia natural (observaie fr


participativ, observaia structurat, intervenie):
experimentul de teren - scopul este surprinderea unor comportamente
vs. aa cum apar ele n contextul lor natural (studiu
Observaia fr intervenie: observaia explorator);
natural - permite validarea observaiilor realizate n
context de laborator (studiu confirmator);
Observaia structurat - sunt singurele metode de cercetare atunci cnd
intervenia nu este permis
a. psihologie cognitiv (studiul Hyman,
Observaia participativ
2009)
b. psihologia dezvoltrii (studiile lui Piaget, a. deschis: reactivitatea subiectului
1965) b. sub acoperire (studiul Rosenhan, 1973)
Avantaje: desfurarea unor experimente n Avantaje: ofer informaii care altfel nu sunt
context natural accesibile
Dezavantaje: lipsa controlului i prezena Dezavantaje: riscul ca participantul s intervin n
posibilelor variabile externe pot duce la derularea evenimentelor (n funcie de mrimea
imposibilitatea generalizrii concluziilor grupului, rolul observatorului, caracterul deghizat
c. psihologia social (studiul Asch, 1951) sau nu al observatorului)
Avantaje: control crescut al situaiei, validitate
intern
Dezavantaje: validitate extern mai redus
Observaia indirect: studiul urmelor fizice Observaia indirect: studiul nregistrrilor
a. analiza urmelor utilizrii (nsemnri pe din arhive:
un text, resturi n deeuri, etc.) a. analiza nregistrrilor curente
b. analiza produselor (obiecte din (fluctuaia de eantionare ntr-o organizaie sau
antichitate, picturi, analiza unui meniu, etc.) domeniu, absenteismul n coal)
Avantaje: informaii care nu pot fi altfel reproduse b. analiza evenimentelor istorice
Dezavantaje: nu este cert validitate msurrii Avantaje: studiul efectelor unor evenimente

6
naturale (ex: dezastre)
Dezavantaje: nregistrarea selectiv,
supravieuirea selectiv a documentelor cresc
riscul descoperirii unor relaii false
nregistrarea comportamentelor: Comprehensive Erori n studiul observaional:
vs. Selective a. efectul observrii asupra subiectului
(reactivitatea, habituarea, desenzibilizarea)
b. problemele etice
c. ateptrile cercettorului
Studiul de tip Survey: un studiu descriptiv Populaia teoretic (statistic): este
care i propune s ofere informaii definit prin criterii de includere i excludere;
referitoare la starea actual sau evoluia unui - definiia trebuie formulat a.. oricine s poat
fenomen, local sau global, ntr-o anumit decide dac un anumit individ face parte din
populaie populaia definit;
- este n continu micare, este o entitate vie ce
nu poate fi cuprins n ntregime
Metoda eantionrii: permite aproximarea Populaia de acces (sampling frame):
ct mai fidel a comportamentului ntregii partea din populaie la care avem acces
populaii (mai exact a mediei sau a tendinei
centrale) doar msurnd un mic eantion din
aceasta.
Populaia: totalitatea indivizilor la care se aplic Cadrul de eantionare: o list a tuturor
concluzia formulat n baza cercetrii; membrilor unei populaii
- stabilirea populaiei reprezint primul pas al
cercetrii; Eantionul reprezentativ: include toate
- modul n care definim populaia (stabilind tipologiile de indivizi care compun populaia, n
criterii de includere i excludere) limiteaz gradul procentul n care acestea sunt prezente n
de generalitate al concluziilor formulate n urma populaie
studiului;
- populaia este dinamic
Selecia probabilistic: criteriile de selecie Eantion distorsionat: apare dac cadrul de
al unui individ sunt fundamentate pe calcul eantionare nu a fost corect ales, metodologia de
probabilistic = estimri ale probabilitii ca un colectare a datelor nu este potrivit, etc.
individ s fie selectat;
Eantionare randomizat simpl (Epsem):
- putem estima probabilitatea de a fi
se face prin atribuirea de probabiliti egale
reprezentativ dpdv al unei variabile;
fiecrei uniti de selecie = fiecare membru al
populaiei are o ans egal s fac parte din
Selecia nonprobabilistic: selecia se face eantion;
pe alte criterii; estimarea probabilitii de a fi - ansa ca eantioanele mici s fie distorsionate
reprezentativ este mult mai dificil sau imposibil este mare; este cu att mai mare pentru
categoriile ale cror frecvene sunt reduse n
populaie
Eantionarea randomizat grupat Eantionare randomizat simpl fr
(clustering): implic selecia eantionului n nlocuire: fiecrui individ i este atribuit un
etape, astfel nct unitile individuale s fie numr i numerele sunt extrase aleator; dac se
grupate n grupuri apropiate geografic (se aleg extrage de dou ori acelai numr, se trece la alt
aleator elevi din cteva coli) numr;
Avantaj: pt un cost fix, produce rezultate mai Eantionare randomizat simpl
bune dect eantionarea randomizat simpl sistematic: fiecrui individ i este atribuit unu
Dezavantaj: pt. o dimensiune fix a eantionului, numr, iar numerele sunt extrase folosind un pas

7
poate suferi de erori majore (ntre indivizii care de extragere i = N/n (unde N este dimensiunea
locuiesc grupai tinde s existe o mai mare populaiei, iar n este dimensiunea eantionului)
asemnare)

Eantionarea randomizat stratificat: Eantionarea cu cote: se specific cote pentru


eantionul este mprit n sub-grupuri separate anumite tipologii de indivizi care trebuie incluse
pe baza unor criterii de stratificare i apoi sunt pentru a reprezenta corect populaia avut n
extrase eantionare din fiecare sub-grup; vedere (poate fi echivalentul stratificrii din
Stratificarea proporionat: se extrage un suportul de curs);
anumit procent de uniti pe baza randomizrii Avantaj: un eantion care seamn cu populaia
simple a.. procentul unui strat din eantion s fie poate fi obinut foarte repede i cu costuri reduse;
identic cu procentul aceluiai strat din populaie Dezavantaj: pot aprea prejudeci (biases) n
Stratificarea disproporionat: pt. a spori selecie care s fac eantionul nereprezentativ
eficiena statistic se pot alege eantioane mai pt. variabilele pt. care nu au fost fixate cote
mari n cazul grupurilor de mici dimensiune;
ulterior acestea sunt ponderate-negativ pentru a
ajunge la procentul corect din populaie
Studiu longitudinal: un singur fenomen este Studiu transversal: un singur fenomen este
studiat pe acelai eantion n momente diferite studiat pe eantioane diferite, care corespund
de timp (un singur eantion de copii este studiat unor momente diferite de timp (exist 3
la 6, 7 i 8 ani); eantioane, unul cu copii de 6, altul de 7 i altul
- sunt afectate de testarea repetat a de 8 ani care sunt studiate o singur dat);
participanilor care pot afecta comportamentul - sunt mai rapide, dar sufer de efecte de
subiecilor i dureaz mult timp cohort: participanii nu difer doar n ceea ce
Studiu cu eantioane independente privete vrsta, ci i experiena de via = nu se
succesive: n primul an este selectat un poate ti dac diferenele se datoreaz vrstei sau
eantion (care include copii de 6, 7 i 8 ani), n experienelor de via diferite.
anul urmtor un al doilea eantion i n al treilea
an, un al treilea eantion similar;
- participanii sunt independeni, alegerea unui
participant ntr-un eantion nu influeneaz
alegerea altor participani n alt eantion
Tendina central a unei distribuii este dat 2. Modul: scorul care apare cel mai frecvent
de: - apare ca bara cea mai nalt din histogram sau
1. Media aritmetic punctul cel mai nalt din poligon;
2. Modul - ntr-o distribuie grupat apare ca un interval;
3. Mediana - o distribuie poate avea dou moduri =
- nici o msur a tendinei centrale nu reprezint bimodal
fidel scorurile dac distribuia conine un nivel Avantaje:
ridicat de variabilitate - n cazul scalelor interval/raport indic dac
distribuia este unimodal sau multimodal
- poate fi folosit pentru orice scal de msurare
Scoruri nedeterminate (timpul de reacie):
- este singura msur a tendinei centrale care
cercettorul nu tie ct i va lua subiectului s
poate fi folosit n cazul scalelor nominale
rspund i
----------------------------------------------------------------------
Scoruri cu final deschis (subiectul poate -------------
alege un rspuns precum 10 sau mai mult); 3. Mediana: este scorul din mijloc
- pot produce o medie care s reprezinte greit
- divide aria poligonului n dou jumti egale,
rezultatele
aria acestuia fiind proporional cu numrul
- mediana are n acest caz un avantaj clar asupra
scorurilor

8
mediei ca msur a tendinei centrale n statistica - nu este sensibil la scoruri extreme
descriptiv - nu poate fi folosit pentru scalele nominale
1. Media (proprieti) Abaterea standard (proprieti):
a. dac o constat este adugat sau sczut din a. dac o constant este adugat sau sczut
fiecare scor al distribuiei, media crete sau scade din fiecare scor al distribuiei, abaterea standard
cu acea constant; nu va fi afectat; media se schimb, dar distana
b. dac un fiecare scor dintr-o distribuie este dintre scoruri rmne constant
nmulit sau mprit cu o constant, media va fi b. dac un fiecare scor dintr-o distribuie este
nmulit sau mprit cu acea constant; nmulit sau mprit cu o constant, abaterea
c. suma abaterilor de la media va fi ntotdeauna standard va fi nmulit sau mprit cu acea
0; constant;
d. suma ptratelor abaterilor de la medie va fi c. abaterea standard fa de medie va fi mai mic
mai mic dect suma ptratelor abaterilor n jurul dect abaterea standard fa de orice alt punct al
oricrui alt punct din distribuie distribuiei.
Msuri ale variabilitii 1. Amplitudinea: diferena dintre valoarea cea
1. Amplitudinea mai mare i cea mai mic a setului de date;
2. Amplitudinea semi-intercvartil - surprinde ntreaga distribuie, fr excepie
3. Abaterea medie - este influenat de valori extreme i tinde s fie
4. Variana neltoare cnd distribuia include cte scoruri
extreme;
5. Abaterea standard
- este determinat doar de dou valori;
- nu poate fi folosit n cazul distribuiilor care
conin scoruri nedeterminate la un capt al setului
de scoruri;
- nu permite analize statistice infereniale
2. Amplitudinea inter-cvartil: jumtate 3. Abaterea medie: distana medie cu care
din diferena dintre scorurile Q3 i Q1; scorurile deviaz fa de medie;
- ofer distana unui scor tipic fa de - se folosesc scorurile absolute (nu se ine cont de
median = jumtate din scorurile din distribuie semnul negativ al scorurilor); rar folosit n
delimitate de intervalul inter-cvartilic vor fi mai statistica avansat.
apropiate de median, iar jumtate se vor afla 4. Variana: media ptratelor valorilor
mai departe; abaterilor medii = media ptratelor abaterilor de
- se bazeaz pe centile; la medie
- se aplic scalelor de msurare ordinale i - este un indicator de arie
numerice; - variana unui eantion se obine mprind suma
- nu este afectat de valori extreme / distribuii ptratelor la N (N = numrul scorurilor); la nivelul
asimetrice; populaiei aceast formul tinde s subestimeze
- se preteaz la situaii open-ended; variana populaiei = bias
- relativ rezistent la fluctuaiile eantionare; - variana la nivelul populaiei suma ptratelor se
mparte la N-1 = unbiased sample variance
---------------------------------------------------------------------- 5. Abaterea standard: radical din varian
------------ - procesul de ridicare la ptrat i de obinere a
Gradele de libertate (df): numrul de mediei d o mai mare greutate scorurilor mari,
abateri care pot varia liber; care nu este ndeprtat prin extragerea
- df = N 1 radicalului;
- este necesar pentru a obine o estimare - nu este niciodat mai mic dect abaterea
nedistorsionat a varianei populaiei medie
- prin extragerea radicalului, aria rezultat n
formula varianei este redusa la un parametru
unidimensional

9
Distribuii asimetrice - asimetria negativ: media se mut spre
- o distribuie este asimetric dac majoritatea minus, media < mediana, jumtate din scoruri
scorurilor sunt concentrare ntr-o singur parte a sunt peste medie;
scalei; - asimetria pozitiv: media se mut spre plus,
- distribuie asimetric negativ = coada media > mediana, jumtate din scoruri sunt sub
poligonului este spre stnga, spre minus; medie;
- distribuie asimetric pozitiv = coada - floor effect: asimetriile pozitive apar cnd
poligonului este spre dreapta, spre plus; exist o limit a valorilor variabilelor la captul
- mediana nu este puternic afectat de asimetria inferior, nu i la captul superior sau cnd
distribuiei, lucru care poate fi un avantaj n majoritatea valorilor sunt grupate la limita
msurarea tendinei centrale; inferioar, nu i la cea superioar;
- dup aflarea medianei, un scor din distribuie - ceiling effect: scorurile sunt grupate lng
poate fi mutat ct se poate mult de aceeai parte limita superior, nu i ctre cea inferioar;
a medianei fr ca aceasta s fie afectat; nu - mediana este preferat cnd floor effect sau
este valabil pt. medie, care este afectat de ceiling effect influeneaz puternic distribuia;
valoare numeric a fiecrui scor din distribuie; - asimetria influeneaz puternic abaterea
- media se mut n direcia cozii distribuiei standard; abaterea medie este afectat mai puin
asimetrice;
Kurtosis: gradul de turtire a curbei distribuiei - msura kurtosis-ului este dat de suma
- distribuia leptokurtic: o concentrare mai abaterilor de la medie ridicate la puterea a 4-a,
mare a scorurilor n mijloc i lipsa scorurilor n mprit la N nmulit cu abaterea standard
umeri = kurtosis pozitiv; ridicat la puterea a 4-a, din care se scade cifra 3
- distribuia platykurtic: are mai multe (pentru a facilita comparaia cu distribuia
scoruri n umeri, o coad subire i un vrf mai normal);
puin abrupt = kurtosis negativ; - este adimensional;
- distribuia mesokurtic = distribuia - are nevoie de cel puin 4 valori pentru a putea fi
normal; definit;
- arat dac eantionul a fost extras dintr-o
populaie normal distribuit (la fel i
skewness).
Skewness (asimetria): este egal cu media Reducerea asimetriei produse de valorile
cuburilor abaterilor de la media distribuiei; extreme sau aberante:
- rezultatul poate fi pozitiv sau negativ, indicnd - Trimming: eliminarea unui procent fix din
un skewness pozitiv sau negativ; valorile extreme sau aberante;
- dac skewness-ul este 0, distribuia este - Winsorizing: nlocuirea unui procent fix din
simetric; scorurile extreme cu cea mai extrem valoare, din
- este adimensional: adunarea, scderea, aceeai direcie, care nu a fost eliminat;
nmulirea sau mprirea la o constant a - Transformarea datelor prin extragerea
scorurilor distribuiei nu l modific; radicalului sau a unui logaritm din toate scorurile
- skewness-ul unui eantion este o estimare distribuiei
distorsionat al populaiei
Standardizarea procedural (are loc n Transformarea liniar: permite compararea a
culegerea datelor) dou grupuri, chiar dac procedurile nu au fost
VS. standard;
Standardizare statistic (are loc dup - permite compararea performantele unui individ
culegerea datelor) = transformarea scorurilor fa de media fiecrui grup din care face parte;
brute n scoruri standard Z = transformare - modific distribuia valorilor, media, tendina
liniar central, valoarea abaterii standard, ns,
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------- - forma distribuiei nu se schimb (ridicarea la
Valori extreme: o valoare care, ntr-o putere reuete s schimbe forma distribuiei; nu

10
distribuie standard, se afl dincolo de 2,5 3 este cazul aici).
cote standard
Scorul Z = ct de mult m abat eu de la medie, Distribuia normal (gussian): este un
fa de ct se abat, n medie, ceilali de la medie model teoretic, matematic convenabil i
SAU rezonabil de precis care aproximeaz foarte
- cu cte abateri standard se deprteaz un bine distribuia multor variabile din realitate,
anumit scor fa de media distribuiei; n general, a variabilelor;
- permite compararea scorurilor care au diferite - fiind un model matematic descrie o infinitate de
uniti de msur (lips de standardizare observaii care sunt pe o scal de msurare
procedural) datorit faptului c, dup continu;
standardizare, toate vor avea aceeai unitate de - n realitate nu exist o infinitate de observaii:
msur = abaterea standard; observaiile sunt discrete =>
- daca Z = 0, scorul meu este egal cu media, a. nici o variabil real nu este distribuit identic
- scorul pozitiv sunt deasupra mediei, cu distribuia normal;
- dac este negativ eu sunt sub medie. b. multe variabile nu sunt distribuite normal.
Proprietile unei distribuii Distribuia normal este definit de o
standardizate (de scoruri Z): ecuaie care descrie nu doar o curb, ci o familie
- media scorurilor Z este 0 (media scorurilor de curbe;
brute este scorul care se afl la 0 abateri - acestea pot avea medii i deviaii standard
standard de medie = de ea nsi), diferite, ns toate curbele distribuite normal sunt:
- abaterea standard i variana vor fi 1 (abaterea a. simetrice (skewness 0);
standard a scorurilor brute este unitatea de b. unimodale i continue,
msur => este unitar = 1), c. mezocurtice (curtozis 0),
- forma distribuiei nu se schimb (folosind o d. au un caracter asimptot (orict departe ne-am
constant, relaii proporionale dintre scoruri duce fa de medie nu am atinge valoarea 0).
rmn la fel). e. aria de sub curba unei distribuii normale este
Ale proprieti: distribuit identic:
- semnul + sau indic dac scorul se afl - 68% la 1 abatere standard,
deasupra sau sub medie; - 95% la 2 abateri standard,
- magnitudinea scorului Z indic distana - 99,7% la 3 abateri standard;
acestuia fa de medie n termeni de deviaii - pt. identificarea unei anumite poziii este nevoie
standard; de o variabil care s nu fie dependent de o
- comparaia a dou distribuii de scoruri medie i o abatere standard particulare =>
standard Z are sens doar dac cele dou au scorul Z
forme similare (n cazul formelor diferite pot fi Distribuia normal aproximeaz bine modul
folosite centilele); n care se comport distribuia mediilor
Scorurile standard normalizate: procesul (eantioanelor selectate ntmpltor);
de transformare modific forma distribuiei, - curba erorilor nesistematice sunt distribuite
rezultnd o distribuie normal; gaussian (au forma, distribuia
Dezavantaje ale scorurilor Z: gaussian/normal).
- scorurile Z au att valori pozitive +, ct i
negative -;
- majoritatea se vor afla ntre 0 i 2 i va fi nevoie
de dou zecimale pentru ca localizarea s fie
suficient de precis;
- cele dou de mai sus pot crea probleme de
comunicare.
Scorurile T sau SAT: Teorema limitei centrale: distribuia
SAT = 100z + 500 / T = 10z + 50 mediilor unui numr infinit eantioane,
- un set complet de scoruri T va avea media 50 i extrase aleator dintr-o populaie i avnd

11
abaterea standard 10 toate aceeai dimensiune, aproximeaz o
Scoruri derivate: coreleaz poziia unui scor form gaussian pe msur ce mrimea
brut fie cu eantioanelor crete, indiferent de forma
a. alte scoruri din aceeai distribuie, fie cu populaiei din care ele sunt extrase;
b. distribuia scorurilor brute obinute de un grup - chiar dac distribuia populaiei este asimetric,
reprezentativ (grupul de control); rectangular, diferit de normal, distribuia
- furnizeaz un cadru standard de referin n mediilor eantioanelor tinde s devin normal;
care nsemntatea unui scor poate fi mai bine - distribuia mediilor permite trecerea de la
neleas. eantion la populaie;
Dou categorii: - cu ct eantioanele sunt mai mari, mediile
A. scoruri derivate care pstreaz relaia eantioanelor sunt mai apropiate de media
proporional a distanelor dintre scoruri dintr-o populaiei;
distribuie (scorurile Z i alte transformri liniare); - fluctuaia de eantionare se reduce pe msur
B. cele care nu fac acest lucru (centilele) ce dimensiunea eantionului crete.
Distribuia mediilor eantioanelor Trecerea de la eantion la populaie: se
- grupurile nu pot fi comparate cu distribuia face pe baza unei distribuii normale,
indivizilor, ci cu distribuia grupurilor de aceeai presupunnd c:
dimensiune; 1. distribuia mediilor eantioanelor
- se folosete media sau ali indicatori ai reflect o distribuie normal la nivelul
tendinei centrale pentru comparaie; populaiei;
- ntre eantioane exist mult mai puin variaiei - dac distribuia nu este normal la nivelul
dect ntre indivizi => este afectat msura n populaiei, sunt de ajutor:
care un grup este considerat neobinuit; a. teorema limitei centrale
- cu ct eantioanele sunt mai mari, cu att
b. dimensiunea eantionului: cu ct eantionul
mediile acestora sunt mai apropiate ntre ele =>
este mai mare, cu att distribuia mediilor
o eroare standard mai mic (eroarea eantioanelor se apropie de una normal =>
standard este echivalentul abaterii standard);
A. dac variabilele sunt distribuite aproape
- eroarea standard este egal cu abaterea normal, se poate presupune c distribuia mediilor
standard a populaiei mprit la radical din eantioanelor este normal chiar i pentru
dimensiunea eantionului eantioanele mici (eroarea este neglijabil);
Cercetarea corelaional B. dac distribuia este mult prea asimetric sau
- este folosit pentru a descrie relaia dintre dou are o form diferit dect cea normal, distribuia
sau mai multe variabile care apar n mod natural: mediilor eantioanelor nu va fi una normal,
- pt. a se determina dac o variabil este legat dect dac dimensiunea eantionului este
de o alt variabil se verific dac scorurile celor suficient de mare (eantioane de 30 40 tind s
dou variabile variaz mpreun;
fie adecvate).
Coeficienii de corelare exprim natura 2. eantioanele sunt alese aleator: dac
relaiilor dintre dou variabile;
dimensiunea eantionului este N, fiecare eantion
- indic gradul n care dou variabile se
posibil de dimensiunea N care ar putea fi format
coreleaz ntr-un mod liniar;
din populaie trebuie s aib aceeai probabilitate
Coeficientul de corelare Pearson (r): este de a fi selectat; acest lucru nseamn:
cea mai folosit msur a corelaiei; msoar A. fiecare individ din populaie trebuie s aib o
doar corelaiile lineare (nu se aplic ans egal de a fi selectat i
corelaiilor curbilinii sau altor forme de corelare); B. fiecare selecie trebuie s fie independent de
- variaz ntre 1.00 i + 1.00; toate celelalte => Eantionare randomizat
- se folosete atunci cnd ambele variabile, x i independent;
y, sunt pe scale de msurare interval sau raport;
- tehnic, eantionarea trebuie fcut cu
- indic semnul i magnitudinea:
nlocuitor (dup ce un subiect a fost selectat,
Semnul corelaiei: + indic o corelare acesta trebuie reintrodus n populaie a.. s

12
pozitiv = o relaie direct, pozitiv ntre cele poat fi selectat mai mult dect o singur dat =
dou variabile, - indic o corelare negativ = a avea ansa de a fi selectat n fiecare eantion);
creterea valorii unei variabile este asociat cu - n realitate, eantionarea se face fr
scderea valorii celeilalte variabile nlocuitor; n cazul grupurilor mari, eroare
introdus de riscul ca acelai individ s nu fie
selectat de dou ori este neglijabil

Magnitudinea corelaiei: este o valoare Reprezentarea grafic a corelaiilor


numeric care ignor semnul i exprim puterea - diagrama de corelaie;
relaiei dintre cele dou variabile; - corelare pozitiv: pant n urcare spre dreapta;
- r = 0 exprim lips unei corelaii liniare ntre - corelare negativ: pant n coborre spre
variabile; dreapta;
- de obicei, r 0,10 reprezint corelaii care - cu ct este mai puternic corelaia, cu att
sunt de magnitudine mic (sunt responsabile scorurile sunt mai apropiate de o linie imaginar
doar pentru 1% din varian), r = n jur de 0,30 care trece printre ele;
reprezint corelaii moderate, iar r 0,50 - n cazul unei corelri perfecte (-1 sau +1), toate
reprezint corelaii puternice scorurile formeaz o linie perfect;

r=
( X X )( Y Y ) - n cazul unei corelri 0, scorurile apar sub forma
n Sx S y unei aezri ntmpltoare de puncte pe toat
suprafaa diagramei;
- exist posibilitatea ca o corelaie 0 s fie de fapt
o corelare curbilinie (nu este acoperit de
r=
Zx Z y coeficientul de corelare r).
n ----------------------------------------------------------------------
Z x Z y = cotele standard ale scorurilor brute z -------------
-
Seminificativitatea statistic a lui r
= (x -m)/s - exist atunci cnd un coeficient de corelare
Coeficientul de determinare: calculat pe un eantion are o probabilitate
- comunic proporia varianei totale ntr-o foarte mic s fie 0 n populaie;
variabil care este corelat cu variana - o corelaie semnificativ statistic exist
sistematic a celeilalte variabile (ex: 6,5% din atunci cnd probabilitatea care aceasta s fie
variana scorurilor pentru variabila X se datoreaz ZERO la nivelul populaiei este suficient de
variabilei Y); mic (de obicei, mai puin de 0,5);
- n msura n care dou variabile sunt corelate,
- factori care afecteaz semnificativiatatea
scorurile uneia dintre ele sunt dependente de
statistic a lui r:
scorurile celeilalte i variana sistematic este
a. mrimea eantionului: cu ct mrimea
prezent;
acestuia este mai mare, cu att o corelaie
- coeficientul de determinare exprim ct la
particular este mai semnificativ;
sut din variana unei variabile se datoreaz
b. magnitudinea corelaiei: pentru o
celei de-a doua variabile; anumit dimensiune a eantionului, cu ct este
- este obinut prin ridicarea la ptrat a mai mare r, cu att este mai puin probabil ca
coeficientului de corelare; acesta s fie 0 n populaie;
- coeficientul de corelare nu se afl pe scal
c. ct de siguri ne dorim s fim c nu
raport; este adus pe scala raport prin ridicarea la
tragem o concluzie greit n ceea ce
ptrat;
privete semnificativitatea statistic a lui r,
- cu ct variana / coeficientul de determinare
respectiv ca acesta s nu fie 0 n populaie;
este mai mare, cu att relaia dintre cele dou
- exist tabele care arat care ar trebui s fie
variabile este mai puternic.
valoarea minim a lui r, n funcie de dimensiunea
Factori care distorsioneaz corelaiile eantionului, pentru ca acesta s fie semnificativ

13
1. amploarea restrns a eantionului: statistic <=> s exist mai puin de 5% anse ca
corelaiile obinute pe un grup relativ corelaia la nivelul populaiei s fie 0;
omogen de participani, cu scoruri care cad - semnificativatea statistic ne spune
ntr-un interval restrns, sunt mai mici dect doar ct de probabil este ca corelaia s fie 0
cele obinute utiliznd eantioane eterogene la nivelul populaiei.
cu o gam variat de scoruri; Corelare i cauzalitate
- este necesar analiza datelor brute pentru a se - corelaia nu implic cauzalitate, nici dac dou
verifica dac scorurile nu sunt artificial restrnse; variabile sunt perfect corelate (r = -1.00 sau +
- problema poate fi mai serioas n cazul 1.00)
variabilelor care sunt corelate curbiliniu, iar Pentru cauzalitate, este necesar s fie ndeplinite
intervalul de scoruri este restrns; 3 criterii:
2. valori aberante = valori aflate la mai mult a. covariaia sau corelarea: dac o variabil
de 3 abateri standard fa de medie; o cauzeaz pe alta, atunci schimbri n ceea ce
- valorile aberante aflate n linie umfl, cresc n privete o variabil ar trebui s fie asociate cu
mod artificial coeficienii de corelare; schimbri n cea de-a doua variabil;
- valori aberante n afara liniei, dezumfl, scad n b. presupusele cauze preced presupusele
mod artificial coeficienii de corelare; efecte n timp;
3. fiabilitatea/fidelitatea msurtorilor: - greu de realizat n studiile corelaionale; de
cu ct sunt mai sczute, cu att este mai mic cele mai multe ori ambele variabile sunt msurate
coeficientul de corelare. n acelai timp;
c. toate efectele strine care ar putea
influena relaia dintre dou variabile sunt
controlate sau eliminate;
- dou variabile pot fi corelate datorit faptului
c ambele sunt legate de o a treia variabil.
Corelaia parial: este corelaia dintre Coeficientul de corelare Spearman: este
dou variabile rezultat din eliminarea folosit atunci cnd una sau ambele variabilele
statistic a uneia sau mai multor variabile sunt msurate pe scale ordinale;
tere (care ar putea influena prima corelaie); Coeficientul phi: este folosit cnd una sau
- se poate concluziona c o posibil explicaie ambele variabile sunt msurate pe scale binare
cauzal a relaiei dintre variabile este mai (ex: sexul, da sau nu);
probabil s fie corect dect alte explicaii Coeficientul de corelare biserial: este
cauzale; folosit atunci cnd o variabil este msurat pe
- folosind corelaia parial se pot testa ipoteze scal binar, iar a doua este pe scal interval sau
privind posibilele efecte produse de o a treia raport.
variabil asupra corelaiilor dintre dou variabile; - o dat calculai, toi coeficienii de mai sus sunt
- dac x este corelat cu y atunci: interpretai precum coeficientul Pearson r.
a. x cauzeaz y ----------------------------------------------------------------------
b. y cauzeaz x -------------
c. z cauzeaz x i y; Covariana = o exprimare nestandardizat a
- dac x i y sunt corelate chiar i atunci cnd gradului de asociere (fr transformarea n scoruri
variana sistemic produs de z este ndeprtat, Z) = modul n care variabilele variaz mpreun,
atunci este improbabil ca z s produc relaia pozitiv sau negativ;
dinte x i y; - covariana crete pe msur ce variabilele
- dac x i y nu se mai coreleaz dup indic o tendin mai mare de a varia mpreun;
ndeprtarea influenei lui z, atunci corelaia
dintre ele este produs de z sau de alte variabile Cov XY =
( x ix )( y i y )
asociate lui z. N1

Corelaia perfect pozitiv: fiecare Variana unei variabile: covariana unei

14
persoan din grup are acelai scor z n cazul variabile cu ea nsi;
ambelor variabile; (xi x )2
Corelaie perfect negativ: fiecare Var =
x
N 1
persoan din grup are acelai scor z n cazul
ambelor variabile, dar de semn contrar.
---------------------------------------------------------------------- Transformarea linear: o transformare care
------------ nu schimb scorurile z = scorurile originale pot fi
Coeficientul de corelare al populaiei adunate, sczute, nmulite i mprite la o
rho ( : coeficientul r al lui Pearson care ar fi constant fr ca acest lucru s schimbe
corelarea perfect existent ntre scorurile
calculat dac o ntreag populaie ar fi msurat;
originale i scorurile transformate;
- poate fi calculat pe baza unui eantion:
- relativa poziie a msurilor celor dou variabile
- este afectat de:
este important, i nu scorurile absolute.
a. amplitudinea restricionat sau
Puterea testului de corelaie
trunchiat: este eantionat doar o mic parte
- ipoteza nul pentru un studiu de corelaie este
din populaie care, de obicei, indic un r mai mic
aproape ntotdeauna 0 = 0 (ipoteza nul
dect n populaie ( ;
- n cazul relaiilor curbilinii, r poate fi nseamn c nu exist nicio corelaie ntre
variabile la nivelul populaiei);
considerabil mai mare dect ( - r descrie mrimea efectului la nivelul populaiei,
b. scorurile extreme (outliers) nu i dac ipoteza nul este sau nu semnificativ
---------------------------------------------------------------------- statistic (nu ne spune i ct de probabil este ca
------------ corelaia s fie de fapt 0 la nivelul pop.)
Transformarea Fisher Z: - este nevoie s transformm a (care este r-ul
- ajut la construirea unui interval de ncredere
pentru corelaie realizat n special cnd rho ( prognozat la nivelul populaiei) n delta ( :
) se apropie de 1; = N1a
- cnd rho ( ) = 0, coeficientul lui Pearson r - pe baza cotaiilor din tabel se afl puterea
formeaz o distribuie simetric n jurul lui 0, care corelaiei;
poate fi aproximat printr-o distribuie normal; - puterea corelaiei poate fi folosit pentru a
determina numrul maxim de subieci care ar
- cu ct rho ( ) se apropie de 1, cu att r
trebui folosit pentru a obine un anumit grad de
nu va fi distribuit simetric n jurul lui rho ( ) putere statistic (se introduce dorit i cel mai
=> ceiling effect deoarece r nu poate fi mai mare a i se extrage N.
mic nivel acceptat al lui
de 1 => o distribuie cu att mai
Utilizarea studiile corelaionale
asimetric cu ct rho ( ) se apropie
1. studiu de tip survey: se estimeaz relaii dintre
de 1; diferite variabile;
- pentru a construi un interval de ncredere pe 2. studiu metodologic: se testeaz indicatorii
baza unei distribuii normale se aplic psihometrici ai instrumentelor de msurare (test
transformarea Fisher Z => r-ul transformat retest, split-half, inter-item, validitatea criteriilor
devine Z: self-report);
3. alte studii: experimental sau cvasi-
Transformarea Fisher Z: experimental
Zr ----------------------------------------------------------------------
- se gsete n tabelul lui Fisher scorul care
-------------
corespunde lui r Strategiile avansate de corelare permit:
- exemplu: dac r = - 0,735 => Zr = - 0,94; se a. dezvoltarea de ecuaii care descriu modul n
care variabilele sunt legate i care permit predicii

15
calculeaz eroarea standard pentru Zr i se privitoare la o variabil pe baza unei sau mai
multor alte variabile (analizele de regresie);
fixeaz intervalul de ncredere (de obicei este b. explorarea direciei probabile de cauzalitate
95%): dintre dou sau mai multe variabile corelate:
1 cross-lagged panel i analiza ecuaiilor
Eroarea Standard (Z r)=
N3 structurale;
c. identificarea dimensiunilor de baz care susin
- la N = 6, Eroarea Standard ( Z r ) = 0,577;
setul de corelaii (analizele factoriale).
pentru Zr = - 0,94 i intervalul de ncredere de ----------------------------------------------------------------------
-------------
95% se tie c limitele intervalului de ncredere Consecina existenei unei corelaii ntre
se afl la 1,96 abateri standard => se
dou variabile: dac se cunoate scorul unei
nmulete 1,96 cu valoarea Erorii Standard Zr variabile, se poate prezice scorul celeilalte
[ 1,96 * 0,577 = 1,13] i se adun/scade la variabile;
- prediciile nu sunt exacte, ns au o mai mare
valoare ei la Zr => - 0.94 1,13 = 0.19 / precizie dect cele fcute prin hazard;
-2.07; Regresia linear
=> avem valorile Zr care formeaz intervalul Scopul: dezvoltarea unei ecuaii de regresie
prin intermediul creia putem prezice un scor pe
pentru care avem o probabilitate de 95 s gsim
baza unuia sau mai multor alte scoruri;
coeficientul r; avem ns nevoie s folosim tabelul - n cazul corelrii liniare a dou variabile => o
transformrilor lui Fisher pentru a aduce valorile
linie poate fi trasat prin scoruri pentru a
lui Zr gsite napoi la coeficieni r (care sunt reprezenta relaia dintre variab.;
ntre 1) => valorile lui r = 0,968 i - 0,188 => - scopul analizei de regresie devine gsirea
putem spune cu o probabilitate de 95% c rho ( ecuaiei pentru linia respectiv care descrie
) se afl n acest interval; cele mai bine tiparul datelor existente;
----------------------------------------------------------------------
- datorit faptul c n acest interval exist i 0, -------------
nu putem exclude ipoteza nul = probabilitatea Regresia multipl: implic folosirea a mai
ca n populaie s nu existe nicio corelaie; acest multor variabile predictor pentru aflarea unei
lucru se datoreaz eantionului foarte mic (N=6) variabile dependente;
Analiza de regresie simpl: implic - n mod obinuit mbuntete acurateea
specificarea modelului = desemnarea prediciei;
rolurilor n analiz: - exist:
Variabila dependent, criteriu, rezultat 1. Regresie multipl standard;
2. Regresie multipl n trepte (stepwise);
= y, variabila pe care dorim s o aflm;
3. Regresie multipl ierarhic
Variabila predictor, examen sau
diagnostic = x, variabila independent, pe care
o cunoatem;
= constanta de regresie, intercept, este
punctul n care linia care reprezint cel mai bine
relaia dintre x i y intersecteaz axa Y (valoarea
pe care o va lua y atunci cnd x este 0)
= coeficientul de regresie, nclinarea liniei
care reprezint cel mai bine relaia dintre x i y
(cu ct crete y atunci cnd x crete cu o unitate)
Y = + x
Regresia multipl n trepte (stepwise): rspunde de mare parte din variabilitatea cu care
variabilele predictor sunt introduse pe rnd; se coreleaz i cea de-a doua, aceasta din urm

16
- prima variabil predictor introdus este cea nu mai este necesar);
care se coreleaz cel mai puternic cu variabila => variabilele sunt introduse n ecuaie pe baza
criteriu; abilitii lor de a se corela cu o varian
- n a doua etap este introdus variabila unic din variabila criteriu;
predictor care contribuie cel mai puternic la - procesul n trepte se oprete atunci cnd:
predicia variabilei criteriu, innd cont de a. au fost introduse n ecuaie toate variabile
faptul c prima variabil se afl deja n (se ntmpl acest lucru dac fiecare dintre
ecuaie; acestea au o contribuie unic la predicia
- a doua variabil nu este obligatoriu s fie a variabilei criteriu);
doua cea mai puternic corelat variabil cu b. variabilele predictor rmase nu pot contribui
variabila criteriu, conform coeficientului de n mod unic la predicia variabilitii din variabila
corelare (dac prima variabil introdus -->> criteriu.;
- modelul stepwise este sensibil la eantionul pe
baza cruia este construit i nu va fi la fel de
puternic pe un alt eantion.
Regresia multipl standard = regresie Regresia multipl ierarhic: variabilele
multipl simultan: toate variabilele predictor predictor sunt introduse n ecuaie ntr-o ordine
sunt introduse n regresie n acelai timp; predeterminat de cercettor, bazat pe ipoteza
- formula va conine o constant de regresie i care se dorete a fi testat;
un coeficient de regresie pentru fiecare variabil - pe msur ce sunt introduse variabilele,
predictor contribuia fiecreia dintre ele la predicia
Y = + X + X + [] variabilei rezultate poate fi evaluat n fiecare
etap = cercettorul poate determina dac
+nx
un anume predictor este responsabil pentru
Corelaia multipl: rspunde la ntrebarea o varian unic n variabila criteriu, influena
Ct de bine x anticipeaz Y? = exprim celorlalte variabile predictor fiind ndeprtat
puterea corelaiei; statistic;
Coeficientul de corelare multipl R: - poate fi folosit pentru a ndeprta efectele
exprim utilitatea unei ecuaii de regresie variabilelor predictor introduse n primele etape
pentru a realiza predicii; pentru a putea vedea dac predictorii introdui
- descrie gradul de corelare dintre variabila ulterior ofer contribuii unice la variabila rezultat;
criteriu y i setul de variabile predictor; - este folosit de obicei pentru:
- variaz de la 0 la 1.00; 1. a elimina variabilele confundate
- un R mai mare reprezint un grad de predicie (datorit faptului c studiul corelaional nu poate
mai ridicat al ecuaiei; controla sau elimina variabilele externe,
- dac este ridicat la ptrat (R), indic variabilele predictor se confund = tind s
acioneze simultan, fcnd dificil separarea
procentul de varian dintr-o variabil criteriu
diferitelor efecte asupra comportamentului);
de care este rspunztor setul de variabile
2. pentru a testa ipotezele mediatoare,
predictor; potrivit crora efectul produs de x asupra lui y
---------------------------------------------------------------------- apare datorit interveniei variabilei z (dac z
------------ mediaz corelarea lui x cu y, atunci introducerea
Evaluare direciei: ofer informaii legate de lui z ar trebui s elimine variabilitatea produs de
plauzibilitatea unei anumite ipoteze cauzale; x asupra lui y; dac variana produs de x
1. Modelul Cross-Lagged Panel rmne, atunci z nu intermediaz relaia dintre x
- corelaia dintre dou variabile este i y).
calculat n dou momente diferite de timp; 2. Modelul ecuaiilor structurale: un mod
- de exemplu: se coreleaz scorurile x mai sofisticat de a testa ipotezele cauzale folosind
nregistrate la Momentul 1 cu scorurile y date corelaionale;
nregistrate la Momentul 2 i se coreleaz - avnd dat tiparul corelaiilor ntr-un set de
scorurile y de la Momentul 1 cu scorurile x de la

17
Momentul 2; dac x produce y, ar trebui ca variabile, anumite explicaii cauzale a
corelarea dintre x la Momentul 1 i y la Momentul relaiilor dintre variabile sunt mai logice sau
2 s fie mai mare dect corelarea dintre y la probabile dect altele;
Momentul 1 i x la Momentul 2; acest lucru se - avnd dat tiparul corelaiilor ntr-un set de
datoreaz datorit faptului c relaia dintre o variabile, anumite relaii cauzale sunt virtual
cauz (variabila x) i efectul acesteia imposibile, n timp ce alte relaii sunt mai
(variabila y) ar trebui s fie mai puternic plauzibile;
dac variabila predictor este msurat - pentru a realiza modelarea ecuaiilor
nainte dect dup ce i produce efectul; structurale, cercettorul face predicii precise
---------------------------------------------------------------------- privitoare la modul n care trei sau mai multe
------------ variabile sunt legate ntre ele;
Analiza factorial: face referire la o clas de - fiecare model presupune variabilele sunt
tehnici statistice folosite pentru a analiza relaiile corelate ntr-un mod particular;
- modelul ecuaiile structurale compar
dintre un numr mare de variabile;
matematic matricea corelaiilor presupus
- are scopul de a identifica dimensiunile sau
de un anumit model ipotetic cu adevrata
factorii care stau la baza tiparelor relaionate matrice corelaional rezultat din datele
observate ntr-un set de variabile; culese;
- ntr-un set mare de variabile se observ c - se urmrete gradul n care modelul presupus se
unele dintre ele se coreleaz puternic, n timp ce potrivete cu matricea rezultat;
altele slab; - analiza ecuaiilor structurale furnizeaz un
- se presupune c aceste tipare de corelare apar index de potrivire (fit index): arat ct de
datorit faptului c variabilele care se bine se potrivesc cele dou elemente;
coreleaz puternic msoar acelai - modelarea variabilei latente (latent
construct, iar cele care se coreleaz slab
variable modeling): sunt folosite multiple
msoar constructe diferite;
msurtori pentru fiecare construct (se presupune
- prezena corelaiilor mai multor variabile
c msurtorilor estimeaz o singur variabil);
sugereaz c variabilele sunt legate de
- analiza cii (path analysis): se folosete o
aspectele unui factor de baz;
singur msurtoare a fiecrui construct.
Analiza factorial: ncearc s identifice Analiza factorial, utilizare:
numrul minim de factori sau dimensiuni 1. pentru a studia structura de baza a
care vor reui rezonabil de bine s explice constructelor psihologice sau a
relaiile observate ntre variabile; experienelor (cte abiliti mentale distincte
- dac toate variabilele se coreleaz puternic exist? care sunt expresiile emoionale primare?);
unele cu celelalte, atunci toate msoar 2. pentru a reduce un numr mare de
aspecte ale aceluiai construct = analiza va variabile la unul mai mic i mai uor de
identifica un singur factor; administrat;
- dac variabilele sunt total necorelate, analiza - de obicei sunt msurate un numr mare de
va identifica atia factori cte variabile exist; variabile tiindu-se c acestea msoar un numr
- soluia unei analize factoriale este prezentat mic de constructe;
ntr-o matrice factorial: intrrile numerice - o dat identificai factorii, proceduri statistice
din matrice sunt ncrcrile factoriale = obinuite pot fi realizate asupra factorilor nii =>
corelaiile variabilelor cu factorii; a. se elimin redundana n analiza mai multor
- ncrcrile factoriale sunt diferite de corelaiile msurtori ai aceluiai construct i b. analizele
dintre variabilele setul iniial de date; sunt de obicei mai puternice i mai fiabile.
- vznd care variabile ncarc un anumit factor, Criteriul celor mai mici ptrate sau al
cercettorii pot identifica natura acestuia; celui mai potrivit (best fit):
- sunt luate n considerare variabilele care - linia care descrie cel mai bine tiparul datelor
ncarc cel puin 0,30 fiecare factor; existente este format din valori estimate pe
----------------------------------------------------------------------

18
------------Regresia lui y pe baza lui x: baza ecuaiei de regresie, care sunt diferite de
z = rz valorile reale;
- z = valoarea scorului standard al lui y; - criteriul celor mai mici ptrate al lui
- r = coeficientul de corelare dintre x i y; Pearson spune c linia cea mai potritiv (best
- z = valoarea scorului standard x pe baza crui fit) minimizeaz ptratele diferenelor
z este estimat; dintre valoarea real i valoarea estimat;
1. pentru toate valorile lui r, ecuaia regresiei Linia regresiei i media:
estimeaz c un caz al mediei lui x va ntlni a. att linia regresiei, ct i media minimizeaz
media lui y pe linia de regresie linia de suma discrepanelor la ptrat i au proprieti
regresie va trece ntotdeauna printr-un analoage, inclusiv rezistena la variaia
punct definit de media lui x i media lui y; eantionului;
2. dac r = 0, estimarea valorii scorului standard b. linia regresiei este un fel de medie, este o
y va fi ntotdeauna 0 dac corelaia este serie de medii:
zero, atunci valoarea estimat a lui y este pentru fiecare valoare a lui x, linia regresiei ne
media lui y indiferent ce valoare a lui x este spune media estimat a lui y dac Ym este
folosit pentru a-l prezice pe y; media tuturor valorilor lui y dintr-un set de scoruri,
y este un estimat al mediei lui y, fiind dat
o anumit valoare a lui x (este un fel de medie
a lui y pt. o anumit valoare a lui x);
Regresia lui y pe baza lui x (formula Eroarea standard a estimatului ( S xy ):
scorurilor brute):
'
Y=r
S
Sx
X r
S
( ) ( )
Sx
X m+Ym S xy =
( Y Y ' )2
n

Y' - valoarea estimat a lui y este doar un estimat al


= scorul brut estimat al lui y
valorii medii a lui y pentru cazurile rezultate dintr-
Sx , S = abaterile standard ale lui x i y o valoarea dat a lui x;
- doar cnd corelaia este unitar (= 1) valorile
Xm, Ym = mediile lui x i y
actuale vor egala regulat i precis valorile
r = coeficientul de corelare dintre x i y
estimate (cnd corelaia este perfect (= 1),
fiecare valoare a lui (y y) este egal cu 0 i,
^y sau y ' = 0 + 1 x
drept urmare, eroarea standard S =0 ;

- S xy este abaterea standard a scorurilor y


Eroarea n estimarea lui y pornind de la
x: obinute n raport cu scorurile y estimate;
- deoarece scorul estimat y este un fel de medie,
iar eroarea standard a estimatului ( S xy ) este un S xy =S y 1r 2
fel de abatere standard, avnd o distribuie
normal bivariat (a lui y), atunci valorile lui y S xy
- variaz de la 0, cnd corelaia este
sunt distribuite sub form gaussian:
68% din valorile reale ale lui y se afl ntre y perfect, la Sy cnd nu exist nici un fel de
1.00 S xy
corelaie;
95% din valorile reale ale lui y se afl ntre y
1.96 S xy
99,7% din valorile reale ale lui y se afl ntre y
3.00 S xy

19
Condiii care privesc estimarea erorii de Eantion aleator/randomizat = un mod de
predicie: eantionare probabilistic;
1. relaia dintre cele dou variabile trebuie s - este un eantion extras ntr-un asemenea mod
fie liniar; nct fiecare eantion posibil de aceeai
- dac nu se ntmpl acest lucru, atunci pentru dimensiune din populaie are anse egale de
majoritatea valorilor lui x, y va subestima sau a fi selectat;
supraestima media scorurilor y brute; - este definit de metoda de selecie i nu de
2. variabilitatea lui y real raportat la y trebuie rezultat;
s fie constant pentru toate valorile lui x; - fiecare element din populaie trebuie s aib o
3. scorurile y reale trebuie s fie distribuite ans egal s fie inclus n eantion;
normal pentru toate valorile lui x; Distribuia mediilor eantioanelor
4. stabilirea erorii n estimarea lui y nu ia n
randomizate
calcul influena variaiei eantionului randomizat, - o distribuie este definit complet de medie,
care extind intervalul n care y real se va regsi
abaterea standard i form =>
(mai puin pentru prediciile fcute pentru valorile
centrale ale lui x i mai mult pentru valorile 1. media ( X ) oricrei distribuii a (tuturor)
distante ale lui x). mediilor eantioanelor randomizate ( denumit
Inferena statistic, obiective: valoarea prognozat a mediei eantionului )
a. obinerea unei concluzii privitoare la un = este aceeai cu media populaiei de scoruri (
parametru al populaiei pe baza unui x )
eantion extras din populaie;
x = x
b. identificarea diferenelor dintre populaii
n ceea ce privete un anumit parametru;
Tipuri de proceduri de inferen: 2. abaterea standard a distribuiei mediilor
1. testarea ipotezelor (ipoteza = o eantioanelor randomizate = eroarea
declaraie privitoare la un parametru din standard a mediei ( x ), depinde abaterea
populaie care poate fi testat i, pe baza
rezultatelor obinute, respins sau acceptat) i standard a populaiei ( x ) i mrimea
2. estimarea; ntrebarea care privete
eantionului n:
estimarea: Ct de aproape este estimarea
noastr de adevrata valoare a parametrului n x
populaie? x =
n
Cheia: aflarea valorilor eantionului care vor
aprea n eantionri repetate i cu ce - eroarea standard a mediei ( x ) este
probabilitate => este nevoie s putem descrie
distribuia eantioanelor;
abaterea standard a distribuiei mediilor ( X )
- pentru a afla care sunt valorilor eantioanelor eantioanelor pe baza eantioanelor de o anumit
care vor aprea i cu ce probabilitate, trebuie mrime;
cunoscute regulile care leag comportamentul - din formula erorii standard a mediilor =>
eantionului de populaie; a. mediile eantioanelor variaz mai puin
- pot fi cunoscute dac exist o metod dect scorurile (cnd mrimea eantionului este
sistematic de extragere a eantioanelor i ea cel puin 2);
este folosit consistent; b. mediile eantioanelor variaz mai puin
- singura regul util = eantionarea atunci cnd scorurile n populaie variaz
probabilistic; mai puin;
Nivelul = nivelul de risc asumat sau nivelul c. mediile eantioanelor variaz mai puin
cnd mrimea eantionului este mai
de eroare asumat (procentul de valori eliminat
din calculul de estimare)
mare;
- distribuia mediilor/abaterilor standard a

20
- de obicei, este acceptat un nivel = 0,05 = eantioanelor este A. o populaie de valori i
B. reprezint toate posibilele medii/abateri
5% standard ale eantioanelor de o anumit
Probabilitatea p = probabilitatea ca ipoteza dimensiune i, drept urmare, reprezint
nul s fie corect populaia (nu doar o parte a ei);
Testul Z pentru un eantion = testul Z - dac forma populaiei scorurilor este distribuit
pentru un eantion larg normal, distribuia mediilor eantioanelor va fi

X distribuit normal, indiferent de mrimea
z= eantionului;
s
N - nu exist doar o distribuie a mediilor
eantioanelor, ci o familie a acestor distribuii, una
- Testul Z pentru un eantion larg, care pentru fiecare dimensiune posibil a eantionului;
implic folosirea lui s atunci cnd este Testul Z pentru un eantion: este bazat pe
necunoscut, este valid doar n cazul unui statisticile unuia sau mai multor eantioane (ex:
eantion suficient de mare (limita inferioar 30 media) i urmrete o distribuie cunoscut (ex:
40 subieci); distribuia normal);
- pt. eantion de 100 sau mai mult este destul de - cu ct este mai mare scorul Z, cu att este mai
precis. mic p;
- scopul: aflare scorului z care corespunde unei - un scor z foarte mare pentru un experiment
medii a eant. particular este foarte rar, doar dac ipoteza nul
se ntmpl s fie adevrat
Ipoteza nul = ipoteza care contrazice Testul Z pentru un eantion:
presupunerea sau ipoteza de la care pornim; - scopul: este obinerea unui scor Z mare,
- dac se dovedete c exist o probabilitate dac este posibil, care ar arta c ipoteza
extrem de redus ca ipoteza nul s fie corect, nul este fals, tocmai pentru c, dac am
avem o dovad indirect c presupunerea de la crede c ipoteza nul este adevrat, am
care am pornit poate fi adevrat;
ajunge la concluzii implauzibile;
- furnizeaz o harta cu rezultatele care au
- scorurile Z mari conduc la valori mici ale lui p,
rezultat sau pot rezulta din ntmplare;
care permit respingerea ipotezei nule, ns nu
Eroarea de Tip I = respingerea ipotezei nule n nseamn c abaterea mediei eantionului este
situaia n care ea este corect ( p = ); suficient pentru a fi important sau interesant.
Eroarea de Tip II = acceptarea ipotezei nule n Testarea ipotezelor cu o singur coad:
situaia n care ea este fals ( p = ); face mai uoar atingerea punctului de
nsemntate statistic n coada avut n vedere;
- evitarea erorilor de Tip I se poate face prin
- ia n calcul ca eroarea s apar doar la un singur
coborrea nivelului ;
capt al distribuiei;
- o coborre prea mare a nivelului poate - elimin posibilitatea de a testa rezultatele i n
cealalt coad;
ns conduce la apariia erorilor de Tip II (= Testarea ipotezelor cu dou cozi: este
ignorarea unor ipoteze adevrate); considerat standard pentru psihologi, datorit
- nivelul = 0,5 reprezint un compromis ntre prevalenei rezultatelor neateptate;
erorile de Tip 1 i erorile de Tip 2 - ia n calcul ca eroarea s apar n ambele
- n testarea ipotezei nule se pornete de la o capete ale distribuiei.
anumit medie a populaiei, care este cunoscut,
i se ncearc a se afla care medii a eantioanelor
sunt probabile, drept urmare, se afl distribuia
mediilor eantioanelor cea mai potrivit i se
centreaz pe media populaiei
Media Variana Dimensiun Abaterea Abaterea

21
ea standard standard
unbiased
Eantion m, x , S2 n (N) s s

X
Populaie Mx , 2 N

Eroarea standard a mediei = x Estimatul erorii standard a mediei = s x

Testul T pentru un eantion: Distribuia t: se aseamn unei distribuii


- se folosete atunci cnd: normale (are form de clopot, este simetric,
a. eantionul este foarte mic (de obicei, asimptot i are media 0);
sub 40); - la eantioane de mici dimensiuni, s poate
b. avem media unei populaii, dar nu i fluctua destul de mult fa de i nu mai
abaterea medie;
reprezint o constant; acest lucru face ca
c. se estimeaz o medie, pe baza unei predicii
distribuia z s nu mai urmreasc o distribuie
teoretice, iar probabilitatea ei este testat pe
normal la valori mici ale lui n;
baza unui experiment cu un eantion;
- exist o distribuie t diferit pentru
d. subiecii din dou grupuri sunt grupai cte doi
dimensiune a eantionului => spunem c exist o
potrivit unui anumit raionament care este
familie de distribuii t;
relevant pentru variabila msurat; ceea ce ar fi
- distincia dintre distribuiile t se face pe baza
un test t pentru dou grupuri devine test t pentru
gradelor de libertate (df)
un grup (mperecheat) pentru a afla scorurile
df =N 1
diferite pentru fiecare pereche.
- pe msur ce gradele de libertate cresc, coada
distribuiei t se subiaz i valorile t critice
(extreme) devin mai mici
Creterea eantionului ajut la obinerea Valorile critice ale distribuiei t:
semnificativitii (claritii) statistice prin: - cresc pe msur ce nivelul alpha ( scade;
a. un eantion mai mare nseamn mai multe
- descresc pe msur ce gradele de libertate (df)
grade de libertate df i o valoarea critic
cresc;
mai mic a lui t;
- atunci cnd gradele de libertate ajung la valori
b. tinde s conduc la creterea lui t i maxime, valorile critice t devin asemeni valorilor
z. critice z, datorit faptului c distribuia t ia
forma unei distribuii normale;
Estimare punctual: folosirea mediei Estimare punctual:
eantionului pentru a estima media populaiei = - un eantion mai mare ofer mai mult ncredere
se sugereaz un singur -->>
numr/punct care se ateapt s corespund
mediei -->> populaiei;
Estimarea interval <=> interval de Calcularea intervalului de ncredere (CI)
ncredere: pentru media populaiei:
- o cale mai informativ de estimare a mediei 1. selectarea dimensiunii eantionului:
populaiei; cu ct este mai mare eantionul, cu att este mai
- n mod obinuit este construit prin amplasarea redus intervalul de ncredere;
estimrii punctuale n mijloc i marcarea aceleiai - dac eantionul ar fi ntreaga populaie,
distane la stnga i la dreapta; intervalul de ncredere s-ar reduce la un singur
- alegerea distanei depinde de ct de mult punct: media eantionului ar fi n acest caz egal

22
ncredere dorim s avem n estimarea noastr; cu media populaiei;
- dup construcia unui interval de ncredere de 2. selectarea nivelului de ncredere:
95% putem fi 95% siguri c media se va afla n nivelul de ncredere trebuie determinat pentru
intervalul specificat (n condiiile n care estimarea intervalului;
premisele de baz au fost respectate); - de obicei se alege un nivel de ncredere de 95%,
- o eroare de 5% este considerat tolerabil; iar pe baza lui se estimeaz intervalul de
- un interval de ncredere de 99% este mult prea ncredere;
mare i identific probabilitatea localizrii mediei - este analog alegerii alpha pentru testarea
populaiei mult prea puin precis. ipotezei nule;
---------------------------------------------------------------------- 3. selectare eantionului randomizat i
------------ colectarea datelor: intervalul de ncredere
depinde de msura n care eantionul este cu
Intervalele de ncredere pot fi reduse i adevrat randomizat;
astfel deveni mai precise prin: 4. calcularea limitelor intervalului: se
1. modificarea nivelului de ncredere (nu este de pornete de la o medie a eantionului i se
dorit)
ncearc a se afla care este media populaiei
2. creterea dimensiunii eantionului N => are
care ar putea produce media eantionului i care
ca efect reducerea lui s x ; nu;
- cretere lui N cu un factor conduce la - se ia o distribuie normal i se centreaz pe
media eantionului, care este punctul estimat
mprirea lui s la radical din acel factor =>
pentru media populaiei: cu ct media posibil a
intervalul de ncredere este redus cu radical din
populaiei este mai aproape de media
factorul respectiv;
eantionului, cu att e mai probabil ca media
- se poate merge i n sens invers: se specific
eantionului s fie media populaiei;
mrimea intervalului de ncredere dorit i apoi se
- pentru 95% din scorurile normal distribuite, z =
afl mrimea minim a eantionului N;
1,96;
Condiii care stau la baza testului t i a - ntruct scorurile z pentru intervalul de
intervalelor de ncredere: ncredere (ex: 95%) sunt cunoscute, ele pot fi
a. eantionarea randomizat convertite n scoruri brute, oferind limitele n care
b. distribuia normal: lipsa ei devine o problem media eantionului ar putea s fie aceeai cu
n special pentru eantioanele mici (sub N = 100); media populaiei sau, altfel spus, limitele ntre
c. abaterea standard a populaiei eantionate care s-ar putea afla media populaiei (cu un
este egal cu cea a populaiei comparate; procent de ncredere de 95%); limitele se afl la 2
d. folosirea de intervale de ncredere pentru abateri standard de o parte i de alta a mediei;
media populaiei - un interval de ncredere mai mare (ex: 99%)
solicit scoruri z mai mari => intervale de
ncredere mai mari.
Studii descriptive: Studiile predictive: pot fi
1. univariate: descriu populaia din perspectiva a. explorative: nu presupunea cunoaterea
unei singure variabile = spun ceva din distribuia mecanismelor cauzale;
n populaie a unei singure variabile; - pot fi parte a studiilor bivariate i multivariate;
- scoruri extreme (outliers) = cele aflate la 2,5 b. explicative: presupunea asumarea unor
- 3 abateri standard fa de medie; mecanisme cauzale teoretice;
2. bivariate: descriu populaia din perspectiva a - ambele folosesc analiza de regresie, care poate
dou variabile = spun ceva despre relaia dintre fi:
dou variabile la nivelul populaiei; 1. simpl: liniar sau non-liniar
- scoruri extreme (outliers) = valorile 2. multipl: liniar sau non-liniar;
variabilelor luate separat pot fi mai mici de 2,5 ----------------------------------------------------------------------
3 abateri standard, dar combinaia, corelarea -------------
dintre ele s fie n extrema distribuiei bivariate;
Etapele studiului predictiv:

23
3. multivariate: descriu populaia din 1. Elaborarea unui model de predicie pe baza
perspectiva a mai multor variabile = vorbesc analizei de regresie;
despre relaiile complexe dintre variabile. 2. Verificarea generalitii modelului;
3. Utilizarea modelului n scop predictiv.
Analiza de regresie simpl R = coeficient de corelaia
^y = 0 + 1 x R = coeficient de determinare
1 - R = coeficient de alienare
^y = variabila dependent, criteriu; ----------------------------------------------------------------------
x -------------
= variabila independent, predictor;
Homoscedasticitate: variana n jurul unei linii
0 = constanta de regresie, intercept, este de regresie este la fel n fiecare punct al liniei =
putem calcula variana lui Y pentru orice valoare
punctul n care linia care reprezint cel mai bine
particular a lui X i vom gsi acelai grad de
relaia dintre x i y intersecteaz axa Y
mprtiere, indiferent ce valoare a lui X alegem;
(valoarea pe care o va lua y atunci cnd x este 0);
- justific folosirea aceleiai valori a varianei
1 = B yx = coeficientul de regresie, estimatului ca marj de eroare, indiferent la ce
nclinarea liniei care reprezint cel mai bine parte a liniei de regresie ne uitm;
relaia dintre x i y (cu ct crete y atunci cnd x vs.
crete cu o unitate); Heteroscedasticitate: variabilitatea unei
0= y 1 x variabile este inegal de-a lungul liniei de regresie

sd y
1=r yx (formula din curs)
sd x
Analiza de regresie simpl Condiii pentru regresia linear:
- pentru o corelaie linear perfect, scorul 1. eantionare randomizat
z prezis pentru y este acelai cu scorul z al lui x; independent: fiecare subiect va fi selectat
pentru o corelaie linear perfect negativ, scorul independent de ceilali i va avea o ans egal
z prezis pentru y este acelai cu scorul z al lui x, pentru a fi selectat;
ca magnitudine, dar de semn contrar; 2. linearitatea: rezultatele ar fi neltoare
- dac o corelaie nu este perfect, scorul z dac corelaia ar fi curbilinie;
prezis pentru y este de r ori scorul z al lui x; dac 3. distribuia normal: la fiecare valoare
r = 0, predicia lui y este ntotdeauna media lui y, posibil a lui X, Y trebuie s urmeze o distribuie
indiferent de valoarea lui x; normal;
- pentru regresia n scoruri z, panta este r, 4. Homeoscedasticitatea
iar interceptul lui y este ntotdeauna 0; Eroarea standard a estimatului ( S xy )
- pentru scoruri brute, panta ( 1 este de r unbiased (permite trecerea de la eantion la
ori raportul dintre cele dou abateri standard (pt. populaie):
y i pt. x);
- pentru scoruri brute, punctul de
intercepie ( 0 este media lui y minus
S xy =
( Y Y ' )2
N2
sau
media lui x nmulit cu panta;
- interceptul lui y nu are ntotdeauna sens;
- variana estimatului ( est y = variana
2
S xy =S y
N1
N2
(1r 2)

- arat ct de mprtiate sunt scorurile fa de


rezidual = variana n jurul liniei de regresie;
linia de regresie (2/3 dintre scoruri ar trebui s se
afle la o abatere standard deasupra sau

24
2est y =0 , iar dedesubtul liniei)
- cnd corelaia este perfect
predicia nu implic nicio eroare;
- cnd r = 0, 2est y = 2y , unde 2y este
variana total a scorurilor y;
- variana total poate fi mprit n:
a. varian neexplicat = variana
estimatului i
b. variana explicat;
- coeficientul de determinare (r) este
proporia varianei explicate raportat la variana
total
- coeficientul de nondeterminare (k): este
proporia varianei neexplicate (a estimatului)
raportat variana total;
k = 1 - r

25

S-ar putea să vă placă și