Sunteți pe pagina 1din 5

Variabilă= o caracteristică

Variantă = valoare
Frecvenţa absolută = nr de unităţi la care se înregistrează aceeaşi variantă (3 studenţi au nota 10)
Frecvenţa relativă = procentul frecvenţei absolute din totalul frecvenţelor (3 din 12 au nota 10,
deci 25%)

Variabile cantitative/numerice (ex vârsta 4 ani)


calitative (ex. vârsta tânăr)

Cuantificare: transformare caracteristici în unităţi măsurabile

Scale:
 pentru variabile calitative:
Nominală= doar diferenţiere calitativă, clasificare după o caracteristică sau un
atribut, apartenenţa la o categorie (elev/student? Masculin/feminin...nu poate fi decât în una din
categorii, nu poţi spune că m e mai mult decât f, e calitativ, nu cantitativ. Temperament:
introvertit, extravertit, ambivert)
Ordinală= tot pt variabile calitative, între categorii existând o relaţie de ordine;
scală de ordine, de rang, de ierarhie (de ex de la mic la mare sau nemulţumit/mulţumit/foarte
mulţumit). Exprimă ordinea preferinţei şi nu intensitatea preferinţei, nu spune nimic despre
distanţa cantitativă dintre valorile ordonate.
 pentru variabile cantitative (scări metrice/numerice):
De interval= Aduce în plus faţă de scala ordinală precizarea distanţei dintre
ranguri (Intervale egale). Este absentă valoarea zero absolut. Dacă ieri au fost 5° şi azi sunt 10°,
poţi spune că azi sunt cu 5 mai multe ca ieri, dar nu că azi e de 2 ori mai cald ca ieri.
De raport= sau scala de proporţii, sau scala de interval cu origine raţională. Cel
mai înalt grad de măsurare. Are intervale egale şi în plus raportarea la zero absolut, deci permite
aprecierea raportului dintre două valori.
Se foloseşte mai degrabă termenul scală interval-raport.

Proprietăţile scalelor: diferenţă/mărime / intervale egale /zero absolut

Variabila independentă= influenţatoare, manipulată, condiţia, contextul predictori


Dependentă= înfluenţată

Ex. VI fumat VD rezultatul la teste de labilitate emoţională (studiu starea


emoţională e inflruanţată de fumat)
VI sex VD nr ţigări (studiu frecvenţa fumatului în funcţie de sex)
Ex beau cafea, sunt mai optimisti/atenţi/mai puţin anxioşi

Statistica Parametrică = testează variabile cantitative (VD e de tip interval-raport)


Neparametrică = testează variabile calitative (VD nominale sau ordinale)

Statistica Descriptivă = prezintă datele în formă numerică sau grafică. Datele statistice sunt
observate direct.
(Inductivă) Inferenţială = aplică proceduri de decizie cu privire la adevărul unei
ipoteze (se verifică ipoteze de cercetare prin verificarea ipotezelor statistice), generalizarea
rezultatelor dincolo de eşantionul pe care au fost recoltate. Datele statistice sunt observate
indirect.

Studii Experimentale = evidenţiază relaţii de tip cauzal între variabile (se măsoară VI, dar se şi
manipulează)
Observaţionale = evidenţiază relaţii între variabile, dar nu permit concluzii de tip cauzal;
VI şi VD sunt măsurate în condiţii care nu permit concluzii de tip cauzal

Ex. Studiu corelaţional: măsurăm precizia unor trăgători la ţintă, un grup a făcut relaxare înainte,
altul nu. Putem stabili că există o legătură între relaxare şi precizie, dar nu că relaxarea determină
creşterea preciziei.

Statistica descriptivă:
- organizarea şi prezentarea datelor:
- numerice (frecvenţa)
- grafice (histograma)
- indicatori numerici:
- indicatori ai tendinţei centrale (medie, mediana, mod) ce au în
comun valorile unei distribuţii, prin ce se aseamănă BOXPLOT
- indicatori sintetici ai împrăştierii, variaţiei (abatere standard,
amplitudine...) prin ce diferă valorile, cum se îndepărtează de
„tendinţa centrală”, indicatori de dispersie
- indicatori ai distribuţiei (simetrie, boltire), ai formei dispersiei

Medie (m pt. eşantion, µ pt. toată populaţia) - se adună valorile şi se împart la numărul lor;
media abaterii valorilor de la medie este egală cu zero (o să dea de ex +4,5-4,5).
Mediana – e cea mai reprezentativă valoare pentru distribuţii asimetrice
Abaterea medie – media abaterilor individuale (în valoare absolută)
Dispersia- sau varianţa sau abatere medie pătratică (S2 pt. eşantion, σ2 pt. toată populaţia) este
media abaterilor individuale pătratice (ridicate la pătrat).
Abaterea standard - (S pt. eşan3tion, σ pt. toată populaţia), este radical din dispersie. Cea mai
utilă pentru scale de măsurare interval/raport.

Coeficient de variaţie (doar pt scale raport)= raport între abaterea standard şi abaterea medie.
Împrăştiere crescută, reprezentativitate scăzută (omogenitate?). CV<15% - împrăştierea e mică,
deci media este reprezentativă. CV 15-30% - împrăştierea este mijlocie şi media este suficient de
reprezentativă. CV>30% - împrăştierea este mare şi media are reprezentativitate redusă. CV se
calculează înainte de proceduri infereţiale (verifică dacă media este legitimă).

Distribuţie normală: are formă de clopot, cele mai multe valori se concentrează în zona medie,
este perfect simetrică pe ambele laturi ale sale, linia curbei se apropie la infinit de axa orizotală
fără să o atingă, de fiecare parte a mediei se află jumătate din valorile distribuţiei.

A testa o ipoteză statistică înseamnă a emite concluzii asupra unei populaţii pe baza rezultatelor
obţinute pe un eşantion care aparţine acelei populaţii. Paşi:
- formularea problemei cercetării (sub forma unei întrebări, cu referire la acea populaţie)
- emiterea unei ipoteze cu privire la cel mai probabil răspuns
- selectarea unui eşantion
- aplicarea unei proceduri care să permită acceptarea sau respingerea ipotezei.
Eşantionul trebuie să fie constituit din „unităţi de informaţie” independente unele de
altele.

Nr de accidente, anxietate

Ex. Elevii la olimpiade au un qi superior celorlalţi elevi. Ipoteza: elevii participanţi la olimpiade
sunt mai inteligenţi decât toţi elevii în general? Selectează un eşantion de 30 olimpici, aplică test
de inteligenţă generală (ex iese 106, faţă de 100 cât e media). Pt a putea decide cu privire la
ipoteza „olimpicii sunt mai inteligenţi decât elevii în general”, trebuie evaluată posibilitatea ca
media eşantionului să fie rezultatul hazardului de eşantionare. Pt aceasta trebuie dovedit că
media eşantionului de olimpici este mai mare decât a unui eşantion extras la întâmplare din
populaţia generală. Se lansează ipoteza de nul; dacă aceasta este respinsă, atunci se consideră
dovada indirectă a validităţii ipotezei cercetării. Ex. Olimpicii nu au o inteligenţă mai ridicată
decât..., aceasta însemnând că mediile (eşantionului de olimpici şi ale celorlalţi elevi- 106 şi 100)
sunt egale. Dacă media eşantionului ar fi fost 100, atunci ipoteza ar fi fost respinsă. Se calculează
nivelul alfa, adică scorul critic de la care se poate considera că diferenţa este semnificativă (sau
se consultă direct probabilitatea p asociată valorii calculate). Alfa maxim 0,05
...nu acceptarea ipotezei de nul, ci eşecul respingerii ei...

Ex: trăgători la ţintă, 6 cu antrenament autogen înainte, 6 fără.


Problema cercetării: are antrenamentul autogen efect asupra tragerii cu arcul? Ip: gr. 1 adună
mai multe puncte ca gr.2 Ip de nul: nr de puncte la gr. 1 nu este mai mare decât la gr. 2.
Sau bilateral: performaţa sportivă este diferită la cei care practică antrenament autugen faţă de
cei care nu practică, cu Ipoteza de nul: Performanţa nu diferă semnificativ în funcţie de
practicarea antrenamentului autogen.

PEARSON: gradul de asociere dintre două variabile, măsurate pe acelaşi grup de subiecţi:
(Nr de ore de studiu la statistică şi nota la examen, frecvenţa pulsului şoferului şi viteza maşiii,
greutate şi înălţime, timpul de reacţie şi nivelul extraversiunii). Câte 2 variabile, dependente una
în raport cu alta, existând o concordanţă în variaţia lor reciprocă, evidenţiată prin „coeficientul de
corelaţie”. La nivel statistic, corelaţia exprimă o legătură cantitativă sistematică între valorile a
două variabile perechi, măsurate pe subiecţi aparţinând aceluiaşi eşantion de cercetare.
Coeficient de corelaţie (Pearson) = r, maxim 1, minim-1 . Valoarea calculată e mai mare sau
egală cu r tabelar (critic) atunci ipoteza de nul se respinge, coeficientul de corelaţie fiind
semnificativ. Grafic Scatterplot

Coeficient de corelaţie la nivelul populaţiei=ro, coeficient de corelaţie pe eşantion=r

 Testul t pentru eşantioane dependente se foloseşte atunci când măsurăm o anumită


variabilă în 2 situaţii diferite (ex. înainte/după), ceea ce presupune aceeaşi unitate de măsură. Se
foloseşte pentru a evidenţia diferenţa dintre valorile medii ale variabilelor.
 Coeficientul de corelaţie poate fi aplicat atât pentru variabile măsurate cu aceeaşi unitate
de măsură, cât şi pentru variabile exprimate în unităţi de măsură diferite. Se foloseşte pentru a
evidenţia intensitatea variaţiei concomitente a variabilelor.
Testele statistice verifică ipoteza de cercetare prin testarea ipotezei adevărului ipotezei de nul
(statistice).

ANOVA – minim 3 grupuri se compară prin raportare la o variabilă numerică. Se compară


mediile, dar nu direct, ci prin compararea dispersiilor. Se foloseşte distribuţia pentru date
numerice (Fisher): are origine în 0 (nu are valori negative), e asimptotică spre infinit la axa OX,
are asimetrie pozitivă şi cele mai multe valori fiind mici, forma sa depinde de 2 grade de
libertate. Grupurile pot fi eşantioane dependente sau independente de valori. VD este variabila
numerică, deci ANOVA este test parametric.
ANOVA simplă: La ANOVA one way e o singură VI.
- VD măsurată pe scală interval (nivelul anxietăţii)- raport, VI categorială (cu 3 sau mai
multe valori ale acesteia- niveluri ale factorului- 3 categorii de fumători: 0-10 ţigări/zi,
10-20, peste 20) sau alt ex: scorul la testul de statistică al studenţilor la ppsighologie
absolvenţi de liceu teoretic/uman/vocaţional
- Eşantioanele comparate sunt independente
- VD e normal distribuită la nivelul fiecărui eşantion
- La nivelul grupurilor comparate, dispersiile sunt egale.
- Grupurile au minim 30 subiecţi
ANOVA detectează doar dacă există o diferenţă, fără a preciza sensul acestei diferenţe.

ANOVA multifactorială:
- avem o singură VD (nivelul anxietăţii) şi cel puţin 2 VI (nr de ţigări fumate şi genul m/f)
fiecare cu cel puţin 2 valori măsurate pe o scară categorială (nominală sau ordinală); aici
problema e dacă intensitatea fumatului şi genul luate împreună au o relaţie cu nivelul
anxietăţii. Sau note la statistică cu profil liceu şi gen m/f luate împreună.

Ex: Analizăm mediile a 3 gr de sportivi antrenaţi cu metode diferite. Ipoteza: fiecărui grup îi
corespunde un nivel diferit de performanţă. Ipoteza de nul: între cele 3 grupuri nu sunt diferenţe
de performanţă semnificative. Se calculează dispersia performanţelor la nivelul tuturor –media
dispersiei grupurilor (grup de nul- dispersia intragrup – se face medie între dispersia la gr 1,2 şi
3) şi dispersia mediilor la nivelul fieărui grup, dispersia mediilor celor 3 eşantioane pentru a
estima dispersia populaţiei totale (dispersia intergrup). Se face raport F (inter/intra), care se
raportează la o distribuţie teoretică şi se vede dacă e mare sau mic. Dacă e mare raportul,
înseamnă că împrăştierea mediilor grupurilor comparate este mai mare, deci diferenţa lor este
diferită de una întâmplătoare, deci poate fi semnificativă, deci sunt 3 grupuri diferite; dacă e mic
înseamnă că e acelaşi grup (de nul), deci nu sunt diferenţe semnificative între grupuri.
Ambele sunt estimări ale varianţei populaţiei de nul. Varianţa intragrup o estimează direct
(media varianţelor), varianţa intergrup o măsoară indirect (varianţa mediilor).

Varianţa intergrup e dispersia mediilor pe cele 3 grupuri, este acea parte a varianţei VD
care poate fi pusă pe seama influenţei VI, este varianţa explicată de VI
Varianţa intragrup este media dispersiilor valorilor individuale la ivelul fiecărui grup.
Mărimea sa indică influenţa hazardului de eşantionare (erorii) asupra variaţiei VD.
Dispersia intragrup arată cît variază, în medie, scorurile din interiorul fiecărui grup
(media dispersiilor pe grupuri individuale). Dispersia intergrup arată cît de mult diferă grupurile
între ele (cu cît se abat, în medie, mediile individuale de la media globală).

Valoarea lui F nu este semnificativă în sine (arată doar de câte ori este cuprinsă dispersia
intragrup în dispersia intergrup). Pentru a decide dacă raportul este „mai mare” sau „mai mic”
trebuie să calculăm un indice al mărimii efectului (similari coeficientului de corelaţie). Cohen-
indice f pt ANOVA. Un indice scăzut al mărimii efectului arată o slabă relaţie între VI şi VD, dar
aceasta poate fi suficient de semnificativă. Doar dacă se obţine un rezultat semnificativ pentru
testul F se fac teste post –hoc. F arată diferenţa semnificativă între mediile mai multor
grupuri, chiar dacă aceste medii nu diferă semnificativ între ele? Mai multe grupuri
independente?

Condiţii pt ANOVA:
- independenţa eşantioanelor
- normalitatea distribuţiei de eşantionare
- absenţa valorilor extreme
- egalitatea varianţei grupurilor comparate

Ex. Seria 5 8 3 2 5 4 se ordonează crescător 2 3 4 5 5 8 şi se face mediana (în mijloc sunt 4 şi


5, media lor e 4,5). Dacă era 3 4 5 5 8, mediana era valoarea din mijloc, 5. Mediana e percentila
50 (50% din valori sunt deasupra medianei, 50% sunt dedesubt).

Indicatorii sintetici (spre deosebire de indicatorii elementari) surprind împrăştierea unei


distribuţii prin luarea în considerare a abaterii unei singure valori de la un anumit indicator al
tendinţei centrale (cel mai uzual indicator de referinţă pentru împrăştiere este media).