Sunteți pe pagina 1din 28

CAPITOLUL UNU: TEORIE SI CHESTII GENERALE

1) Probabilitati
-1 insemna ca se intampla mereu
-0 inseamna ca nu se poate intampla
-probabilitatile se afla intre 1 si 0
Avem urmatoarele notiuni:
-Experienta= de ex. Aruncarea monedei in general, sau aruncarea zarului in general
-Proba= de ex partea monedei cu fata, sau fata zarului cu cifra6
-Eventimentul=orice situatie care este posibil sa apara in urma unei experiente
-de ex situatia in care aruncam zarul si cade cu fata6 in sus
-evenimentul elementar este cel care implica o singura proba(de exemplu sa cada fata 6)
-evenimentul compus este cel care implica mai multe probe(de exemplu sa pice fata 3 si
fata 5)
-evenimentul cert este cel care apare intotdeauna, adica are o probabilitate de 1
-evenimentul imposibil este cel care nu apare niciodata, adica are o probabilitate de 0
-evenimentul contrar al evenimentului A, este evenimentul care se intampla atunci cand
nu se produce A. de ex: ev contrar al situatiei in care pica capul monedei,
este situatia in care pica banul monedei
-probabilitatea unui eveniment este si egala cu: 1-proabilitatea evenimentului sau contrar
-Probabilitatea ca un evenimet sa se intample este numarul de cazuri in care se intampla
acel lucru raportat(impartit) la numarul de cazuri in care se poate intampla orice
eveniment:

-probabilitatea ca doua evenimente sa se intample(si unul si altul) este egala cu


probabilitatea primului eveniment inmultita cu probabilitatea celui deal doilea eveniment
-proabilitatea sa se intample un eveniment sau sa se intample alt eveniment, este egala cu
probabilitatea primuia adunata cu probabilitatea celui de-al doilea
-cu alte cuvinte:
-cand e SI SI, se inmultesc probabilitatile

-cand e SAU SAU, se aduna probabilitatile

2)Cercetarea
De ce naiba s-au apucat oamenii de stiinta? Pt ca aveau nevoie de cunostinte pe
care sa le poata folosi in mod practic pentru a trai(bine). Pentru a putea folosi ceva in
mod practic, trebuie sa fie util, adica sa aiba cineva nevoie de chestia aia, sa fie
sigur(cert), si sa fie util in vitor, pentru ca oamenii traiesc prezent, si vor trai in vitor, dar
in trecut cu siguranta nu se mai modifica nimic.
-

de obicei se desfasoara in etapele: observaia, stabilirea ipotezelor,


experimentarea propriu-zis i analiza/interpretarea datelor
nu este neaparat sa urmeze fazele respective
datele se pot verifica prin facerea de predictii: daca se adeveresc
inseamna ca e corect, daca nu atunci mai trebuie lucrat
datele se pot verifica si prin alte date(adica repetarea experimentului)
o ipoteza trebuie sa fie falsificabila, adica trebuie sa se poata demonstra
ca e adevarata sau falsa
programele de cercetare trebuie sa gaseasca legitati(pe baza carora se pot
face predictii), si nu sa descrie pur si simplu faptele
cand un program de cercetare(paradigma) nu mai poate explica un lucru,
apare o criza, si in final va aparea o alta paradigma care poate
explica si acel lucru
-sau se modifica paradigma

De ce e nevoie sa verificam datele(resp. rezultatele cercetarii)?


-ca sa ne putem increde in ele si sa putem opera cu ele
De ce trebuie sa fie falsificabil?
-pentru ca daca nu poti stii daca e adevarat sau fals ceea ce propui(ipoteza), atunci
nu are utilitate practica.diferenta dintre un fapt stintific si o credinta e ca
poti demonstra ca faptul stintific e fals sau adevarat(falsificabil), dar in cazul
credinta nu poti demonstra ca e adevarata sau falsa.
De ce e nevoie de legitati?
-pt ca cu descrierile nu ai ce sa faci. Legitatile sunt ca niste unelte, poti face
predictii cu ele. daca punem numai 1kg de ciment, beton care rezulta o
sa se sfareme si ne da la protv

3)Scale de masurare

-masuram variabile (deci trebuie sa poata lua cel putin 2 valori. Ca da nu, ce sa
mai masuram?!)
-variabilele pot fi :
-continue: adica e vorba despre un gradient, nu se sare de la o valoare la
alta. De ex: gradul de incordare al muschilor, nu poti sa treci de la
incordat la relaxat: chiar daca se produce rapid, este un proces
continuu; inca putin inca putin inca putin.
-discrete: se sare de la o valoare la alta si nu e nimic intre ele. De exemplu
genul(ori e masculin ori feminin), orientarea politica(ori pnlist, ori
pdist, ori psdist, ori prmist)
-masurarea inseamna sa atribui numere unor carcateristici, iar aceste numere sa refelcte
relatia dintre caracteristici
-pentru ca o masuratoare(respectiv un test) sa fie valida e trebuie sa masoare exact ceea
ce isi propune sa masoare(validitate predictiva) si sa aiba fidelitate adica
aplicand-o din nou sa obtinem aceleasi rezultate
-validitatea de criteriu se refera la faptul ca masuratoare respectiva da aceleasi rezultate
ca si un alt test deja consacrat
-binenteles noi masuram prin scale ceea ce vrem sa masuram, deci validitatea
predictiva si fidelitatea(si validitatea de criteriu) se refera imperativ si la ele
a)scala nominala
-da frecventa unui comportament
-operam astfel
-tintim un comportament
-facem definitii(pt variatiile posibile ale comport)
-aplicam grila de observatie
-fiecare subiect se incadreaza doar intr-o categorie si sigur
intr-una (exhaustiv&complementar)
b)scala de ordinala (de ranguri, de ierarhi)
-se obtine o ierarhie, adica o ordonare in funcite de un criteriu
-in mod ideal ierarhia este stricta(adica doar un om pe un loc)
-o folosim cand avem un singur criteriu, care este greu de
cuantificat(masurat)
-ia in considerare ca intre subiecti este o diferenta
-dar nu spune nimic despre cat de mare este diferenta dintre 2
locuri
c)scala de interval
-intervalele dintre o valoare si alta sunt egale
-adica intre 2 locuri, distanta este egala
-cu aceasta scala se pot obtine valori numerice(cantitati)
d)scala de proportii
-in plus fata de toate ea mai are si zero real, adica o valoare care

denota lipsa lucrului respectiv, si nu valoarea minima


-datorita acestui lucru se pot face proportii: de exemplu jumate,
de 2x mai mult.
-scalele trebuie sa aiba validitate(de masurare) adica sa masoare exact ceea ce isi
propun si fidelitate, adica la masurari repetate sa dea aceleasi rezultate.
-fiecare scala are un construct/model in spate, si deci trebuie sa aiba o validitate de
construct, adica sa se suprapuna cu el
-validitatea predictiva se refera la faptul ca pe baza scorurilor se poate face o predictie

3)Metode de cercetare
a)observatia stintifica
-pe baza observatiei poti emite ipoteze locale(adica pt cazul observat) pe
care apoi le poti folosi in constructia ipotezei mari
-se deosebeste de cea normala prin faptul ca e obiectiva, adica nu se lasa
influentata de clisee, emotii samd; si ia in considerare doar date relevante, pe care
le urmareste sistematic.
-de aici se impune nevoia de o grila de observare, ca sa nu se apuce ala care observa sa
povesteasca toate prostii pe care le-a vazut. Cu grila, bifeaza si se concentreaza pe
ceea ce e important
-grila nu e bine sa aiba mai mult de 10 categorii ca e greu de folosit

-categoriile trebuie sa fie exhaustive si complementare, adica sa se completeze reciproc si


sa se poata incadra orice variatie al comportamentui tintit in categoriile
respective; ca daca nu,atunci omu vede ceva si nu are unde bifa, ceea ce
rezulta in faptul ca noi ulterior o sa ajungem la concluzii incorecte
-definitile pentru categori trebuie sa fie clare, concise, pentru ca sa inteleaga cel ce
observa despre ce e vorba si pentru ca observatori diferiti sa inteleaga acelasi
lucru
!dar.pentru ca de multe ori asta e greu, nenea kohen a inventat o
modalitate pentru a testa cat de bine se potriveste ceea ce a bifat fiecare
observator cu restul
Coeficientul kohen
-verfica daca concordantele dintre observatori(adica unde toti au ales la fel) sunt
intamplatoare sau chiar se gandeau la acelasi lucru
-se foloseste pt scale nominale

-cu cat nr de observatori e mai mare, sau numarul de categorii e


mai mare, cu atat scade Pe, adica probabilitatea sa fie
concordanat din intamplare. Deci creste K
-valoarea prag de semnificatie este 0,7. adica daca K e mai mare
decat 0,7 atunci e bun
b)experimentul
-se foloseste pentru a analiza situatii
-se creaza situatii miniaturizate, adica cu mai putin variabile. Cu alte cuvinte se
pot elimina variabilele care influenteaza suplimentar ceea ce vrem noi sa
vedem(variabile extene), si se pot controla foarte precis variabilele pe care
le testam( var independente)
-deci are precizie mare dar este foarte simplificata situatia(are validitate
interna(precizie) dar nu prea are validitate externa(asemanare cu
realitatea))
-in experiment se manipuleaza sistemic una sau mai multe variabile, si se studiaza
efectul manipularii asupra subiectilor/situatiei
-variabila independenta e ceea ce manipulam, ceea ce vrem sa vedem daca influenteaza
ceva (rezulatatul)sau nu
-variabila depdenta e ceea ce masuram, adica ceea ce vrem sa vedem daca e afectat de
schimbarile variabilei independente
-variabila dependenta trebuie sa:
-fie sensibla la schimbarile variabilei indepndente, adica sa se modifice
putin si cand var indep se modifica putin
-sa fie usor de masurat si clar definita

-sa fie fiabila, adica sa nu fluctueze episodic


-experimentul isi propune sa stabileasca o lege intre var indep si cea dependenta, adica o
relatie cauza efect.
asta implica:
-covarianta
-succesiunea
-varianta concomitenta
-exista trei tipuri de design experimental
-design exp de baza: cand manipulam/variaza un singur factor
-design exp factorial: cand manipulam/variaza mai multi factori
-design exp mixt: cand variabila independenta(manipulata) este pusa in relatie si
cu o variabil clasificatorie sau variabil etichet
-variabila eticheta const n repartizarea subiecilor care particip
la experiment n clase diferite pe baza unor caracteristici
imanente ale acestora (sexul, vrsta, statutul social etc.).
-punctele forte ale designului exp mixt sunt:
- sporete senzitivitate, constatabil experimental, a
variabilei dependente fa de factorul manipulat;
- ofer informaii despre gradul de generalitate a
rezultatelor obinute
c)studiul de corelatie
-in acest caz vedem corespondenta dintre doua variabile, si efectul deja s-a
produs. De exemplu ne laum dosarele de la politie cu accidente, si vedem
cat de multe au fost cauzate de alcool
d) qvasi experiment
-cand vrem de exemplu sa vedem daca homosexualii se pricep mai bine la moda
decat heterosexualii. Manipularea deja s-a produs. Adica nu ii facem noi
homosexuali sau heterosexuali, ci asa ii gasim. Apoi le aplicam
chestionarul de moda, si vedem care se pricep mai bine
-subiectii trebuie alesi cu grija(aleator), sa fie randomizati(adica amestecati omogen si
sa reprezinte bine populatia, adica sa nu fie toti intr-fel).
-in realitate se participa pe baza de voluntariat la experimente, adica noi astia din anul 1,
dar se presupune ca noi in general suntem randomizati in an, si deci nu e o
problema(mare)

metodele comparatae pe scurt(pe baza tabelului miracol al lui Robi):


Observatia
Avantaje
-poate furniza ipoteze pt studii mai riguroase
-evidentiaza lucrurile asa cum apar in realitate
Dezavantaje
-este desriptiva si nu pune in evidenta relatii cauza-efect
-consuma timp si resurse
Studiul de corelatie
Avantaje
-poate furniza ipoteze pt studii mai riguroase
-folosim cand nu putem manipula var independenta
-cand vrem sa vedem legatura dinte 2 variabile in realitate
Dezavantaje
-nu poate evidentia relati cauza-efect
Experiment
Avantaje
-control riguros la variabilelor=validitate interna mare
-evidentiaza relatii cauza-efect
Dezavantaje
-validitate externa redusa, adica situatiile nu sunt chiar ca in realitate
-subiectii se pot comporta diferit in laborator
-este util cand putem manipula variabila independenta
Qvasi experiment
Avantaje
-se foloseste cand nu putem manipula var independenta
-poate evidentia relatii cauza-efect, destul de bine
Dezavantaje
-nu poate dovedi mereu succesiunea temporala cauza-efect
-uneori e dificil sa gasesti subiecti

Erori ce pot aparea prin comparatii intra si intergup


Erori intragrup(in interiorul sau)
-Eroarea de maturare: pe parcursul experimentului subiectii se dezvolta=>se
schimba
-Eroare la testari repetate: de ex subiectii invata raspunsuri
-Degradarea instrumentelor de masura: asemanator cu testarile repetate, de ex
chestionare de personalitate
-Regresia statistica: se testeaza oameni,se selecteaza unii dintre ei, se retesteaza,
dar acum alta va fi media si valorile din distributie
-Evenimente externe: moare bunica subiectului, el se va comporta altfel
Erori intergrup(intre grupuri diferite)
-Datorita selectiei
-Moarte experimentala: la experimente lungi, se pierd subiecti ca de ex se muta,
mor samd
-Efectul difuziunii: se raspandeste efectul de la grupul experimental la cel de
control; de ex daca vorbesc intre ei
-Efectul compensarii: de ex, cei din grupul de control se ambitioneaza si se
straduiesc mai mult decat cei din cel experimental
-Efectul resemnarii: exact opusul efectului compensatoriu.

CAPITOLUL DOI: STATISTICA HARDCORE


Introducere
Totul va fi bine. Relax. Faceti pauze.

Restul
La ce ne trebuie statistica in psihologie?
-in psihologie nu avem ca in fizica totul exact si concret, asaca orice facem
noi nu este sigur ci probabil. Noi obtinem date, dar nu stim daca leam obtinut pentru ca asa stau lucrurile sau daca le-am obtinut din
intamplare
-statistica are rolul de a verifica si evalua aceasta eventualitate, daca datele
au un caracter intamplator sau sunt pe bune
-in statistica niciodata nu poti vorbi de certitudine. In cel mai bun
caz obtii o probabilitatea foarte mare/semnificativa

5) Indicatori statistici
-cand masuram mai multi subiecti putem sa facem un grafic cu
rezultatele(distributie):

-dupa ce am efectuat experimentul propriu zis noi avem:


-numarul de subiecti testati
n
-valorile obtinute de fiecare subiect x (urile)
-putem sa calculam:
-media pentru subiecti(media esantionului) m
-abaterea standard a esantionului
s
-cu aceste informatii putem sa purcedem la analiza statistica
Indicatorii tendintei centrale
-la fel ca si in politica, unde nu prea intereseaza pe multa lume cine voteaza cu
partidu lu becali, ci cu cine a votat majoritatea(da,psd..), asa si in
psihologie important este ce rezultate a obtinut majoritatea
-indicatorii centrali incearca sa dea o idee despre acest lucru: unde se strang cele
mai multe valori
-totusi in psihologie trebuie sa fim mai realisti pentru ca e vorba de stiinta, asaca
nu putem sa ignoram o parte prea mare din date, pentru ca altfel concluzile
noastre nu mai sunt asa de reprezentative
-indicatorii tendintei centrale sunt:
- modul
-mediana
- media

a)modul
-este valoarea distributiei cu ce mai mare frecventa,adica
cea care e mereu in varful graficului
-chestia e ca nu iti zice nimic despre restul valorilor, poate
ca restul sunt o gramada mare de valori la distante
mari
-se poate folosi cu toate scalele(deci si cea nominala)
b)mediana
-punctul/pozitia sub care se afla 50% dintre valorile
ierarhiei din distributie(adica imparte in 2 parti
egale)
-rezista la valori extreme
-e utila in situatia de open ended questions
(subiectii nu pot fi inregistrati cu numere, sau
numerele nu sunt finale: la timpul de reactie, nu a
reactionat in x secunde, bye bye, nu stai ore dupa el;
sau daca nu a avut reactii adverse in 2 ani, tu nu stai
sa mai astepti pana la moartea lui, si analizezi
rezultatele dupa 2 ani ale studiului)
-utila la distributii asimetrice
-formula ei este (n+1)/2 , asta da pozitia pe care se afla
mediana in sirul ordonat crescator/descresctaor
-daca n este par, rezulta un numar cu x ,5, iar noi vom
face media numerelor care se afla in stanga si
in dreapta acestui punct
-de ex daca n=10, rezulta 5,5, deci facem media
valorilor de pe pozitia 5 si 6
-se foloseste la:
-scale de proportii
-scale de interval
-scale ordinale(ierarhii)
c)media
-media e centrul de greutate al distributiei
-se foloseste de maximum de informatii(aidca de toate
valorile din distributie plus numarul lor)
-problema ei este ca valorile extreme, chiar daca sunt
putine, si pe noi nu ne intereseaza, o influenteaza si
trag de ea in dreapta sau in stanga
-ea nu cade neaparat in dreptul varfului distributiei, dar la o

distributie gausseana, va cadea exact acolo


-se foloseste la:
-scale de interval
-scale de proportii
-adica la scalele care denota si cantitati
numerice
-in cazul ditrib normale/gauss toate cele trei(modul, mediana, media) sunt egale
sau foarte apropiate

Indicatorii dispersiei
-stim acum care este punctul unde se cam aduna majoritatea datelor, dar noi mai trebuie
sa stim si despre restul cam la ce distanta sunt fata de aceasta majortitate---chestia asta e dispersia
-noi folosim media cand calculam dispersii, pentru ca dupa cum ziceam, se foloseste de
cea mai mare cantitate de date, si este centrul de greutate al distributii(adica daca
mai adaugi o valoare, media se schimba astfel incat sa ramana in echilibru
distributia)

-poza: o distributie care sta cu capul in jos si


este tinuta in echilibru de medie; daca mai
adaugam o valoare intro parte, media se
schimba a. i. sa ramana in echilbru
distributia
-ok
-acum, daca am vrea sa aflam cat de departe este o anumita valoare de m, atunci e normal
sa scadem din acea valoare pe m, pentru ca ne ramane exact distanta dintre cele
doua: x-m
-mai departe, daca vrem sa stim cat se departeaza in medie toate valorile de la m, atunci
trebuie sa facem x-m pentru fiecare valoare, sa le adunam, si sa impartim aceasta
suma la cate sunt(ca asa se calculeaza orice medie: suma/cate sunt): (x-m)/n
-dar chestia e ca noi avem numere mai mari si mai mici decat m.in plus la o ditrib gauss,

pe o parte e exact imaginea in oglinda a celeilalte parti(simetrica)


-atunci, cand facem x-m, vom avea numere pozitive si negative, care mai sunt si
omoloage, asaca daca le adunam obtinem 0. (x-m)=0nici nu mai are rost sa
impartim la n
-x-m , este deci bun, dar problema e ca suma da 0. pentru a anula problema ca suma da 0,
putem face doua lucruri:
-sa facem modul de x-m, inainte sa le adunam. Astfel scapam de semnul -,
si pastram valoarea, care ne intereseaza defapt
-sa ridicam x-m la patrat inainte sa facem suma. Toate vor avea semnul +,
si diferenta va creste mult, devenind mai evidenta(22=4 si 32=9, 94=5 fata de 3-2=1)
-dupa ce impartim suma (diferentelor de la valorile x la m)2 si impartim la n, obtinem
varianta
-dar noi am ridicat la patrat, si am denaturat putin situatia, din cauza asta va trebui sa
scoatem radical din tot, si obtinem departarea medie a valorilor x de la m, adica
abaterea standard
-cand folosim smecheria cu modulul ne rezulta eroarea standard, pe care o folosim insa la
ditributia medilor si nu la esantioane
-abaterea standard are o precizie mai mare, deoarece patratul da o precizie mai mare,
scotand radical nu neutralizam toata aceasta precizie,ci pastram chiar cat ne
trebuie

-cand calculam abatera standard in ideea de a folosi ceea ce obtinem pentru a face
comparatii cu populatia sau estimari despre populatie(testul t, z, estimarea mediei
in populatie samd) folosim in loc de n , Df, adica degree of freedom
-degree of freedom este n-1; in afara de cazul in care facem testul t pentru esantioane
independente
-acest Df este folosit pentru ca aproximarile pe care le facem sa fie mai aproape de ceea
ce se intampla in populatie
daca creste numarul subiectilor din esantion scade disperisa

6) Distributia gaussiana sau normala

-este unimodala
-este simetrica
-prezinta distributia de frecvente, adica aia cu 68%, 95%, 99%
-este asimptota, adica nu atinge axa orizontala
-ceea ce e fain e ca performantele in populatie, sau performantele masurate repetat la un
individ, puse sub forma de grafic, seamana cu aceasta distributie
-mai mult, daca impartim populatia in toate esantioanele posibile, atunci, reprezentate
grafic medile tuturor acestor esantioane, vor semana din nou cu distributia
gaussiana.
-distributia asta a medilor esantioanelor impartite din populatie, se cheama distributia
medilor

7)Distributia medilor
Noi cand cercetam ceva, cercetam pt ca suntem platiti si pt ca altfel nu putem fi
profi universitari, dar si pentru ca vrem sa aducem un folos societatii. Societatea este
populatia. Din aceasta cauza concluziile pe care le obtinem din cercetare trebuie sa fie
valabile pentru toti sau majoritatea indivizilor din populatie.
-noi nu putem testa toti indivizii, si ne alegem cativa, un esantion
-noi alegem aleator subiectii(pe cat putem), dar chiar si asa apar diferente intre
esantioanele posibile:
-daca alegem un esantion cu:
-gica, IQ 70
-petronela IQ 80

-marius IQ 95
-obtinem un rezultat
-dar noi am fi putut sa alegem si :
-pavel:IQ 100
-cristina: IQ 90
-luminita: IQ 92
-e o diferenta nu?
-dar puteam alege si gica, petronela, marius...
-noi alegem subiectii la intamplare, si nu stim ce performante au inainte de experiment,
deci pot aparea diferente de rezultate numai din cauza ca noi am nimerit un
esantion anume din toata sumedenia de esantioane posibile
-acum, cu cat e mai mare esantionul cu atat media lui este mai aproape de media
populatiei, adica are dispersie mai mica, si este mai din centrul distributiei cu
toate esantioanele posibile din medie
-inferenta statistica analizeaza exact aceasta posibilitate, ca diferenta dintre grupul nostru
de control si cel experimental sa fie din cauza ca oamenii astia sunt diferiti din
start
-pe baza esantionului nostru, si a cercetarii putem aproxima carcateristici ale populatiei
-treaba e ca noi vrem sa aproximam cat mai bine
-abaterea standard a distributiei medilor este:

-distributia medilor esantioanelor este un construct teoretic, dar ne ajuta sa ne imaginam


esantionul nostru in relatie cu toate esantioanele posibile

8)Cota standard z
-nu, nu trebuie sa va speriati
-cota standard z este utila pentru ca:
-ne permite sa comparam performante pe care aparent nu le putem compara
-cum?
-ea nu compara valorile in sine, ci zice asa:

-valoarea unu cu cat se abate de la media esantionului ei?


-dar valoarea doi cu cat se abate de la media esantionului
ei?
-deci, cu ea putem compara relatiile dintre valori si esantioanele lor
-de ex: nu poti compara un surub cu un diamteru de 4mm cu o para
de 200g
-dar poti sa compari ca in medie un surub are diametrul de 2mm, si
ca o para in medie are 700g. pe baza acestui fapt poti sa zici
ca surubul de 4mm este mai mare fata de alte suruburi,
decat o para de 200g fata de alte pere
-si atunci avem asa:

poza: cota z pentru esantion


------------------------------------------------------------------------------------

poza: cota z pentru populatie


----------------------------------------------------------------------------------------

poza: cota z pentru distributia medilor(esantioanelor)


--------------------------------------------------------------------------------------------noi putem sa calculam z pentru fiecare valoare(de exemplu din esantion) si sa facem o
distributie noua cu aceste valori z obtinute
-distributia z va avea urmatoarele diferente(schimbari) fata de distributia initiala in care
am aplicat-o:
-media devine 0
-abaterea standard devine 1
-distributia z insa va pastra forma distributiei initiale

9)Estimarea mediei in populatie


-pe baza datelor obtinute din esantionul nostru(n, x-uri) si a indicatorilor esantionului
calculati din datele obtinute(S,m) noi vrem sa aflam media populatiei.
-putem face asta pentru ca subiectii provin din populatie, sunt alesi aleator, si pt ca media
esantionului nostru se afla undeva in distributia medilor esantionalor :

-statisticienii au stabilit ca pentru un z=1,96, exista doar sanse de 5% ca o valoare


oarecare sa pice in partile extreme

-deci:

-1,96 Zes +1,96


Zes z esantionului nostru
Inlocuim Zes cu formula

-1,96(m-)/ m +1,96
media populatiei
m abaterea dist. Medilor
m media esantionului nostru
trecem m in afara semnelor, apoi trecem si m

m - 1,96 x m m + 1,96 x m
inlocuim m cu formula

m - 1,96 x S/

m + 1,96 x S/

n
m media esantionului nostru
S abaterea standard a esantionului nostru
N numarul de subiecti din esantionul nostru
media populatiei(ce vrem noi sa aflam)

-deci media populatiei se afla foarte probabil intre cele 2 valori


-cu cat creste n cu atat estimarea este mai precisa, dar ramane la fel de probabila (95%)

10)Inferenta statistica
-efectuam un experiment: avem un grup de control si unul experimental
-le testam si obtinem anumite performante diferite intre cele doua grupuri(in mod normal)
-asta nu inseamna insa automat ca manipularea noastra este cauza diferentei
-este posibil ca simplul fapt ca am utilizat subiecti diferiti, sa fie cauza, sau daca am
utilizat aceasi subiecti, este posibil ca intr-un moment sa se fi simtit mai bine si sa
fi obtinut alte performante
-aceste doua lucruri sunt variabilitatea intrerindividuala, si variabilitatea individuala
-dupa cum am mai zis o data, inferenta statistica inseamna ca noi verificam daca puteam
obtine aceeasi diferenta cu cea pe care o avem in mod concret, daca am fi ales

esantioane diferite
-adica daca alegerea noastra la intamplare a subiectilor este cauza diferentei constatate

Ipoteza nula
-am ramas la presupunera ca: diferenta dintre grupul de control si cel experimental este
doar din cauza selectiei
-asta ar insemna ca defapt manipularea nu a produs nici o schimbare si nici o diferenta
(diferenta e DOAR din cauza alegerii intamplatoare)
-deci asta inseamna ca daca am lua toata populatia si am testa-o am obtine anumite valori
cu o medie
-si ca daca i-am aplica manipularea, dupa care am testao i-ar, am obtine cam aceleasi
valori si aceeasi medie

H0: 0 = e
0 media populatiei inainte de manipulare
e media populatiei dupa manipulare
-ipotezele se refera la populatie si nu la esantion. Intotdeauna.
-pentru ca noi in esantion avem o diferenta intre media grupului de
control(fara manipulare) si media grupului experimental(cu
manipulare), dar conform ipotezei nule ea apare doar din cauza
variabilitatii interindividuale (si individuale)
-in populatie sunt cuprinsi toti subiectii posibili, deci nu mai putem
vorbi de variabilitate
-daca exista foarte putine combinatii de esantioane care sa aiba o diferenta asemanatoare
cu cea pe care am obtinut-o noi, atunci este foarte putin probabil ca noi sa fi
nimerit exact acele esantioane, si aceasta posibilitate este neglijabila, adica
ipoteza nula este infirmata
-ipoteza nula nu poate fi afirmata(adica sa demonstrezi ca asa e)
-ramane atunci ipoteza alternativa
Ipoteza alternativa
-ea zice exact opusul:
-ca diferenta nu se datoreaza alegerii esantioanelor la intamplare, ci ca exista o
alta cauza; nu neaparat manipularea noastra
-si ipoteza alternativa se refera tot la populatie:

H0: 0 e

0 media populatiei inainte de manipulare


e media populatiei dupa manipulare
-in momentul in care ramanem cu ipoteza alternativa, deoarece am infirmat ipoteza nula,
trebuie sa ne asiguram ca diferenta se datoreaza manipularii efectuate de noi, si nu
unui factor extern de exemplu
-cu alte cuvinte, dupa ce am infirmat ip nula, tot ce stim e ca diferenta nu se datoreaza
esantionizarii, nu mai mult

Testul T pentru esantioane independente


-esantioanele independente sunt esantioanele care nu au nici o legatura:
-nu au fost testate aceleasi persoane de doua ori
-nu sunt oameni identici(de ex gemeni)
-ne confruntam cu variabilitatea dintre indivizi

-dupa experiment obtinem doua randuri de valori: performantele din grupul de control si
cele din grupul experimental
-acestea se refera la aceeasi variabila, doar valorile in sine sunt diferite
-pe noi ne intereseaza diferenta dintre ele, adica schimbarea produsa: mo-me
-efectuand toate scderile(cu toate x-urile) putem obtine o noua distributie a medilor care
se va intinde insa pe o lungime de 2x mai mare(pentru ca practic le comasam)

-in distributia dieferentelor medilor de esantionae in general (echivalentul a dist. Medilor


esantioanelor) aplicam Z (ca sa comparam diferenta noastra cu alte diferente
posibile):

-avem o noua abatere medie a diferentelor, pe care nu o stim, dar o vom


aproxima cu ajutorul S0 si Se(abaterea grupului de control si experimental)
-datorita acestei aproximari, valorile prestabilite pentru z nu mai sunt valabile
(mai ales la esantioane mici, adica control+experimental 60 de subiecti)
-luand acestea in considerare, notam treaba asta cu T:

-aproximam abaterea medie a diferentelor , ca fiind media ponderata a celor doua


grupuri ale noastre, control si experimental
-astfel abaterea fiecarui grup va contribui in functie de numarul de subiecti din
fiecare grup:

inlocuind obtinem:

-ceea ce vom obtine din calcul va fi o valoare(de ex 2,34)


-valoarea va fi ori pozitiva ori negativa, in functie de cum am facut m0-me sau mem0; dar pe noi nu ne intereseaza semnul ci cantitatea de dupa el
-va trebui sa cautam in tabelul facut de statisticieni, in functie de:
- numarul de subiecti din toate grupurile(control+experiment) minus
numarul de grupuri ->asta e degree of freedom la esantioane
independente
-si va trebui sa ne uitam la valoarea care ne intereseaza( 5%, 1% , 0,1%)
-vom gasi o valoare
-daca t obtinut de noi este mai mare decat aceasta valoare, atunci H0 este
neglijabil, adica probabilitatea ca sa nu fie adevart este de 95% / 99% /
99,9%
Testul T pentru esantioane dependente
-aici este vorba despre esantioane identice sau aproape identice:
-daca testam aceasi oameni de doua ori
-daca testam oameni aproape identici(de ex gemeni,clone)
-avand in vedere ca e vorba despre aceasi oameni putem sa notam cu d diferenta dintre
performanta unui individ la masuratoarea de control si performanta la
masuratoarea dupa manipularea experimentala: d=x0-xe
-md va fi media d-urilor, adica diferentelor; este egal si cu me-m0
-abaterea medie a diferntelor va fi acum:

si T va deveni(inlocuind in T de mai sus):

-valoarea obtinuta va trebui comparata din nou ca la testul T pentru esantioane


independente
-daca la z nu se modifica distributia, in cazul testulurilor T ea se modifica!

S-ar putea să vă placă și