Sunteți pe pagina 1din 29

Material pentru psihologie experimentala si analiza datelor

-:*:- -:*:- -:*:-

PROLOG
Totul va fi bine. Relax. Faceti pauze.

CAPITOLUL UNU: TEORIE SI CHESTII GENERALE


1) Probabilitati
-1 insemna ca se intampla mereu -0 inseamna ca nu se poate intampla -probabilitatile se afla intre 1 si 0 Avem urmatoarele notiuni: -Experienta= de ex. Aruncarea monedei in general, sau aruncarea zarului in general -Proba= de ex partea monedei cu fata, sau fata zarului cu cifra6 -Eventimentul=orice situatie care este posibil sa apara in urma unei experiente -de ex situatia in care aruncam zarul si cade cu fata6 in sus -evenimentul elementar este cel care implica o singura proba(de exemplu sa cada fata 6) -evenimentul compus este cel care implica mai multe probe(de exemplu sa pice fata 3 si fata 5) -evenimentul cert este cel care apare intotdeauna, adica are o probabilitate de 1

-evenimentul imposibil este cel care nu apare niciodata, adica are o probabilitate de 0 -evenimentul contrar al evenimentului A, este evenimentul care se intampla atunci cand nu se produce A. de ex: ev contrar al situatiei in care pica capul monedei, este situatia in care pica banul monedei -probabilitatea unui eveniment este si egala cu: 1-proabilitatea evenimentului sau contrar -Probabilitatea ca un evenimet sa se intample este numarul de cazuri in care se intampla acel lucru raportat(impartit) la numarul de cazuri in care se poate intampla orice eveniment:

-probabilitatea ca doua evenimente sa se intample(si unul si altul) este egala cu probabilitatea primului eveniment inmultita cu probabilitatea celui deal doilea eveniment -proabilitatea sa se intample un eveniment sau sa se intample alt eveniment, este egala cu probabilitatea primuia adunata cu probabilitatea celui de-al doilea -cu alte cuvinte: -cand e SI SI, se inmultesc probabilitatile -cand e SAU SAU, se aduna probabilitatile

2)Cercetarea
De ce naiba s-au apucat oamenii de stiinta? Pt ca aveau nevoie de cunostinte pe care sa le poata folosi in mod practic pentru a trai(bine). Pentru a putea folosi ceva in mod practic, trebuie sa fie util, adica sa aiba cineva nevoie de chestia aia, sa fie sigur(cert), si sa fie util in vitor, pentru ca oamenii traiesc prezent, si vor trai in vitor, dar in trecut cu siguranta nu se mai modifica nimic. de obicei se desfasoara in etapele: observaia, stabilirea ipotezelor, experimentarea propriu-zis i analiza/interpretarea datelor nu este neaparat sa urmeze fazele respective datele se pot verifica prin facerea de predictii: daca se adeveresc inseamna ca e corect, daca nu atunci mai trebuie lucrat datele se pot verifica si prin alte date(adica repetarea experimentului) o ipoteza trebuie sa fie falsificabila, adica trebuie sa se poata demonstra ca e adevarata sau falsa programele de cercetare trebuie sa gaseasca legitati(pe baza carora se pot face predictii), si nu sa descrie pur si simplu faptele

cand un program de cercetare(paradigma) nu mai poate explica un lucru, apare o criza, si in final va aparea o alta paradigma care poate explica si acel lucru -sau se modifica paradigma

De ce e nevoie sa verificam datele(resp. rezultatele cercetarii)? -ca sa ne putem increde in ele si sa putem opera cu ele De ce trebuie sa fie falsificabil? -pentru ca daca nu poti stii daca e adevarat sau fals ceea ce propui(ipoteza), atunci nu are utilitate practica.diferenta dintre un fapt stintific si o credinta e ca poti demonstra ca faptul stintific e fals sau adevarat(falsificabil), dar in cazul credinta nu poti demonstra ca e adevarata sau falsa. De ce e nevoie de legitati? -pt ca cu descrierile nu ai ce sa faci. Legitatile sunt ca niste unelte, poti face predictii cu ele. daca punem numai 1kg de ciment, beton care rezulta o sa se sfareme si ne da la protv

3)Scale de masurare

-masuram variabile (deci trebuie sa poata lua cel putin 2 valori. Ca da nu, ce sa mai masuram?!) -variabilele pot fi : -continue: adica e vorba despre un gradient, nu se sare de la o valoare la alta. De ex: gradul de incordare al muschilor, nu poti sa treci de la incordat la relaxat: chiar daca se produce rapid, este un proces continuu; inca putin inca putin inca putin. -discrete: se sare de la o valoare la alta si nu e nimic intre ele. De exemplu genul(ori e masculin ori feminin), orientarea politica(ori pnlist, ori pdist, ori psdist, ori prmist) -masurarea inseamna sa atribui numere unor carcateristici, iar aceste numere sa refelcte relatia dintre caracteristici -pentru ca o masuratoare(respectiv un test) sa fie valida e trebuie sa masoare exact ceea ce isi propune sa masoare(validitate predictiva) si sa aiba fidelitate adica aplicand-o din nou sa obtinem aceleasi rezultate -validitatea de criteriu se refera la faptul ca masuratoare respectiva da aceleasi rezultate ca si un alt test deja consacrat -binenteles noi masuram prin scale ceea ce vrem sa masuram, deci validitatea predictiva si fidelitatea(si validitatea de criteriu) se refera imperativ si la ele a)scala nominala -da frecventa unui comportament

-operam astfel -tintim un comportament -facem definitii(pt variatiile posibile ale comport) -aplicam grila de observatie -fiecare subiect se incadreaza doar intr-o categorie si sigur intr-una (exhaustiv&complementar) b)scala de ordinala (de ranguri, de ierarhi) -se obtine o ierarhie, adica o ordonare in funcite de un criteriu -in mod ideal ierarhia este stricta(adica doar un om pe un loc) -o folosim cand avem un singur criteriu, care este greu de cuantificat(masurat) -ia in considerare ca intre subiecti este o diferenta -dar nu spune nimic despre cat de mare este diferenta dintre 2 locuri c)scala de interval -intervalele dintre o valoare si alta sunt egale -adica intre 2 locuri, distanta este egala -cu aceasta scala se pot obtine valori numerice(cantitati) d)scala de proportii -in plus fata de toate ea mai are si zero real, adica o valoare care denota lipsa lucrului respectiv, si nu valoarea minima -datorita acestui lucru se pot face proportii: de exemplu jumate, de 2x mai mult. -scalele trebuie sa aiba validitate(de masurare) adica sa masoare exact ceea ce isi propun si fidelitate, adica la masurari repetate sa dea aceleasi rezultate. -fiecare scala are un construct/model in spate, si deci trebuie sa aiba o validitate de construct, adica sa se suprapuna cu el -validitatea predictiva se refera la faptul ca pe baza scorurilor se poate face o predictie

3)Metode de cercetare
a)observatia stintifica -pe baza observatiei poti emite ipoteze locale(adica pt cazul observat) pe care apoi le poti folosi in constructia ipotezei mari -se deosebeste de cea normala prin faptul ca e obiectiva, adica nu se lasa influentata de clisee, emotii samd; si ia in considerare doar date relevante, pe care le urmareste sistematic. -de aici se impune nevoia de o grila de observare, ca sa nu se apuce ala care observa sa povesteasca toate prostii pe care le-a vazut. Cu grila, bifeaza si se concentreaza pe ceea ce e important -grila nu e bine sa aiba mai mult de 10 categorii ca e greu de folosit -categoriile trebuie sa fie exhaustive si complementare, adica sa se completeze reciproc si

sa se poata incadra orice variatie al comportamentui tintit in categoriile respective; ca daca nu,atunci omu vede ceva si nu are unde bifa, ceea ce rezulta in faptul ca noi ulterior o sa ajungem la concluzii incorecte -definitile pentru categori trebuie sa fie clare, concise, pentru ca sa inteleaga cel ce observa despre ce e vorba si pentru ca observatori diferiti sa inteleaga acelasi lucru !dar.pentru ca de multe ori asta e greu, nenea kohen a inventat o modalitate pentru a testa cat de bine se potriveste ceea ce a bifat fiecare observator cu restul Coeficientul kohen -verfica daca concordantele dintre observatori(adica unde toti au ales la fel) sunt intamplatoare sau chiar se gandeau la acelasi lucru -se foloseste pt scale nominale

-cu cat nr de observatori e mai mare, sau numarul de categorii e mai mare, cu atat scade Pe, adica probabilitatea sa fie concordanat din intamplare. Deci creste K -valoarea prag de semnificatie este 0,7. adica daca K e mai mare decat 0,7 atunci e bun b)experimentul -se foloseste pentru a analiza situatii -se creaza situatii miniaturizate, adica cu mai putin variabile. Cu alte cuvinte se pot elimina variabilele care influenteaza suplimentar ceea ce vrem noi sa vedem(variabile extene), si se pot controla foarte precis variabilele pe care le testam( var independente) -deci are precizie mare dar este foarte simplificata situatia(are validitate interna(precizie) dar nu prea are validitate externa(asemanare cu realitatea)) -in experiment se manipuleaza sistemic una sau mai multe variabile, si se studiaza efectul manipularii asupra subiectilor/situatiei -variabila independenta e ceea ce manipulam, ceea ce vrem sa vedem daca influenteaza ceva (rezulatatul)sau nu -variabila depdenta e ceea ce masuram, adica ceea ce vrem sa vedem daca e afectat de schimbarile variabilei independente -variabila dependenta trebuie sa: -fie sensibla la schimbarile variabilei indepndente, adica sa se modifice putin si cand var indep se modifica putin -sa fie usor de masurat si clar definita

-sa fie fiabila, adica sa nu fluctueze episodic -experimentul isi propune sa stabileasca o lege intre var indep si cea dependenta, adica o relatie cauza efect. asta implica: -covarianta -succesiunea -varianta concomitenta -exista trei tipuri de design experimental -design exp de baza: cand manipulam/variaza un singur factor -design exp factorial: cand manipulam/variaza mai multi factori -design exp mixt: cand variabila independenta(manipulata) este pusa in relatie si cu o variabil clasificatorie sau variabil etichet -variabila eticheta const n repartizarea subiecilor care particip la experiment n clase diferite pe baza unor caracteristici imanente ale acestora (sexul, vrsta, statutul social etc.). -punctele forte ale designului exp mixt sunt: - sporete senzitivitate, constatabil experimental, a variabilei dependente fa de factorul manipulat; - ofer informaii despre gradul de generalitate a rezultatelor obinute c)studiul de corelatie -in acest caz vedem corespondenta dintre doua variabile, si efectul deja s-a produs. De exemplu ne laum dosarele de la politie cu accidente, si vedem cat de multe au fost cauzate de alcool d) qvasi experiment -cand vrem de exemplu sa vedem daca homosexualii se pricep mai bine la moda decat heterosexualii. Manipularea deja s-a produs. Adica nu ii facem noi homosexuali sau heterosexuali, ci asa ii gasim. Apoi le aplicam chestionarul de moda, si vedem care se pricep mai bine -subiectii trebuie alesi cu grija(aleator), sa fie randomizati(adica amestecati omogen si sa reprezinte bine populatia, adica sa nu fie toti intr-fel). -in realitate se participa pe baza de voluntariat la experimente, adica noi astia din anul 1, dar se presupune ca noi in general suntem randomizati in an, si deci nu e o problema(mare)

metodele comparatae pe scurt(pe baza tabelului miracol al lui Robi): Observatia Avantaje -poate furniza ipoteze pt studii mai riguroase -evidentiaza lucrurile asa cum apar in realitate Dezavantaje -este desriptiva si nu pune in evidenta relatii cauza-efect -consuma timp si resurse Studiul de corelatie Avantaje -poate furniza ipoteze pt studii mai riguroase -folosim cand nu putem manipula var independenta -cand vrem sa vedem legatura dinte 2 variabile in realitate Dezavantaje -nu poate evidentia relati cauza-efect Experiment Avantaje -control riguros la variabilelor=validitate interna mare -evidentiaza relatii cauza-efect Dezavantaje -validitate externa redusa, adica situatiile nu sunt chiar ca in realitate -subiectii se pot comporta diferit in laborator -este util cand putem manipula variabila independenta Qvasi experiment Avantaje -se foloseste cand nu putem manipula var independenta -poate evidentia relatii cauza-efect, destul de bine Dezavantaje -nu poate dovedi mereu succesiunea temporala cauza-efect -uneori e dificil sa gasesti subiecti

Erori ce pot aparea prin comparatii intra si intergup Erori intragrup(in interiorul sau) -Eroarea de maturare: pe parcursul experimentului subiectii se dezvolta=>se schimba -Eroare la testari repetate: de ex subiectii invata raspunsuri -Degradarea instrumentelor de masura: asemanator cu testarile repetate, de ex chestionare de personalitate -Regresia statistica: se testeaza oameni,se selecteaza unii dintre ei, se retesteaza, dar acum alta va fi media si valorile din distributie -Evenimente externe: moare bunica subiectului, el se va comporta altfel Erori intergrup(intre grupuri diferite) -Datorita selectiei -Moarte experimentala: la experimente lungi, se pierd subiecti ca de ex se muta, mor -Efectul difuziunii: se raspandeste efectul de la grupul experimental la cel de control; de ex daca vorbesc intre ei -Efectul compensarii: de ex, cei din grupul de control se ambitioneaza si se straduiesc mai mult decat cei din cel experimental -Efectul resemnarii: exact opusul efectului compensatoriu.

CAPITOLUL DOI: STATISTICA HARDCORE


Introducere
Totul va fi bine. Relax. Faceti pauze.

Restul
La ce ne trebuie statistica in psihologie? -in psihologie nu avem ca in fizica totul exact si concret, asa caorice facem noi nu este sigur ci probabil. Noi obtinem date, dar nu stim daca leam obtinut pentru ca asa stau lucrurile sau daca le-am obtinut din intamplare -statistica are rolul de a verifica si evalua aceasta eventualitate, daca datele au un caracter intamplator sau sunt pe bune -in statistica niciodata nu poti vorbi de certitudine. In cel mai bun caz obtii o probabilitatea foarte mare/semnificativa

5) Indicatori statistici
-cand masuram mai multi subiecti putem sa facem un grafic cu rezultatele(distributie):

-dupa ce am efectuat experimentul propriu zis noi avem: -numarul de subiecti testati n -valorile obtinute de fiecare subiect x (urile) -putem sa calculam: -media pentru subiecti(media esantionului) m -abaterea standard a esantionului s -cu aceste informatii putem sa purcedem la analiza statistica Indicatorii tendintei centrale -la fel ca si in politica, unde nu prea intereseaza pe multa lume cine voteaza cu partidu lu becali, ci cu cine a votat majoritatea(da,psd..), asa si in psihologie important este ce rezultate a obtinut majoritatea -indicatorii centrali incearca sa dea o idee despre acest lucru: unde se strang cele mai multe valori -totusi in psihologie trebuie sa fim mai realisti pentru ca e vorba de stiinta, asaca nu putem sa ignoram o parte prea mare din date, pentru ca altfel concluzile noastre nu mai sunt asa de reprezentative -indicatorii tendintei centrale sunt: - modul -mediana - media

a)modul -este valoarea distributiei cu ce mai mare frecventa,adica cea care e mereu in varful graficului -chestia e ca nu iti zice nimic despre restul valorilor, poate ca restul sunt o gramada mare de valori la distante mari -se poate folosi cu toate scalele(deci si cea nominala) b)mediana -punctul/pozitia sub care se afla 50% dintre valorile ierarhiei din distributie(adica imparte in 2 parti egale) -rezista la valori extreme -e utila in situatia de open ended questions (subiectii nu pot fi inregistrati cu numere, sau numerele nu sunt finale: la timpul de reactie, nu a reactionat in x secunde, bye bye, nu stai ore dupa el; sau daca nu a avut reactii adverse in 2 ani, tu nu stai sa mai astepti pana la moartea lui, si analizezi rezultatele dupa 2 ani ale studiului) -utila la distributii asimetrice -formula ei este (n+1)/2 , asta da pozitia pe care se afla mediana in sirul ordonat crescator/descresctaor -daca n este par, rezulta un numar cu x ,5, iar noi vom face media numerelor care se afla in stanga si in dreapta acestui punct -de ex daca n=10, rezulta 5,5, deci facem media valorilor de pe pozitia 5 si 6 -se foloseste la: -scale de proportii -scale de interval -scale ordinale(ierarhii) c)media -media e centrul de greutate al distributiei -se foloseste de maximum de informatii(aidca de toate valorile din distributie plus numarul lor) -problema ei este ca valorile extreme, chiar daca sunt putine, si pe noi nu ne intereseaza, o influenteaza si trag de ea in dreapta sau in stanga -ea nu cade neaparat in dreptul varfului distributiei, dar la o

distributie gausseana, va cadea exact acolo -se foloseste la: -scale de interval -scale de proportii -adica la scalele care denota si cantitati numerice -in cazul ditrib normale/gauss toate cele trei(modul, mediana, media) sunt egale sau foarte apropiate

Indicatorii dispersiei -stim acum care este punctul unde se cam aduna majoritatea datelor, dar noi mai trebuie sa stim si despre restul cam la ce distanta sunt fata de aceasta majortitate---chestia asta e dispersia -noi folosim media cand calculam dispersii, pentru ca dupa cum ziceam, se foloseste de cea mai mare cantitate de date, si este centrul de greutate al distributii(adica daca mai adaugi o valoare, media se schimba astfel incat sa ramana in echilibru distributia)

-poza: o distributie care sta cu capul in jos si este tinuta in echilibru de medie; daca mai adaugam o valoare intro parte, media se schimba a. i. sa ramana in echilbru distributia -ok -acum, daca am vrea sa aflam cat de departe este o anumita valoare de m, atunci e normal sa scadem din acea valoare pe m, pentru ca ne ramane exact distanta dintre cele doua: x-m -mai departe, daca vrem sa stim cat se departeaza in medie toate valorile de la m, atunci trebuie sa facem x-m pentru fiecare valoare, sa le adunam, si sa impartim aceasta suma la cate sunt(ca asa se calculeaza orice medie: suma/cate sunt): (x-m)/n -dar chestia e ca noi avem numere mai mari si mai mici decat m.in plus la o ditrib gauss,

pe o parte e exact imaginea in oglinda a celeilalte parti(simetrica) -atunci, cand facem x-m, vom avea numere pozitive si negative, care mai sunt si omoloage, asaca daca le adunam obtinem 0. (x-m)=0nici nu mai are rost sa impartim la n -x-m , este deci bun, dar problema e ca suma da 0. pentru a anula problema ca suma da 0, putem face doua lucruri: -sa facem modul de x-m, inainte sa le adunam. Astfel scapam de semnul -, si pastram valoarea, care ne intereseaza defapt -sa ridicam x-m la patrat inainte sa facem suma. Toate vor avea semnul +, si diferenta va creste mult, devenind mai evidenta(22=4 si 32=9, 94=5 fata de 3-2=1) -dupa ce impartim suma (diferentelor de la valorile x la m)2 si impartim la n, obtinem varianta -dar noi am ridicat la patrat, si am denaturat putin situatia, din cauza asta va trebui sa scoatem radical din tot, si obtinem departarea medie a valorilor x de la m, adica abaterea standard -cand folosim smecheria cu modulul ne rezulta eroarea standard, pe care o folosim insa la ditributia medilor si nu la esantioane -abaterea standard are o precizie mai mare, deoarece patratul da o precizie mai mare, scotand radical nu neutralizam toata aceasta precizie,ci pastram chiar cat ne trebuie.

-cand calculam abatera standard in ideea de a folosi ceea ce obtinem pentru a face comparatii cu populatia sau estimari despre populatie(testul t, z, estimarea mediei in populatie samd) folosim in loc de n , Df, adica degree of freedom -degree of freedom este n-1; in afara de cazul in care facem testul t pentru esantioane independente -acest Df este folosit pentru ca aproximarile pe care le facem sa fie mai aproape de ceea ce se intampla in populatie daca creste numarul subiectilor din esantion scade disperisa

6) Distributia gaussiana sau normala

-este unimodala -este simetrica -prezinta distributia de frecvente, adica aia cu 68%, 95%, 99% -este asimptota, adica nu atinge axa orizontala -ceea ce e fain e ca performantele in populatie, sau performantele masurate repetat la un individ, puse sub forma de grafic, seamana cu aceasta distributie -mai mult, daca impartim populatia in toate esantioanele posibile, atunci, reprezentate grafic medile tuturor acestor esantioane, vor semana din nou cu distributia gaussiana. -distributia asta a medilor esantioanelor impartite din populatie, se cheama distributia medilor

7)Distributia medilor
Noi cand cercetam ceva, cercetam pt ca suntem platiti si pt ca altfel nu putem fi profi universitari, dar si pentru ca vrem sa aducem un folos societatii. Societatea este populatia. Din aceasta cauza concluziile pe care le obtinem din cercetare trebuie sa fie valabile pentru toti sau majoritatea indivizilor din populatie. -noi nu putem testa toti indivizii, si ne alegem cativa, un esantion -noi alegem aleator subiectii(pe cat putem), dar chiar si asa apar diferente intre esantioanele posibile: -daca alegem un esantion cu: -gica, IQ 70 -petronela IQ 80

-marius IQ 95 -obtinem un rezultat -dar noi am fi putut sa alegem si : -pavel:IQ 100 -cristina: IQ 90 -luminita: IQ 92 -e o diferenta nu? -dar puteam alege si gica, petronela, marius... -noi alegem subiectii la intamplare, si nu stim ce performante au inainte de experiment, deci pot aparea diferente de rezultate numai din cauza ca noi am nimerit un esantion anume din toata sumedenia de esantioane posibile -acum, cu cat e mai mare esantionul cu atat media lui este mai aproape de media populatiei, adica are dispersie mai mica, si este mai din centrul distributiei cu toate esantioanele posibile din medie -inferenta statistica analizeaza exact aceasta posibilitate, ca diferenta dintre grupul nostru de control si cel experimental sa fie din cauza ca oamenii astia sunt diferiti din start -pe baza esantionului nostru, si a cercetarii putem aproxima carcateristici ale populatiei -treaba e ca noi vrem sa aproximam cat mai bine -abaterea standard a distributiei medilor este:

-distributia medilor esantioanelor este un construct teoretic, dar ne ajuta sa ne imaginam esantionul nostru in relatie cu toate esantioanele posibile

8)Cota standard z
-nu, nu trebuie sa va speriati -cota standard z este utila pentru ca: -ne permite sa comparam performante pe care aparent nu le putem compara -cum? -ea nu compara valorile in sine, ci zice asa:

-valoarea unu cu cat se abate de la media esantionului ei? -dar valoarea doi cu cat se abate de la media esantionului ei? -deci, cu ea putem compara relatiile dintre valori si esantioanele lor -de ex: nu poti compara un surub cu un diamteru de 4mm cu o para de 200g -dar poti sa compari ca in medie un surub are diametrul de 2mm, si ca o para in medie are 700g. pe baza acestui fapt poti sa zici ca surubul de 4mm este mai mare fata de alte suruburi, decat o para de 200g fata de alte pere -si atunci avem asa:

poza: cota z pentru esantion ------------------------------------------------------------------------------------

poza: cota z pentru populatie ----------------------------------------------------------------------------------------

poza: cota z pentru distributia medilor(esantioanelor) --------------------------------------------------------------------------------------------noi putem sa calculam z pentru fiecare valoare(de exemplu din esantion) si sa facem o distributie noua cu aceste valori z obtinute -distributia z va avea urmatoarele diferente(schimbari) fata de distributia initiala in care am aplicat-o: -media devine 0 -abaterea standard devine 1 -distributia z insa va pastra forma distributiei initiale

9)Estimarea mediei in populatie


-pe baza datelor obtinute din esantionul nostru(n, x-uri) si a indicatorilor esantionului calculati din datele obtinute(S,m) noi vrem sa aflam media populatiei. -putem face asta pentru ca subiectii provin din populatie, sunt alesi aleator, si pt ca media esantionului nostru se afla undeva in distributia medilor esantionalor :

-statisticienii au stabilit ca pentru un z=1,96, exista doar sanse de 5% ca o valoare oarecare sa pice in partile extreme

-deci:

-1,96 Zes +1,96


Zes z esantionului nostru Inlocuim Zes cu formula

-1,96(m-)/ m +1,96 media populatiei m abaterea dist. Medilor


m media esantionului nostru trecem m in afara semnelor, apoi trecem si m

m - 1,96 x m m + 1,96 x m
inlocuim m cu formula

m - 1,96 x S/

m + 1,96 x S/

n m media esantionului nostru S abaterea standard a esantionului nostru N numarul de subiecti din esantionul nostru media populatiei(ce vrem noi sa aflam)

-deci media populatiei se afla foarte probabil intre cele 2 valori -cu cat creste n cu atat estimarea este mai precisa, dar ramane la fel de probabila (95%)

10)Inferenta statistica
-efectuam un experiment: avem un grup de control si unul experimental -le testam si obtinem anumite performante diferite intre cele doua grupuri(in mod normal) -asta nu inseamna insa automat ca manipularea noastra este cauza diferentei -este posibil ca simplul fapt ca am utilizat subiecti diferiti, sa fie cauza, sau daca am utilizat aceasi subiecti, este posibil ca intr-un moment sa se fi simtit mai bine si sa fi obtinut alte performante -aceste doua lucruri sunt variabilitatea intrerindividuala, si variabilitatea individuala -dupa cum am mai zis o data, inferenta statistica inseamna ca noi verificam daca puteam obtine aceeasi diferenta cu cea pe care o avem in mod concret, daca am fi ales esantioane diferite

-adica daca alegerea noastra la intamplare a subiectilor este cauza diferentei constatate

Ipoteza nula -am ramas la presupunera ca: diferenta dintre grupul de control si cel experimental este doar din cauza selectiei -asta ar insemna ca defapt manipularea nu a produs nici o schimbare si nici o diferenta (diferenta e DOAR din cauza alegerii intamplatoare) -deci asta inseamna ca daca am lua toata populatia si am testa-o am obtine anumite valori cu o medie -si ca daca i-am aplica manipularea, dupa care am testao i-ar, am obtine cam aceleasi valori si aceeasi medie

H0: 0 = e 0 media populatiei inainte de manipulare e media populatiei dupa manipulare


-ipotezele se refera la populatie si nu la esantion. Intotdeauna. -pentru ca noi in esantion avem o diferenta intre media grupului de control(fara manipulare) si media grupului experimental(cu manipulare), dar conform ipotezei nule ea apare doar din cauza variabilitatii interindividuale (si individuale) -in populatie sunt cuprinsi toti subiectii posibili, deci nu mai putem vorbi de variabilitate -daca exista foarte putine combinatii de esantioane care sa aiba o diferenta asemanatoare cu cea pe care am obtinut-o noi, atunci este foarte putin probabil ca noi sa fi nimerit exact acele esantioane, si aceasta posibilitate este neglijabila, adica ipoteza nula este infirmata -ipoteza nula nu poate fi afirmata(adica sa demonstrezi ca asa e) -ramane atunci ipoteza alternativa Ipoteza alternativa -ea zice exact opusul: -ca diferenta nu se datoreaza alegerii esantioanelor la intamplare, ci ca exista o alta cauza; nu neaparat manipularea noastra -si ipoteza alternativa se refera tot la populatie:

H0: 0 e 0 media populatiei inainte de manipulare

e media populatiei dupa manipulare


-in momentul in care ramanem cu ipoteza alternativa, deoarece am infirmat ipoteza nula, trebuie sa ne asiguram ca diferenta se datoreaza manipularii efectuate de noi, si nu unui factor extern de exemplu -cu alte cuvinte, dupa ce am infirmat ip nula, tot ce stim e ca diferenta nu se datoreaza esantionizarii, nu mai mult

Testul T pentru esantioane independente -esantioanele independente sunt esantioanele care nu au nici o legatura: -nu au fost testate aceleasi persoane de doua ori -nu sunt oameni identici(de ex gemeni) 0-ne confruntam cu variabilitatea dintre indivizi -dupa experiment obtinem doua randuri de valori: performantele din grupul de control si cele din grupul experimental

-acestea se refera la aceeasi variabila, doar valorile in sine sunt diferite -pe noi ne intereseaza diferenta dintre ele, adica schimbarea produsa: mo-me -efectuand toate scderile(cu toate x-urile) putem obtine o noua distributie a medilor care se va intinde insa pe o lungime de 2x mai mare(pentru ca practic le comasam)

-in distributia dieferentelor medilor de esantionae in general (echivalentul a dist. Medilor esantioanelor) aplicam Z (ca sa comparam diferenta noastra cu alte diferente posibile):

-avem o noua abatere medie a diferentelor, pe care nu o stim, dar o vom aproxima cu ajutorul S0 si Se(abaterea grupului de control si experimental) -datorita acestei aproximari, valorile prestabilite pentru z nu mai sunt valabile (mai ales la esantioane mici, adica control+experimental 60 de subiecti) -luand acestea in considerare, notam treaba asta cu T:

-aproximam abaterea medie a diferentelor , ca fiind media ponderata a celor doua grupuri ale noastre, control si experimental -astfel abaterea fiecarui grup va contribui in functie de numarul de subiecti din fiecare grup:

inlocuind obtinem:

-ceea ce vom obtine din calcul va fi o valoare(de ex 2,34) -valoarea va fi ori pozitiva ori negativa, in functie de cum am facut m0-me sau mem0; dar pe noi nu ne intereseaza semnul ci cantitatea de dupa el -va trebui sa cautam in tabelul facut de statisticieni, in functie de: - numarul de subiecti din toate grupurile(control+experiment) minus numarul de grupuri ->asta e degree of freedom la esantioane independente -si va trebui sa ne uitam la valoarea care ne intereseaza( 5%, 1% , 0,1%) -vom gasi o valoare -daca t obtinut de noi este mai mare decat aceasta valoare, atunci H0 este neglijabil, adica probabilitatea ca sa nu fie adevart este de 95% / 99% / 99,9% Testul T pentru esantioane dependente -aici este vorba despre esantioane identice sau aproape identice: -daca testam aceasi oameni de doua ori -daca testam oameni aproape identici(de ex gemeni,clone) -avand in vedere ca e vorba despre aceasi oameni putem sa notam cu d diferenta dintre performanta unui individ la masuratoarea de control si performanta la masuratoarea dupa manipularea experimentala: d=x0-xe -md va fi media d-urilor, adica diferentelor; este egal si cu me-m0 -abaterea medie a diferntelor va fi acum:

si T va deveni(inlocuind in T de mai sus):

-valoarea obtinuta va trebui comparata din nou ca la testul T pentru esantioane independente -daca la z nu se modifica distributia, in cazul testulurilor T ea se modifica!

EPILOG
Totul va fi bine. Relax. Pauza lunga.