Documente Academic
Documente Profesional
Documente Cultură
Expe PT Tembeli
Expe PT Tembeli
analiza datelor
PROLOG
Totul va fi bine. Relax. Faceti pauze.
1) Probabilitati
2)Cercetarea
3)Scale de masurare
-masuram variabile (deci trebuie sa poata lua cel putin 2 valori. Ca da nu, ce sa
mai masuram?!)
-variabilele pot fi :
-continue: adica e vorba despre un gradient, nu se sare de la o valoare la
alta. De ex: gradul de incordare al muschilor, nu poti sa treci de la
incordat la relaxat: chiar daca se produce rapid, este un proces
continuu; inca putin inca putin inca putin.
-discrete: se sare de la o valoare la alta si nu e nimic intre ele. De exemplu
genul(ori e masculin ori feminin), orientarea politica(ori pnlist, ori
pdist, ori psdist, ori prmist)
-masurarea inseamna sa atribui numere unor carcateristici, iar aceste numere sa refelcte
relatia dintre caracteristici
-pentru ca o masuratoare(respectiv un test) sa fie valida e trebuie sa masoare exact ceea
ce isi propune sa masoare(validitate predictiva) si sa aiba fidelitate adica
aplicand-o din nou sa obtinem aceleasi rezultate
-validitatea de criteriu se refera la faptul ca masuratoare respectiva da aceleasi rezultate
ca si un alt test deja consacrat
-binenteles noi masuram prin scale ceea ce vrem sa masuram, deci validitatea
predictiva si fidelitatea(si validitatea de criteriu) se refera imperativ si la ele
a)scala nominala
-da frecventa unui comportament
-operam astfel
-tintim un comportament
-facem definitii(pt variatiile posibile ale comport)
-aplicam grila de observatie
-fiecare subiect se incadreaza doar intr-o categorie si sigur
intr-una (exhaustiv&complementar)
c)scala de interval
-intervalele dintre o valoare si alta sunt egale
-adica intre 2 locuri, distanta este egala
-cu aceasta scala se pot obtine valori numerice(cantitati)
d)scala de proportii
-in plus fata de toate ea mai are si zero real, adica o valoare care
denota lipsa lucrului respectiv, si nu valoarea minima
-datorita acestui lucru se pot face proportii: de exemplu jumate,
de 2x mai mult.
-scalele trebuie sa aiba validitate(de masurare) adica sa masoare exact ceea ce isi
propun si fidelitate, adica la masurari repetate sa dea aceleasi rezultate.
-fiecare scala are un construct/model in spate, si deci trebuie sa aiba o validitate de
construct, adica sa se suprapuna cu el
-validitatea predictiva se refera la faptul ca pe baza scorurilor se poate face o predictie
3)Metode de cercetare
a)observatia stintifica
Coeficientul kohen
-verfica daca concordantele dintre observatori(adica unde toti au ales la fel) sunt
intamplatoare sau chiar se gandeau la acelasi lucru
-se foloseste pt scale nominale
-cu cat nr de observatori e mai mare, sau numarul de categorii e
mai mare, cu atat scade Pe, adica probabilitatea sa fie
concordanat din intamplare. Deci creste K
-valoarea prag de semnificatie este 0,7. adica daca K e mai mare
decat 0,7 atunci e bun
b)experimentul
-experimentul isi propune sa stabileasca o lege intre var indep si cea dependenta, adica o
relatie cauza efect.
asta implica:
-covarianta
-succesiunea
-varianta concomitenta
c)studiul de corelatie
-in acest caz vedem corespondenta dintre doua variabile, si efectul deja s-a
produs. De exemplu ne laum dosarele de la politie cu accidente, si vedem
cat de multe au fost cauzate de alcool
d) qvasi experiment
-cand vrem de exemplu sa vedem daca homosexualii se pricep mai bine la moda
decat heterosexualii. Manipularea deja s-a produs. Adica nu ii facem noi
homosexuali sau heterosexuali, ci asa ii gasim. Apoi le aplicam
chestionarul de moda, si vedem care se pricep mai bine
Observatia
Avantaje
-poate furniza ipoteze pt studii mai riguroase
-evidentiaza lucrurile asa cum apar in realitate
Dezavantaje
-este desriptiva si nu pune in evidenta relatii cauza-efect
-consuma timp si resurse
Studiul de corelatie
Avantaje
-poate furniza ipoteze pt studii mai riguroase
-folosim cand nu putem manipula var independenta
-cand vrem sa vedem legatura dinte 2 variabile in realitate
Dezavantaje
-nu poate evidentia relati cauza-efect
Experiment
Avantaje
-control riguros la variabilelor=validitate interna mare
-evidentiaza relatii cauza-efect
Dezavantaje
-validitate externa redusa, adica situatiile nu sunt chiar ca in realitate
-subiectii se pot comporta diferit in laborator
-este util cand putem manipula variabila independenta
Qvasi experiment
Avantaje
-se foloseste cand nu putem manipula var independenta
-poate evidentia relatii cauza-efect, destul de bine
Dezavantaje
-nu poate dovedi mereu succesiunea temporala cauza-efect
-uneori e dificil sa gasesti subiecti
Erori ce pot aparea prin comparatii intra si intergup
-Datorita selectiei
-Moarte experimentala: la experimente lungi, se pierd subiecti ca de ex se muta,
mor samd
-Efectul difuziunii: se raspandeste efectul de la grupul experimental la cel de
control; de ex daca vorbesc intre ei
-Efectul compensarii: de ex, cei din grupul de control se ambitioneaza si se
straduiesc mai mult decat cei din cel experimental
-Efectul resemnarii: exact opusul efectului compensatoriu.
CAPITOLUL DOI: STATISTICA HARDCORE
Introducere
Restul
-in psihologie nu avem ca in fizica totul exact si concret, asaca orice facem
noi nu este sigur ci probabil. Noi obtinem date, dar nu stim daca le-
am obtinut pentru ca asa stau lucrurile sau daca le-am obtinut din
intamplare
-statistica are rolul de a verifica si evalua aceasta eventualitate, daca datele
au un caracter intamplator sau sunt pe bune
-in statistica niciodata nu poti vorbi de certitudine. In cel mai bun
caz obtii o probabilitatea foarte mare/semnificativa
5) Indicatori statistici
-la fel ca si in politica, unde nu prea intereseaza pe multa lume cine voteaza cu
partidu lu becali, ci cu cine a votat majoritatea(da,psd..), asa si in
psihologie important este ce rezultate a obtinut majoritatea
-indicatorii centrali incearca sa dea o idee despre acest lucru: unde se strang cele
mai multe valori
-totusi in psihologie trebuie sa fim mai realisti pentru ca e vorba de stiinta, asaca
nu putem sa ignoram o parte prea mare din date, pentru ca altfel concluzile
noastre nu mai sunt asa de reprezentative
-indicatorii tendintei centrale sunt:
- modul
-mediana
- media
a)modul
b)mediana
c)media
-in cazul ditrib normale/gauss toate cele trei(modul, mediana, media) sunt egale
sau foarte apropiate
Indicatorii dispersiei
-stim acum care este punctul unde se cam aduna majoritatea datelor, dar noi mai trebuie
sa stim si despre restul cam la ce distanta sunt fata de aceasta majortitate----
chestia asta e dispersia
-noi folosim media cand calculam dispersii, pentru ca dupa cum ziceam, se foloseste de
cea mai mare cantitate de date, si este centrul de greutate al distributii(adica daca
mai adaugi o valoare, media se schimba astfel incat sa ramana in echilibru
distributia)
-ok
-acum, daca am vrea sa aflam cat de departe este o anumita valoare de m, atunci e normal
sa scadem din acea valoare pe m, pentru ca ne ramane exact distanta dintre cele
doua: x-m
-mai departe, daca vrem sa stim cat se departeaza in medie toate valorile de la m, atunci
trebuie sa facem x-m pentru fiecare valoare, sa le adunam, si sa impartim aceasta
suma la cate sunt(ca asa se calculeaza orice medie: suma/cate sunt): (x-m)/n
-dar chestia e ca noi avem numere mai mari si mai mici decat m.in plus la o ditrib gauss,
pe o parte e exact imaginea in oglinda a celeilalte parti(simetrica)
-atunci, cand facem x-m, vom avea numere pozitive si negative, care mai sunt si
omoloage, asaca daca le adunam obtinem 0. (x-m)=0nici nu mai are rost sa
impartim la n
-x-m , este deci bun, dar problema e ca suma da 0. pentru a anula problema ca suma da 0,
putem face doua lucruri:
-sa facem modul de x-m, inainte sa le adunam. Astfel scapam de semnul -,
si pastram valoarea, care ne intereseaza defapt
-sa ridicam x-m la patrat inainte sa facem suma. Toate vor avea semnul +,
si diferenta va creste mult, devenind mai evidenta(22=4 si 32=9, 9-
4=5 fata de 3-2=1)
-dupa ce impartim suma (diferentelor de la valorile x la m)2 si impartim la n, obtinem
varianta
-dar noi am ridicat la patrat, si am denaturat putin situatia, din cauza asta va trebui sa
scoatem radical din tot, si obtinem departarea medie a valorilor x de la m, adica
abaterea standard
-cand folosim smecheria cu modulul ne rezulta eroarea standard, pe care o folosim insa la
ditributia medilor si nu la esantioane
-abaterea standard are o precizie mai mare, deoarece patratul da o precizie mai mare,
scotand radical nu neutralizam toata aceasta precizie,ci pastram chiar cat ne
trebuie
-cand calculam abatera standard in ideea de a folosi ceea ce obtinem pentru a face
comparatii cu populatia sau estimari despre populatie(testul t, z, estimarea mediei
in populatie samd) folosim in loc de n , Df, adica degree of freedom
-degree of freedom este n-1; in afara de cazul in care facem testul t pentru esantioane
independente
-acest Df este folosit pentru ca aproximarile pe care le facem sa fie mai aproape de ceea
ce se intampla in populatie
-este unimodala
-este simetrica
-prezinta distributia de frecvente, adica aia cu 68%, 95%, 99%
-este asimptota, adica nu atinge axa orizontala
-ceea ce e fain e ca performantele in populatie, sau performantele masurate repetat la un
individ, puse sub forma de grafic, seamana cu aceasta distributie
-mai mult, daca impartim populatia in toate esantioanele posibile, atunci, reprezentate
grafic medile tuturor acestor esantioane, vor semana din nou cu distributia
gaussiana.
-distributia asta a medilor esantioanelor impartite din populatie, se cheama distributia
medilor
7)Distributia medilor
-pe baza esantionului nostru, si a cercetarii putem aproxima carcateristici ale populatiei
-treaba e ca noi vrem sa aproximam cat mai bine
8)Cota standard z
-noi putem sa calculam z pentru fiecare valoare(de exemplu din esantion) si sa facem o
distributie noua cu aceste valori z obtinute
-distributia z va avea urmatoarele diferente(schimbari) fata de distributia initiala in care
am aplicat-o:
-media devine 0
-abaterea standard devine 1
-distributia z insa va pastra forma distributiei initiale
-1,96(m-)/ m +1,96
media populatiei
m abaterea dist. Medilor
m media esantionului nostru
m - 1,96 x m m + 1,96 x m
inlocuim m cu formula
m - 1,96 x S/ m + 1,96 x S/
n n
m media esantionului nostru
S abaterea standard a esantionului nostru
N numarul de subiecti din esantionul nostru
media populatiei(ce vrem noi sa aflam)
-cu cat creste n cu atat estimarea este mai precisa, dar ramane la fel de probabila (95%)
10)Inferenta statistica
Ipoteza nula
-am ramas la presupunera ca: diferenta dintre grupul de control si cel experimental este
doar din cauza selectiei
-asta ar insemna ca defapt manipularea nu a produs nici o schimbare si nici o diferenta
(diferenta e DOAR din cauza alegerii intamplatoare)
-deci asta inseamna ca daca am lua toata populatia si am testa-o am obtine anumite valori
cu o medie
-si ca daca i-am aplica manipularea, dupa care am testao i-ar, am obtine cam aceleasi
valori si aceeasi medie
H0: 0 = e
0 media populatiei inainte de manipulare
e media populatiei dupa manipulare
-ipotezele se refera la populatie si nu la esantion. Intotdeauna.
-pentru ca noi in esantion avem o diferenta intre media grupului de
control(fara manipulare) si media grupului experimental(cu
manipulare), dar conform ipotezei nule ea apare doar din cauza
variabilitatii interindividuale (si individuale)
-in populatie sunt cuprinsi toti subiectii posibili, deci nu mai putem
vorbi de variabilitate
-daca exista foarte putine combinatii de esantioane care sa aiba o diferenta asemanatoare
cu cea pe care am obtinut-o noi, atunci este foarte putin probabil ca noi sa fi
nimerit exact acele esantioane, si aceasta posibilitate este neglijabila, adica
ipoteza nula este infirmata
-ipoteza nula nu poate fi afirmata(adica sa demonstrezi ca asa e)
-ramane atunci ipoteza alternativa
Ipoteza alternativa
H0: 0 e
0 media populatiei inainte de manipulare
e media populatiei dupa manipulare
-in momentul in care ramanem cu ipoteza alternativa, deoarece am infirmat ipoteza nula,
trebuie sa ne asiguram ca diferenta se datoreaza manipularii efectuate de noi, si nu
unui factor extern de exemplu
-cu alte cuvinte, dupa ce am infirmat ip nula, tot ce stim e ca diferenta nu se datoreaza
esantionizarii, nu mai mult
inlocuind obtinem:
-ceea ce vom obtine din calcul va fi o valoare(de ex 2,34)
-valoarea va fi ori pozitiva ori negativa, in functie de cum am facut m0-me sau me-
m0; dar pe noi nu ne intereseaza semnul ci cantitatea de dupa el
-va trebui sa cautam in tabelul facut de statisticieni, in functie de:
- numarul de subiecti din toate grupurile(control+experiment) minus
numarul de grupuri ->asta e degree of freedom la esantioane
independente
-si va trebui sa ne uitam la valoarea care ne intereseaza( 5%, 1% , 0,1%)
-vom gasi o valoare
-daca t obtinut de noi este mai mare decat aceasta valoare, atunci H0 este
neglijabil, adica probabilitatea ca sa nu fie adevart este de 95% / 99% /
99,9%
EPILOG
Totul va fi bine. Relax. Pauza lunga.