Documente Academic
Documente Profesional
Documente Cultură
Scoruri standardizate și
distribuția normală
Cel mai bun mod de cuantificare a variabilității e prin calcularea abaterii standard.
Semnul + sau – e important la z deoarece îți spune dacă scorul se situează deasupra sau, respectiv,
dedesuptul mediei.
Scorurile z = scoruri standardizate, deoarece nu sunt asociate cu nicio unitate de măsură particulară.
Scorurile z ne ajută să comparăm distribuții care au unități de măsură diferite, prin transformarea
într-o cotă standard.
Scorurile z ne ajută în scopuri descriptive pentru a localiza un scor într-o distribuție. Scorurile z pot fi
folosite și pentru a descrie un grup.
Media oricărui set complet de scoruri z va fi întotdeauna 0, deoarece însumând scorurile z de o parte
și de alta a mediei, ele se anulează.
Dacă extragi o constantă din fiecare scor, media va fi egală cu cea de dinainte din care extragem
aceeași constantă ca cea extrasă din fiecare scor.
Abaterea standard pentru un set complet de scoruri z va fi întotdeauna 1. (Scăzând o constantă din
fiecare scor nu va schimba abaterea standard, împărțind fiecare scor cu o constantă vom obține o
abatere standard care va avea valoarea celei dinainte împărțită la acea constantă).
Cel mai simplu mod de a găsi scorurile SAT e de a transforma scorurile brute în scoruri z și apoi de a
aplica formula următoare:
Scorurile T
Distribuția normală
Distribuția normală e ca o „familie de distribuții”. Fiecare membru al acestei familii se poate deosebi
prin medie sau abatere standard, dar forma e aceeași.
Datorită simetriei distribuției normale, media, modul și mediana cad în același punct.
Tabele ale distribuției normale standard sunt acele table care dau proporțiile distribuției deasupra
sau dedesuptul diferitelor scoruri z.
Aproximativ 68% din orice distribuție standard este sub o abatere standard. (fie la stânga, fie la
dreapta de medie).
Probabilitatea unui eveniment poate fi definită ca numărul de șanse ca acesta să poată fi selectat
dintr-un număr infinit de subiecți.
Distribuția normală nu se termină niciodată, ea se distribuie la infinit în ambele direcții. Așa că acele
valori ale proporțiilor date în tabel nu mai sunt atât de precise.
Media eșantionului:
Asta înseamnă că eșantioanele nu variază atât de mult precum indivizii din populație. (de aceea îi zice
eroare, pentru că am putea presupune în mod intuitiv că cele două (distribuția eșantioanelor și
distribuția indiviziilor) variază la fel)
Mediile eșantioanelor variază mai puțin între ele decât indivizii (decât cele ale indiviziilor).
Grupurile variază mai puțin decât indivizii, asta înseamnă că e nevoie de o abatere mai mică pentru
ca un grup să fie neobișnuit decât ca un individ să fie neobișnuit. (Deci abaterea standard a grupurilor
e mai mică decât cea a populației).
Din formulă se vede că eroarea standard a mediei tinde să scadă o dată cu creșterea numărului de
subiecți din fiecare eșantion.
Tot din formulă deducem că cu cât indivizii variază mai mult cu atât eșantioanele vor varia mai mult
(dacă sigma crește, atunci și sigma indice x va crește).
O regulă a statisticii: Dacă distribuția populației e normală, atunci și distribuția eșantioanelor mediei
(cred că se referă la distribuția mediilor eșantioanelor) va fi și ea normală.
Teoremă (Teorema limitei centrale): Când distribuția populației nu e normală, distribuția mediilor
eșantioanelor va fi mai apropriată de distribuția normală.
Mediile grupurilor tiind să varieze mai puțin față de media populației în comparație cu indivizii și
grupurile mari tind să varieze mai puțin decât grupurile mici. (Un individ poate varia mai mult față de
media populației decât un grup față de aceeași medie.)
Pentru fiecare „găsire” e nevoie să desenezi o distribuție normală deoarece altfel vei putea greși cu
ușurință.
PR (Percetil Rank) e acel procent din distrubuție care se află sub un anumit scor.
Pentru a transforma o proporție într-un procentaj nu trebuie decât să înmulțim proporția cu 100.
Ex.: Pt. un scor x avem o proporție 0,8345 * 100 => PR=83,45 ceea ce înseamnă că aprox. 83% din
scoruri se află sub scorul acesta.
E bine să desenezi o distribuție normală pe care să reprezinți media când calculezi prin metoda de
mai sus PR pentru a nu omite o parte din proporție (deoarece în tabele proporțiile sunt date
raportate la medie, și poate te interesează ce se află și înainte de medie, ceea ce nu apare în tabel, și
trebuie tu să observi și să însumezi cu proporția din tabel).
În tabele unde scrie Beyond z (după z) se referă la direcția după z înspre cea mai apropriată coadă.
Găsirea suprafeței dintre 2 scoruri z
Ai 2 scoruri. Să zicem unul peste medie și altul sub. Calculezi cota standard z pentru fiecare, și le
însumezi proporția în modul. După care, înmulțești proporția cu 100 și obții procentajul.
Când scorurile se află de aceeași parte, treburile se complică puțin. Aflii z-urile celor 2 scoruri dar NU
le scazi între ele că îți dă eroare (suprafața dintre -1 σ și -2 σ e mai mare decât cea dintre -2 σ și -3 σ,
de aceea nu poți scădea scorurile între ele). Aflii proporția celui mai îndepărtat z față de medie din
tabel, și din aceasta scazi proporția celui mai puțin îndepărtat z față de medie. După care înmulțești
cu 100 și obții procentajul.
Începi să te uiți la zona „beyond z” și vezi ce z are, apoi folosești formula (de calcularea a lui z)
σ
Eroarea standard a mediei = abaterea standard a populației împărțină la √n (radical din n) ( )
√n
Cu cât un eșantion este mai mare, cu atât el tinde să aibă o distribuție mai apropriată de cea
normală.
Selectarea aleatorie a eșantioanelor = fiecare eșantion din populație are probabilitate (șansă) egală,
în comparație cu celelalte eșantioane, de a fi selectat. (fiecare selecție să fie indepedentă de toate
celelalte, probabil se referă la faptul că dacă un eșantion este extras, pt. ca următoarea extragere să
fie perfect aleatorie e nevoie ca acel eșantion să fie reintrodus în populație) (în practică, selecția se
face întotdeauna fără repunere, deoarece probabilitatea de selectare a exact aceluiași subiect e
destul de redusă)