Sunteți pe pagina 1din 9

Pr

CURS 4
Masuratori in Statistica
Valori ale tendintei centrale - valorile masurabile - are 3 valori de baza
19 tipuri de masuratori in cadrul statisticii – sunt in curs, dar 5-6 sunt cele mai
importante

Cele 6 cele mai importante sunt:


- Media, Mediana sau Modulul
- Variatia care precede Deviatia standard
- Asimetria, Boltinea

MEDIA – prescurtata min


- suma scorurilor impartita la numarul acestora

MEDIANA
- valoarea centrala a unui sir de scoruri ordonat crescator.
Ex: 1, 2, 3, 4 = avem doua valori centrale, facem media intre cele doua scoruri centrale,
adica mediana este 2,5
Ex: 1, 2, 5, 6 = mediana 3,5
MODUL
- valoarea care se repeta cel mai des in carul scorurilor obtinute
- daca nu avem nicio valoare care nu se repeta = nu avem modul

Cea mai sensibila la cele 3 de mai sus, la modificarea sirurilor, este MEDIA, pt ca
ea va simti imediat ca ceva se deplaseaza
Ex: Sirul 1, 2, 3, 3, 3, 4
Media 2,66
Mediana 3
Modul 3
Ex: Sirul 1 2 4 7 11
Media 5
Mediana 4
Modul –
Ex: Presupunem ca din 100 de studenti 99 iau nota 10. Un singur student ia nota 5.
Media 9.95
Mediana 10
Modul 10

ASIMETRIA
- sau skewness
- indicator sau o inclinare a distributiei scorurilor pt o anume variabila
- vezi clopotul lui Gauss, care poate fi inclinat spre stanga, dreapta sau poate fi central,
aceaste inclinatii se numesc Asimetrii
- valoarea e pozitiva daca scorurile sunt asimetrice spre stanga sau negativa daca
scorurile sunt asimetrice spre dreapta – e pe invers!
- o distributie e perfect simetrica atunci cand valorile sunt egal/simetric raspundite in
jurul tendintei centrale = sunt rare sau imposibile in realitate. Nu ies asimetrii perfecte,
asa e normal.
- cand rezultatele tind catre valori mici, sunt aglomerate in partea stanga a.i. asimetria,
turnirea e spre dreapta - skewness dreapta
- cand rezultatele tind catre valori mari, sunt aglomerate in partea dreapta, asimetrica la
stanga, skewness negativ
- e data de panta distributiei, de panta si nu de varful acesteia

- graficul B - este o distributie simetrica, perfect simetrica


- distributia A = distributie asimetrica la dreapta, skewness negativ
Aglomerare scoruri mari spre stanga, inseamna ca linia coboara Lin spre dreapta,
asimetria se identifica prin zona in care linia coboara mai lent spre axa OX
Predomina scoruri mici, ar fi foarte multe note mici la examen daca ar fi grafic de note.
In dreapta ar fi din ce in ce mai putin studenti spre nota maxima, in dreapta.
- distributia C = distributie asimetrica la stanga, skewness pozitiva, predomina notele
mari la examen,

BOLTIREA
- sau kurtosis (cocosat)
- se refera la cum arata cocoasa
- cat de ascutita, cat de turtita e distrib scorurilor pt ao anumita variabila
- Va fi cu semnul + pt curbe cu frecvente ridicate. Daca cocoasa e foarte ridicata
inseamna ca e pe plus, daca e turtita, e pe minus
- daca e f. ascutita - vorbim de distributie leptokurtica – vezi graficul C de mai jos
- daca e medie – vorbim de distributie mezokurtica - A
- daca e f. turtita - vorbim de distributie platikurtica - B

Programele de analiza genereaza si o astfel de figura.


EX: Daca am o reprezentare turtita, platikurtica, graficul B la notele unei disciplina, ce
concluzie extrag dintr-o astfel de reprezentare –
Notele sunt 4, 5, 6, 7, 8, 9, 10 in reprezentare platikurtica ce inseamna?
- extremele au acelasi numar de studenti
- cei mai multi sunt extremele, cu 4, 5 si 9, 10 sunt cam egali, iar cei cu 6, 7, 8, sunt
putini mai multi decat la extreme.
Daca reprezentarea este leptokurtica, graficul C
- majoritarea studentilor au luat app. 70% au nota 6,7,8. Vreo 15% dub 6, 15% peste 8

Histograma – creata in PSPP pot avea acea curba care indica cat de turtita sau cat de
asimetrice pot fi.
PSPP – sus buton Graphs, click Histogram, dai click pe varibila pe care vrei s-o
transferi, se face albastra,

dai click pe sageata din dreapta ei si apare in drepta


Bifezi Display normal curve din fereastra.
Apoi dai OK.
Si iese asa, Output-ul:

Majoritatea sudentilor au nota intre 7 si 8


Curba asimetrica

EX: Reale note obtinute de noi. 174 studenti (vezi in dreapta jos)
- asimetrica spre stanga!! = am luat note mari - media e 8
- in stanga pe verticala sunt nr subiecti = peste 45 subiecti au luat nota 10
- mezokurtica

Ex: Histograma strudenti an 3

- inclinatia spre dreapta, note mici

Rezumat HISTOGRAMELE DE MAI SUS:


Curba normalitatii ia diferite forme

AMPLITUDINEA IMPRASTIERII
- sau AI sau cu V sau cu ?
- rezultatele dintre valorile aflate la extreme indiferent de valorile distributiilor
Ex: Sirul 6, 6, 7, 7, 8, 8, 8, 9, 9, 10
Amplitudinea este 4 din valoarea mare se scade valoarea mica 10-6 = 4
Ex: Sirul 1, 6, 7, 7, 8, 8, 8, 9, 9, 10
Amplitudinea este 9

VARIANTIA – nu la examen
= Variatia este verificarea omogenitatii valorilor individuale si de obicei implica analiza
imprastierii datelor individuale fata de valorile centrale calculate.

DEVIATIA / ABATEREA STANDARD – nu la examen


- standard deviation
= Deviatia sau abaterea standard – este o evaluare a masurii in care scorurile difera, in
medie, fata de media scorurilor pentru o oarecare variabila
…………………………….vezi curs

- grupul care este sub medie are si el media lui, grupul care este peste medie are si el
media lui. Aceste doua grupuri cat de mult se indeparteaza de medie?
E importanta Corelare intre scorurile Z (Gaus vezi curs 3) si Abaterile standard
(cele de mai sus)

Ex: care este abaterea standard pentru variatie:


Care este abaterea standard pt varstele a 100 studenti din anul nostru aflam in prima
faza ca avem 100 studenti impartiti in 10 grupe a cate 10 studenti/grupa

X = varsta studentilor La fiecare grupa de an, 19, 20, etc intra cate 10 studenti.
Care e varsta medie a celor 10 grupe de studenti, care este media intre 19 si 28?
Media este 23,5
Abaterea medie -4.5 inseamna abaterea acestei varste de 19 ani de la media de 23,5
20 ani inseamna abatere de -3.5
Unele abateri sunt negative si unele sunt pozitive. Solutia pt a anula aceste negative, a
fost sa se ridice la patrat. Astfel:

Pe randul 3 (x-m)2 - avem ridicarile la patrat.


Ulterior se aduna aceste ridicari la patrat, 20,25+12,25+6.25+….=82.5
Trebuie sa inmultim cu 10 pt ca la fiecare categorie de varsta avem 10 oameni.
Deci 82.5 x 10 = 825 si aceasta suma se imparte la numarul de scoruri, 100, dar minus
1. Pentru ca este o corectie a lui Desel (?) care a recomandat sa se scada aceasta
diferenta: nr. total minus 1 = 8.33-Varianța
DS - deviatia standard – aplicam radicalul si avem 2.89.
Abaterea este de 2.89 – cu cat se abate media grupurilor de la media centrala? Se
abate cu 2 unitati de la medie, adica foarte mult.
Vezi Scorurile Z din graficul de mai jos:

Cum ar arata aceasta curba a deviatiei standart? Ar fi platicurdica, doar 2% diferente


intre grupe, e turtita la extrem

Exercitiu pentru acasa: Sa construim baza de date in PSPP si sa facem Histograme,


ne alegem o plaja intre 1 si 5. La 5 respondetni sa punem mai multe scoruri mici si in alt
caz sa punem scoruri mai mari. Din 50 de scoruri sa incercam sa construim o curba de
distributie perfecta: cate doi respondenti la extreme: 2 pentru 1 si 2 pentru 5. Vreo 10
repsondenti pentru 2, alti 10 pentru 4 si restul de 26 respndenti pentru valoarea 3 =
distributie uniformizata.
Incearca sa construiesti o variantie leptokurtica
Sa construim in PSPP aceste scoruri.

*Tema PID:*
1. Calculați media, mediana și modul pentru următoarele două șiruri de date:
2 4 6 8 10 11 13 15 15 17 19 6
10 15 20 1 2 3 4 5 21 27 30 7 2 3 2
2. Concepeți un tabel cu șase variabile care să conțină scoruri (în cifre de la 1 la 5)
pentru minim 50 de subiecți. Denumirile celor șase variabile vor fi următoarele:
Leptocurtică, Mezocurtică, Platocurtică, Simetrie, Asimetrie de dreapta și Asimetrie de
stânga.
Importați datele în PSPP și modificați scorurile în așa fel încât pentru fiecare denumire
de variabilă să rezulte câte o histogramă (și curba aferentă) cu aspect și nume identic
(ca la denumirilor variabilelor).

De la ana:
platicurtica multe de 1 si 5, foarte
putine restul

Formula de calcul mediana in


excel: =median si pui intervalul de
celule pentru care vrei sa calculezi
mediana
La Skewness pozitiv, de dreapta, media > decat mediana
La Skewness
negativ, de stanga, media < decat mediana

S-ar putea să vă placă și