Documente Academic
Documente Profesional
Documente Cultură
CURS 4
Masuratori in Statistica
Valori ale tendintei centrale - valorile masurabile - are 3 valori de baza
19 tipuri de masuratori in cadrul statisticii – sunt in curs, dar 5-6 sunt cele mai
importante
MEDIANA
- valoarea centrala a unui sir de scoruri ordonat crescator.
Ex: 1, 2, 3, 4 = avem doua valori centrale, facem media intre cele doua scoruri centrale,
adica mediana este 2,5
Ex: 1, 2, 5, 6 = mediana 3,5
MODUL
- valoarea care se repeta cel mai des in carul scorurilor obtinute
- daca nu avem nicio valoare care nu se repeta = nu avem modul
Cea mai sensibila la cele 3 de mai sus, la modificarea sirurilor, este MEDIA, pt ca
ea va simti imediat ca ceva se deplaseaza
Ex: Sirul 1, 2, 3, 3, 3, 4
Media 2,66
Mediana 3
Modul 3
Ex: Sirul 1 2 4 7 11
Media 5
Mediana 4
Modul –
Ex: Presupunem ca din 100 de studenti 99 iau nota 10. Un singur student ia nota 5.
Media 9.95
Mediana 10
Modul 10
ASIMETRIA
- sau skewness
- indicator sau o inclinare a distributiei scorurilor pt o anume variabila
- vezi clopotul lui Gauss, care poate fi inclinat spre stanga, dreapta sau poate fi central,
aceaste inclinatii se numesc Asimetrii
- valoarea e pozitiva daca scorurile sunt asimetrice spre stanga sau negativa daca
scorurile sunt asimetrice spre dreapta – e pe invers!
- o distributie e perfect simetrica atunci cand valorile sunt egal/simetric raspundite in
jurul tendintei centrale = sunt rare sau imposibile in realitate. Nu ies asimetrii perfecte,
asa e normal.
- cand rezultatele tind catre valori mici, sunt aglomerate in partea stanga a.i. asimetria,
turnirea e spre dreapta - skewness dreapta
- cand rezultatele tind catre valori mari, sunt aglomerate in partea dreapta, asimetrica la
stanga, skewness negativ
- e data de panta distributiei, de panta si nu de varful acesteia
BOLTIREA
- sau kurtosis (cocosat)
- se refera la cum arata cocoasa
- cat de ascutita, cat de turtita e distrib scorurilor pt ao anumita variabila
- Va fi cu semnul + pt curbe cu frecvente ridicate. Daca cocoasa e foarte ridicata
inseamna ca e pe plus, daca e turtita, e pe minus
- daca e f. ascutita - vorbim de distributie leptokurtica – vezi graficul C de mai jos
- daca e medie – vorbim de distributie mezokurtica - A
- daca e f. turtita - vorbim de distributie platikurtica - B
Histograma – creata in PSPP pot avea acea curba care indica cat de turtita sau cat de
asimetrice pot fi.
PSPP – sus buton Graphs, click Histogram, dai click pe varibila pe care vrei s-o
transferi, se face albastra,
EX: Reale note obtinute de noi. 174 studenti (vezi in dreapta jos)
- asimetrica spre stanga!! = am luat note mari - media e 8
- in stanga pe verticala sunt nr subiecti = peste 45 subiecti au luat nota 10
- mezokurtica
AMPLITUDINEA IMPRASTIERII
- sau AI sau cu V sau cu ?
- rezultatele dintre valorile aflate la extreme indiferent de valorile distributiilor
Ex: Sirul 6, 6, 7, 7, 8, 8, 8, 9, 9, 10
Amplitudinea este 4 din valoarea mare se scade valoarea mica 10-6 = 4
Ex: Sirul 1, 6, 7, 7, 8, 8, 8, 9, 9, 10
Amplitudinea este 9
VARIANTIA – nu la examen
= Variatia este verificarea omogenitatii valorilor individuale si de obicei implica analiza
imprastierii datelor individuale fata de valorile centrale calculate.
- grupul care este sub medie are si el media lui, grupul care este peste medie are si el
media lui. Aceste doua grupuri cat de mult se indeparteaza de medie?
E importanta Corelare intre scorurile Z (Gaus vezi curs 3) si Abaterile standard
(cele de mai sus)
X = varsta studentilor La fiecare grupa de an, 19, 20, etc intra cate 10 studenti.
Care e varsta medie a celor 10 grupe de studenti, care este media intre 19 si 28?
Media este 23,5
Abaterea medie -4.5 inseamna abaterea acestei varste de 19 ani de la media de 23,5
20 ani inseamna abatere de -3.5
Unele abateri sunt negative si unele sunt pozitive. Solutia pt a anula aceste negative, a
fost sa se ridice la patrat. Astfel:
*Tema PID:*
1. Calculați media, mediana și modul pentru următoarele două șiruri de date:
2 4 6 8 10 11 13 15 15 17 19 6
10 15 20 1 2 3 4 5 21 27 30 7 2 3 2
2. Concepeți un tabel cu șase variabile care să conțină scoruri (în cifre de la 1 la 5)
pentru minim 50 de subiecți. Denumirile celor șase variabile vor fi următoarele:
Leptocurtică, Mezocurtică, Platocurtică, Simetrie, Asimetrie de dreapta și Asimetrie de
stânga.
Importați datele în PSPP și modificați scorurile în așa fel încât pentru fiecare denumire
de variabilă să rezulte câte o histogramă (și curba aferentă) cu aspect și nume identic
(ca la denumirilor variabilelor).
De la ana:
platicurtica multe de 1 si 5, foarte
putine restul