Documente Academic
Documente Profesional
Documente Cultură
Nota finală:
60% nota de la examen
30% proiect + referat
10% prezenţă şi activitate seminar
Bibliografie
Andrei T., Stancu S. – Statistică. Teorie şi aplicaţii. Ed. ALL, Bucureşti, 1995
Boboc C. – Analiză statistică multidimensională, Ed.Meteor Press, 2007
Opariuc-Dan C. – Statistică aplicată în ştiinţele socio-umane. Vol.II, 2011
Introducere
Parametric versus non-parametric
O potenţială sursă de erori în analizele statistice este utilizarea
necorespunzătoare a metodelor parametrice în cazul unor date
neparametrice
Sintetizarea datelor:
sunt determinate frecvenţele de apariţie în datele observate ale fiecărei variante posibile a variabilei
studiate
Reprezentarea grafică:
se utilizează diagrama prin coloane pentru reprezentarea frecvenţelor absolute
se utilizează diagrama de structură pentru reprezentarea grafică a structurii populaţiei observate
70 www.ej
60 altele
Frecv. % 12% obs.ro
60 48%
www.ejobs.ro 72 48 50
www.bestjobs.ro 60 40 40
altele 18 12 30
18
www.be
stjobs.r
o
total 150 100 20
40%
10
0
www.ejobs.ro www.bestjobs.ro altele
ANALIZA UNIVARIATĂ
VARIABILE NOMINALE
Tendinţa centrală
Modul: varianta cea mai des întâlnită (cu frecvenţa maximă)
Variabilitatea
Procentul numărului de observaţii corespunzător fiecărei modalităţi calculat sub diverse
baze
ANALIZA UNIVARIATĂ
VARIABILE ORDINALE
Sintetizarea datelor:
sunt determinate frecvenţele de apariţie în datele observate ale fiecărei variante posibile a
variabilei studiate
Reprezentarea grafică:
se utilizează diagrama prin coloane pentru reprezentarea frecvenţelor absolute
se utilizează diagrama de structură pentru reprezentarea structurii populaţiei observate
Tendinţa centrală
Mediana: valoarea ce împarte populaţia studiată în două părţi egale
când seria are un număr impar de valori: valoarea (n+1)/2 este mediana
când seria are un număr par de valori: media valorilor n/2 şi n/2+1 este mediana
Variabilitatea:
Fractilele: împărţirea populaţiei în categorii de efective egale (cele mai frecvente sunt
curtilele şi decilele)
Sintetizarea datelor:
sunt grupate datele pe intervale de variaţie
mărimea intervalului de variaţie:
x x min
h max
r
Reprezentarea grafică:
se utilizează histograma pentru reprezentarea distribuţiei variabilei
se utilizează diagrama de structură pentru reprezentarea structurii populaţiei
observate
ANALIZA UNIVARIATĂ
VARIABILE CANTITATIVE
Intervale Frecvenţe
0-20 5
Câte ore aţi navigat pe Intervale Frecvenţe
20-40 10
10-35 10
internet luna trecută? 40-60 9
35-60 10
60-80 8
40 70 40 30 60-85 12
80-100 5
80 130 90 80 85-110 5
100-120 2
20 60 30 40 110-135 3
120-140 1
100 20 20 50 12
70 70 50 30 10
60 90 70 110
8
40 10 70 90
6
30 50 80 60
4
30 40 60 20
50 120 100 50
2
0
20.0 40.0 60.0 80.0 100.0 120.0 140.0
NR.ORE
ANALIZA UNIVARIATĂ
VARIABILE CANTITATIVE
Tendinţa centrală:
Media: valoarea medie a valorilor observate
Valoarea medie este mai sensibilă ca alţi indicatori ai tendinţei centrale (modulul sau
mediana) de prezenţa “observaţiilor extreme”
x
xi
n
Media nu se situează în centrul eşantionului decât dacă distribuţia este simetrică
În cazul unei disimetrii puternice modulul poate fi mai reprezentativ pentru ansamblul
eşantionului
În cazul distribuţiilor multimodale (întâlnite în cazul studiilor de opinie când populaţia
este polarizată în jurul a 2 extreme) puţine valori sunt apropiate de medie
Modulul: valoarea cea mai des întâlnită în serie
Mediana: valoarea care împarte seria în două
ANALIZA UNIVARIATĂ
VARIABILE CANTITATIVE
Variabilitatea:
Amplitudinea: A=x n max-xmin
xi x 2
Dispersia: s x2 i 1
n 1
sx
2
Abaterea medie pătratică: s x
0,1
sx
Coeficientul de variaţie: cv (cv<30% - date omogene)
x
Compararea distribuţiei observate cu distribuţia normală
n
x x
3
i
n s x
3
Concentrarea (Kurtosis):