Sunteți pe pagina 1din 95

MCAAD

Conf. dr. Teo Hărăguș


Planul întâlnirii
Recapitulare: statistică descriptivă
1. Măsurarea variabilelor: nivele de măsurare
2. Distribuții de frecvență
3. Grafice
4. Indicatori de poziție
5. Indicatori de dispersie
6. Distribuția normală
1. Masurarea variabilelor
Măsurarea = proces sistematic prin care se oferă numere unui “ceva”. (Nunnally, 1978, p. 3). Acel
“ceva” este cunoscut sub numele de variabilă.

Variabila statistica - (o însuşire ce prezintă interes ştiinţific)


• Nu orice variabilă poate fi măsurata numeric (într-un sens strict)
• Și clasificarea este un fel de “masurare”

Scale (Nivele) de masurare :


 Modul în care se atribuie numere sau simboluri
variabilelor statistice
 Forma sub care se exprima însuşirile indivizilor
statistici
Patru nivele de măsurare: - nominal N

complexitate
- ordinal O
- interval I
- rapoarte R
3
Nivelul nominal

Nominal –atribuirea numelor la categorii (valori)


• Implica: clasificarea indivizilor in clase
• Nu implica: diferentieri de cuantum sau ordonari

Cerinte:
 Categorii distincte si reciproc exclusive
 Categorii exhaustive

Etichetele atribuite categoriilor:


 Doar coduri, simboluri
 Nu cantitati
4
Nivelul ordinal
Scala ordinala implică: clasificarea și
ordonarea
Etichetele arată:
 Că doua valori difera
 Că una e mai mare/multa/ inalta/etc decat cealalte

Etichetele NU exprima:
 Cantitatea exacta
 Intervale egale
 Aranjarea exacta in cadrul categoriei

Nivelul ordinal superior celui nominal deoarece:


 Adauga o diferentiere categoriilor
 Face posibila o observare ordonata
5
Nivelul interval

Scala interval implica: clasificarea


ordonarea
+ aranjarea valorilor la distante egale
+ existenţa unei unitati de masura
+ posibiliatea comparatiilor in termeni de “cu cat”
Etichetele exprima:
 Un cuantum, o cantitate din acea insusire
 Distanta la care se afla valorile unei variabile fata de celelalte

Etichetele NU exprima:
 Un zero absolut (care sa arate lipsa acelei insusiri)
 Nu se pot face comparatii in termeni de “cate ori”

Nivelul interval este superior celui ordinal


6
Nivelul rapoarte

Scala rapoarte implica IN PLUS: existenta unui zero absolut

Etichetele exprima:
 Cantitatea reala a proprietatii masurate

 Posibilitatea comparatiilor in termeni de “câte ori”

In datele folosite în asistența sociala:


 Rareori intalnim variabile masurate la nivel rapoarte
 Daca exista posibilitatea unor valori negative nu avem nivel rapoarte
 Distinctia dintre nivelul interval si nivelul rapoarte nu este atât de importanta

(în majoritatea aplicațiilor statistice chiar lipsește)

Nivelul rapoarte este superior celui interval


7
Precizari suplimentare

Cunosterea nivelului de masura al datelor de care dispunem serveste


la alegerea indicatorului sau al testului statistic potrivit

Diferitele nivele de masura ale unei variabile depind de modul in care


sunt conceptualizte si operationalizate fenomenele sociale si nu de
caracteristicile inerente ale fenomenelor in sine

Variabile dependente si variabile independente

8
2. Distribuții de frecvență

• Notiunea de frecventa
• Tabelul de frecvente
• Tabelul de frecvente pentru variabile cantitative
• Frecvente absolute si frecvente relative
• Frecvente valide
• Frecvente cumulate
• SPSS: comenzi si exemplu

9
Notiunea de frecventa

 Cautarea frecventelor= cautarea numarului de indivizi statistici din fiecare categorie a


variabilei statistice

Cat de fericit se Frecvente


simte R ki
Foarte fericit 600
Mai degraba fericit 700

Nu prea fericit 100

Total 1 400

• Tabel de frecvențe pentru variabile calitative (nominale si ordinale)

10
Tabelul de frecvente

• Definitie: Daca avem o variabila X cu valorile {x1, x2, …xs}, si daca din n indivizi ai
populatiei, k1 sunt din clasa x1, k2, sunt din clasa x2, … ks sunt din clasa xs, atunci
corespondenta biunivoca dintre multimea claselor X={x1, x2, …xs} si multimea
frecventelor
K={k1, k2,… ks} se numeste distributie de frecvente, sau tabel de frecvente.

Valori (clase) Frecvente


xi ki
x1 k1 Proprietati:
x2 k2 Pentru orice ki 0  ki  n
… … s

xs ks k
i 1
i n
Total n
11
Tabelul de frecvente pt variabile cantitative
• Exista 2 forme, in functie de capacitatea investigatorului de a masura cu o precizie mai
mare sau mai mica :

1. Tabel de frecvente cu valori => pt. variabile discrete


2. Tabel de frecvente cu intervale de grupare => pt. variabile continue

Gospodariile din Romania dupa numarul Distributia deceselor dupa varsta,


de membri, la Recensamantul din 2002 Romania 2006
Numar persoane Numar Varsta la Numar
in gospodarie gospodarii deces persoane
1 1 384 422 0-4 3 600
2 1 952 683 5-9 334
3 1 666 351
… …
4 1 304 253
5 568 322 100+ 254

6+ 444 171 Total 258 094


12 Total 7 320 202
Tabelul de frecvente pt variabile cantitative

Criterii de construire a intervalelor (determinarea lungimii lor):


1. Numarul de intervale (nu prea mic si nu prea mare)
2. Raportul dintre lungimea intervalelor si frecvente

Distributia comunelor din Romania


dupa numarul de locuitori, in 2006
Numar locuitori Numar
comune
Interval
prea mic Sub 1 000 68 prea putini
(indivizi
1 000 - 1 999 568
statistici)
interval 2 000 - 4 999 1 769
prea
5 000 - 9 999 428
mare prea multi
10 000 + 21
13 Total 2 854
Tabelul de frecvente pt variabile cantitative

Criterii de construire a intervalelor:

1. Numarul de intervale (nu prea mare si nu prea mic)

2. Raportul dintre lungimea intervalelor si frecvente

3. Intervalele trebuie sa pastreze proprietatea de exclusivitate si exhaustivitate

4. Intervalele de la capetele scalei pot fi deschise

5. Pentru scale stabilite ad-hoc, se utilizeaza intervale de lungimi egale, intr-un numar optim

PS. Formula lui Sturges pentru calculul lungimii intervalului de grupare:

x max  x min
l
14 1  3,322 * lg n
Frecvente absolute si frecvente relative
Frecvente absolute = numar de indivizi ce se gasesc intr-o grupa sau alta

Nu sunt relevante pentru comparatii daca nu se tine cont si de totalul indivizilor

 Necesitate reducerii la un total fix, standard: 1, 100, 1 000, 10 000, 100 000

Frecvente absolute  Frecvente relative

K={k1, k2,… ks}  P={p1, p2,… ps}

ki
pi  proportii (reducere la unitate)
n

pi %  pi * 100 procente (reducere la 100)

pi ‰  pi * 1000 promile (reducere la 1000)


15
Frecvente absolute si frecvente relative

Exemplu
Cat de fericit se Frecvente Frecvente
simte R absolute relative
xi ki pi

Foarte fericit 600 0,43

Mai degraba fericit 700 0,50

Nu prea fericit 100 0,07

Total 1400 1

16
Frecvente absolute si frecvente relative
• Interpretarea frecventelor relative: “probabilitati empirice”
- prime aproximari pentru propensitatea experimentarii unui eveniment
- prime aproximari pentru propensitatea de apartinere la o categorie sau
alta

• Utilizare
- pentru a intelege mai usor o distributie de frecvente
- pentru comparatii si standardizari
- pentru modele explicative

17
Frecvente valide

• Frecvente valide = frecvente relative in care se tine cont de numarul non-raspunsurilor prin
scoaterea acestora de la numitor

• Ex: 100 indivizi: 55 foarte fericiti


35 nu prea fericiti
10 nu vor sa raspunda

• SPSS/PSPP: non-raspunsuri = “missing values”

18
Frecvente cumulate

• Frecventele cumulate pot fi:

- absolute sau relative


- ascendente (mici-mari) sau descendente (mari-mici)

• Interpretare:

Frecvente ascendente = cati indivizi (in ce proportie, cate procente) se gasesc sub o anumita valoare
a scalei
= cati sunt pana la o anumita valoare (treapta)

Frecvente descendente = cati indivizi (ce proportie, cate procente) se gasesc peste o anumita valoare
(treapta) a scalei
= cati au depasit o anumita valoare

19
Frecvente cumulate

• Ex: Varsta mamelor la nastere, in Romania 2006


Grupa Frecv. Pro- Var- Procente Var- Procente
de absolute cente sta cumulate sta cumulate
varsta ascendente descendente

10-14 551 0,3 < 15 0,3 10+ 100


15-19 28 329 12,9 < 20 13,2 15+ 99,7
20-24 54 533 24,8 < 25 38,0 20+ 86,8
25-29 71 721 32,7 < 30 70,7 25+ 62,0
30-34 44 580 20,3 < 35 91,0 30+ 29,4
35-39 17 537 8,0 < 40 99,0 35+ 9,1
40-44 2 104 1,0 < 45 99,9 40+ 1,1
45-49 128 0,1 < 50 100 45+ 0,1
Total 219483 100 Total Total

20
SPSS: comenzi si exemplu
Comanda SPSS pentru tabele de frecvente:
ANALYZE, DESCRIPTIVE STATISTICS, FREQUENCIES

Frequencies
S ta tis tics

Ge n e ra l Ha pp i n e s s
N Va l i d 1504
M i s s i ng 13

General Happiness
Cumulative
Frequency Percent Valid Percent Percent
Valid Very Happy 467 30.8 31.1 31.1
Pretty Happy 872 57.5 58.0 89.0
Not Too Happy 165 10.9 11.0 100.0
Total 1504 99.1 100.0
Missing NA 13 .9
Total 1517 100.0

21
Reprezentări grafice

• Rolul reprezentarilor grafice


• Diagrama circulara
• Diagrama de bare
• Histograma
• Linia poligonala
• Curba de frecvente
• Diagrama de imprastiere

22
Rolul reprezentarilor grafice
• Graficul ca forma alternativa de reprezentare a tabelei de frecvente

• Rolul reprezentarilor grafice


- face ca distributiile de frecvente sa fie percepute mai usor
- prezinta idei, rezultate relevante derivate dintr-o cercetare

• Dezavantaje fata de tabelele de frecvente


- sacrifica detaliile (cateodata acuratetea) in favoarea imbunatatirii comunicarii
- exista riscul de a folosi o reprezentare grafica care printr-o modificare usoara poate conduce la
concluzii eronate

• Cand se justifica folosirea graficelor in locul tabelelor de frecvente?


- rezultatul de comunicat este important
- rezultatul poate fi captat efectiv intr-un grafic
- cei carora li se comunica rezultatul nu sunt cercetatori si este propbabil ca ei sa intelega mai bine
dintr-un grafic decat dintr-un tabel
- este esential sa se treaca rapid la subiect, inainte ca auditoriul sa-si piarda rabdarea

• Folosirea graficelor in faza de explorare, in procesul de analiza a datelor, in scopul gasirii unor
idei interesante  ajutor substantial al calculatoarelor si al software-lor specializate

23
Grafice atasate variabilelor calitative
Diagrama circulara - principiul divizarii unui intreg in parti componente

Diagrama de bare - principiul reprezentarii proportionale a efectivelor


distributiei de frecvente
- fara vizualizarea conturului intregului

60%
Cat de fericit se Procente 50%
simte R
40%
Foarte fericit 43%
30%
Mai degraba fericit 50%
20%
Nu prea fericit 7% 10%

Total 100% 0%
Foarte fericit Mai degraba Nu prea fericit
24 fericit
Diagrama circulară

6+
membrii
5 6% 1
membrii membru
8% 19%

4
membrii
18%

2
membrii
26%
3
membrii
23%

Gospodarii dupa numarul membrilor, Romania


25 la recensamantul 2002
Diagrama circulara

Decese dupa grupa de varsta, Romania 2006 AȘA NU!!


0-4 5-9
10-14 15-19
5%1%
0%
1%
0%
0%
1%
1%
1%
1%
3%
8% 5% 20-24 25-29
30-34 35-39
6%
40-44 45-49
17%
7% 50-54 55-59
60-64 65-69
10% 70-74 75-79
80-84 85-89
17%
14% 90-95 98-99
100+

27
Grafice atasate variabilelor calitative

Cum se face alegerea intre diagrama circulara (dc) si diagrama de bare (db) ?

- avantaj dc: e mai expresiva si exprima intregul impreuna cu partile componente

- dezavantaj dc: daca exista prea multe valori (clase) dc devine mult prea incarcata

- avantaj db: exista posibilitatea folosirii aceluiasi grafic pentru a reprezenta mai multe
serii de date

28
Grafice atasate variabilelor calitative

Variante ale diagramei de bare

Diagrama de bare
- verticale
- orizontale

Diagrama de bare cu serii multiple de date


- bare alaturate
- bare incalecate
- bare procentuale incalecate

29
Diagrama de bare

Nascuti-vii dupa varsta mamei la nastere, Romania 2000

100 000
90 000
Numar de nascuti-vii
80 000
70 000
60 000
50 000
40 000
30 000
20 000
10 000
0
10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49
Varsta mamei la nastere

30
Diagrama de bare alaturate

Nascuti-vii dupa varsta mamei la nastere, Romania 2000 si 2006

100 000
90 000 2000
Numar de nascuti-vii 80 000 2006
70 000
60 000
50 000
40 000
30 000
20 000
10 000
0
10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49
Varsta mamei la nastere

31
Diagrama de bare incalecate

160 000
140 000

120 000
100 000

80 000
60 000

40 000
20 000
0
1 2 3 4 5 6 7 8

32
Diagrama de bare procentuale incalecate

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
1 2 3 4 5 6 7 8

33
Grafice atasate variabilelor cantitative

Histograma – principiul reprezentativitatii proportionale a


frecventelor (Aria barelor si nu a inaltimea lor)
Linia poligonala (Poligonul de frecvente) – puncte de
coordonate (xi valoarea centrala a intervalui, ki frecventa in
interval) unite pentru a sublinia senzatia de continuitate
Grupa de Decese 50 000
varsta 45 000

0-4 3 600 40 000

Numar de decese
35 000
5-9 334 Barele se ating !
30 000
10-14 365 25 000

15-19 941 20 000


15 000
20-24 1 020
10 000
… … 5 000

100+ 254 0
0-4
5-9
10-14
15-19
20-24
25-29
30-34
35-39
40-44
45-49
50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
90-95
98-99
100+
Total 258 094
34 Varsta (in ani impliniti)
Grafice atasate variabilelor cantitative

Histograma – principiul reprezentativitatii proportionale a frecventelor (Aria


barelor si nu a inaltimea lor)
Linia poligonala (Poligonul de frecvente) – puncte de coordonate (xi, ki )
(respectiv, valoarea centrala a intervalui si frecventa in interval) unite pentru a
sublinia senzatia de continuitate
Grupa de Decese 50 000
varsta 45 000

0-4 3 600 40 000


35 000

Numar de decese
5-9 334
30 000
10-14 365 25 000

15-19 941 20 000


15 000
20-24 1 020
10 000
… … 5 000
0
100+ 254
0-4
5-9
10-14
15-19
20-24
25-29
30-34
35-39
40-44
45-49
50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
90-95
98-99
100+
Total 258 094
35 Varsta (in ani impliniti)
Grafice atasate variabilelor cantitative

Procente cumulate a deceselor dupa varsta, Romania 2006

120%
Grupa de Procen
varsta te cum. 100%

0-4 1,4
80%
5-9 1,5
10-14 1,7 60%

15-19 2,0 40%


20-24 2,4
20%
… …
95-99 99,9 0%
0-4
5-9
10-14
15-19
20-24
25-29
30-34
35-39
40-44
45-49
50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
90-95
98-99
100+
100+ 100,0
Varsta (in ani impliniti)
36
Histograma

• Cazul tabelelor cu intervale de grupare inegale

Distributia comunelor din Romania dupa numarul de locuitori, in 2006

Numar Nr. 2000


locuitori com 1800

une 1600
1400

Numar comune
Sub 1000 68 1200
1000
1000 -1999 568
800
2000 - 4999 1 769 600
400
5000 - 9999 428
200
10000 + 21 0
< 1000 1000-1999 2000-4999 5000-9999 10000 +
Total 2 854 Numar locuitori

37
Histograma

• Cazul intervalelor de grupare inegale

Distributia comunelor din Romania dupa numarul de locuitori, in 2006


700
Numar Nr. 600
locuitori com

Numar comune
500
une
400
Sub 1000 68
300
1000 -1999 568 200
100
2000 - 4999 1 769
0
5000 - 9999 428
00 99 99 99 +
10 1 9 4 9 9 9 00
10000 + 21 < 00- 00- 00- 10
0
10 20 50
Total 2 854 Numar locuitori

Calculele trebuiesc refacute astfel incat ariile barelor sa fie proportionale cu


frecventele ! Frecventele trebuiesc reduse cu un factor egal cu raportul dintre
38
lungimea intervalului si lungimea intervalului cel mai scurt.
Grafic nereuşit: două treimi din el este gol, nefolosit.
Soluţia: schimbarea scalei pentru axa Y.
Poligonul de frecvente

• Poligonul de frecvente este o “forma imperfecta” (obtinuta pe baze empirice) a


unei curbe de frecvente (frecvente teoretice)

• Curba de frecventa este reprezentarea grafica a unei functii matematice f: x P,


numita densitate de repartitie sau densitate de probabilitate, care reflecta o “lege
teoretica” de distributie e fenomenului statistic. Functia F: x P, al probabilitatilor
cumulate poarta denumirea de functie de repartitie

• Poligonul de frecvente al unei variabile continue, pentru o populatie infinita,


masurabila cu oricata precizie, al punctelor de coordonate (xi, pi) se apropie (la
limita) de o functie continua
( f: x P ) reprezentata grafic de o curba de frecvente
40
Curba de frecvente
Forme teoretice de curbe

• Curba normala (sau Curba lui Gauss)

Frecvente

Valori variabila continua


41
Curba de frecvențe
Forme teoretice de curbe

• Curba normala (sau Curba lui Gauss)

 Distributii pozitiv asimetrice (Ex: fertilitatea pe varste)

 Distributii negativ asimetrice (Ex: mortalitatea pe varste, a doua parte)

 Distributii in forma de J (Ex: salariile intr-o fabrica)


 Distributii in forma de U (Ex: mortalitatea pe varste, prima parte)

42
Diagrama de imprastiere
• Diagrama de imprastiere - se ataseaza seriilor de valori (si nu
distributiilor de frecvente !) Fiecare individ din populatia statistica
reprezinta un punct in diagrama de imprastiere.

Țările lumii, dupa durata vietii si venitul mediu pe cap de locuitor, 1995

85

Speranta de viata la nastere (ani)


80
75
70
65
60
55
50
45
40
0 5000 10000 15000 20000 25000
Venitul mediu pe cap de locuitor ($) 43
Software

Excel: Charts

SPSS: GRAPHS
ANALYZE, …, Charts

44
Indicatori statistici descriptivi

• Indicatori statistici descriptivi


• Indicatori de pozitie
• Media
• Mediana
• Modul
• Medie, mediana sau mod?

45
Indicatori statistici descriptivi

• Indicatori = valori atasate variabilelor statistice prin care se incearca


exprimarea intr-o maniera sintetica a informatiilor continute in
distributia de frecvente atasata

Alte denumiri: “valori tipice”, “valori reprezentative”, “parametrii”

• Clasificare:

Indicatori de pozitie (sau de nivel, sau ai tendintei centrale)

Indicatori de dispersie (sau de imprastiere, sau de variatie)

Indicatori ai formei

46
Indicatori de poziţie

• Rostul ind. pozitie : sa exprime printr-o singura valoare


nivelul general al valorilor seriei, sau ordinul de marime al
acestor valori

 nu au o semnificatie exacta
 au doar o semnificatie generala cu continut relativ redus

47
Media

• Denumiri sinonime: media aritmetica, valoarea medie, media

• Definitie 1: Valoarea care se obtine impartind suma valorilor


tuturor indivizilor din populatie la numarul acestora
n

x i
x i 1
n
 Definitie 2 : Valoarea comuna pe care ar trebui sa o ia fiecare
individ din populatie astfel incat sa se pastreze neschimbata suma
valorilor
n
n x   xi
i 1
48
Media

• Calculul mediei cu date din tabele de frecvente:

k x i i
x i 1
n
 Nu e formula mediei ponderate. Aici fiecare individ conteaza la fel in generarea
valorii medii, indivizii avand ponderi egale.

Ex de medie ponderata: media notelor in sistemul de credite transferabile.


Discipline: A, B, C, D, E
Credite: 4, 5, 6, 7, 8 (total 30)
Note obtinute: 10, 9, 9, 8, 8

Media simpla (aritmetica): Media ponderata:


10  9  9  8  8 44 4  10  5  9  6  9  7  8  8  8 259
x   8,80 x   8,63
49 5 5 30 30
Media

Cazul in care distinctia dintre frecvente si ponderi dispare:


 cand media generala se calculeaza pe baza valorilor medii ale indivizilor constituiti in
grupuri

Ex: media generala a notelor studentilor din anul I, la o anumita disciplina, calculata pe baza
mediilor obtinute pe grupe de studenti:
n – nr. studenti; s – nr. subgrupe;
ki – nr. de studenti in subgrupa i,
xi media obtinuta de grupa i
s

k x i i
x i 1
n
50
Proprietăţile mediei

(1) Daca consideram o populatie impartita in mai multe sub-populatii, Media generala
este egala cu media mediilor sub-populatiilor ponderate cu marimea fiecarei subpopulatii

(2) Media este o valoare cuprinsa in intervalul dintre valoarea cea mai mica si
valoarea cea mai mare a seriei de valori

(3) Media este o valoare a carei unitate de masura coincide cu unitatea de masura in
care sunt exprimate valorile variabilei respective
Ex: lei, euro, ani (de varsta), puncte (obtinute)

51
Proprietatile mediei

(4) Suma abaterilor de la medie este nula

 x 
n

i x 0
i 1
 Media este un “centru de greutate” al seriei de valori

(5) Media ramane neschimbata daca frecventele se inmultesc


sau se impart cu un acelasi numar (m)
s s

m k x i i k x i i
x 
' i 1
 i 1
x
mn n
 Posibilitatea utilizarii frecventelor relative (pi) in calculele mediei
s
x   pi x i
52 i 1
Proprietatile mediei

(6) Daca valorile xi sufera toate o aceasi transformare liniara, media


noii variabile se obtine prin aceasi transformare

x  a  b  xi
'
i x'  a  b  x
 Obs1. Media poate fi calculata si daca nu se cunoaste distributia
variabilei, ci doar suma valorilor

 Obs2. Media poate fi o valoare pe care nu o are nici un individ


4  4  5  7  10 30
Ex: 4, 4, 5, 7, 10 x  6
5 5
 Obs3. Media poate fi o valoare care nu are sens pentru nici un individ

Ex: Calculul numărului mediu de persoane pe familie în Romania 2002


53 = 2,91 (persoane)
Calculul mediei din tabele de frecvente cu intervale de
grupare
• Ex: Calculul varstei medii a mamelor la nastere, in Romania 2006
Grupa Frecv. Pro-
de absolute cente
varsta
10-14 551 0,3
15-19 28 329 12,9
20-24 54 533 24,8
25-29 71 721 32,7
30-34 44 580 20,3
35-39 17 537 8,0
40-44 2 104 1,0
45-49 128 0,1
Total 219 483 100

12,5  0,3  17,5  12,9  22,5  24,8  ...  42,5  0,1


x  26,90 (ani) 54
100
Interpretari gresite ale mediei

• Valoare mijlocie (se pleaca de la proprietatea (2)

• Valoare tipica

Contra exemplu (varste): 25, 26, 27, 28, 44  media=30

 alti indicatori de pozitie

 Valoarea medie arata ordinul de marime, nivelul general al valorilor

55
Mediana

• Interpretare: valoare mijlocie

• Definitie: Valoarea individului statistic care imparte populatia in doua


submultimi egale numeric, prima avand valori mai mici sau egale cu
acesta, iar cealalta avand valori mai mari sau egale cu aceasta

Ex1: 4, 4, 5, 7, 10
media= 6
mediana = 5

Ex2: 7, 4, 4, 5, 10 ?

56
Mediana

Algoritmul de calcul al medianei (Me)

1) se aseaza valorile in ordine crescatoare


2) se determina rangul individului median (rme)

Daca n impar: Daca n par:


n 1 n n
rme1  si rme2  1
rme  2 2
2
3) se precizeaza valoarea individului median

x rme1  x rme 2
Me  x rme Me 
2

57
Mediana

• Algoritmul de calcul al medianei din tabele de frecvente cu


intervale de grupare

1) se determina rangul individului median (poate fi virtual


-cu zecimale- in caz ca n e par)

2) se calculeaza frecventele cumulate ascendente pana se


depaseste rme  Fi >= rme

3) se stabileste intervalul median [xi, xi+1) (l lungimea interv.)

4) se calculeaza Me dupa formula:

rme  Fi 1
Me  xi  l 
ki
58
Mediana

• Ex: Calculul varstei mediane a mamei la nastere, in Romania 2006


Grupa Frecv. Frecv.
de absolute cumu- 219.483  1
rme   109.742
varsta late 2
10-14 551 551
15-19 28 329 28 880 F4  155.134  109.742
20-24 54 533 83 413
25-29 71 721 155 134
[ 25, 30 ) este intervalul median
30-34 44 580
35-39 17 537
109.742  83.413
40-44 2 104 Me  25  5   26,84
71.721
45-49 128
Total 219 483 (ani)

59
Modul

• Interpretare: valoare tipica

• Definitie: Valoarea care apare cel mai des


Ex: 4, 4, 5, 7, 10
media = 6
mediana = 5
modul =4

• Pentru tabele de frecvente cu intervale de grupare logic ar fi


suficienta stabilirea unui interval modal, dar prin conventie
se poate utiliza formula:
ki  ki 1
Mo  xi  l 
ki  ki 1   ki  ki 1 

60 Unde [xi, xi+1) interval modal; ki frecventa intervalului modal;


ki-1 frecventa intervalului pre-modal; ki+1 frecventa intervalului post-modal
Modul

• Ex: Calculul varstei modale a mamei la nastere, in Romania 2006

Grupa Frecv.
de absolute
varsta
10-14 551 [ 25, 30 ) este intervalul modal
15-19 28 329
20-24 54 533
71.721  54.533
25-29 71 721 Mo  25  5   26,94
30-34 44 580
71.721  54.533  71.721  44.580
35-39 17 537
(ani)
40-44 2 104
45-49 128
Total 219 483

61
Media, mediana sau modul?

• Cel mai precis indicator: media


- ia in calcul toate valorile

• Cel mai senzitiv indicator: media


- sesizeaza orice schimbare
- avantaj de regula, dar
- dezavantaj cand exista cateva valori deviante

• La variabilele cantitative: indicatorii de pozitie se folosesc combinat

• La variabile masurate nominal: numai modul

• La variabilele masurate ordinal: mediana si modul

62
Indicatori de dispersie
Structura cursului

• Rolul indicatorilor de dispersie

• Cerinte de indeplinit pentru un indicator de dispersie

• Amplitudinea

• Abaterea intercuartila si derivatele sale

• Abaterea medie

• Varianta si abaterea standard

• Proprietatile abaterii standard

• Comenzi SPSS

64
Rolul indicatorilor de dispersie

Denumiri folosite: indicatori de dispersie, indicatori de imprastiere, indicatori


de variatie, indicatori de variabiliate

• Insostesc indicatorii de pozitie cu scopul de a imbogati informatia despre variabila


studiata

• Masoara gradul de imprastiere a indivizilor in cadrul seriei de valori

• Caracterizeaza o populatie statistica din punctul de vedere al omogenitatii, al


eterogenitatii in raport cu o variabila data

• In sociologie, cand variabila reflecta ierarhii sociale recunoscute sau valorizate:


reflecta gradul de inegalitate dintre indivizi
Ex: saracia, studiile

• In modelele explicative: rol esential; reflecta gradul de nedeterminare, de


variabilitate a unui fenomen
Ex: notele la un examen in functie de absolvirea unui liceu cu profil teoretic sau a
unui liceu cu profil aplicativ

65
Cerinte de indeplinit

Ex: seria A: 4, 4, 5, 7, 10; seria B: 2, 4, 6, 6, 12; seria C: 1, 4, 8, 9, 11


mediaA=6 mediaB=6 media C= 6,6
Care serie e mai omogena?
Exista diferente de omogenitate intre seria B si seria C?

1) Senzitivitate. Orice schimbare in valorile seriei sa implice schimbare a


indicatorului de dispersie.
Ex: Daca in seria B: 12  14 Ce ar trebui sa se intample cu indicatorul de
dispersie? Dar daca 12  10 ? Dar daca 6 8

2) Calculabilitate. Plecand atat de la serii de valori cat si de la distributii de


frecvente. ! Numai pentru variabile cantitative !

3) Sa nu depinda de volumul populatiei

4) Sa nu depinda de marimea mediei

Obs. Volumul si media pot interveni in modul de calcul al indicatorului de dispersie,


dar masura in sine sa nu reflecte nici volumul populatiei si nici marimea mediei
66
Amplitudinea

• Definitie. Amplitudinea este diferenta dintre valoarea cea mai mare si valoarea
cea mai mica.

amplitudinea = xmax - xmin

Ex: seria A: 4, 4, 5, 7, 10; seria B: 2, 4, 6, 6, 12; seria C: 1, 4, 8, 9, 11


amplitudineA =6 amplitudineB = 10 amplitudineC = 10

 Avantaje: usor de calculat, nu depinde de marimea populatiei si nici de media ei

 Dezavantaje: senzitiviate deficitara


- nu ia in calcul decat 2 valori (lipsa precizie – seria B si seria C)
- nu sesizeaza diferentele intre doua serii distincte daca valorile lor
maxima si minima coincid (senzitivitate redusa)
- sesizeaza aberant diferentele intre doua serii care difera doar prin
valorile maxima si minima. Cazul valorilor deviante si a erorilor de masurare.
(senzitivitate excesiva)
67
Abaterea intercuartila

• Cuartilele : Acele valori ale indivizilor statistici, din ierarhia valorilor de la


cea mai mica la cea mai mare, care impart populatia in 4 parti egale ca
volum.

Notatie cuartile: Q1, Q2, Q3


4 intervale egale ca volum: (xmin, Q1), (Q1, Q2), (Q2, Q3), (Q3, xmax)

Definitie. Abaterea intercuartila este diferenta dintre cuartila 3 si cuartila 1


I  Q3  Q1

Q3  Q1
Abaterea semi-intercuartila 
2
Q3  Q1
Abaterea intercuartila relativa 
Q2
Q3  Q1
Abaterea semi-intercuartila relativa 
68 2  Q2
Abaterea intercuartila

Ex: seria D (seriile A, B, C reunite): 1, 2, 4, 4, 4, 4, 5, 6, 6, 7, 8, 9, 10, 11, 12


Abaterea intercuartilaD = 9 – 4 = 5 Q1 Q2 Q3

 Alte valori care impart populatia in intervale cu submultimi de indivizi cu


efective egale:

Decile – 10 intervale, 9 decile


Centile – 100 intervale, 99 centile
Cuantile – generalizare, un numar oarecare de parti egale

 Avantaje: relativ mai greu de calculat decat amplitudinea, nu depinde de


marimea populatiei si nici de media ei

 Dezavantaje: senzitiviate relativ mai buna, dar nu sesizeaza toate


schimbarile din seria de valori (doar 50% la ab.intercuartila, doar 80% la
ab.interdecila, etc.)
69
C
ze S l

0
1
2
3
4
5
6

ch ov
R a ki
ep a
u
H blic
un
ga
N ry
or
w
a
N E st y
et on
he ia
rl a
n
N Fi ds
n
ew la
M S n
em Lu we d
b e xe m d e
rS b n
ta our
te g
s
(1
Po 2)
D lan
en d
m
Li ar
th k
ua
n
Au i a
Sl stria
ov
e
Be nia
lg
G ium
er
Eu m
an
ro y
ar M
ea al
(c Ire t a
h a EU la
n n
Eu g i n (2 7 La d
ro g c o t v
Eu are com unt ia
ro a p ri e
ar (17 osit s)
ea c io
(1 oun n)
6
co trie
u n s)
EU tri
e
(1 Ic s)
5 el
co an
un d
tri
e
G s)
re
R ec
om e
U an
ia
S80/S20 income quintile share ratio, elderly people (65+), 2010

ni
te
d
4.1

Ki It a
ng ly
do
m
Sp
a
Fr in
an
B ce
Sw ulg
ar
it z ia
er
la
C nd
yp
P o ru s
rtu
g
C al
ro
at
ia
Abaterea medie

• Se introduce o valoare fixa “a” fata de care se calculeaza distanta fiecarui


termen al seriei. Apoi se calculeaza media acestor distante. De regula se
alege valoarea medie pentru acea valoare fixa “a”.
Problema: suma abaterilor valorilor fata de medie este zero

• Definitie. Abaterea medie este media abaterilor individuale a valorilor


fata de media seriei, luate in valoare absoluta

n s

| x i x| k i | xi  x |
Abm  i 1 sau Abm  i 1

n n

Ex: seria A: 4, 4, 5, 7, 10; seria B: 2, 4, 6, 6, 12; seria C: 1, 4, 8, 9, 11


Abaterea medie A = (|4-6|+|4-6|+|5-6|+|7-6|+|10-6|)/5=(2+2+1+1+4)/5 =2
71
Abaterea medie B = (4+2+0+0+6)/5=2,4
Abaterea medie C = … = 3,28
Varianța

• Definitie: Varianța este media patratelor abaterilor de la medie a


valorilor unei serii de date

n s

(x i  x) 2

sau
 k (x i i  x)2
2  i 1
2  i 1
n n

Inconvenient : datorita ridicarilor la patrat varianta poate depasi amplitudinea.

 Defintie: Abaterea standard este valoarea obtinuta prin extragerea


radicalului din varianță
  2
Alte denumiri: deviatie standard, ecart-tip, dispersie

72
Varianța

Ex: seria A: 4, 4, 5, 7, 10; seria B: 2, 4, 6, 6, 12; seria C: 1, 4, 8, 9, 11

( 4  6) 2  ( 4  6) 2  (5  6) 2  (7  6) 2  (10  6) 2 26
 
2
A   5,2
5 5
( 2  6) 2  ( 4  6) 2  (6  6) 2  (6  6) 2  (12  6) 2 56
 
2
B   11,2
5 5
(1  6,6) 2  ( 4  6,6) 2  (8  6,6) 2  (9  6,6) 2  (11  6,6) 2
 
2
C  13,04
5

 A  2,28

 B  3,35

 C  3,61

73
Proprietatile abaterii standard

(1) Cea mai mica abatere medie patratica fata de o valoare “a” este abaterea
standard
 Orice abatere medie patratica fata de o valoare “a” poate fi obtinuta ca suma
dintre varianta si patratul distantei “d” dintre valoarea “a” si valoarea medie
(propr. foarte utila la calculul manual al ab.std.)

Pentru orice “a” S 2 (a )   2  d 2 unde d ax


(2) Daca valorile variabilei se inmultesc (sau se impart) cu o aceeasi
constanta “a” valoarea abaterii standard se dilata proportional.

Daca X’ = aX atunci σX’ = aσX

(3) Daca la valorile variabilei se adauga (sau se scade) o aceeasi constanta


“a” abaterea standard nu se schimba.

74 Daca X’ = a + X atunci σX’ = σX


Proprietatile abaterii standard

(4) Abaterea standard (amplitudinea, abaterea medie sau abaterea


intercuartila) are aceeasi unitate de masura ca si valorile variabilei

(5) Varianța are proprietati suplimentare care o fac potrivita pentru analizele
folosite in modele explicative (numita analiza de varianta sau ANOVA)

 Teorema de descompunere a variantei:


Pentru populatiile impartite in mai multe sub-populatii dupa un anumit criteriu (numit
factor in modele explicative).
Varianta totala se poate descompune in suma a doua parti, una datorata variatiei
mediilor sub-populatiilor fata de media generala (varianta intergrupala, varianta
explicata de factor) si alta datorata variatiei in cadrul sub-populatiilor (varianta
intragrupala, varianta ramasa de explicat)

75
Comenzi SPSS

• Analyze, Descriptive statistics, Descriptives, Options


Standarad deviation (abatere standard)
Variance (varianta)
Range (amplitudine)
Minimun
Maximum

• Analyze, Frequencies, Statistics


Percentiles (centile)
Quartiles (cuartile)
Cut point for “n”: equal groups (cuantile)
Standard deviation
Variance
Range
Minimum
Maximum

76
Indicatori ai formei distributiilor.
Valori Z.
Distribuția normală.
Structura cursului

• Indicatori ai formei distributiilor


• Oblicitatea
• Boltirea
• Valori Z
• Distributia normala standardizata
• Legatura dintre probabilitati si aria de sub curba normala
Indicatorii formei distributiilor de frecvente

Problema formei se pune doar pentru variabile cantitative: doar aceste distributii de
frecvente empirice pot fi comparate cu distributii matematice avand proprietati bine
definite (si in special cu distributia normala)

• Indicatorii oblicitatii arata masura in care distributia frecventelor se abate de la


simetria in jurul valorilor centrale, cum e in cazul a distributiei normale

• Indicatorii boltirii arata masura in care distributia este mai plata, respectiv, mai
boltita fata de forma de clopot a distributiei normale
Simetria curbei normale

• Curba normala este simetrica. Are o axa de simetrie.


(valorile mari sunt la fel de multe ca valorile mici)

 Distributiile normal asimetrice sunt “oblice”:


- “pozitiv asimetrice” valorile mici sunt mai dese,
valorile mari sunt mai rare
- “negativ asimetrice” valorile mari sunt mai dese,
valorile mici sunt mai dese
Oblicitatea (skewness)

 Calculul Indicatorului de oblicitate (sau de asimetrie)

x  Mo
Oblicitate =

n

 i
( x
i 1
 x ) 3

Oblicitate = (moment centrat de ordinul 3)


n 3
• Interpretarea Indicatorului de oblicitate:
> 0 distributia este pozitiv asimetrica
= 0 distributia este simetrica
< 0 distributia este negativ asimetrica
Boltirea (kurtosis)

Distributie leptocurtica Distributie platicurtica


 Calculul Indicatorului de boltire (sau de ascutime)
n

 i
( x  x ) 4

Boltire = i 1
3 (moment centrat de ordinul 4)
n 4

 Interpretarea Indicatorului de boltire


> 0 distributie leptocurtica
= 0 distributie ca cea normala
< 0 distributie platicurtica
Curba normala (“clopotul” lui Gauss)

• Simetrica fata de verticala ridicata de la valoarea medie


Oblicitate=0
Boltire=0

• Forma “clopot”. Cea mai mare parte a valorilor concentrate in zona


centrala (media = mediana = modul)

• Contine 6 abateri standard, 3 de fiecare parte a mediei

• Linia curbei se apropie la infinit de axa X, fara a o atinge vreodata


Valori Z
• Valorile Z (sau scoruri Z) sunt valori individuale
transformate in unitati de abateri standard
xi  x
zi 

 Rolul valorilor Z: in compararea a 2 valori care au fost obtinute pe


scale diferite
Ex: nivelul cunostintelor de lb.engleza a doua persoane (x1 si x2)
evaluate cu teste diferite (mediile si abaterile standard pot fi diferite)
Distribuţia I Distribuţia II

x2=70 x3=45
x1=70
m=60 m=60
m=60
σ=20 σ=20
σ=5
z2=+0,5 z3=-0,75
z1=+2
m=60 70 m=60 70
Distributia normala standardizata (z)
34,13%

13,59%
34% 34%

2,15%
14% 14%

2% 2%
Scoruri z -3 -2 -1 0 +1 +2 +3

0,13%

• Media = 0, Abaterea standard =1


• Aria de sub curba normala =1 (=100%)
• Aria delimitata de curba normala, axa orizontala si de
perpendicularele ridicate de la medie si valorile z este bine
cunoscuta (exista tabele cu aceste valori in toate manualele de
statistica)
• Valorile Z pentru o distributie normala se pot transforma usor in
centile
Distributia normala standardizata (z)
Aria cuprinsă între curba normală, medie şi valoarea Z
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.00 0.40 0.80 1.20 1.60 1.99 2.39 2.79 3.19 3.59
0.1 3.98 4.38 4.78 5.17 5.57 5.96 6.36 6.75 7.14 7.53
0.2 7.93 8.32 8.71 9.10 9.48 9.87 10.26 10.64 11.03 11.41
0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17
0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79
0.5 19.15 19.50 19.85 20.19 20.54 20.48 21.23 21.57 21.90 22.24
0.6 22.57 22.91 23.24 23.57 23.89 24.22 24.54 24.86 25.17 25.49
0.7 25.80 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.52
0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78 31.06 31.33
0.9 31.59 31.86 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89
1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
...

• Citirea datelor din tabel (partea intreaga si prima zecimala de


pe capul de linie, a doua zecimala din capul de tabel)
Aria de sub curba normala vazuta ca probabilitate

• In situatiile in care o distributie frecvente empirice are o forma “normala”, aria de sub curba,
medie si valorile “z” corespunzatroare valorilor seriei de date sunt chiar frecventele relative
pentru intervalul (medie,x)

• In situatii ipotetice, in care volumul populatiei este infinit, frecventele relative se asimileaza cu
probabilitatile

Valorile mai multe sunt “mai probabile”

Valorile mai putine sunt “mai putin probabile”

0 <= p <= 1

p = 0,05 exprimata in procente este 5%


Aria de sub curba normala vazuta ca probabilitate

• Cateva valori demne de retinut:


Cat este probabilitatea ca o valoare sa fie intre medie si o abatere
standard peste medie (z = +1) ?
Aria cuprinsă între curba normală, medie şi valoarea Z
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.00 0.40 0.80 1.20 1.60 1.99 2.39 2.79 3.19 3.59
0.1 3.98 4.38 4.78 5.17 5.57 5.96 6.36 6.75 7.14 7.53
0.2 7.93 8.32 8.71 9.10 9.48 9.87 10.26 10.64 11.03 11.41
0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17
0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79
0.5 19.15 19.50 19.85 20.19 20.54 20.48 21.23 21.57 21.90 22.24
0.6 22.57 22.91 23.24 23.57 23.89 24.22 24.54 24.86 25.17 25.49
0.7 25.80 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.52
0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78 31.06 31.33
0.9 31.59 31.86 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89
1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
...

p=0,34 (=34%)
Aria de sub curba normala vazuta ca probabilitate

• Cateva valori demne de retinut:


Care este probabilitatea valorilor cu z peste +1,64 ?
Aria cuprinsă între curba normală, medie şi valoarea Z
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
...
1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
...
1.1 36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.30
1.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97 40.15
1.3 40.32 40.49 40.66 40.82 40.99 41.15 41.31 41.47 41.62 41.77
1.4 41.92 42.07 42.22 42.36 42.51 42.65 42.79 42.92 43.06 43.19
1.5 43.32 43.45 43.57 43.70 43.83 43.94 44.06 44.18 44.29 44.41
1.6 44.52 44.63 44.74 44.84 44.95 45.09 45.15 45.25 45.35 45.45
1.7 45.54 45.64 45.73 45.82 45.91 45.99 46.08 46.16 46.25 46.33
1.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.06
1.9 47.13 47.19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.67
2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48.12 48.17
2.1 48.21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.57

p=0,05 (=5%)
Aria de sub curba normala vazuta ca probabilitate

• Cateva valori demne de retinut:


Care este probabilitatea valorilor cu z peste +1.96?
Aria cuprinsă între curba normală, medie şi valoarea Z
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
...
1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
...
1.1 36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.30
1.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97 40.15
1.3 40.32 40.49 40.66 40.82 40.99 41.15 41.31 41.47 41.62 41.77
1.4 41.92 42.07 42.22 42.36 42.51 42.65 42.79 42.92 43.06 43.19
1.5 43.32 43.45 43.57 43.70 43.83 43.94 44.06 44.18 44.29 44.41
1.6 44.52 44.63 44.74 44.84 44.95 45.09 45.15 45.25 45.35 45.45
1.7 45.54 45.64 45.73 45.82 45.91 45.99 46.08 46.16 46.25 46.33
1.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.06
1.9 47.13 47.19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.67
2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48.12 48.17
2.1 48.21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.57
p=0,025 (=2,5%)
Aria de sub curba normala vazuta ca probabilitate

• Cateva valori demne de retinut:


Care este probabilitatea valorilor cu z sub -1.96?
Aria cuprinsă între curba normală, medie şi valoarea Z
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
...
1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
...
1.1 36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.30
1.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97 40.15
1.3 40.32 40.49 40.66 40.82 40.99 41.15 41.31 41.47 41.62 41.77
1.4 41.92 42.07 42.22 42.36 42.51 42.65 42.79 42.92 43.06 43.19
1.5 43.32 43.45 43.57 43.70 43.83 43.94 44.06 44.18 44.29 44.41
1.6 44.52 44.63 44.74 44.84 44.95 45.09 45.15 45.25 45.35 45.45
1.7 45.54 45.64 45.73 45.82 45.91 45.99 46.08 46.16 46.25 46.33
1.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.06
1.9 47.13 47.19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.67
2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48.12 48.17
2.1 48.21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.57

p=0,025 (=2,5%)
Aria de sub curba normala vazuta ca probabilitate

• Cateva valori demne de retinut:


Care este probabilitatea valorilor cu z sub -1.96 sau peste +1.96 ?
Aria cuprinsă între curba normală, medie şi valoarea Z
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
...
1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
...
1.1 36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.30
1.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97 40.15
1.3 40.32 40.49 40.66 40.82 40.99 41.15 41.31 41.47 41.62 41.77
1.4 41.92 42.07 42.22 42.36 42.51 42.65 42.79 42.92 43.06 43.19
1.5 43.32 43.45 43.57 43.70 43.83 43.94 44.06 44.18 44.29 44.41
1.6 44.52 44.63 44.74 44.84 44.95 45.09 45.15 45.25 45.35 45.45
1.7 45.54 45.64 45.73 45.82 45.91 45.99 46.08 46.16 46.25 46.33
1.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.06
1.9 47.13 47.19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.67
2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48.12 48.17
2.1 48.21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.57

p=0,05 (=5%)
• Statistica inferențială:
– Ipoteze de cercetare
– Teste statistice
– Asocierea. Testul hi pătrat χ.
– Testarea diferențelor între medii. Testul t
– Corelatia
– Test 2

S-ar putea să vă placă și