Sunteți pe pagina 1din 241

UNIVERSITATEA 

DIN CRAIOVA
Facultatea de Științe Sociale

S
STATISTICĂ
S CĂ
SOCIALĂ
Capitolul 1

STATISTICA –
EVOLUȚIE,
Ț CONȚINUT,
Ț
METODOLOGIE, NOȚIUNI
Ț
y 1.1. Evoluţia, rolul şi conţinutul 
statisticii
y 1.2. Etapele cercetării statistice
1 2  Etapele cercetării statistice
y 1.3. Observarea statistică
3
y 1.4. Noţiuni utilizate în cercetarea 
statistică
y 1.5. Erorile observării statistice și 
1 5  Erorile observării statistice și 
controlul datelor înregistrate
1.1. Evoluţia, rolul şi conţinutul 
statisticii
y „statistică” = 
i i ă”   
y Culegere, prelucrare și valorificare a 
Culegere  prelucrare și valorificare a 
unor date legate de fenomene generale.
y Știință care culege, sintetizează, descrie 
și interpretează date referitoare la 
fenomene generale.
y Etapa de debut ‐ primele forme de 
eevidenţă (în Sumer, în
idenţă (în Sumer  în China, în Egipt, în 
China  în Egipt  în 
Grecia, în Imperiul Roman): 
y recensăminte periodice ale populaţiei
y evidenţa naşterilor, căsătoriilor şi a 
deceselor pe lângă marile temple
y evidenţe despre diverse construcţii
y inventarierea pentru mărimea şi structura 
averilor
y evidenţe în scopuri militare şi fiscale
y Etapa de delimitare a evidenţei 
statistice de evidenţa contabilă.
i i  d   id   bilă
y Etapa descriptivă ‐ dezvoltarea rapidă 
a vechilor activităţi, însoțită de apariţia 
altora  de extinderea relaţiilor 
altora, de extinderea relaţiilor 
comerciale şi culturale.
y Etapa aritmeticii politice debutează 
în Anglia, unde se manifestă o statistică 
deosebită, cunoscută sub numele de 
„aritmetică politică
aritmetică politică”.
y Etapa probabilistică ‐ disputa dintre 
curentul descriptiv şi cel al aritmeticii 
l d i i   i  l  l  i i ii 
p
politice, în care a triumfat ultimul ⇒
„Statistica matematică”. 
y Etapa diferenţierii Statisticii 
matematice de Statisticile aplicate în 
dif i  d
diferite domenii din natură, tehnologie 
ii di   ă  h l i  
ş
şi societate (Biostatistica, Statistica 
chimică, Statistica social‐economică, 
Statistica demografică). 
y Etapa statisticii moderne ‐ are loc 
instituţionalizarea activităţii practice de 
l d
statistică, în paralel cu dezvoltarea ei ca 
, p
ştiinţă.
y În ţara noastră s‐au efectuat înregistrări 
s au efectuat înregistrări 
ale populaţiei, în scopuri militare şi fiscale, 
din cele mai vechi timpuri.
y De Unirea de la 1859 se leagă organizarea 
statisticii oficiale în România.
Organizarea instituțională a Statisticii
y În România: Institutul Naţional de 
Statistică (www.insse.ro)
y Pe plan internaţional:
y Comisia de Statistică a Naţiunilor Unite
y Departamentul de Economie şi Statistică
y Oficiul de Statistică al Uniunii Europene
y Institutul Inter‐American de Statistică
y Institutul Internațional de Statistică. 
Institutul Internațional de Statistică  
Obiectul şi metoda statisticii
y Obiectul de studiu   variaţia în timp, în spaţiu şi din 
Obiectul de studiu = variaţia în timp, în spaţiu şi din 
punct de vedere calitativ a fenomenelor şi proceselor 
colective, în scopul descrierii acestora şi a descoperirii 
legilor care guvernează existența și manifestarea lor  
legilor care guvernează existența și manifestarea lor. 
y Raportat la domeniul de cercetare, prin diferenţierea 
metodelor de cercetare rezultă: statistica teoretică și 
statistica aplicată.
i i   li ă
y Din perspectiva scopului urmărit, putem întâlni: 
statistica descriptivă și statistica inferenţială. 
y Totalitatea operaţiilor, tehnicilor, procedeelor şi 
metodelor de investigare statistică a fenomenelor şi 
proceselor de tip colectiv formează metodologia sau 
l  d  ti   l ti  f ă  t d l i    
metoda statisticii. 
1.2. Etapele cercetării statistice
y pregătirea cercetării statistice
y elaborarea programului cercetării:
y observarea statistică
y prelucrarea statistică
y analiza şi interpretarea rezultatelor
y diseminarea informaţiilor 
statistice.
1.3. Observarea statistică
Planul de observare statistică:
y definirea scopului observării
y definirea obiectului observării
y definirea unităţilor de observare
y elaborarea programului observării statistice
y stabilirea timpului observării statistice
p
y locul observării statistice
y măsuri organizatorice
Tipuri de observări statistice:
y după modul de organizare:
y observări curente
y observări speciale
y după periodicitate:
y observări curente
y observări periodice
b ă i  i di
y observări ocazionale
y după volumul populaţiei statistice observate:
y observări totale
y observări parţiale
y după procedeul de obţinere a datelor:
y observări directe
y observări indirecte. 
b ă i i di t  
Principalele metode de observare 
statistică 

y Recensământul
R ă â t l
y Rapoartele statistice
p
y Sondajul statistic
y Ancheta statistică
y Observarea părţii principale
y Panelul
y Monografia
1.4. Noţiuni utilizate în 
cercetarea statistică
y Populaţia statistică
y Eşantionul
y Variabila statistică
y Variante/valori
y Scala/scara de măsură
y Datele statistice
y Indicatorii statistici
y Mărimile statistice
y Parametrul.
1.5. Erorile observării statistice 
și controlul datelor înregistrate
î
y Eroarea statistică = diferenţa dintre o 
dată şi valoarea concretă. Se clasifică 
d ă  i  l   ă  S   l ifi ă 
în: 
y erori de observare
y erori de prelucrare
i d   l
y erori de analiză şi interpretare.
y Tipurile de erori de observare statistică sunt:
y erori întâmplătoare
y erori sistematice
y erori de reprezentativitate.
erori de reprezentativitate
y O eroare implicată într‐o singură înregistrare 
poate fi pozitivă sau negativă ⇒ eroare totală / 
eroare netă / eroare brută.
y Distincţia dintre erori intenţionate şi erori
neintenţionate. 
y În funcţie de sursele majore de erori: 
y erori de observaţie
y erori de eşantionare.
erori de eşantionare
Capitolul 2
SERII STATISTICE
ŞI REPREZENTĂRI
Ă
GRAFICE
2.1. Variabila de grupare

22 S
2.2. Serii
ii statistice
t ti ti

2 3 Reprezentări grafice
2.3.
2 1 Variabila de grupare
2.1.
Tipuri
a)După conţinut:
• variabile atributive
• variabile
i bil de
d timp
ti
• variabile de spaţiu

b) După forma de exprimare:


• variabile
i bil cantitative:
tit ti
– discrete
– continue
• variabile calitative
Tipuri de variabile de grupare
discretă
cantitativă
atributivă continuă
calitativă

Variabila de de momente
de timp
grupare de intervale

de spaţiu
2 2 Serii statistice
2.2.
• Seriile statistice pot fi:
• serii simple
• serii complexe

• Tipuri de serii statistice:


• seriiii d
de di
distribuţie
ib i
• serii cronologice
• serii de spaţiu
2.2.1. Serii de distribuţie
• Seria de distribuţie simplă
•ddupă
ă variante
i t
xmax − xmin
• după intervale k=
1 + 3.322 log N

Categoria de Nr. de Salariul Nr. de


calificare muncitori (lei) muncitori
I 3 1.400-1.500 3
II 22 1.500-1.600 12
III 35 1.600-1.700 25
IV 20 1.700-1.800 20
V 10 1.800-1.900 10
Total 90 Total 80

Serie de distribuţie simplă. Serie de distribuţie simplă.


după variante după intervale.
• Seria de distribuţie bidimensională
Grupare după Y
Grupare după X Total fx
y1 y2 … yj … ym
x1 f11 f12 … f1j … f1m f1
x2 f21 f22 … f2j … f2m f2
M M M … M … M M
xi fi1 fi2 … fij … fim fi

M M M … M … M M
xn fn1 fn2 … fnj … fnm fn
Total fy f1 f2 … fj … fm n
n n n n

∑f
i =1
xi = ∑ f y j = ∑∑ f ij = N
j =1 i =1 j =1
Exemplu:
p

Vechimea (ani) 1 5 10 15 20 25 Total


- - - - - -
Vârsta (ani) 5 10 15 20 25 30
18-25 1 - - - - - 1
25-32 - 2 - - - - 2
32-39 - - 3 2 - - 5
39 46
39-46 - - - 3 1 - 4
46-53 - - - 1 2 3 6
53-60 - - - - 2 2 4
Total 1 2 3 6 5 5 22
Tipuri
p de frecvenţe:
ţ
• frecvenţele absolute (fi)
• frecvenţele relative (pi)
• frecvenţele cumulate (fci)
Salariul (xi) fi pi fci fci pci
- lei - cumulate cumulate cumulate
crescător descrescător crescător
1 700-2
1.700 2.000
000 2 2/18=0
2/18 0.111
111 2 18 0 111
0.111
2.000-2.300 4 4/18=0.222 6 16 0.333
2.300-2.600 5 5/18=0.278 11 12 0.611
2.600-2.900 4 4/18=0.222 15 7 0.833
2.900-3.200 3 3/18=0.167 18 3 1
Total 18 1 * * *
2 2 2 Serii cronologice
2.2.2.
• variabile de grupare de timp
• valorile variabilei de timp ordonate
cronologic
• numără suficient
fi i t dde mare dde valori
l i
• valorile
a o e variabilelor
a ab e o ttrebuie
ebu e să se refere
e e e la
a
aceeaşi unitate spaţială
Exemple:

Populația Populația Populația


Anul Data
-mii persoane- Orașul A Orașul B
2013 801 1.01.2019 22.180 32.101
2014 850 1.02.2019 22.120 32.111
2015 848 1 03 2019
1.03.2019 22 121
22.121 32 148
32.148
2016 885 1.04.2019 22.115 32.165
2017 983 1 05 2019
1.05.2019 22 125
22.125 32 165
32.165
2018 1.015 1.06.2019 22.150 32.125
2019 1 101
1.101 1.07.2019 22.160 32.211

Serie cronologică
g simplă.
p Serie cronologică
g complexă.
p
după intervale de timp după momente de timp.
2 2 3 Serii de spaţiu
2.2.3.
• variabile de grupare de spaţiu
• număr suficient de mare de valori
• valorile variabilelor trebuie să se refere la
aceeaşii perioadă
i dă d de titimp
Exemple:

Judeţul Populaţia Durata medie de viaţă


Dolj 762.142 Judeţul - ani-

Gorj 401.021 M
Masculin
li F i i
Feminin

Mehedinţi 332.673 Dolj 66.16 72.67

Olt 523.291 Gorj 66 17


66.17 73 56
73.56

Vâlcea 438.388 Mehedinţi 66.78 73.34


Olt 65 46
65.46 73 02
73.02
Vâlcea 66.86 74.52

Serie de spaţiu simplă. Serie de spaţiu complexă.


serie de distribuţie
discretă după variante
cantitativă serie de distribuţie
atributivă continuă după
p intervale
calitativă serie de distribuţie
după variante

Variabila de momente serie


de timp cronologică
d
de d intervale
de i t l
grupare

serie de
de spaţiu
spaţiu

Tipuri de variabile de grupare – tipuri de serii statistice


2.3 Reprezentări grafice
2.3.1. Grafic statistic - elemente constructive
Evoluţia Cifrei de Afaceri
Titlul
graficului
Legenda
Scara de
reprezentare
Legenda
g
Top SRL
Fenic SRL
Reţeaua
graficului

Figura Nota explicativă


graficului
Notă: Firma Fenic SRL a fost înfiinţată la 1 ian. 1999
2.3.2. Reprezentarea grafică a
seriilor statistice
2.3.2.1. Grafica seriilor de distribuţie
• Histograma
55
50
Distribuţia după greutate a 45
coletelor poştale transportate pe 40
calea ferată. ianuarie 2019 35
30
Greutatea (kg) Număr de colete 25
40 – 45 7 20
45 – 50 26 15
50 – 55 27 10
55 – 60 37 5
60 – 65 43 0
65 – 70 34 40 45 50 55 60 65 70 75 80
70 – 75 27
75 – 80 11 Histograma prin dreptunghiuri
Total 212
Distribuţia după categoria de
calificare a muncitorilor din firma
Y martie 2019

Categoria Număr 55
d calificare
de lifi d muncitori
de it i 50
I 5
45
II 15
III 50 40
IV 55 35
V 23 30
VI 2 25
2
Total 150
20
15
10
5
0
I II III IV V VI
• Poligonul frecvenţelor
55
50
45
40
35
30
25
20
15
10
5
0
40 45 50 55 60 65 70 75 80
• Curba frecvenţelor cumulate

220
Greutatea ((kg)
g) fi fci
201
40 – 45 7 7
45 – 50 26 33 180

50 – 55 27 60 160

55 – 60 37 97 140

60 – 65 43 140 120
65 – 70 34 174 2019
180
70 – 75 27 201
75 – 80 11 212 60
40
Total 212 *
20

0
40 45 50 55 60 65 70 75 80
• Grafica seriilor de distribuţie bidimensionale
1.7 2.0 2.3 2.6 2.9
Y
- - - - - fx
X
20
2.0 23
2.3 26
2.6 29
2.9 32
3.2
100-110 2 1 0 0 3
110-120 0 2 1 0 0 3
120-130 0 1 3 2 0 6
130-140 0 0 1 2 0 3
3
140 150
140-150 0 0 0 0 3 3
2,5
fy 2 4 5 4 3 18
2

1,5

1
0,5
10
0-1
10 0
20
0-1
11 0
0-13 2,9-
12 2,6- 3,
4 0 3,2
0-1 2,3- 2,9
13
5 0 2,0- 2,6
0-1
14 1,7- 2,3
2,0
2.3.2.2. Grafica seriilor cronologice
• Indicatori care nu sunt influenţaţi de
factori sezonieri
• Cronograma

Populația 1400
Anul
-mii. persoane- 1200
1995 601 1000
1996 850 800
1997 748 600
1998 805 400
1999 983 200
2000 1015 0
2001 1301 1995 1996 1997 1998 1999 2000 2001
• Historiograma
Populația
Anul
-mii. persoane-
1995 1010
1996 1101
1997 1010
1998 1201
1999 1101 1400
2000 1305 1300

2001 1350 1200


1100
1000
900
800
0
700
1995 1996 1997 1998 1999 2000 2001
• Diagrama prin coloane

Cifra de afaceri
1400
1200
1000
800
600
400
200
0
1995 1996 1997 1998 1999 2000 2001
• Indicatori care sunt influenţaţi de
factori sezonieri
• Diagrama
g polară
p radială

• Diagrama polară sectorială

Valoarea vânzărilor Luna Valoarea vânzărilor


Luna de îngheţată de îngheţată
-mii. lei- -mii. lei-
ianuarie 5 iulie 35
februarie 6 august 18
martie 9 septembrie 11
aprilie 11 octombrie 8
mai 16 noiembrie 7
iunie 30 decembrie 6
Ian Dec Ian
Dec
Feb N i
Noi Feb

Noi
Mar
Oct Mar

Oct Apr
Sep
Apr

Sep Mai Mai


Aug

Iun Iul Iun


Aug Iul

Diagrama polară radială Diagrama polară sectorială


2.3.2.3 Grafica seriilor de spaţiu
p ţ
• Diagrama prin coloane
Populaţia la data de 1 ian. 2019

Judeţul Populaţia
Populaţia
Dolj 762142 800000
Gorj 401021
700000
Mehedinţi 332673
Olt 523291 600000
Vâlcea 438388 500000
Sursa: Anuarul statistic al României 400000
2020
300000
200000
100000
0
lj rj ti Ol t ea
Do Go in lc
he d Vâ
Me
• Diagrama prin benzi
Populaţia
Vâlcea

Olt

Mehedinti

Gorj

Dolj

0 200000 400000 600000 800000 1000000

• Cartograma
g
• Cartodiagrama
2.3.3. Reprezentarea grafică a
comparaţiilor
• Dreptunghiul
• Cercul
• Pătratul
• Paralelipipedul
• Cilindrul
• Sfera
2.3.4. Reprezentarea grafică a
structurilor

• Dreptunghi
p g
• Paralelipiped
• Cilindru
• Pătrat
• Cerc
Tipuri de date – tipuri de reprezentări grafice
histograma
de distribuţie poligonul frecvenţelor
curba recvenţelor
ţ cumulate
cronograma
Serii fără sezonalitate historiograma
de timp
statistice diagrama prin coloane
cu sezonalitate diagrama polară radială
diagrama polară sectorială
de spaţiu
diagrama prin coloane
diagrama prin benzi
cartodiagrama

Cerc
Comparaţii Figuri geometrice plane Pătrat
Dreptunghi
Figuri geometrice tridimensionale P l li i d
Paralelipiped
Cilindru
Structuri Sfera

Cazuri speciale Diagrama dde bbalanţă


Di l ţă
Diagrama prin coloane în aflux
C i l l 
Capitolul 3

ANALIZA
SERIILOR DE
DISTRIBUȚIE
Ț
33.1. Introducere

3.2. Media
di
33
3.3. Cuantilele

3.5. Indicatorii
d variaţiei

3 6  Indicatorii formei
3.6. Indicatorii
3 2 M di
3.2. Media

Nota 4 5 6 7 8 9 10
N
Numără studenţi
t d ţi 9 10 10 2 2 1 1
4 + 5 + 6 + 7 + 8 + 9 + 10
m= =7
7
4 ⋅ 9 + 5 ⋅10 + 6 ⋅10 + 7 ⋅ 2 + 8 ⋅ 2 + 9 ⋅1 + 10 ⋅1
m= = 5,57
35
Media ‐ expresia sintetizării într‐un singur 
p g
nivel reprezentativ a ceea ce este esenţial, 
p ş p ţ , ş
tipic şi obiectiv în apariţia, manifestarea şi 
dezvoltarea acesteia. 
Media aritmetică
‐ Utilizare: fenomenul înregistrează modificări aproximativ 
Ut a e: e o e u eg st ea ă od că ap o at v
constante / în progresie aritmetică / tendinţă liniară. 
Media aritmetică simplă

O caracteristică statistică X, cu valorile x1, x2, …, xn

x1 + x 2 + ... + x n = ∑ xi
x + x + ... + x = ∑ xi ⇒
n ⋅ x = ∑ xi ⇒ ∑ xi
x=
n
Media aritmetică ponderată
p

x1 ⋅ f 1 + x 2 ⋅ f 2 + ... + x n ⋅ f n = ∑ xi ⋅ f i ⎫
⎬⇒
x ⋅ f 1 + x ⋅ f 2 + ... + x ⋅ f n = x ⋅ ∑ f i ⎭

x ⋅ ∑ f i = ∑ xi ⋅ f i ⇒

x=
∑ xi ⋅ f i
∑ fi
Proprietăţile mediei aritmetice
• Media aritmetică este cuprinsă între varianta minimă şi
varianta maximă:
xmin < x < xmax
• Suma
S abaterilor
b il variantelor
i l caracteristicii
i i ii de
d la
l media
di lor
l este
egală cu zero:
∑ ( xi − x ) = 0 ‐ pentru media aritmetică simplă;
∑ ( xi − x ) f i = 0 ‐ pentru media aritmetică ponderată;
• Media aritmetică a unei variabile aleatoare X care are valorile 
individuale egale între ele este egală cu valoarea lor:
x = x1 = x 2 = ... = x n
Media aritmetică a variabilei alternative
Convenţii şi notaţii:
• x1 ‐ 1 ‐ f1 ‐ p
• x2 ‐ 0 ‐ f2 ‐ q
p + q = 1 ⇒ p = 1 – q şi q = 1 – p

x=
∑ x⋅f i i
=
x1 ⋅ f1 + x2 ⋅ f 2
=
∑f i f1 + f 2
f1 f2
= x1 ⋅ + x2 ⋅ =
f1 + f 2 f1 + f 2
= 1⋅ p + 0 ⋅ q = p

x=p
3 3 C antilele
3.3. Cuantilele
Cuantilele ‐ indicatori de poziţie care împart seria de 
distribuţie în părţi cu efective egale.

3 3 1  Mediana
3.3.1. Mediana
Mediana ‐ valoarea care împarte seria (ordonată 
p (
crescător sau descrescător) în două părţi egale.
♦ Pentru o serie simplă vom parcurge etapele:

1. se ordonează crescător sau descrescător elementele 
seriei;
2. se calculează valoarea mediană într‐una din următoarele două 
variante:
‐ dacă seria are un număr impar de termeni:
M = x n +1
Me
2

‐ dacă seria este formată dintr‐un număr par de


termeni:

xn + xn
+1
Me = 2 2
2
♦Pentru seriile de distribuţie
ţ

• Pentru o serie de distribuţie după variante ‐ etape:
1. se determină frecvenţele cumulate crescător sau 
descrescător (Fci )
2. determinăm unitatea mediană după relaţia:
n
U Me =
2
3. stabilim mediana ‐ prima valoare din cadrul seriei de valori
pentru care:
p
UMe ≤ Fci
• Pentru o serie de distribuţie pe intervale ‐ etape:
1. se determină frecvenţele cumulate crescător sau 
 d i ă f l   l   ă    
descrescător (Fci )
2  determinăm unitatea mediană după relaţia:
2. determinăm unitatea mediană după relaţia:
n
U Me =
2
3. se stabileşte intervalul median I Me = ( x Me
inf sup
, x Me ) respectiv
i l l pentru care: UMe ≤ Fc
intervalul F i
4
4. se calculează mediana cu ajutorul relaţiei: :
j ţ

⎛n ⎞ k
Me = x inf
Me + ⎜ − Sn ⎟ ⋅
⎝2 ⎠ f Me
B. Calculul grafic
33
3.3.2. Cuartilele
Există trei cuartile 
xQ1 ‐ cuartila inferioară 
xQ2 ‐ mediana 
xQ3 ‐ cuartila superioară
Etape:
1. se stabileşte intervalul cuartilic I Qh
h⋅n
U Qh =
4
2. se calculează cuartilele pe baza relaţiei:
⎛ h⋅n ⎞ k
xQh = xQinfh +⎜ − SQh −1 ⎟ ⋅
⎝ 4 ⎠ fQh
333
3.3.3. Decilele
Etape:
1. se stabileşte intervalul decilic I Dh
h⋅n
U Dh =
10
2. se calculează cuartilele pe baza relaţiei:
⎛ h⋅n ⎞ k
xDh = xDinfh +⎜ − S Dh −1 ⎟ ⋅
⎝ 10 ⎠ f Dh

2.1.2.4. Percentilele
4
⎛ h⋅n ⎞ k
xPh = xPinfh +⎜ − S Ph −1 ⎟ ⋅
⎝ 100 ⎠ f Ph
3.4. Modul
3.4. Modul
Modul (dominanta) ‐ valoarea caracteristicii cu 
frecvenţa cea mai mare.
frecvenţa cea mai mare
Pentru o serie de distribuţie putem avea:
• seria de date are o singură valoare modală – unimodală
• seria de date are mai multe valori modale – multimodală
• seria de date nu conţine valori modale
fi fi

xi xi
inf
xMo + sup
xMo
1 )Mo =
2
2) Δ1 Δ1 = fMo – fMo‐1
Mo = x inf
+k Δ2 = fMo – fMo+1
Δ1 + Δ 2
Mo

3 )Mo = 3 Me − 2 x
x − Me = ( x − Mo )
1
3
4) Metoda grafică ‐
) M d   fi ă  utilizarea histogramei prin 
ili  hi i  i  
dreptunghiuri 
3 5 Indicatorii variaţiei
3.5. Indicatorii variaţiei

Z
1. Indicatorii simpli ai variaţiei

2. Indicatorii sintetici ai variaţiei

3. Abaterile intercuantilice

4. Dispersia în analiza distribuţiilor 
4  Dispersia în analiza distribuţiilor 
bidimensionale
1 Indicatorii simpli ai variaţiei
1. Indicatorii simpli ai variaţiei
y Amplitudinea variaţiei (A)
l d ( )

• amplitudinea absolută
p
Aa = Xmax – Xmin
• amplitudinea relativă
li di   l i ă
Aa X − X min
Ar = ⋅ 100 = max ⋅ 100
x x

Xmin Xmax Xmin Xmax Xmin Xmax


• Abaterile individuale (di )
• abaterile individuale absolute
⎧ x1 − x

⎪ x2 − x
dai = xi − x → ⎨
⎪...
⎪⎩ xn − x

• abaterile individuale relative

dai xi − x
dri = ⋅ 100 = ⋅ 100
x x
2 I di
2. Indicatorii sintetici ai variaţiei 
ii i i i i i i i
y Abaterea medie liniară
b d l

d =
∑ xi − x
‐ pentru o serie simplă
n

d =
∑ xi − x f i ‐ pentru o serie de frecvenţe
∑ fi
⎧⎪ x + d
x±d ⇒⎨
⎪⎩ x − d
• Dispersia

σ2 =
(
∑ ix − x )2
‐ pentru o serie simplă
    i   i lă
n

σ =
2 ∑ ( xi − x )2
fi
‐ pentru o serie de frecvenţe
∑ fi
Dispersia variabilei alternative

σ =
2 ∑ ( xi − x ) f i (x1 − x ) f1 + (x2 − x ) f 2
=
2 2 2

=
∑ fi f1 + f 2

=
( x 1
− x ) f1 ( x2 − x ) f 2
2

+
2

=
f1 + f 2 f1 + f 2
= (1 − p ) p + (0 − p ) q = pq( p + q )
2 2 2

σ = pq2
• Abaterea standard

∑ (xi − x )
2
σ= σ =
2
‐ pentru serii simple
n

∑ (xi − x )
2
fi
σ= σ =
2
‐ pentru serii de frecvenţe.
frecvenţe
∑ fi
⎧x + σ
x ±σ ⇒ ⎨
⎩x − σ

Abaterea standard a variabilei alternative

σ = σ 2 = pq
• Coeficientul de variaţie

σ
Cv = ⋅ 100 Cv < 35%
x

fi
X1 X2

x1 x2 = 2 x1 xi
3 Abaterile intercuantilice
3. Abaterile intercuantilice 

• Abaterea intercuartilică
(Me − x ) + (x − Me )= x − xQ1
=
Q1 Q3 Q3
Qc
2 2

Coeficientul de variaţie intercuartilică
Qc xQ3 − xQ1
VQ = ⋅ 100 = ⋅ 100
Me 2 Me
• Abaterea interdecilică
Ab t  i t d ili ă
(Me − x ) + (x − Me )= x − xD1
=
D1 D9 D9
Qd
2 2
Coeficientul de variaţie intercuartilică
Qd xD9 − xD1
VQ = ⋅ 100 = ⋅ 100
Me 2 Me
4. Dispersia în analiza distribuţiilor 
4 Dispersia în analiza distribuţiilor
bidimensionale 

Grupare
p Grupare după Y
Total fx
după X y1 y2 … yj … ym
x1 f11 f12 … f1j … f1m f1
x2 f21 f22 … f2j … f2m f2
M M M … M … M M
xi fi1 fi2 … fij … fim fi
M M M … M … M M
xn fn1 fn2 … fnj … fnm fn
Total fy f1 f2 … fj … fm n
• Dispersia de grupă

∑ (y j − yi ) ∑ (y j − yi )
m m
2 2
f ij f ij
j =1 j =1
σ =
i
2
m
=
fi
∑ fij
j =1
m m
∑ y j fij ∑ y j fij
j =1 j =1
yi = m
=
fi
∑ fij
j =1
• Media dispersiilor de grupă
n
∑σ 2
i fi
σ 2 = i =1n
∑ fi
i =1

• Dispersia dintre grupe
Di i  di  
n
∑ ( yi − y0 )
2
fi m n

δ =
2 i =1 ∑ yj f j ∑ yi fi
j =1 i =1
n y0 = =
∑ fi m
∑ fj
n
∑ fi
i =1
=1
j =1 i =1
• Dispersia generală

∑ (y j − y0 )
m
2
fj
j =1
σ =
2
0 m
∑ fj
j =1

Regula de adunare a dispersiilor

σ =σ +δ
2
0
2 2
3 6 Indicatorii formei
3.6. Indicatorii formei 
3.6.1. Asimetria 
• Metoda grafică
M t d   fi ă

fi fi Me fi Mo
M Me
Mo
x x

x = Me = Mo x x < Me < Mo xi Mo < Me < x xi


i

a) b) c)
• Coeficientul de asimetrie al lui Pearson

x − Mo
Cas =
σ
• Cas ∈ ((–11,1)
1)
• Serii moderat asimetrice: Cas ∈ [‐0,3 ; 0,3] 
• Cas < 0 ‐ serie cu asimetrie spre stânga (negativă);
p g ( g );
• Cas = 0 ‐ serie simetrică;
• Cas > 0 ‐ serie cu asimetrie spre dreapta (pozitivă).
3.6.2. Boltirea 
3

curba leptocurtică

curba mezocurtică

curba platicurtică
• coeficientul de boltire Pearson
μ4 μ4
β2 = 2 = 4
μ2 σ
• β2 = 3 pentru o distribuţie normală – curba mezocurtică
• β2 > 3 ‐ curbă leptocurtică
• β2 < 3 ‐ curbă platicurtică

• coeficientul de boltire Fisher ‐ coeficient al excesului
γ2 = β2 – 3
• γ2 = 0 pentru o distribuţie normală – curba mezocurtică
• γ2 > 0 ‐ curbă leptocurtică
• γ2 < 0 ‐ curbă platicurtică
Capitolul 4

INFERENȚA
STATISTICĂ
Ă
4 1 Introducere
4.1.

4 2 Di
4.2. Distribuţii
t ib ţii clasice
l i de d probabilitate
b bilit t

4.3. Distribuţii de sondaj

4.4. Estimarea parametrilor repartițiilor

4.5. Testarea ipotezelor


p statistice
4.1. Introducere
Inferenţa statistică
y metodă de cercetare inductivă
y permite extinderea proprietăţilor
eşantionului la întreaga populaţie
y permite testarea ipotezelor
y este însoţită de o marjă de incertitudine,
specificată în termeni probabilistici
Metodologia inferenței statistice - operații:
y se extrage eșantionul
y se calculează o valoare tipică a eșantionului
(medie dispersie
(medie, dispersie, abatere standard etc
etc.))
y din considerente teoretice, se cunoaște distribuția
din care provine această valoare tipică și relația
distribuției de sondaj a indicatorului cu valoarea
tipică din populație
y valoarea tipică din populație se aproximează cu
valoarea tipică a eșantionului
y utilizând distribuția de sondaj a indicatorului se pot
face evaluări ale erorilor de estimație
estimație.
4.2. Distribuţii clasice de 
probabilitate
4.2.1. Distribuţia binomială
4.2.2. Distribuţia Poisson
4 2 3 Distribuţia normală
4.2.3. ă
4 2 4 Distribuţia χ2
4.2.4.
4 2 5 Distribuţia Student
4.2.5.
4.2.1. Distribuţia binomială 
b b lă
y Variabila binomială = o variabilă discretă care poate lua
orice valoare 0,1, 2, ... n.
y p = probabilitatea
b bilit t producerii
d ii evenimentului
i t l i „succes”;

y q=1-p = probabilitatea producerii „insuccesului”.
y Distribuţia de probabilitate binomială = probabilitatea ca
un „succes” să apară de k ori în n încercări (k=0,1,2,...,n).

n−k n! k n−k
PB ( k ; n , p ) = C p q k k
= p q
k ! ( n − k )!
n

k
FB ( k ; n , p ) = ∑ C p q i
n
i n−i

i =0
4.2.2. Distribuţia Poisson
y Variabila Poisson = numărul de evenimente rare
(
(succese) ) care apar
p într-un interval de timpp sau o regiune
g
specificat (ă).
y Distribuția Poisson înlocuiește în practică distribuția
binomială atunci când una dintre probabilități (p sau q)
devine infinit de mică și n crește în mod corespunzător
(pentru a se păstra nq sau np).
np)

−λ k
e λ −λ
k λi
PPo ( k ; λ ) = FPo ( k ; λ ) = e ∑
k! i =0
0 i!
4.2.3. Distribuţia normală
y Distribuţia normală = distribuţia posibilelor estimări ale
unui parametru al populaţiei care pot apărea în diferite
eşantioane.
ti
y Distribuţia normală asigură o aproximare utilă pentru alte
distribuţii inclusiv distribuţii discrete
distribuţii, discrete.

1 ⎛ x−μ ⎞
2

1 − ⎜ ⎟
2⎝ σ ⎠
f ( x; μ ,σ ) =
2
⋅e
σ 2π
1 ⎛ x−μ ⎞
2

1 x − ⎜ ⎟
2⎝ σ ⎠
F ( x; μ ,σ ) =
2
⋅ ∫e dx
σ 2π −∞
f(x)

x
μ-σ μ μ+σ

68,30%


95,40%


99,72%
4.2.4. Distribuţia χ 2

y Este o distribuţie derivată din distribuţia normală,


care are un
n rol foarte important în inferenţa statistică
statistică.
y Densitatea de probabilitate a lui χ2

⎛n ⎞ x
1 ⎜ −1 ⎟ −
f ( x; n ,σ ) =
2
x ⎝2 ⎠
e 2σ 2

⎛n⎞
n
2 σ Γ⎜ ⎟
2 n

⎝2⎠
4 2 5 Distribuţia Student
4.2.5. Distribuţia Student
y Distribuția
ț Student ((sau t)) este folosită p
pentru estimarea
mediei unei populații normal distribuite, dacă eșantionul este
mic și abaterea standard a populației este necunoscută.
y Distribuția Student - analize statistice utilizate pe scară largă,
inclusiv testul t-Student pentru evaluarea semnificației
statistice
t ti ti a diferenței
dif ț i di
dintre
t d două
ă medii
dii d
de eșantion,
ti
determinarea intervalelor de încredere pentru diferența
mediilor a două colectivități,
colectivități analiza de regresie liniară
liniară.
y Funcția de densitate de probabilitate este:
⎛ n +1⎞ n +1
Γ⎜ ⎟ −
⎝ 2 ⎠ ⎛ x 2
⎞ 2
f ( x; n ) = ⎜1 + ⎟
⎛ n ⎞ ⎜⎝ n ⎟⎠
nπ ⋅ Γ⎜ ⎟
⎝2⎠
4 3 Di ib ii d
4.3. Distribuţii de sondaj
d j
y Orice experiment aleatoriu poate fi precedat de o
operație de vizualizare mentală a valorilor pe care le
poate lua o variabilă,, dar și
p ș de calculul distribuţiei
ţ de
probabilitate, a mediei sau dispersiei.
y Pot fi calculate mediile ș
și dispersiile
p eşantioanelor,
ş sau
proporţiile succesului în interiorul unui eşantion. Și pentru
aceste variabile pot fi descrise legile de probabilitate şi
valorile
l il caracteristicilor
t i ti il specifice.
ifi

X1 =
∑ Xi
(X )( ) (
− μ , X 2 − μ ,..., X K − μ ) μX = μ
1
n
σ2 σ2 N −n σ
σ =
2
σ = 2
⋅ σX =
X
n X
n N −1 n
y Distribuții de sondaj pentru variabile binare

X
ps = μ = np σ = np( 1 − p )
n
⎛X ⎞ E ( X ) np
E ( ps ) = E ⎜ ⎟= = =p
⎝n ⎠ n n
V ( X ) np (1 − p ) p (1 − p )
σ = V ( ps ) = 2 =
2
p 2
=
n n n

σ p = p(1 − p ) / n
s

ps − p
Z=
p( 1 − p ) / n
Dacă datele sunt calitative ps =
X
n
p(x)

0.20

0.15

0.10

0.05

0 x
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Figura 4.3.
4 3 Distribuţia binomială cu n = 20 şi p = 0.5
0 5 şi
aproximarea normală.
y Distribuții de sondaj pentru diferenţa
dintre două medii

( ) ( ) ( )
E X 1 − X 2 = E X 1 − E X 2 = μ1 − μ 2

σ σ
( ) ( ) ( )
2 2
V X1 − X2 = V X1 +V X2 = 1
+ 2
n1 n2

σ / n1 + σ / n2
2
1
2
2
P(x1 − x2 )

μ1 −μ2 x1 − x2
Figura 4.2. Distribuţia de sondaj a lui X 1 − X 2
4.4. Estimarea parametrilor 
repartițiilor
i iil
4.4.1. Estimarea punctuală

4.4.2. Estimarea p
prin intervale de
încredere

⎡ σ σ ⎤
μ ∈ ⎢ xs − z ; xs + z ⎥
⎣ n n⎦
4.5. Testarea ipotezelor 
statistice

4.5.1.
4 5 1 Metodologia de verificare a
ipotezelor

4.5.2. Teste statistice uzuale

4.5.3. Teste neparametrice


4.5.1. Metodologia de verificare a 
f
ipotezelor 
ipotezelor
1) Formularea ipotezei nule (H0)
2) Formularea ipotezei alternative (H1)
3) Identificarea unui test statistic
4) Nivelul de semnificație
5) Determinarea regiunii critice
6) Determinarea valorii testului statistic

7) Luarea unei decizii și interpretarea ei


4.5.2. Teste statistice uzuale
y în funcţie de gradul de cunoaștere a distribuţiei:
y teste
t t parametrice
ti
y teste neparametrice
y în
î funcţie
f ţi de
d modul
d l de
d formulare
f l a ipotezei
i t i
alternative:
y teste
t t unilaterale
il t l (direcţionale)
(di ţi l ) → H1 : m > m0 sau H1 :
m < m0
y teste bilaterale (nedirecţionale) → H1 : m ≠ m0
y în funcţie de numărul de eşantioane folosite:
y teste bazate pe date dintr-un eşantion
y teste bazate pe date din mai multe eşantioane
y în funcție de testul care se aplică:
y teste de concordanţă
y teste
t t ded semnificaţie
ifi ţi
y teste de comparare.
y Testul erorii standard a mediei

y Testul de concordanţă Student (t)

y Teste
T t ded comparare

y Testul F

y Testarea concordanței dintre distribuțiile


empirice și cele teoretice
4.5.3. Teste neparametrice
y Testul medianei
y Testul
T t l „ U” Mann-Whitney
M Whit
y Testul medianei generalizate
y Testul Kruskal-Wallis
y Testul semnului
y Testul Wilcoxon
y Testul Cochran
y Testul Friedman
y Teste neparametrice de corelaţie
Capitolul 5

SONDAJUL
STATISTIC
51 C
5.1. Caracteristicile
t i ti il sondajului
d j l i statistic
t ti ti
5 2 Eşantionarea
5.2.
5.3.
5 3 Erori şi surse de erori în cercetările
selective
5.4. Construcţia chestionarului

5.5. Sondajul simplu întâmplător

5.6. Sondajul stratificat

5.7. Sondajul de serii


5 1 Caracteristicile
5.1.
sondajului statistic
5 1 1 Necesitatea
5.1.1. N it t cercetărilor
tă il parţiale
ţi l
• Sondajul statistic aparține categoriei cercetărilor
statistice parţiale.
• Este folosit când se doreşte caracterizarea unor
fenomene şi procese social-economice pentru
care nu dispunem de date suficiente, care nu pot
fi studiate în totalitate sau pentru unităţile statistice
care sunt distruse în urma cercetării.
5.1.2. Domenii de utilizare a 
5 12 D ii d tili
sondajului statistic
sondajului statistic
• social
i l
• economic – în industrie,, în comerţ,
ţ, în
marketing, în agricultură, în domeniul fiscal
• ştiinţe politice
• sport
• medicină
• mediu
5.1.3. Avantajele utilizării 
sondajului statistic
d j l i t ti ti
• erori mai mici în culegerea datelor
• rapiditate în obţinerea indicatorilor
• cheltuieli mai mici
• se poate utiliza în situaţii în care o
cercetare totală nu este posibilă
• rezultatele sondajului pot fi verificate
5.1.4.
5 1 4 Etapele de realizare a
sondajului statistic
1. Stabilirea obiectivelor cercetării
2. Generarea eşantionului
3. Elaborarea chestionarului
4. Culegerea datelor
5. Codificarea şi prelucrarea primară a
d t l
datelor
6. Prelucrarea p propriu-zisă
p a datelor
7. Analiza şi interpretarea rezultatelor
5.1.5. Principalele
p tipuri
p de
sondaje
• modul de organizare a populaţiei:
– populaţia de bază neorganizată
– populaţia de bază organizată pe grupe
• varianta procedeului tip loterie:
– sondaj repetat
– sondaj nerepetat
• numărul de unităţi extrase:
– o unitate simplă
p
– un grup de unităţi
• algoritmul
l it l de
d extragere
t a eşantionului:
ti l i
– sondaje
j aleatoare
– sondaje dirijate
– sondaje mixte
• volumul eşantionului:
– sondaje de volum mare
– so
sondaje
daje de volum
o u redus
edus
• numărul etapelor parcurse la formarea
eşantionului:
– sondaje simple
– sondaje în trepte
• sondaj
d j simplu
i l cu probabilităţi
b bili ă i egale:
l
– repetat
– nerepetat
• sondaj simplu cu probabilităţi inegale:
– repetat
– nerepetat
• sondaj tipic (stratificat):
– proporţional
ţi l repetat
t t / nerepetat
t t
– optimal repetat / nerepetat
• sondaj cu stratificare a posteriori:
– repetat
p
– nerepetat
• sondaj
d j de
d serii
ii cu probabilităţi
b bili ă i egale
l /
g
inegale:
– pentru serii de volum egal
– pentru serii de volum inegal
• sondaj în mai multe trepte, cu
probabilităţi egale / inegale:
– repetat
– nerepetat
t t
• sondaj în mai multe faze:
– cu dublă eşantionare
– cu reînnoire p
parţială
ţ a eşantioanelor
ş
• sondaj cu eşantionare secvenţială.
5.2. Eşantionarea
Procesul de eşantionare
ş - etape:
p
y definirea populaţiei ţintă
y stabilirea cadrului de eşantionare (a bazei de
sondaj)
y alegerea
l metodei
t d id de eşantionare
ti
y determinarea mărimii eşantionului
y elaborarea şi testarea procedurilor de eşantionare.
5.2.1. Reprezentativitatea
eşantionului
Reprezentativitatea = eşantionul reproduce
cât mai fidel structurile şi caracteristicile
populaţiei
l ţi i di
din care este
t extras.
t
Gradul de reprezentativitate
p a unui eşantion
ş
- intervin două entităţi:
• d - eroare maximă
• P - nivel de probabilitate ((sau de încredere).
)
• Niciodată nu suntem siguri că eroarea de
eşantionare
ş este mai mică decât o valoare d.
Reprezentativitatea unui eşantion este (d,P).
• Nu există reprezentativitate a unui eşantion în
general, ci numai în raport cu o caracteristică
dată.
dată
• Reprezentativitatea este o noţiune relativă - un
eşantion
ti estet maii multlt sau maii puţin
ţi
reprezentativ.
• d şi P, nu sunt independente
• În ppractică se foloseşte
ş expresia
p „„eşantion
ş
reprezentativ / nereprezentativ”.
Gradul de reprezentativitate depinde de:
• caracteristicile populaţiei
• mărimea eşantionului
• procedura
d d
de eşantionare
ti

• reprezentativitatea creşte odată cu


creşterea numărului de indivizi cuprinşi în
eşantion
• sporull d
de reprezentativitate
t ti it t nu este
t direct
di t
proporţional cu creşterea volumului
eşantionului
Reprezentativitate
100

Mărimea
eşantionului
• Reprezentativitatea
p atinge
g foarte repede
p un
nivel suficient de ridicat, aşa încât o creştere
suplimentară a numărului de indivizi în
eşantion nu mai aduce un spor notabil de
repre entati itate
reprezentativitate
• Un astfel de exemplu îl reprezintă proporţia
răspunsurilor de „Da” la o întrebare a unui
sondaj efectuat în Franţa, pe un eşantion
de 1600 de persoane, în 1945, înaintea
unui referendum:
Grupe de sute Procente de „Da” pe Procente de „Da” pe grupe
succesive grupe cumulate
1 68 68,0
2 55 61,5
3 62 61 6
61,6
4 66 62,8
5 64 63,0
6 61 62,7
7 74 64,3
8 75 65,6
9 69 66,0
10 69 66 3
66,3
11 77 67,2
12 68 67,3
13 69 67,4
14 67 67,4
15 66 67,3
16 68 67,3
• Mărimea ş şi reprezentativitatea
p eşantionului
ş
nu depind de mărimea populaţiei
• „Ce
Ce proporţie din populaţie trebuie să
reprezinte un bun eşantion?”
• Un eşantion poate fi reprezentativ la nivelul
populaţiei,
p p ţ iar subeşantioanele
ş sale să nu
mai fie reprezentative pentru subpopulaţiile
corespunzătoare.
corespunzătoare
5.2.2.
22 P Procedee
d d de selecţie
l i ale
l
sondajului statistic
Eşantion reprezentativ - condiţii:
y lotul de bază să fie omogen
y şanse egale - extragerea unităţilor
statistice întâmplător
Procedee de extragere:g
y aleatoare (probabilistice)
y subiective (dirijate)
• Procedee
P d aleatoare
l t
a) Procedeul tragerii la sorţi:
y schemei bilei revenite
y schemei bilei nerevenite
b) Procedeul
P d l mecanic i

• Procedee subiective
5.2.3. Principalele metode de
eşantionare
• eşantionarea simplă aleatoare
• eşantionarea prin stratificare
• eşantionarea
ti multistadială
lti t di lă
• eşantionarea multifazică
• eşantionarea pe cote
• eşantioanele fixe (panel)
• eşantionarea prin metoda bulgărelui de
zăpadă
• eşantionarea prin metoda voluntariatului.
5.3. Erori şi surse de erori în
cercetările selective

y 5.3.1. Erori efective. Verificarea


reprezentativităţii eşantionului

y 5.3.2. Surse de erori în cercetările


selective
5.3.1. Erori efective. Verificarea
reprezentativităţii eşantionului
• Procesul de verificare a reprezentativităţii
eşantionului porneşte de la compararea
structurii
t t ii pe grupe a colectivităţii
l ti ităţii d
de selecţie
l ţi
cu cea a colectivităţii generale, denumită şi
structură programată. Se calculează
ț
abaterile frecvențelor de g
grupă
p ale selecției
ț
(fi) de la cele teoretice (Fi):
• di = fi – Fi
5.3.2.
5 3 2 Surse
S de
d erorii în
î
cercetările selective
• A. Erori legate
g de eşantionare
ş
• B. Erori legate de construcţia
chestionarului
• erori produse de formularea întrebărilor
• erori generate de numărul şi ordinea
întrebărilor în chestionar
• erori cauzate de forma de răspuns
• erori generate de construcţia grafică a
chestionarului.
• C.
C EErorii datorate
d t t operatorilor
t il
• erori g
generate de trăsături de p
personalitate
• erori cauzate de prejudecățile referitoare tema
anchetei
• erori de anticipaţie.
• D.
D EErorii datorate
d t t respondenţilor
d ţil
• erori generate de sensibilitatea la natura
temelor
• erori rezultate din dezirabilitatea socială
• erori produse de limitele memoriei umane
• erori cauzate de procesarea şi interpretarea
informaţiei.
5.4. Construcţia chestionarului
y Chestionarul = ansamblu de întrebări ordonate
logic şi psihologic. Un chestionar cuprinde:
y adresa organizaţiei
y denumirea anchetei
y data
d t anchetării
h tă ii
y un text explicativ al naturii şi a obiectivelor
y întrebările propriu-zise.
5.4.1. Clasificarea
chestionarelor
h ti l
În funcţie de conţinutul informaţiilor:
• chestionare de date factuale
• chestionare de opinie
• chestionare de cunoştinţe
În funcţie de cantitatea informaţiei:
• chestionare speciale, cu o singură temă
• chestionare omnibuz, cu mai multe teme
După forma întrebărilor:
• chestionare cu întrebări închise
• chestionare cu întrebări deschise

În funcţie de modul de administrare:


• chestionare administrate de către
operatori de interviu
• chestionare poştale
• chestionare publicate în reviste / Internet
• chestionare autoadministrate colectiv
În funcție de tipurile de întrebări conţinute:
• întrebări introductive
• întrebări de trecere
• întrebări filtru
• întrebări bifurcate
• întrebări „de ce”
• întrebări de control
• întrebări de identificare
• în funcţie de subiectul de referinţă:
• întrebări directe
• întrebări indirecte
În funcţie de sprijinul pe care îl oferă
întrebările subiecţilor:
ţ
• întrebări ajutătoare
• întrebări neajutătoare
neajutătoare.
5.4.2. Reguli de formulare a
întrebărilor
• evitarea întrebărilor care sugerează un anumit
răspuns
• întrebările nu trebuie să fie lungi
• evitarea întrebărilor care suprasolicită gândirea
• folosirea cu precauţie a întrebărilor care
generează teamă
• evitarea invocării unei autorităţi, organizaţii de
prestigiu în favoarea a ceva
prestigiu, ceva.
5.5. Sondajul simplu întâmplător
• Sondajul simplu întâmplător
- model teoretic de bază
- cel mai elementar nivel de reprezentare
(populaţii omogene)
- unităţile populaţiei au probabilităţi egale de
a fi incluse în eşantion
• Obiectivul - estimarea unor parametri ai
populaţiei
p p ţ cu ajutorul
j unor statistici calculabile
plecând de la datele unui eşantion.
Se calculează indicatorii:
• eroarea medie de reprezentativitate
• eroarea limită
li ită admisă
d i ă
• intervalul de încredere
• volumul eşantionului
Notații:
Nivel Populaţia de bază Eşantion
Indicator
- variabila studiată X X
- volumul N n
- media variabilei X
x=
0
∑x i
x=
s
∑x i

N n
- dispersia
di i variabilei
i bil i X (
∑i 0
x − x )2
(
∑i s
x − x )2

σ02 = σs2 =
N n
5.5.1. Estimaţii punctuale în
selecţia repetată
• Principalii
P i i lii parametri
t i aii populaţiei:
l ţi i

x0 σ 2
0

• Media de selecţie:
n
∑ Xi
X s = h( X 1 , X 2 , ..., X n ) = i =1
n
• M
Media
di de
d selecţie
l ţi - sondaj
d j simplu
i l repetat t t-
estimator absolut corect al mediei populaţiei:
• este nedeplasat (fără distorsiune): E (X s ) = x0
• are dispersie asimptotic n
nulă:

σ 02
Var ( X s ) = σ X2 s = →∞
⎯n⎯
⎯→ 0
n

• Eroarea
E d reprezentativitate
de t ti it t - dispersia
di i
mediilor de selecţie în raport cu media generală:

∑ (x )
2
( j)
s − x0 n j
σ 2
=
∑ nj
Xs
• Estimatorul nedeplasat al dispersiei
p p

σ =
2 ∑ ( Xi − Xs )
2

s
n −1
σs
σXs ≈
n
5 5 2 Estimaţii prin intervale de
5.5.2.
încredere
• Intervalul de încredere:
x 0 = x s ± eroarea de estimaţie
A. Cazul când se cunoaşte dispersia
asociată populaţiei
p p ţ
σ0
x0 = xs ± z ⋅ σ X s = xs ± z ⋅
n
Δx = z ⋅ σ X s
B. Cazul când nu se cunoaşte dispersia
asociată populaţiei
σ0 σs
x0 = xs ± z ⋅ x0 = xs ± tn −1; α 2 ⋅
n n
• Volumul necesar al eşantionului:
z ⋅σ2 2
t ⋅σ2 2
n= 0
n= s

Δx 2
Δx 2

• Nivelul
Ni l l totalizat
t t li t all variabilei
i bil i X:
X
N
∑ xi ∈ N ⋅ (x s − Δx , x s + Δx )
i =1
5.5.3. Estimaţii în sondajul
simplu nerepetat
1 N
2 ⎛ n − 1 ⎞ σ02 N − n
σ 2X s = ⋅ ∑ ( X α − x0 ) ⋅ ⎜ 1 − ⎟= ⋅
n ⋅ N α =1 ⎝ N −1⎠ n N −1
N −n n
≈ 1−
N −1 N
• Eroarea medie de reprezentativitate:

σ N −n2
σ ⎛ n⎞ 2
σXs = ⋅ 0
≈ ⋅ ⎜1 − ⎟ 0
n N −1 n ⎝ N⎠
• Eroarea limită admisă:
Δx = z ⋅ σ X s

• Intervalul
I t l l de
d încredere:
î d
x0 = xs ± Δx = xs ± z ⋅ σ X s

• Volumul necesar al eşantionului:


N ⋅ z 2 ⋅ σ 02 z 2 ⋅ σ 02
n= ≈
(N − 1) ⋅ Δx + z ⋅ σ 0
2 2 2
z 2
⋅ σ 2
Δx 2 + 0

N
• Estimatorul
E ti t l nedeplasat
d l t all dispersiei:
di i i
σ =
2 ∑ ( xi − xs ) ⎛
2
1⎞
⋅ ⎜1 − ⎟
s
n −1 ⎝ N⎠
5.5.4.
4 SSondajul
d j l simplu
i l pentru
variabila alternativă

• Notaţii:

Nivel Populaţia Eşantion


I di
Indicator d bază
de b ă
- media variabilei X p w
- dispersia variabilei X (volum mare) σ p2 = p(1− p) σ w2 = w(1− w)
• Estimaţie nedeplasată a dispersiei -
pentru sondajul
p j simplu
p repetat:
p
n
σ = w(1 − w)
2
s
n−1
• Estimaţie nedeplasată a dispersiei -
pentru sondajul simplu nerepetat:
n ⎛ 1⎞
σ = w(1 − w) ⋅
2
s ⋅ ⎜1 − ⎟
n −1 ⎝ N⎠
• Eroarea medie de reprezentativitate -
pentru sondajul simplu repetat:
σ 2p p( 1 − p )
σw = =
n n
• Eroarea medie de reprezentativitate -
pentru sondajul
p j simplu
p nerepetat:
p
σ ⎛ 2
p n⎞ p( 1 − p ) ⎛ n⎞
σw = ⎜1 − ⎟ = ⎜1 − ⎟
n ⎝ N⎠ n ⎝ N⎠
• Eroarea medie de reprezentativitate
p
nedeplasată j simplu
- sondajul p repetat:
p

σs w(1 − w)
σw ≈ =
n n−1

• Eroarea medie de reprezentativitate


p
nedeplasată - sondajul simplu nerepetat:

w(1 − w) ⎛ 1⎞ ⎛ n⎞
σw ≈ ⋅ ⎜1 − ⎟ ⋅ ⎜1 − ⎟
n −1 ⎝ N⎠ ⎝ N⎠
• Eroarea limită admisă - pentru sondajul
simplu repetat:
p( 1 − p )
± Δw = z ⋅
n

• Eroarea limită admisă - pentru sondajul


p nerepetat:
simplu p
p( 1 − p ) ⎛ n⎞
± Δw = z ⋅ ⎜1 − ⎟
n ⎝ N⎠
• Intervalul
I t l l de
d încredere:
î d
p = w ± Δw
w − Δ w ≤ p ≤ w + Δw
[w − Δw; w + Δw]
• Nivelul totalizat al variabilei X:
N
∑ xi ∈ N ⋅ [w − Δw, w + Δw]
i =1
1
• Volumul eşantionului - pentru sondajul
simplu repetat:
t 2 ⋅ p(1 − p ) t 2 ⋅ w(1 − w)
n= ≈ +1
Δw
2
Δw
2

• Volumul eşantionului - pentru sondajul


simplu nerepetat:
N ⋅ z 2 ⋅ p(1 − p ) z 2 ⋅ p(1 − p )
n= ≈
(N − 1) ⋅ Δ w + z ⋅ p(1 − p )
2 2
z 2
⋅ p(1 − p )
Δw +
2

N
5.6. Sondajul stratificat

5.6.1. Introducere

• S
Sondajul
d j l stratificat
t tifi t - populaţii
l ţii statistice
t ti ti
cu grad de omogenitate scăzut.
Variante:
• selecţia tipică simplă
• selecţia tipică proporţională
• selecţia tipică optimă
Definirea straturilor - caracteristici
economico-sociale:
• nivelul pregătirii profesionale a persoanei
• gruparea populaţiei pe regiuni geografice
sau unităţi administrative
• gruparea persoanelor după sex
• gruparea populaţiei pe naţionalităţi
• repartizarea populaţiei pe grupe de vârstă
Pentru aplicarea tehnicii de eşantionare
stratificată se parcurg următoarele etape:
• populaţia este repartizată pe straturi
• se stabileşte
t bil t dimensiunea
di i eşantionului
ti l i
• se stabileşte dimensiunea subeşantionului
din fiecare strat
• se ge
generează
e ea ă eşa
eşantionul
o u fiecărui
ecă u sstrat.
a

k k
∑ (xh − x0 ) ∑ 0h N h
σ
2 2
Nh
σ =δ +σ
2
0
2 2
δ2 = h =1
σ2 = h =1
N N
5 6 2 Sondajul stratificat
5.6.2.
proporţional
k k
N = ∑ Nh n = ∑ nh nh / N h = n / N = f
h =1 h =1

nh nh
∑ xhi ∑ (xhi − xh )
2

xh = i =1
σ 2h = i =1

nh nh − 1
k k
∑ x0 h N h ∑ xh N h
x0 = h =1
xs = h =1

N N
• Eroarea standard a selecţiei
- în sondajul repetat

σ2
σXs =
n
- în sondajul
j nerepetat
p

σ N −n
2
σ ⎛ 2
n⎞
σX s = ⋅ ≈ ⋅ ⎜1 − ⎟
n N −1 n ⎝ N⎠
• Eroarea limită admisă
- în
î sondajul
d j l repetat
t t

σ 2
Δx = z
n
- în sondajul nerepetat

σ N −n
2
σ ⎛ 2
n⎞
Δx = z ⋅ ≈z ⋅ ⎜1 − ⎟
n N −1 n ⎝ N⎠
• Intervalul de încredere

x0 = xs ± Δx

x s − Δx ≤ x0 ≤ x s + Δx
[x s − Δx ; x s + Δx ]
• Volumul eşantionului
- în sondajul repetat
z ⋅σ
2 2
n=
Δx 2
- în sondajul nerepetat
N ⋅ z2 ⋅ σ2 z2 ⋅ σ2
n= ≈
(N − 1) ⋅ Δx + z ⋅ σ
2 2 2
Δx +
2 z 2
⋅ σ 2

N
5.6.3.
5 63 S Sondajul
d j l stratificat
t tifi t
pentru variabila alternativă
• Media
M di generală:

k
∑ ph N h
p= h =1

N
k
∑ wh N h
w= h =1

N
• Eroarea standard a selecţiei
- în
î sondajul repetat

σ 2p p(1 − p )
σw = =
n n
- în sondajul nerepetat

σ ⎛ p(1 − p ) ⎛
2
p n⎞ n⎞
σw = ⎜1 − ⎟ = ⎜1 − ⎟
n ⎝ N⎠ n ⎝ N⎠
• Eroarea limită admisă
- în
î sondajul
d j l repetat
t t

p( 1 − p )
± Δw = z ⋅
n
- în sondajul nerepetat

p( 1 − p ) ⎛ n⎞
± Δw = z ⋅ ⎜1 − ⎟
n ⎝ N⎠
• Intervalul de încredere

p = w ± Δw
w − Δw ≤ p ≤ w + Δw
[w − Δw; w + Δw]
• Nivelul totalizat al variabilei X
N
∑ xi ∈ N ⋅ [w − Δw, w + Δw]
i =1
• Volumul eşantionului
- în sondajul repetat

2 2
p
n=
Δx 2
rep

- în sondajul nerepetat
zσ 2 2
p
n=
zσ 2 2
p
Δx 2
nrep +
N
5 7 Sondajul de serii
5.7.
5 7 1 IIntroducere
5.7.1. t d
Selecţia de serii:
• populaţia eterogenă
• nu există
i tă posibilitatea
ibilit t structurării
t t ă ii îîn clase
l
omogene
• colectivitatea generală formată din unităţi
p
complexe numite şiş serii (pachete,
(p , echipe,
p ,
familii, magazine etc.)
• unităţile complexe = serii sau cuiburi ⇒
sondaje de serii (de cuiburi)
• Eroarea medie de reprezentativitate = în
funcţie de componenta inter-serii a
di i i⇒
dispersiei
• În locul dispersiei
p σ2 se utilizează dispersia
p
dintre serii δ2
• Notații:
- N = nr. unităţilor
ţ simple
p din p populaţie
p ţ
- n = nr. unităţilor simple din sondaj
- R = nr. seriilor
iil di
din populaţie
l ţi
- r = nr. seriilor din sondajj
5.7.2. Sondajul de serii pentru
variabila
i bil obişnuită
bi ită

δ =
2 ∑ ( xi − x0 )
2

r
A. Serii de volume egale
B. Serii de volume inegale
A. Serii de volume egale
R R
Nρ = N0 , ∀ρ = 1,2 ,..., R N = ∑ Nρ = ∑ N0 = R ⋅ N0
ρ =1 ρ =1

r r
N n
n = ∑ N g = ∑ N0 = r ⋅ N0 N 0 = =
g =1 g =1 R r
R Nρ R R
∑ ∑ xρh ∑ xρ N ρ ∑ xρ
ρ =1 h =1 ρ =1 ρ =1
x0 = = =
N N R
r Ng r r
∑ ∑ x ggh ∑ xg N g ∑ xg
g =1 h =1 g =1 g =1
xs = = =
n n r
∑ (xρ − x0 )
R
2

ρ =1
δ =
2

∑ (xρ − x0 ) 1 R − r
R
2

ρ =1 δ2 R − r
σ 2X s = ⋅ ⋅ = ⋅
R r R −1 r R −1

∑ (xg − xs )
r
2

g =1 ⎛ 1⎞
δ =
2
s ⎜1 − ⎟
r −1 ⎝ R⎠

(x g − xs )
r

2

δ R − r g =1
2
1 ⎛ r⎞
σ 2X s = ⋅ s
= ⋅ ⋅ ⎜1 − ⎟
r R −1 r −1 r ⎝ R⎠
B. Serii de volume inegale
R r
∑ Nρ N
∑ Ng n
ρ =1 g =1
N= = N= =
R R r r

R Nρ R R Nρ
∑ ∑ xρh ∑ xρ N ρ ∑ xρ
ρ =1 h =1 ρ =1 ρ =1 N
x0 = = =
N N R

r Ng r r Ng
∑ ∑ x gh ∑ xg N g ∑ xg
g =1 h =1 g =1 g =1 N
xs = = =
n n r

∑ (xρ − x0 )
R
2

ρ =1 N 1 R − r δ 2
R−r
σ 2X s = ⋅ ⋅ = ⋅
R r R −1 r R −1

∑ (xρ − x0 )
R
2

ρ =1 N
δ =
2

Ng
∑ (xg − xs )
r
2

g =1 N ⎛ 1⎞
δs =
2
⎜1 − ⎟
r −1 ⎝ R⎠
Ng
∑ (x g − xs )
r
2

δ R−r 2
g =1 N 1 ⎛ r⎞
σ 2
= ⋅ =⋅
s
⋅ ⋅ ⎜1 − ⎟
Xs
r R −1 r −1 r ⎝ R⎠
• Eroarea standard a selecţiei

δ 2
R−r
σXs = σ 2
= ⋅
Xs
r R −1
• Eroarea limită admisă

δ 2
R−r
Δx = z ⋅ σ xs = z ⋅ ⋅
r R −1
• Intervalul de încredere

x0 = xs ± Δx
xs − Δx ≤ x0 ≤ xs + Δx
• Volumul eşantionului

R⋅ z ⋅δ 2 2
r=
(R − 1) ⋅ Δx + z ⋅ δ
2 2 2
5.7.3.
5 73 S Sondajul
d j l de
d seriiii pentru
t
variabila alternativă
• Eroarea
E standard
t d d a selecţiei
l ţi i
δ R−r
2
σw = ⋅
w

r R −1
• Eroarea limită admisă
δ R−r
2
Δw = z ⋅ σ w = z ⋅ w

r R −1
• Intervalul de încredere

p = w ± Δw
w − Δw ≤ p ≤ w + Δw

• Volumul eşantionului

R⋅ z ⋅δ
2 2
r= w

(R − 1) ⋅ Δw + z ⋅ δw
2 2 2
Capitolul 6

ANALIZA STATISTICĂ
Ă
A LEGĂTURILOR
Ă
DINTRE VARIABILE
6.1. Clasificarea legăturilor

6.2. Procedura utilizată

6.3. Metode elementare

6 4 Metode analitice
6.4.

6.5. Asocierea variabilelor calitative

6.6. Testarea ipotezelor statistice


6 1 Clasificarea
6.1. Cl ifi llegăturilor
ăt il
dintre fenomene
• după
d ă natura
t relaţiei
l ţi i de
d cauzalitate:
lit t
- legături funcţionale (deterministe) - y = f(x)
- legături
l ă i statistice
i i sau stochastice
h i - y = f(x) + e
• după
p numărul variabilelor asociate:
- legături simple
- legături
g multiple
p
• după natura caracteristicilor:
- legături de asociere
- legături de corelaţie
• după direcţia legăturii:
- legături directe
- legături inverse
• după forma funcţiei care descrie legătura:
- legături liniare
- legături
l ăt i neliniare
li i

• după timpul realizării legăturii:


- legături sincrone
- legături
l ăt i asincrone
i
62 P
6.2. Procedura
d utilizată
tili tă îîn
analiza legăturii
y metode elementare:
– diagrama de împrăştiere
– tabelul
t b l l de
d corelație
l ți
–a
analiza
a a dispersională
d spe s o a ă
y metode analitice:
– analiza regresiei: simplă / multiplă
– analiza corelației: parametrică /
neparametrică.
6.3.
6 3 Metode elementare
utilizate în analiza legăturii
6.3.1. Diagrama de împrăştiere
Y

yj

α
xi X
0
Y Y

α
α

X 0
X
0 b)
a))
Y Y

0 0
a) X b) X
Y Y

X X
Figura 6.5. Graficul funcţiei liniare Figura 6.6. Graficul funcţiei parabolice de ordinul II
Y Y

X X
Fi
Figura 6.7. Graficul funcţiei hiperbolice
6 7 G fi l f i i hi b li Figura 6.8. Graficul funcţiei exponențiale
Y

yj

α
xi X
0

Figura 6
6.9.
9 Corelograma
6.3.2. Tabelul de corelaţie
Y
y1 y2 y3 … yj … yn f
fx
X
x1 f11 f12 f13 … f1j … f1m f 1
fx
x2 f21 f22 f23 … f2j … f2m fx2
x3 f31 f32 f33 … f3j … f3m ffx3
: : : : : : : : :
xi fi1 fi2 fi1 … fij … fmi ffxi
: : : : : : : : :
xn fn1 fn2 fn3 … fnj … fnm ffxn
fy fy1 fy2 fy3 … fyj … fym f
Elementele evidenţiate
1. Existenţa legăturii dintre variabila X factorială şi
Y rezultativă

Y yj F
Fx Y yj Fx

X X

xi Fxi xi Fxi

Fy Fyj F Fy Fyj F

Corelaţie directă Corelaţie inversă


2. Sensul legăturii

Y yj Fx Y yj Fx

X X

xi Fxi xi Fxi

Fy Fyj F Fy Fyj F

C l ţi di
Corelaţie directă
tă C l ţi iinversă
Corelaţie ă
3. Intensitatea legăturii

Y yj F
Fx Y yj Fx

X X

xi Fxi xi Fxi

Fy Fyj F Fy Fyj F

Corelaţie puternică Corelaţie slabă


4. Forma legăturii

Y yj Fx Y yj Fx

X X

xi Fxi xi Fxi

Fy Fyj F Fy Fyj F

Corelaţie liniară Corelaţie neliniară


6.3.3. Analiza dispersională
y Analiza dispersională este cunoscută, în general,
sub denumirea de ANOVA (ANalysis Of VAriance)VAriance), și
presupune studiul dispersiei diferențiat pe grupuri de
unități statistice
statistice.
y La baza analizei dispersionale regăsim metoda
grupării variantelor variabilelor după diverse criterii
criterii.
y În aplicarea ANOVA se urmărește descompunerea
variației totale în mai multe elemente
elemente, care reflectă
influențele exercitate de diferiți factori asupra
fenomenului.
Myyr12

y A. Modelul de analiză dispersională unifactorială

Grupe după factorul cauză


1 2 … r
y11 y21 … yr1
y12 y22 … yr2

y1n1 y2n2 … yrnr
Media …
Volum de grupă n1 n2 … nr

y B. Modelul de analiză dispersională bifactorială
B  M d l l d   li ă di i lă bif t i lă
6.4. Metode analitice

6 4 1 Regresia simplă
6.4.1.

y y = f(x ) + ε
y Determinarea parametrilor - metoda celor mai
mici pătrate:

( )
n
S = ∑ yi − y x i → min
2

i =1
Funcţii de corelaţie simplă
- funcţia liniară:
y = a + bx
- funcţia parabolică:
y = a + bx + cx2
- funcţia exponenţială:
y = abx
- funcţia
ţ logaritmică:
g
y = a · logx sau y = a + b · logx
- funcţia
ţ hiperbolică:
p

1 1
y= y = a+b
a + bx x
Funcţia liniară

y = a + bx
Y Y
b > 0 b < 0
a
a
X X
Graficul funcţiei liniare
⎧⎪na + b ∑ xi = ∑ yi

⎪⎩a ∑ xi + b ∑ xi = ∑ xi yi
2

∑y i − b ∑ xi ∑x y
i i − y ∑ xi
a= = y − bx b=
n
∑ i − x ∑ xi
x 2

n∑ xi yi − ∑ xi ⋅ ∑ yi
b=
n∑ − (∑ xi )
2
xi2

a= ∑ yi ⋅ ∑ 2
xi − ∑ xi ⋅ ∑ xi yi
n∑ − (∑ xi )
2 2
xi
F
Funcţia
ţi parabolică
b li ă d
de ordinul
di l 2

Yx = a + bx + cx 2

Y Y

X X
Grafice ale funcţiei parabolice de ordinul 2

⎪∑ y i = na + b∑ xi + c ∑ xi
2


⎪⎪
⎨∑ i i = ∑ i ∑ i ∑ i
+ +
2 3
x y a x b x c x


⎪∑ xi2 y i = a ∑ xi2 + b∑ xi3 + c ∑ xi4
⎪⎩
F
Funcţia
ţi hiperbolică
hi b li ă
b
Yx = a +
x ⎧ 1
Y ⎪∑ y i = na + b∑ x
⎪ i

⎪ yi = a 1 + b 1
⎪∑ x i ∑ x ∑ x2
⎩ i i

X
Graficul funcţiei hiperbolice
F
Funcţia
ţi exponenţială
ţi lă

Yx = ab x

X
Graficul funcţiei exponenţiale
Sistemele de ecuaţii normale ale
principalelor funcţii de extrapolare (1)
Tipul
Funcţia
ţ Sistemul de ecuaţii
ţ normale
f
funcţiei
ţi i
Liniară ⎧⎪ na ± b ∑ x = ∑ y
y = a ± bx ⎨
⎪⎩ a ∑ x ± b ∑ x 2 = ∑ xy
Parabolică ⎧ na + b ∑ x + c ∑ x 2 = ∑ y
⎪⎪
y = a + bx + cx2 ⎨ a ∑ x + b ∑ x + c ∑ x = ∑ xy
2 3


⎪⎩ a ∑ x + b ∑ x + c ∑ x = ∑ x y
2 3 4 2

Exponenţială ⎧⎪n lg a + lg b ∑ x = ∑ lg y
y = abx ⎨
⎪⎩lg a ∑ x + lg b ∑ x 2 = ∑ x lg y

Putere ⎧⎪n lg a + b ∑ lg x = ∑ lg y
y= axb ⎨
⎪⎩lg a ∑ lg x + b ∑ (lg x )2 = ∑ lg x ⋅ lg y
Sistemele de ecuaţii normale ale
principalelor funcţii de extrapolare (2)
Tipul
Funcţia Sistemul de ecuaţii normale
funcţiei

Hiperbolică ⎪∑ y = na + b ∑
1
b ⎪
i
xi
Yx = a + ⎨
⎪ yi 1 1
⎪∑ ∑ ∑
x = a + b
⎩ xi xi x i2

Logistică ⎧ Δy
clasică k ⎪( n − 1 ) A + B ∑ y = ∑ y
y= ⎨
b − cx
1 + be ⎪A
⎩ ∑ y + B ∑ y 2
= ∑ Δy

Törnquist ⎧ 1 a 1 1
kx ⎪n ⋅ k + k ∑ x = ∑ y

y= ⎨
x+a ⎪ 1 ∑ 1 + a ∑ 1 = ∑ 1
⎪⎩ k x k x2 xy
6.4.2. Regresia
g multiplă
p
Yi = a0 + a1 x1 + a 2 x2 + ... + a n xn

Yi = a0 + a1 x1 + a 2 x2
⎧na0 + a1 ∑ x1 + a2 ∑ x2 = ∑ y

⎨ 0∑ 1 + 1 ∑ 1 + a 2 ∑ x1 x 2 = ∑ x1 y
2
a x a x

⎩ 0∑ 2 + 1∑ 1 2 + 2 ∑ 2 = ∑ x2 y
2
a x a x x a x
6.4.3. Calitatea ajustării
j
y eroarea standard a reziduurilor
d d d l
y coeficientul de determinaţie
y coeficientul de eroare
y abaterea medie pătratică procentuală
6.4.4.
6 44 C Corelaţia
l ţi
parametrică simplă
y A.
A Covarinţa
cov( x , y ) = ⋅ ∑ (xi − x )( yi − y )
1
n

y B. Coeficientul de corelaţie ţ simplă p


n∑ xi yi − (∑ xi )(∑ yi )
r=
[ n∑ xi2 − (∑ xi ) ] ⋅ [ n∑ yi2 − (∑ yi ) ]
2 2

ry / x =
∑ ( xi − x )( yi − y )
(
∑ ix − x )2
⋅ (
∑ i y − y )2
y C.
C Raportul de corelaţie

Ry / x = 1 −
∑ ( yi − Yi )
2

(
∑ i y − y )2
6.4.5. Metoda corelaţiei
rangurilor
y Coeficientul
C fi i t l lui
l i Spearman
S
6∑ d 2
θ = 1−
n( n 2 − 1 )

y Coeficientul lui Kendall


2S 2 (P − Q )
τ= =
n(n − 1) n(n − 1)
6.5. Asocierea variabilelor
calitative
lit ti

6 5 1 Asocierea variabilelor binare


6.5.1.

6 5 2 Asocierea variabilelor categoriale


6.5.2.

6.5.3. Asocierea variabilelor ordinale

6.5.4. Analiza multivariată


6.5.1. Asocierea variabilelor
binare
y Coeficientul ϕ
y Coeficientul Q
y Coeficientul Y
6.5.2. Asocierea variabilelor
categoriale
y Coeficientul de contingenţă C
y Coeficientul V
y Coeficientul λ
y Coeficientul τ
y Coeficientul
C fi i t l ded incertitudine
i tit di U
6.5.3. Asocierea variabilelor
ordinale
y Coeficienţii τ
y Coeficientul τa
y Coeficientul τb
y Coeficientul τc
y Coeficientul γ
y Coeficientul d
6.5.4. Analiza multivariată
y Într-o manieră g
generală,, prin
p „analiză

multivariată” se înţelege orice procedură
statistică de evidenţiere
ţ şşi evaluare a relaţiilor
ţ
dintre trei sau mai multe caracteristici, indiferent
de natura lor.
y Într-un sens restrâns, se vorbeşte, mai ales în
literatura statistică destinată sociologilor, de
analiză multivariată atunci când caracteristicile
sunt de tip calitativ sau când avem de-ade a face cu
aşa-numitele variabile categoriale.
66 T
6.6. Testarea
t iipotezelor
t l
statistice
6.6.1. Validarea modelului de regresie
6.6.2.
6 6 2 Testarea parametrilor modelului de
regresie
6.6.3. Testarea semnificaţiei
coeficientului de corelaţie
6.6.4.
6 6 4 Testarea semnificaţiei raportului de
corelaţie
Capitolul 7

ANALIZA
SERIILOR
CRONOLOGICE
7.1. Introducere

7.2.
7 2 Etapele parcurse în analiza
seriilor cronologice
g

7 3 Indicatorii dinamicii
7.3.

7.4. Metode de ajustare a seriilor


cronologice
7.1. Introducere
• Orice fenomen al activităţii umane poate fi
studiat atât în timp, cât şi în spaţiu.
• Fenomenele
F l pott fi d
descompuse astfel:
tf l
• trendul (T)
• componenta t sezonieră
i ă (S)
• componenta ciclică (C)
• componenta t reziduală
id lă (R)
(R).
• În funcție de modul de combinare, avem:
a) Y=T+S+C+R , b) Y=T⋅S⋅C⋅R
7.2.
7 2 Etapele
Et l parcurse în
î
analiza seriilor cronologice
Analiza retrospectivă
y reprezentarea grafică a datelor
y determinarea indicatorilor dinamicii (absoluţi,
(absol ţi
relativi, medii)
A li prospectivă
Analiza ti ă
y modelarea
y modelarea trendului
y modelarea componentei sezoniere
y previzionarea.
7.3. Indicatorii dinamicii

• indicatori absoluţi

• indicatori relativi

• indicatori medii
7.3.1. Indicatori absoluţi
• nivelul
i l l absolut
b l t – y1 , y2 , …, yn
• modificarea absolută
- cu baza fixă:

Δ t / 1 = y t − y1
- cu baza în lanţ:

Δ t / t −1 = y t − y t −1

Δ t / 1 = ∑ Δ t / t −1
7.3.2. Indicatori relativi
• Indicele
I di l dinamicii
di i ii
- cu baza fixă:

yt
It / 1 =
y1
- cu baza în lanţ:
ţ
yt
I t / t −1 =
y t −1

I t / 1 = ∏ I t / t −1
• Ritmul dinamicii
- cu baza fixă:

Rt / 1 =
yt − y1
y1
⋅ 100 =
Δt / 1
y1
(
⋅ 100 = I t / 1 − 1 ⋅ 100 )
- cu baza în lanţ:

Rt / t −1 =
yt − yt −1
yt −1
⋅ 100 =
Δ t / t −1
yt −1
( )
⋅ 100 = I t / t −1 − 1 ⋅ 100
• Valoarea absolută a unui procent de creştere /
reducere
- cu baza fixă:

Δt / 1 yt − y1 y1
At / 1 = = =
Rt / 1 yt − y1 100
⋅ 100
y1
- cu baza în lanţ:

Δ t / t −1 yt − yt −1 yt −1
At / t −1 = = =
Rt / t −1 yt − yt −1 100
⋅ 100
yt −1
7 3 3 IIndicatori
7.3.3. di i medii
dii
• nivelul mediu absolut
• dacă seria cronologică
g este de intervale
- media aritmetică Δ t / t −1
- media pătratică
- media geometrică

• dacă seria cronologică este de momente


- media cronologică
g - etape:
p
• calculul mediilor mobile
• calculul mediei cronologice
g
• Media cronologică simplă
t1 = t2 = … = tk

xi + xi +1 k
xi = ∑ xi
2 i =1
xc =
k
• Media cronologică ponderată
t1 ≠ t2 ≠ … ≠ tk
xi + xi +1
k

xi = ∑ xi t i
i =1
2 xc = k
∑ ti
i =1
• Modificarea medie

Δ= ∑ Δt / t −1 Δt / 1
=
n −1 n −1
• Indicele
I di l mediu
di
I = n −1 ∏ I t / t −1 = n −1 I t / 1
• Ritmul mediu
(
R = I − 1 ⋅ 100)
• Valoarea medie absolută a 1% de creştere
Δ
A=
R
7.4. Metode de ajustare a
seriilor
iil cronologice
l i
• ajustarea grafică

• ajustarea mecanică

• ajustarea analitică
7.4.1. Ajustarea grafică
yt yt yt

t t t
a) Funcţie liniară b) Funcţie hiperbolică c) Funcţie parabolică

yt yt

t t
d) Funcţie exponenţială e) Funcţie logistică
7.4.2. Ajustarea mecanică
• Metoda mediilor eşalonate
y1 + y2 y3 + y4 yn − 1 + yn
y1 = , y2 = , ..., yn / 2 =
2 2 2
y1 , y2 , ..., yn / 2

• Metoda mediilor mobile


y1 +y2 y2 +y3 yn−1 +yn
y1 = y2 = , ... yn−1 =
2 2 2
y1 , y 2 , ..., y n −1
• Metoda
M t d sporului
l i mediu
di
Y1 = y1 + 0 ⋅ Δ = y1
Yi = y1 + k ⋅ Δ Y2 = y1 + 1 ⋅ Δ
unde i = 1, 2, …, n; Y3 = y1 + 2 ⋅ Δ
k = 0,
0 1,
1 …, n-1 ………………..
Y1 = y1 , Yn = yn Yn = y1 + ( n − 1 ) ⋅ Δ = yn

• Metoda indicelui mediu


Y1 = y1 ⋅ I 0 = y1
Yi = y1 ⋅ I k
Y2 = y1 ⋅ I 1

Y1 = y1 , Yn = yn Y3 = y1 ⋅ I 2
………………..
Yn = y1 ⋅ I n −1 = yn
7 4 3 Aj
7.4.3. Ajustarea analitică
li i ă
F ncţia liniară
Funcţia
Yi = a + b ⋅ ti
⎧⎪na + b ∑ ti = ∑ yi

⎪⎩a ∑ ti + b ∑ ti = ∑ ti yi
2


a= ∑ yi
⎧⎪na = ∑ yi ⎪
⎪ n
⎨ ⇒⎨
Σti =0 ⎪⎩b∑ ti = ∑ ti yi
2
∑ t y
⎪b = i i
⎪⎩ ∑i t 2
Funcţia hiperbolică
Funcţia parabolică de ordinul 2
Funcţia exponenţială
Criterii de alegere a celui mai adecvat
procedeu de ajustare
• minimizarea sumei pătratului abaterilor
( y − Y )
∑ i i = min
2

• eroarea medie de estimaţie


∑ (yi − Yi )
2

E=
n
• coeficientul de variaţie E
C = ⋅ 100
Cv
y