Documente Academic
Documente Profesional
Documente Cultură
CAPITOLUL 1.
ISTORICUL SI ROLUL STATISTICII
Cuvinte cheie:
- carcateristică statistică
- frecvenţă statistică
- statistica
- statistica teoretică
- statistica aplicată
- statistica descriptivă
- statistica inferenţială
- unitatea statistică
- variabilă statistică
Probleme şi aplicaţii:
1.1.Zece studenţi care se aflau în sala de lectură a unei biblioteci universitare au fost
chestionaţi în legătură cu motivul prezenţei lor acolo. Cinci dintre ei au răspuns că
se află acolo pentru studiu; doi au răspuns că încercau să doarmă; unul a răspuns
că trebuia să se întâlnească cu o colegă şi ultimii doi au răspuns prin întrebarea
“Aici este sala de lectură?”. Precizaţi care din următoarele propoziţii aparţin
statisticii descriptive şi care aparţin celei inferenţiale:
a) 20% din studenţii chestionaţi au răspuns că se aflau acolo pentru a încerca să doarmă;
b) unul dintre cei zece studenţi dintr-o universitate aşteaptă o colegă sau un coleg în sala
de lectură.
1.2. Arătaţi care din următoarele propoziţii aparţin statisticii descriptive sau
statisticii inferenţiale:
a) Dintre 100 de medici stomatologi chestionaţi au răspuns că 95% din pacienţii lor nu
mestecă chewing gum;
b) Media notelor obţinute într-o grupă de studenţi la examenul de statistică a fost 7,50;
c) Bazându-ne pe datele asupra inflaţiei din ultimii doi ani, rata inflaţiei pentru anul în
curs va fi de 35%.
Statistică teoretică şi economică
CAPITOLUL 2.
CERCETAREA STATISTICĂ
Cuvinte cheie:
- analiza şi interpretarea statistică
- caracteristica de grupare
- grafice statistice.
- observarea statistică
- observarea documentară
- observarea directă
- prelucrarea statistică
- plan de observare statistică.
- tabele statistice.
10
Statistică teoretică şi economică
11
Statistică teoretică şi economică
Elementele Caracteristici
colectivitatii C1 C2 C3 …….. Cn
1 X X X X
2 - - X -
.
.
.
n X X X -
Total (n) C1 C2 C3 …….. Cn
Prin caracteristica de grupare se înţelege acea însuşire care stă la baza împărţirii
colectivităţii în grupe omogene.
După numărul caracteristicilor puse la baza grupării se disting: grupări simple şi
grupări combinate.
După continutul caracteristicilor, grupările simple şi combinate pot fi: teritoriale,
cronologice sau atributive.
Grupările după caracterstici numerice sunt cele mai dificile, deoarece, cu cât
amplitudinea variaţiei este mai mare, cu atât este mai greu de asigurat omogenitatea
unităţilor din aceeaşi grupă.
In acest caz există două probleme:
12
Statistică teoretică şi economică
A X max − X min
k= = ⋅
r r
X max − X min
k= .
1 + 3,322 ⋅ log n
unde:
A = amplitudinea absolută;
r = numărul de grupe;
Intervalul de variaţie este un grup omogen de variante, despărţit de restul
colectivităţii prin limita inferioară şi limita superioară a grupei. Intervalele de grupare pot
fi: intervale egale şi intervale neegale; intervale deschise şi intervale inchise; intervale
cu variaţie continuă şi intervale cu variaţie discontinuă (discretă).
1
H.A.Sturges: The Choise of a Class Interval, Journal of the American Statistical Association, vol.21, p.65-
66.
13
Statistică teoretică şi economică
Tabele statistice.
Tabelul statistic este o formă de prezentare ordonată şi completă a datelor despre
o colectivitate cercetată, facilitând formarea unei imagini globale despre obiectul de
studiu.
Elementele constructive ale unui table statistic sunt:
• titlul tabelului, trebuie să precizeze în câteva cuvinte ce se prezintă în tabel, unde
şi când s-au produs evenimentele prezentate în tabel;
• macheta tabelului care cuprinde totalitatea liniilor orizontale şi verticale a căror
intersecţie conduce la formarea de rubrici pentru subiectul şi predicatul
tabelului;
• subiectul tabelului se înscrie în capetele rândurilor şi îl reprezintă colectivitatea
şi părţile sale componente;
• predicatul tabelului se înscrie în capătul coloanelor şi este format din totalitatea
aspectelor cantitative referitoare la colectivitatea cercetată. Macheta devine tabel
statistic când se umple cu date.
• conţinutul tabelului reprezintă totalitatea informaţiilor trecute în rubrici;
• sursa datelor se trece imediat sub tabel;
• notă explicativă se pune fie imediat după sursa datelor, fie în subsolul paginii pe
care se afla tabelul daca în etapa de culegere sau prelucrare a datelor din table s-
au folosit proceduri sau tehnici noi sau rar utilizate de către posibilii cititori.
Grafice statistice.
Graficul statistic reprezintă o altă formă de prezentare a datelor sub formă de
imagini spaţiale cu caracter convenţional care prin mijloace plastice reliefează unele
caracteristici esenţiale ale colectivităţii cercetate.
Elementele constitutive ale unui grafic statistic sunt:
• titlul graficului;
• axa sau axale graficului;
• scara sau scările graficului pentru gradare;
• legenda care să explice culori, haşuri;
• graficul propriu-zis reprezentat de puncte, linii, figuri geometrice în plan sau
spaţiu sau figuri natural convenţionale construite la scara;
• sursa datelor se plasează imediat după grafic;
• nota explicative.
Principalele tipuri de grafice sunt: diagramele prin benzi şi coloane; grafice prin
areale; diagrame de structură; diagrame polare etc.
Diagramele prin benzi se costruiesc sub forma unor dreptunghiuri cu latura mare
orizontală sprijinite pe o dreaptă ridicată în punctul de origine a axei (orizontale) de
reprezentare.
Diagrame prin coloane se construiesc sub forma unor dreptunghiuri cu latura
mare verticală cu ajutorul unui sistem de axe rectangulare.
14
Statistică teoretică şi economică
Graficele prin areale se construiesc sub forma unor figuri geometrice în plan a
căror suprafaţă este proporţională cu mărimea caracteristicii. De regulă, se folosesc
pătrate, romburi, cercuri, triunghiuri echilaterale, dreptunghiuri etc.
Diagramele de structură presupun un raport de proporţionalitate între suprafaţa
figurii geometrice şi totalul structurii de 100%.
Diagrama polară se utilizează, de obicei, pentru a ilustra sezonalitatea, dar poate
fi folosită şi pentru a da o imagine grafică raportului dintre elementele unor serii de
repartiţie.
Probleme şi aplicaţii.
267 268 270 285 286 290 292 296 285 288
296 299 325 346 261 252 270 262 255 248
272 170 165 275 172 240 181 185 250 252
197 280 192 181 284 195 197 282 187 194
215 217 196 198 225 220 230 211 227 231
233 220 225 228 233 234 217 236 245 248
Se cere
15
Statistică teoretică şi economică
16
Statistică teoretică şi economică
Observaţie: Formula lui H.D. Sturgers oferă o soluţionare optimală a cerinţei de grupare
pe intervale egale numai în cazul unei distribuţii quasi-continue a unităţilor observate
între xmin şi xmax. În acest exemplu, intervalul penultim (300 - 325) este vid.
Totodată, coloana a doua a tabelului 1.2 reflectă fluctuaţii ale numărului de unităţi
cuprinse în diferite grupe, ceea ce poate fi considerat ca semn al unei sistematizări
deficitare a datelor observării statistice (între grupele cu 11 şi, respectiv 14 societăţi
comerciale apare una cu numai 6 unităţi, între grupele cu 14 şi, respectiv 13 societăţi se
înregistrează o grupă cu o frecvenţă mai mică, de 11 societăţi comerciale).
Pentru a elimina astfel de neajunsuri, există două alternative:
a) eluarea procesului de grupare a datelor observării tot pe intervale de variaţie
a numărului de salariaţi de 25 de persoane, dar, se glisează fie în sus (de exemplu, primul
interval să cuprindă societăţile cu până la 180 salariaţi, al doilea interval să fie de la 180
la 205 salariaţi etc.) fie în jos (de exemplu, prima grupă să fie până la 170 salariaţi etc.).
b) se procedează la regrupare, unind două câte două intervalele de variaţie a
numărului de salariaţi ai societăţilor comerciale. Mai jos se prezintă două variante de
regrupare a societăţilor comerciale observate, intervalele fiind de câte 50 salariaţi:
b1)
Intervale de variaţie a Număr de societăţi
numărului de salariaţi comerciale ( n j )
Sub 175* 3
175 – 225 17
225 – 275 25
275 – 325 13
325 şi peste 2
Total 60
*
Din felul în care sunt definite intervalele marginale de grupare,
rezultă că limita inferioară este inclusă în fiecare interval.
b2)
Intervale de variaţie a Număr de societăţi
numărului de salariaţi comerciale
(n j )
Sub 200* 14
200 – 250 20
250 – 300 24
300 şi peste 2
Total 60
*Limita superioară nu este inclusă în interval
17
Statistică teoretică şi economică
Acea grupare care se abate cel mai puţin (în plus sau minus) de la această sumă
este considerată că denaturează cel mai puţin specificul colectivităţii analizate.
Datele fiind grupate, frecvenţa (nj) specifică fiecărei grupe (j) se înmulţeşte cu
centrul (xj) grupei pentru a calcula ∑ x j ⋅ n j .
j
18
Statistică teoretică şi economică
2.2 În cursul lunii martie 2001, trei echipe (A, B şi C) au realizat un număr de 220
de loturi de produse, fiecare lot fiind alcătuit din câte 500 de unităţi.
Cu prilejul unui control total dispus de managementul fabricii, s-au înregistrat
următoarele date (alături de însemnul echipei s-a notat numărul de produse defecte
din fiecare tip).
19
Statistică teoretică şi economică
37 B 8 92 B 8 147 C 4 202 B 5
38 C 10 93 C 9 148 B 3 203 A 1
39 B 4 94 A 6 149 C 4 204 C 4
40 C 7 95 C 11 150 C 5 205 C 7
41 B 5 96 C 3 151 B 3 206 A 2
42 A 7 97 C 12 152 C 10 207 B 2
43 B 8 98 C 11 153 C 8 208 B 2
44 A 2 99 A 4 154 A 7 209 C 5
45 C 4 100 A 5 155 A 2 210 A 3
46 A 3 101 C 5 156 B 8 211 A 2
47 B 4 102 C 4 157 A 3 212 B 6
48 A 2 103 B 5 158 A 5 213 C 12
49 C 7 104 C 4 159 B 5 214 C 6
50 A 1 105 A 2 160 C 7 215 C 9
51 B 5 106 C 10 161 A 5 216 A 5
52 C 4 107 A 6 162 B 4 217 A 6
53 B 7 108 B 6 163 C 3 218 C 5
54 A 1 109 C 7 164 B 5 219 C 10
55 A 6 110 B 7 165 A 2 220 B 7
Se cere:
Să se grupeze loturile în raport cu echipa care a realizat fabricaţia şi să se
reprezinte grafic repartiţia obţinută.
Rezolvare:
Repartiţia loturilor fabricate pe echipe:
80 67
53
60
40
20
0
Echipa A Echipa B Echipa C
20
Statistică teoretică şi economică
Observaţie: Ultima linie a tabelului de mai sus reproduce prima grupare, iar ultima
coloană cea de-a doua grupare a loturilor de produse.
Se cere:
1. Să se observe punctajele maxim şi minim înregistrate în această colectivitate.
2. Să se grupeze candidaţii după rezultatele obţinute în cinci grupe egale.
3. Să se reprezinte grafic repartiţia obţinută.
4. Să se calculeze mărimile relative prin care se caracterizează structura colectivităţii în
funcţie de performanţa înregistrată de candidaţi, precum şi proporţia între grupele
constituite.
21
Statistică teoretică şi economică
lei): 24; 10; 14; 20; 23; 24; 12; 10; 17; 21; 22; 17; 15; 18; 12; 24; 21; 11; 18; 20; 24;
16; 18; 17; 22.
Se cere:
1. Să se grupeze datele pe 4 intervale egale.
2. Să se reprezinte grafic gruparea obţinută.
Se cere:
1. Să se reprezinte grafic această serie.
2. Să se grupeze băncile pe trei intervale de variaţie a ratei dobânzii practicate şi să se
facă o nouă reprezentare grafică a repartiţiei obţinute.
Numărul Frecvenţa
accidentelor accidentelor
1-2 6
3-4 10
5-6 5
7-8 2
9-10 1
Se cere:
1. să se determine frecvenţele cumulate crescător şi descrescător;
2. presupunem că în următoarea lună au loc 11 accidente, ce sugerează acest lucru
managerului?
2.7. O companie cu două filiale doreşte să compare salariile plătite. Acestea sunt
următoarele:
Salariu (mii lei) Filiala 1 Filiala 2
Sub 500 15 2
501-800 80 16
801-1100 55 12
1101-1400 30 11
peste 1401 20 9
Total 200 50
Se cere:
1. să se transforme aceste frecvenţe absolute în frecvenţe relative;
2. să se transforme aceste frecvenţe absolute în frecvenţe cumulate crescător;
22
Statistică teoretică şi economică
3. care dintre aceste modalităţi poate permite o mai uşoară comparare a salariilor
celor două filiale.
4 3 4 3 4 3
∑∑ ( x
i =1 j =1
ij − 2 ⋅ y ij + 5) = ∑ ∑ x ij − 2 ⋅ ∑ ∑ y ij + 60.
i =1 j =1 i =1 j =1
2.9. Dacă x1=-1, x2=3, x3=5 şi y1=4, y2=0, y3=2, calculaţi următoarele:
3 3 3 3
a) ∑∑ x i ⋅ yj; b) (∑ xi ) ⋅ (∑ y i )
i =1 j =1 i =1 i =1
3 3 3 3
c) ∑∑ xi ( y j − 1); d) ∑∑ ( xi + y j ).
i =2 j =2 i =1 j =1
23
Statistică teoretică şi economică
CAPITOLUL 3.
INDICATORII STATISTICI
Cuvinte cheie:
- Indicatorul statistic
- Indicatorii absoluţi
- Indicatorii derivaţi
- Mărimile relative
- Mediana
- Modul
- media aritmetică
- media armonică
- media geometrică;
- media patratică
Indicatorul statistic este expresia numerică a unei categorii economice sau sociale
localizate în timp şi spaţiu (expresia numerică a unei trăsături observate pe o colectivitate
definită în timp şi spaţiu).
Indicatorii statistici au anumite funcţii: de măsurare, de comparare, de sinteză, de
estimare, de verificare a ipotezelor şi testare a semnificaţiei parametrilor statistici utilizaţi
etc.
In funcţie de metoda obţinerii indicatorilor şi de rolul jucat în cercetare,
indicatorii pot fi împărţiţi în două categorii:
• indicatori absoluţi (primari);
• indicatori derivaţi (secundari).
Indicatorii absoluţi sunt rezultatul observarii şi sistematizării datelor, în
consecinţă aceştia reflectă dimensiunea, mărimea, amplitudinea fenomenului în unităţi
concrete, specifice de măsură.
Indicatorii derivaţi se obţin în procesul de calcul statistic şi reflectă într-o
manieră, de regulă abstractă, aspecte calitative, evolutive ale colectivităţii cercetate.
Dintre indicatorii derivaţi amintim: mărimile relative şi mărimile medii; indicatorii
variaţiei şi ai asimetriei; indicii statistici; parametrii funcţiilor de regresie şi ajustare
analitică etc.
yt
y t / t −1 =
y t −1
yt
yt / 0 =.
yo
Prima relaţie fiind mărimea relativă a dinamicii cu bază mobilă (în lanţ) iar cea de a
doua fiind mărime relativă a dinamicii cu baza fixă.
Mărimi relative de structură exprimă ponderea, cota parte, greutatea specifică a
unui element sau a unui grup de elemente în totalul colectivităţii.
ni
gi =
∑ ni
i
Mărimi relative de coordonare compară două elemente sau două grupuri ale
aceleiaşi colectivităţi sau două colectivităţi similare situate în spaţii diferite, coexistente
în timp de forma a/b sau b/a.
Mărimi relative de plan. In planificarea microeconomică se utilizează raportul
dintre nivelul propus de activitate (xplan) şi nivelul realizărilor perioadei precedente (x0)
pentru a arata intensitatea efortului necesar realizării planului:
x plan
⋅ 100.
x0
x1
⋅ 100.
x plan
n +1
Loc Me =
2
De exemplu: avem valorile 7;3;1;9;4;2;4. Aceste valori trebuie ordonate crescător sau descrescător.
In cazul nostru le vom ordona crescător astfel: 1;2;3;4;4;7;9.
Locul medianei utilizând formula de mai sus va fi: Loc Me = (7+1)/2 = 4.
Deci, locul medianei fiind 4, valoarea medianei se află pe locul al patrulea şi va fi egală cu Me = 4.
Dacă, avem un numar par te factori atunci locul medianei se va calcula după aceiaşi relaţie iar,
mediana se determină ca medie aritmetică simplă a celor două valori centrale.
In cazul exemplului nostru, frecvenţa maximă de apariţie este 2, deci varianta este 4 şi
rezultă că modul Mo = 4.
Pot exsita colectivităţi bidimensionale în care două sau mai multe variante
înregistrate au aceeaşi frecvenţă maximă. Se constată că aceste poziţii nu sunt în total
edificatoare.
Mediile calculate.
Mediile calculate se determina pe baza tuturor variantelor înregistrate într-o
colectivitate.
Statistică teoretică şi economică
Media aritmetică.
Media aritmetică se foloseşte, în general, când fenomenul studiat înregsitrează
modificari aproximativ constante în progresie aritmetică.
Media aritmetică este acea valoare abstractă care înlocuind toate variantele unei
colectivităţi nu modifică suma elementelor.
Media aritmetică simplă are următoarea relaţie de calcul:
∑x i
x= i
∑x ⋅n i i
x= i
∑n i
i
b) suma abaterilor nivelurilor individuale ale variabilei aleatoare de la media lor este
egală cu zero, întrucât, prin definiţie, media anihilează toate abaterile în plus sau
în minus de la nivelul sau:
∑ (x
i
i − x) = 0
∑ (x
i
i − x) ⋅ ni = 0.
Media armonică.
Media armonică reprezintă acea valoare care înlocuind termenii reali din
colectivitate nu modifică suma inverselor. Media armonică se calculează sub forma
neponderată sau ponderată după urmatoarele relaţii:
n
xh = .
1
∑x
i
xh =
∑n i
.
1
∑ x ⋅n i
i
Statistică teoretică şi economică
Media geometrică.
Media geometrică reprezintă acea valoare care înlocuind elementele colectivităţii
nu modifică produsul acestora. Media geometrică poate fi calculată sub forma
neponderată sau ponderată astfel:
x g = n Π xi .
x g = ∑ i Πxini .
n
Media patratică.
Media patratică reprezintă acea valoare care înlocuind variantele reale din
colectivitate nu modifică suma pătratelor lor. Se calculează ca medie simplă sau
ponderată dupa relaţiile:
Statistică teoretică şi economică
xp =
∑x 2
i
.
n
xp =
∑x ⋅n
2
i i
.
∑n i
Intr-o serie statistică obisnuită la care se pot calcula toate aceste medii trebuie să
existe următoarea relaţie:
x h ≤ x g ≤ x ≤ x p ≤ xcr .
Pentru a exprima ceea ce este esenţial într-o colectivitate este suficient să folosim
o singură mărime medie, dar ea să fie aleasă în concordanţă cu tipul variaţiei şi cu datele
disponibile.
Statistică teoretică şi economică
Probleme şi aplicaţii
3.1. O societate comercială specializată în producţia şi exportul de confecţii a
realizat în anul 1999 un export de 10 milioane USD, în anul 2000 de 12 milioane
USD, iar pentru anul 2001 îşi propune să orienteze spre pieţele externe 60% dintr-o
producţie marfă estimată la 25 milioane USD.
Până la 31 martie 2001, societatea a realizat deja exporturi în valoare de 5
milioane USD şi avea în portofoliul de comenzi de executat contracte în valoare de
alte 8 milioane USD, din care 1 milion USD cu termene de livrare în 2002.
Rezolvare:
Pentru a caracteriza dinamica exportului, se va observa că în anul 2000 exportul era
cu 2 milioane USD mai mare decât în 1999, respectiv de 1,2 ori (cu 20%) superior
realizărilor anului precedent.
Exportul programat pentru anul 2001 se situează la 15 milioane USD
60
( ⋅ 25 = 15 ). Aceasta înseamnă că exportul anului 2001 va putea fi de 1,25 ori mai
100
mare decât cel din 2000 (15:12) şi, respectiv, de 1,5 ori superior exportului din 1999, cu
condiţia îndeplinirii integrale a programului propus.
Programul de export pe anul 2001 prezintă următoarea structură din punct de
vedere al execuţiei la data de 31 martie 2001:
3.2 Piaţa zahărului din România se caracteriza prin următoarele date specifice
anilor 1996 şi 1997 şi estimări pentru anul 2000:
Consumul de zahăr;
Răspuns: 1999: 85,1%; 2000: 76,6%
Aprecierea consumului de zahăr din producţia proprie de zahăr din sfeclă cultivată în
ţară;
Răspuns: 1996: 40,4% (100%)
1999: 18,0% (44,6%)
2000: 11,1 (27,5%)
Consumul de zahăr pe locuitor
Răspuns: 1996: 26,0 kg/locuitor (100%)
1999: 22,3 kg/locuitor (85,8%)
2000: 20,2 kg/locuitor (77,7%)
3.4 Să se determine mărimile medii specifice seriei de variante simple de mai jos şi
să se observe relaţia dintre indicatorii determinaţi: 7; 9; 4; 6; 3; 5; 8; 2.
Să se observe efectul atribuirii unor frecvenţe diferite variantelor seriei de mai
sus, potrivit tabelului alăturat:
xi 7 9 4 6 3 5 8 2
ni 4 1 9 4 8 4 3 3
Rezolvare:
Σx i 44
• Media aritmetică: x = = = 5,5
n 8
n 8
• Media armonică: x h = = = 4,374
1 1,829
∑x
i
Σxi2 284
• Media pătratică: xp = = = 5,958
n 8
Dintre mediile poziţionale, doar mediana poate fi aflată, locul ei fiind egal cu
n +1 8 +1
= = 4,5 .
2 2
5+6
Me = = 5,5
2
Se obseră că x ≡ Me .
Într-o serie de variante simple nu există valoare modală.
Pentru seria de variante cu frecvenţe, mediile calculate rezultă din aplicarea
relaţiilor:
Statistică teoretică şi economică
Σxi ⋅ ni 171
• Media aritmetică: x = = = 4,75
Σn i 36
Σn i 36
• Media armonică: x h = = = 4,026
ni 8,9409
∑x
i
Deoarece media armonică este sensibilă la variantele mici ale seriei, scăderea nu
mai este atât de pronunţată ca în cazul mediei aritmetice. Totuşi, scăderea mediei
armonice a seriei de frecvenţe este de 0,348 unităţi (-8%) faţă de aceeaşi medie a seriei
de variante simple.
x g = Σni Πx i
ni
• Media geometrică: = 36 7 4 ⋅ 91 ⋅ 4 9 ⋅ ....2 3 ⋅ = 4,406
Σni lg xi 23,09098
lg x g = = = 0,64142
Σn i 36
Σxi2 ⋅ ni 941
• Media pătratică: xp = = = 5,113
Σn i 36
Ea este, la rândul ei, cu 0,845 unităţi (-14,2%) mai mică decât aceeaşi fel de
medie calculată pe seria de intervale simple.
însă atribuirea unor frecvenţe diferite variantelor seriei generează reduceri variabile de la
o medie la alta.
Medii poziţionale
xi 2 3 4 5 6 7 8 9
ni 3 8 9 4 4 4 3 1
Σni + 1 36 + 1
Locul medianei este egal cu = = 18,5 , iar mediana este media
2 2
aritmetică simplă a variantelor x18 şi x19. Adunând treptat frecvenţele, se constată că
3+8+9=20, ceea ce înseamnă că ambele variante au valoarea 4, deci:
Me = 4
Prin urmare, în acest exemplu, mediana şi modul au aceeaşi valoare, 4, fiind mai
mici decât media aritmetică ponderată.
Se cere:
Să se caracterizeze intensitatea modificării orientării geografice a exporturilor şi,
respectiv, a importurilor româneşti în 1999 faţă de 1990
Rezolvare:
Întrucât enunţul problemei cuprinde doar date procentuale, iar suma abaterilor
structurale ale anului 1999 faţă de 1990 (exprimat în puncte procentuale la nivelul
fiecărei grupe de ţări) este nulă la nivelul tuturor exporturilor (sau importurilor), cerinţa
poate fi soluţionată prin folosirea unei medii pătratice simple.
Dacă se notează cu xi diferenţa între ponderea unei grupe de ţări “i” ( i = 1,3 ) în
anul 1999 şi ponderea aceleiaşi grupe de ţări în anul 1990 în totalul unui flux de mărfuri,
atunci intensitatea modificării orientării geografice (IMOG) va fi:
Statistică teoretică şi economică
Σxi2
IMOG = , cu n = 3
n
1407,02
IMOG = = ±21,7 puncte procentuale
3
2088,06
IMOG = = ±26,4 puncte procentuale
3
3.6. Se cunosc următoarele date referitoare la comerţul exterior al unor ţări în anul
1995 în milioane dolari S.U.A.
Se cere:
1. să se calculeze mărimile relative de structură pentru export şi import;
2. să se efectueze ierarhizarea celor cinci ţări după aceste mărimi de structură.
Se cere:
1 să se determine mărimile relative de coordonare faţă de ultima grupă de vechime;
2. să se reprezinte grafic fondul de salarii şi numărul de salariaţi;
3. să se determine mărimile relative de intensitate.
Se cere:
1. să se calculeze mărimile relative de intensitate;
2. să se reprezinte grafic rezultatele obţinute.
3.9. Producţia de energie electrică într-un număr de ţări europene în anii 1995 şi
1996 se prezintă în tabelul următor:
Se cere:
1. să se calculeze mărimile relative de dinamică;
2. să se reprezinte grafic rezultatele obţinute.
Se cere:
1. să se calculeze mărimile relative de intensitate posibile;
2. să se compare evoluţia acestor fenomene demografice.
3.13. Un student obţine la două exemene următoarele puncte: 66 şi 95. Care medie
este mai avantajoasă pentru student atunci când comunică media părinţilor săi:
media aritmetică sau media geometrică.
Se cere:
1. să se calculeze toate tipurile de medie posibile şi să se verifice relaţie dintre ele pentru
ambele sexe;
2. să se calculeze valoarea medieană şi cea modală pentru ambele sexe.
Statistică teoretică şi economică
(date convenţionale)
Grupe de vârstă (ani) Număr de persoane
Sub 20 10
20-25 14
25-30 20
30-35 36
35-40 15
peste 40 5
Se cere:
1 să se determine vârsta medie a personalului din societatea comercială respectivă;
2. să se calculeze vârsta care împarte cei 100 de salariaţi în două grupe egale;
3. să se determine vârsta cea mai des întâlnită.
3.18. Se cunosc vânzările unei societăţi comerciale în perioada 1986-1996: 4,2; 5,3;
6,9; 7,2; 7,5; 8,3; 9,5; 11,0; 12,7; 14,4; 16,3. Datele sunt în miliarde lei, preţuri
comparabile. Managerul firmei a anunţat într-o conferinţă de presă că vânzarea
medie anuală pe întrega perioadă a fost 8,3 miliarde lei.
Se cere:
1. să se precizeze ce tip de medie a anunţat managerul firmei la conferinţa de presă.
Statistică teoretică şi economică
CAPITOLUL 4.
ANALIZA STATISTICĂ A SERIILOR DE REPARTIŢIE
Cuvinte cheie:
- amplitudinea variaţiei
- abaterea medie liniară
- abaterea medie pătratică (standard)
- coeficientul de variatie
- coeficientul de concentrare GINI
- dispersia
- dispersia explicata
- dispersia reziduala
- seria de repartiţie
- variabila alternativă
- diagramă de structură
- curbă de concentrare
- curba frecvenţelor cumulate
- ogivă
- diagramă de corelaţii
Din cel de-al doilea set de indicatori din cadrul sistemului de indicatori care
caracterizeaza repartiţiile unidimensionale fac parte:
Obs.1. din datele prezentate lipseşte oraşul Bucureşti care având o populaţie de peste 5 ori mai mare
decât limita superioară a ultimului interval de grupare se constituie într-un element atipic
al colectivităţii localităţilor urbane din România;
Obs.2. intervalele de grupare folosite în statistica oficială a României pentru aceste date sunt neegale.
Pentru calculul mediei este necesară stabilirea centrelor intervalelor de grupare (xi), ca
medii aritmetice simple ale limitelor fiecărui interval de grupare. Primul interval se consideră închis
la limita inferioară de 200 pers.
11001
x= = 42,475 mii persoane
259
Media este varianta care împarte seria ordonată în două părţi egale.
n +1 259 + 1
Loc Me = ; Loc Me = 130 .
2 2
Într-o serie organizată pe intervale de grupare, după aflarea locului medianei se procedează
la identificarea intervalului ce conţine mediana. Adunând treptat frecvenţele ajungem la un număr
mai mare sau egal cu cel al locului meidanei, astfel rezultând intervalul în care se găseşte mediana.
Mediana se calculează după relaţia următoare:
0,5(n + 1) − ∑ np Me
Me = x 0 + k ⋅ , unde:
n Me
130 − 64
Me = 10 + 10 ⋅ = 17,586 mii pers.
87
Mediala separă în două părţi egale suma produselor dintre valorile variabilei şi frecvenţele
corespunzătoare. Mediala se aplică la repartiţia valorilor globale ale variabilei analizate.
locMl − ∑ npMl
Ml = x 0 + k ⋅ .
n Ml
Într-o serie organizată pe intervale de grupare, valoarea modală se află tot prin interpolare
în interiorul cu frecvenţa cea mai mare. Intervalul modal din tabel este (10-20) (nu este obligatoriu să
coincidă cu cel al medianei).
Modul se calculează după relaţia:
∆1
Mo = x 0 + k ⋅ , unde:
∆2 + ∆3
34
Mo = 10 + 10 ⋅ = 15,667 mii pers.
34 + 26
Chiar dacă cele trei valori ale tendinţei centrale ar fi fost foarte apropiate în
preocuparea economistului trebuie să se afle nu numai valorile tipice (cu caracter de
generalitate cu mediile) ci şi variabilitatea în jurul mediei. Se pune problema de a
carcteriza mărimea, intensitatea şi forma variaţiei în jurul mediei.
d i = xi − x
d i % = (( x i − x ) ⋅ x ) ⋅ 100
d=
∑ (x i − x)
n
d=
∑ (d )n
i i
=
∑ ( x − x ) = 10257,375 = ±39,604 mii pers.
i
∑n i ∑n i 259
Interpretare: populaţia din cele 259 de localităţi este cu 39,604 mii pers. mai mică sau mai
mare decât media calculată ca fiind egală cu 42,475 mii pers.
2) Dispersia poate fi definită ca medie aritmetică a pătratelor abaterilor de la
media colectivităţii. Este o mărime abstractă, adimensională ce nu serveşte direct analizei
variaţiei.
σ2 =
∑ (x i − x)
n
σ2 =
∑ (x i − x ) 2 ⋅ ni
=
1159524,5
= 4476,9285
∑n i 259
σ 2
=
∑x ⋅n 2
i i
− (x) 2 =
1626791
− (42,475) 2 = 4476,9285
∑n i 259
σ = σ2
4) coeficientul de variaţie este indicatorul cel mai sintetic care exprimă într-o
formă abstractă intensitatea variaţiei. Se calculează astfel:
σ 66,91
v= ⋅ 100 = ⋅ 100 = 157,5%
x 42,475
as = x − Mo ≤ 0
x − Mo 3 ⋅ ( x − Me)
C as = sau C as′
σ σ
C as ∈ [− 1,1] C as′ ∈ [− 3,+3]
26,808
C as = = +0,4007 rezultă că media nu este caracteristică pentru că are loc
66,91
o asimetrie mică.
yi =
∑ y ⋅nj ij
y0 =
∑ y ⋅n j j
∑n ij ∑n j
j
5000
y0 = = 50 min
100
15 ⋅ 30 + 50 ⋅ 20 + 70 ⋅ 5
y1 = = 45 min
40
30 ⋅ 10 + 50 ⋅ 30 + 70 ⋅ 20 3200
y2 = = = 53,3 min
60 60
∑(y j
j − y i ) ⋅ nij
σ = 2
∑n
i
ij
i
σ 2
=
∑(y j − y0 ) 2 n j
∑n
0
j
Pe baza acestor indicatori se trece la determinarea în cadrul fiecărei grupe a abaterii medii
pătratice (σi) şi a coeficientului de variaţie (vi).
Pentru a rezuma aceste consideraţii sub forma unor indicatori statistici ce calculează
dispersia explicată de numărul de staţii de aşteptare (σ2) şi dispersia reziduală (σ2) ca părţi ale
dispersiei generale (σ2o).
Dispersia explicată σ2 se calculează ca dispersia de grupă faţă de media generală şi se
numeşte explicată pentru că mediile de grupă sunt determinate, condiţionate de numărul de staţii de
aşteptare:
σ 2
=
∑(y i − y 0 ) ⋅ ni
=
(45 − 50) 2 ⋅ 40 + (53,3 − 50) 2 ⋅ 60 1653,4
= = 16,6
∑n i 100 100
Disperisa reziduală σ arată influenţa factorilor reziduali (alţi factori decât numărul de
2
σ 2
=
∑σ ⋅ ni
2
i
=
175 ⋅ 40 + 188,89 ⋅ 60 18333,4
= = 183,4
∑n i 100 100
σ 02 = σ 2 + σ 2
σ2 16,6
R2 = ⋅ 100 = = 8,3%
σ0
2
200
Deci, în proporţie de 8,3% variaţia timpilor de aşteptare poate fi explicată prin factorul
″numărul de staţii de aşteptare″.
- coeficientul de nedeterminaţie (k2) care este o valoare complementară faţă de R2.
σ2 183,4
k = 2 ⋅ 100 =
2
⋅ 100 = 91,7%
σ0 200
Deoarece coeficientul de determinaţie este mai mic de 50% este necesară testarea statistică a
semnificaţiei influenţei factorului de grupare asupra variabilei cercetate.
Această testare statistică se face cu ajutorul testului Fisher-Snedecor (F). Acest test verifică
consistenţa influenţei factorului suplimentar de grupare comparând cele două părţi ale dispersiei
generale. Mai precis, se iau în considerare numărătorii acestor dispersii (denumiţi varianţe sau
devianţe) corectaţi cu un număr corespunzător al gradelor de libertate de variaţie.
∆2 ⋅ x ∆2 ⋅ z
F= :
r −1 n − r
Statistică teoretică şi economică
∆2x = ∑ ( y i − y 0 ) 2 ⋅ ni
∆2z = ∑ σ i2 ⋅ ni
x=
∑x ⋅ni i
=
1⋅ M + 0 ⋅ (N − M ) M
= =p
∑n i N N
Din totalul de N elemente ale unei colectivităţi se notează cu M numărul de elemente care
posedă starea care ne interesează (în cazul nostru n1 = M iar n2 = N-M, rezultă n1 + n2 = N
Statistică teoretică şi economică
prin urmare media unei caracteristici alternative este egală cu cota parte a elementelor care posedă
varianta (starea) ce ne interesează în analiză.
99032
P= = 0,46
215226
Dacă se foloseşte frecvenţa relativă atunci:
x = ∑ x i ⋅ nix = 1 ⋅ p + 0 ⋅ q = p
σ2 =
∑ (x − x)
i
2
=
(1 − p) 2 ⋅ p + (0 − p) 2 ⋅ q q 2 p + p 2 ⋅ q
= = pq = 0,2484
∑n i p+q p+q
Dispersia unei caracteristici alternative este produsul cotelor părţi ale celor două stări sau
vriante în colectivitatea generală.
Media şi dispersia caracteristicii alternative se folosesc în estimarea unor parametrii ai
colectivităţii generale atunci când cercetarea se bazează pe eşantioane reprezentative.
Coeficienţi de concentrare
1. GINI (1922, fondat de şcoala statistică din Italia)
n xi
c = ∑ g i2 , gi = i ,
∑ ni ∑ xi
gi = cota parte neprocentuală a fiecărei stări în totalul colectivităţii.
1
≤c≤i
n
n∑ g i2 − 1
c′ = , 0 < c′ < 1
n −1
8 ⋅ 0,32 − 1
c′ = = 0,4728 , adică alternează la mijlocul intervalului de definire, însă nu
8 −1
se poate vorbi de o repartiţie echilibrată.
Probleme şi aplicaţii
4.1. Pentru a verifica reglarea unei maşini de debitat, din producţia realizată de-a lungul
unei zile (N = 600 piese) se prelevă un eşantion n = 65 piese, care măsoară în mm:
90,9 93,2 72,4 91,7 93,2 67,4 75,0 83,3 75,0 90,2 99,2 88,6 62,8
95,5 76,1 78,8 97,0 65,2 77,8 86,4 87,1 76,1 86,4 96,2 83,3 87,9
70,5 83,3 91,7 93,9 91,7 84,1 85,6 87,9 89,4 85,6 84,1 100,0 80,3
92,4 88,6 92,4 97,7 7,9 95,5 87,1 91,7 96,2 92,4 86,4 81,8 76,5
89,4 92,4 93,2 88,6 87,1 97,0 96,2 86,1 90,9 87,9 98,5 98,5 81,8
Statistică teoretică şi economică
Σxi ni 5659
• Media: x = = = 87,0615 ≈ 87,1 mm
Σn i 65
Σni + 1 65 + 1
• Locul medianei: locMe = = = 33;
2 2
Mediana este a 33-a variantă în seria ordonată crescător. Deci, Me = 87,9 mm.
• Pentru a afla modul se va observa că frecvenţa maximă înregistrată este 4,
întâlnită la trei variante. Deci, seria de variante distincte ale caracteristicii
observate este o serie trimodală (cu trei moduri):
Mo = 87,9 mm; Mo = 91,7 mm; Mo = 92,4 mm.
Indicatorii variaţiei:
A 37,2
A% = ⋅ 100 = ⋅ 100 = 42,7%
x 87,1
σ = σ 2 = 8,42 mm
Cele 65 piese măsurate sunt în medie cu 8,42 mm mai scurte sau mai lungi decât media
calculată (87,1 mm).
• Coeficientul de variaţie:
σ
v= ⋅ 100 = 9,67%
x
• Locul medianei este tot 33, dar se va observa că această variantă este cuprinsă
în intervalul (85,1 – 90,0). Prin interpolarea în acest interval, rezultă mediana:
0,5(Σn + 1) − F 33 − 20
Me = x Me + k Me ⋅ i = 85,1 + 5 ⋅ = 88,7 mm
f Me 18
∆ 10
Mo = x Mo + k Mo ⋅ 1 = 85,1 + 5 ⋅ = 88,9 mm
∆ +∆ 10 + 3
1 2
A = 97,5 – 62,5 = 35 mm
A% = (35:87,2)*100 = 40,14%
∗
Eroarea de estimare (e) indusă de folosirea centrelor intervalelor de grupare, în locul variantelor reale, se
obţine comparând mediile din rezolvările 1 şi 2:
x −x 87.2 − 87.1
e = 2 1 ⋅ 100 = ⋅ 100 = +0,11% (o eroare neglijabilă).
x1 87.1
Statistică teoretică şi economică
Număr
piese (xi) xi − x ( xi − x ) 2 ni 2
xi ni
(ni)
Intervale de
variaţie a lungimii
piesei (mm)
Până la 65 1 62,5 -24,7 610,09 3906,25
65,1 – 70,0 2 67,5 -19,7 776,18 9112,50
70,1 – 75,0 4 72,5 -14,7 864,36 21025,00
75,1 – 80,0 5 77,5 -9,7 470,45 30031,25
80,1 – 85,0 8 82,5 -4,7 176,72 54450,00
85,1 – 90,0 18 87,5 0,3 1,62 137812,50
90,1 – 95,0 15 92,5 5,3 421,35 128343,75
95,1 – 100,0 12 97,5 10,3 1273,08 114075,00
Total 65 --- --- 4593,85 498756,25
Σ( xi − x ) 2 ⋅ ni 4593,85
σ2 = = = 70,6746 ,
Σn i 65
2
Σxi ⋅ ni 49756,25
σ2 = − (x)2 = − 87,2 2 = 69,3333
Σn i 65
Diferenţa dintre cele două rezultate este cauzată de rotunjirile repetate la prima
versiune a calculului.
Abaterea medie pătratică este radicalul de ordinul doi din dispersie:
σ 2 = σ 2 = 69.3333 = 8,3 mm ,
ceea ce arată că între lungimile reale ale celor 65 piese observate şi media estimată există
o distanţă medie de aproximativ 8,3 mm.
σ 8,3
v= ⋅ 100 = ⋅ 100 = 9,5%
x 87,2
Statistică teoretică şi economică
Deci, intensitatea variaţiei în jurul mediei este redusă (sub 35%), colectivitatea
este omogenă, bine caracterizată prin valoarea medie a lungimii pieselor.
Se observă o diferenţă de numai 1,7 mm între medie şi mod, modul fiind mai
mare, ceea ce înseamnă că seria prezintă o moderată asimetrie de dreapta (-0,2048).
Se cere:
Să se determine indicatorii tendinţei centrale şi să se comenteze rezultatele
folosind indicatorii variaţiei în jurul mediei şi indicatorii asimetriei.
Rezolvare
Salariul mediu lunar al celor 540 salariaţi investigaţi este de:
Σxi ni 28960
x= = = 5,363 mil lei / luna
Σn i 540
∆ 21
Mo = x Mo + k Mo ⋅ 1 = 4,5 + 1 ⋅ = 4,856 mil lei / lună
∆ +∆ 21 + 38
1 2
A= x −x = 90 − 30 = 60 mil lei
max min
A
A % = ⋅ 100 = 111,9%
x
Întrucât amplitudinea variaţiei comparată cu media colectivităţii depăşeşte 100%,
se poate afirma că mărimea împrăştierii este destul de mare.
Dispersia se determină cu ajutorul formulei de calcul simplificat astfel:
2
Σx i ⋅ n i 16880
σ 02 = − ( x0 ) 2 = − 5,363 2 = 2,4979
Σni 540
Coeficientul de variaţie:
σ0
v0 = ⋅ 100 = 29,5%
x0
Pentru că intensitatea împrăştierii este sub 35%, putem accepta că, pe total,
colectivitatea salariaţilor este relativ omogenă din punct de vedere al salariului lunar.
Indicatorii asimetriei propuşi de Pearson sunt:
Σ( xi − x1 ) 2 ⋅ ni1
σ = 2
1 = 2,4309
Σni1
Σxi ni 2 528
x2 = = = 4,4 mil lei
Σn i 2 120
Σ( xi − x2 ) 2 ⋅ ni 2
σ 22 = = 1,54
Σni 2
v 2 = 28,2%
Σ( x j − x 0 ) 2 ⋅ n j ∆2y / x 43,0468
δ = 2
= = = 0,2649
Σn j Σn j 540
Dispersia reziduală:
Σσ 2j ⋅ n j ∆2y / z 1205,778
σ = 2
= = = 0,2649
Σn j Σn j 540
σ 02 = δ 2 + σ 2
Ca urmare a repetatelor rotunjiri, pot apare unele mici diferenţe, cum este şi în
acest caz.
Să se afle în ce măsură influenţează sexul salariaţilor variaţia în jurul mediei (D)
şi să se testeze dacă diferenţa (disparitatea salarială) este statistic consistentă (testul F şi,
eventual, testul t).
Rezovare:
Coeficientul de determinaţie:
Statistică teoretică şi economică
δ2 0 ,2649
D= ⋅ 100 = ⋅ 100 = 10 ,6%
σ0
2
2,979
Doar 10,6% din variaţia totală a salariilor poate fi explicată prin diferenţierea
salariaţilor după sex.
- Testul Fisher-Snedecor se aplică pentru a vedea dacă o asemenea influenţă redusă
este statistic semnificativă:
-
∆2y / x ∆2y / z 143,9468 1205,778 13,0468
F= : = : = = 63,825
r −1 n − r 2 −1 540 − 2 2,2412
Pentru probabilitatea p = 0,95 (eroare acceptată α = 0,05), F1, 538 ∈ (3,84; 3,92).
Cum Fcalculat > Ftabelat ⇒ factorul de grupare (sexul) are o influenţă consistentă
asupra variaţiei salariilor lunare ale celor 540 angajaţi.
- Testul Student pentru verificarea semnificaţiei diferenţei între două medii:
Valoarea calculată este mult mai mare decât t = 1,96 (pentru o eroare acceptată α
= 0,05) sau t = 2,58 (pentru o eroare acceptată α = 0,01), ceea ce înseamnă că mediile
diferă consistent din punct de vedere statistic (grade de libertate n-r = 540-2 = 538).
9% 5% 7%
17%
13%
22% 27%
sub 3.5 mil 3.5 - 4.5 mil 4.5 - 5.5 mil 5.5 - 6.5 mil
6.5 - 7.5 mil 7.5 - 8.5 mil 8.5 mil si peste
23%
39%
sub 3.5 mil 3.5 - 4.5 mil 4.5 - 5.5 mil 5.5 - 6.5 mil
6.5 - 7.5 mil 7.5 - 8.5 mil 8.5 mil si peste
Intervale de variaţie a
salariului lunar (mil lei)
până la 3,5 93 81 3,9 15,3
3,5 – 4,5 284 192 12,0 36,4
4,5 – 5,5 560 140 23,6 26,5
5,5 – 6,5 552 60 23,3 11,4
6,5 – 7,5 385 21 16,3 4,0
7,5 – 8,5 296 16 12,5 3,0
8,5 şi peste 198 18 8,4 3,4
Total 2368 528 100,0 100,0
4.4. Se consideră o firmă de comerţ exterior care are 15 sucursale în oraşe diferite
grupate după profitul obţinut astfel:
(date convenţionale)
Grupe după profit (mil.$) Număr filiale
Sub 10 2
10-20 3
20-30 7
30-40 2
peste 40 1
Se cere:
1. să se determine indicatorii simplii ai variaţiei;
2. să se determine indicatorii sintetici ai variaţiei.
4.6. Fie v coeficientul de variaţie al n numere. Dacă fiecare din aceste numere este
înmulţit cu 2, să se precizeze care va fi noul coeficent de variaţie?
Statistică teoretică şi economică
4.8. În urma efectuării unei anchete statistice într-un oraş de provincie în rândul a
300 de persoane privind timpul de deplasare zilnică rezultă următoarea situaţie:
Se cere:
1. să se caracterizeze gradul de omogenitate al repartiţiei;
2. să se calculeze indicatorii tendinţei centrale;
3. să se măsoare gradul de asimetrie.
Statistică teoretică şi economică
CAPITOLUL 5.
CERCETAREA SELECTIVĂ
Cuvinte cheie:
- cercetarea selectivă
- sondajul
- selecţia simplă repetată (urna cu bilă revenită).
- selecţia simplă nerepetată (urna cu bilă nerevenită),
- reprezentativitatea eşantionului
- eroare de reprezentativitate
- eroare medie de reprezentativitate
- eroarea limită admisă
colectivitate eşantion
generală
N (volumul) n (volumul)
x 0 (media) x (media)
σ2 (dispersia)
σ 02 (dispersia)
p2 = M/N (pt. car. w = m/n
alternativ) σ w2 (1 − w)
σ (1 − p)
2
p
5.1.Procedee de selecţie
Se recomandă alegerea procedeului de selecţie în funcţie de mărimea (N) a
colectivităţii generale şi în funcţie de omogenitatea sau eterogenitatea acesteia.
Dacă colectivitatea generală este omogenă putem folosi:
• procedeul loteriei
• procedeul tabelului cu numere întâmplătoare sau un program pe calculator de
generare de numere întâmplătoare;
• procedeul mecanic sau al pasului de numărare.
Dacă colectivitatea generală este eterogenă se recomandă folosirea selectţiei
dirijate pentru a asigura reprezentativitatea eşantionului (procedeul selecţiei stratificate,
selecţie tipică).
Dacă colectivitatea generală este alcătuită din unităţi complexe numite şi serii (de
ex. populaţia alcătuită pe familii, locurile de mărfuri grupate pe paleţi etc.) se recomandă
procedeul selecţiei de serie.
Procedeul loteriei.
Se aplică în cazul colectivităţii generale de volum mic, relativ omogenă.
Aplicablitatea constă în numerotarea de la 1 la N a tuturor elementelor din colectivitatea
generală (ceea ce uneori este incomod) confecţionând jetoane sau bile absolut de aceleaşi
dimensiuni, care se introduc într-o urnă şi se amestecă înainte de fiecare extragere.
Extragerea poate fi efectuată în două variante:
¾ selecţia simplă repetată (urna cu bilă revenită).
În acest caz, la fiecare extragere există o aplicabilitate de 1/N de a intra în
alcătuirea eşantionului. Folosind această variantă se pot forma foarte multe eşantioane
diferite având acelaşi volum, dar posibilitatea includerii a unui acelaşi element face ca
reprezentativitatea includerii a unui acelaşi element face ca reprezentativitatea
eşantionului să fie redusă.
¾ selecţia simplă nerepetată (urna cu bilă nerevenită), prin care probabilitatea
includerii în eşantion creşte, treptat pe măsura extragerii elementelor. La extragerea I,
probalilitatea extrageriiv este 1/N; la extragerea a II-a probalilitatea extragerii este de
1/(N-1) si asa mai departe; la ultima extragere, probalilitatea va fi: 1/[N – (n+1)].
Aceste eşantioane se bucură de o mai mare reprezentativitate, iar numărul lor este
CnN (mult mai mic decât la selecţia repetată Nn).
Pentru a evita constituirea urnelor cu bile se poate folosi fie tabele cu numere
întâmplătoare, fie un program de calculator care să genereze numere întâmplătoare.
Procedeul mecanic sau al pasului de numărare.
Acest procedeu este foarte operativ dar nu asigură o selecţie strict aleatoare, doar
primul element din eşantion se extrage la întâmplare, restul intrând în componenţa
eşantionului ca urmare a poziţiei ocupate.
Ştiind că există N elemente în colectivitatea generală şi că eşenationul trebuie să
fie de n elemente, se calculează k; k = N/n, adică pasul de numărare.
Din primele k elemente se extrage, la întâmplare, unul, acesta devenind primul
element al eşantionului. Numărul de ordine al celorlate elemente se află adunând succesiv
k.
Dacă elementele colectivităţii generale sunt eterogene, constatându-se o anumită
stratificare a colectivităţii generale se recomandă să fie folosită o selecţie dirijată
Statistică teoretică şi economică
(nealeatoare) pentru a asigura pătrunderea în eşantion a unor elemente din toate straturile
tipice. O asemenea selecţie dirijată este selecţia stratificată sau selecţia tipică: după
stabilirea volumului n al eşantionului se stabileşte componenţa pe straturi (număr de
elemente din fiecare strat), astfel încât structura eşantionului să corespundă structurii
colectivităţii generale. Pentru extragerea separată din fiecare strat a numărului
corespunzător de elemente, se utilizează unul din procedeele aleatoare de mai sus.
Selecţia de serii (sau de unităţi complexe) reprezintă un alt procedeu de selecţie.
Pentru colectivitatea organizată pe unităţi complexe (populaţia organizată pe familii) se
recomandă să nu distrugem aceste structuri pentru a extrage unităţi simple, ci să preferăm
extragerea de unităţi complexe sau extragerea de serii.
5.2.Reprezentativitatea eşantionului.
Reprezentativitatea eşantionului inseamna capacitatea acestuia de a reda
trăsăturile esenţiale ale colectivităţii generale din care s-a extras chiar dacă volumul
eşenationului este mult mai mic decât volumul colectivităţii din cade s-a extras.
Dintre metodele de exprimare a reprezentativităţii eşantionului cele mai frecvente
se referă la compararea structurii eşantionului cu structura colectivităţii generale sau la
compararea mediei eşantionului x cu media colectivităţii generale x 0, la una sau mai
multe caracteristici cunoscute, înregistrarea atât pe eşantion cât şi la colectivitatea
generală. De exemplu compararea mediei de vârstă a eşantionului cu media de vârstă a
întregii ţări.
Se întâmplă, în unele cazuri, să nu se cunoască nimic despre colectivitatea
generală. În acest caz când nu este posibilă compararea cu parametrii colectivităţii
generale, se recomandă extragerea a cel puţin două eşantioane diferite din aceeaşi
colectivitate generală şi compararea mediilor sau structurilor acestor eşantioane. Dacă ele
nu diferă semnificativ, atunci oricare dintre eşantioane poate fi folosit pentru a estima
parametrii colectivităţii generale.
µx =
∑ (x − x
i
2
0 ⋅ fi
∑f i
σ 02 = µ x2 ⋅ n
σ 02
ceea ce înseamnă că µ x = , adică eroarea medie de reprezentativitate este direct
n
proporţională cu dispersia colevtivităţii generale şi invers proporţională cu volumul
eşantionului.
Dacă nu se cunoaşte σ20 se acceptă că dispersia unicului eşantion cunoscut σ2
oferă o marjă satisfăcătoare a împrăştierii elementelor colectivităţii dacă eşantionul este
convenabil de mare. Totuşi se face o corecţie cu 1, adică:
σ2
µx = .
n −1
Dacă se foloseşte o variabilă alternativă, eroarea medie de reprezentativitate se
stabileşte potrivit aceloraşi relaţii, adică atunci când se cunoaşte dispersia colectivităţii
generale:
p (1 − p )
µw =
n
w(1 − w)
µw =
n −1
σ 02 n σ 02 n
µx = 1 − µx = 1 −
n −1 N n N
Statistică teoretică şi economică
∆x = z ⋅ µx
∆w = z ⋅ µw
Există tabele ale repartiţiei normale care ne arată relaţia dintre coeficientul de
multiplicare z sau t sau probabilitatea φ (z) sau φ (t) corespunzătoare.
Eroarea limită arată diferenţa maximă în plus sau în minus care poate surveni la o
anumită probabilitate φ (z), z fiind utilizat în calculul erorii limită.
Necunoscând parametrii colectivităţii generale, rezultă că pentru o variabilă
( )
numerică x 0 ∈ x ± ± ∆ x , iar pentru o variabilă alternativă avem p ∈ (w ± ∆ w ) cu
probabilitatea corespunzătoare.
φ (z) = funcţia de probabilitate cu care se generează rezultatele
z = coeficientul funcţiei de probabilitate.
Eroarea limită se poate mări sau micşora fie prin modificarea volumului
eşantionului (n), fie prin modificarea probabilităţii cu care se garantează rezultatele,
deoarece dispersia colectivităţii totale rămâne aceeaşi.
După modul în care se combină sistemul de organizare, felul unităţilor de selecţie
şi procedeul de selecţie folosit, în cercetarea activităţii economice şi sociale, se disting
următoarele tipuri de selecţie:
- selecţie întâmplătoare simplă;
- selecţie mecanică;
- selecţie tipică (stratificată);
- selecţia de serii.
Pentru fiecare tip de selecţie se calculează trei indicatori: eroarea de medie de
reprezentativitate, eroarea limită şi volumul eşantionului.
Selecţia întâmplătoare simplă este utilizată în special pentru colectivităţi formate
dintr-un număr de unităţi simple şi care se caracterizează printr-un anumit grad de
omogenitate. Erorile de reprezentativitate sunt mari în raport cu alte tipuri de selecţie,
Statistică teoretică şi economică
deoarece dispersia folosită măsoară variaţia totală a caracteristicii datorată cauzelor care
influenţează.
Deoarece, în practică, se lucrează cu o eroare limitată, calculul volumului
eşantionului (n) se face flosind formula erorii limită.
- selecţia întâmplătoare simplă repetată:
σ 02
∆x = z ⋅ µx = z ⋅
n
σ 2
z ⋅ σ 02 z 2 ⋅ σ i2
2
∆ =z ⋅
2
x
2 0
⇒ n= ≈
n ∆2x ∆2x
σ 02 n z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x = z ⋅ µx = z ⋅ 1 − ⇒ n = ≈
n N z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x +
2
∆2x +
N N
x − ∆ x < x0 < x + ∆ x
n
salariaţilor direct operativi ⋅ 100 = 2,5% s-a făcut prin luarea în considerare a
N
vârstei, precum şi a structurii socio-profesionale a întregului personal operativ.
În cadrul programului de observare selectivă, între alte caracteristici urmărite, se
înregistrează vârsta salariaţilor (exprimată în ani de viaţă împliniţi), precum şi interesul
(disponibilitatea) acestora de a participa la un program de formare profesională continuă.
În tabelul de mai jos se prezintă rezultatul grupării în funcţie de vârstă a celor 100
de persoane din eşantionul extras aleator şi nerepetat.
Repartiţia personalului cuprins în eşantion în funcţie de vârstă
Grupe de vârstă Număr personal
(ani împliniţi)
Sub 25*) 17
25 – 35 30
35 – 45 25
45 – 55 18
peste 55 10
Total 100
*)
Limita superioară nu este cuprinsă în interval.
x=
∑ xi ni = 3740 = 37,4 ani,
∑ ni 100
iar dispersia în jurul mediei eşantionului este:
∑ (x − x ) n
2
14924
σ
i i
2
= = = 149,24 .
∑n i 100
Observaţii:
1) Eşantionul este destul de omogen (v = 32,7%) pentru a putea considera că media
de 37,4 ani caracterizează corect vârsta tuturor celor 100 de persoane înregistrate.
2) Dacă media nu este reprezentativă la nivelul eşantionului (v>>35%), nu are sens să
se mai continue cercetarea printr-o eventuală tentativă de extindere a acestui indicator
(deja nereprezentativ la nivel restrâns) asupra colectivităţii generale.
∆x = z ⋅ µx [5.7]
∆w = z ⋅ µw [5.8]
Există tabele ale repartiţiei normale care exprimă relaţia dintre argumentul z sau t şi
funcţia de probabilitatea φ(z) sau φ(t) corespunzătoare.
În exemplul considerat, eroarea limită pentru o probabilitate Φ(z) = 0,95 (z = 1,96)
este:
y pentru caracteristica numerică, de aproximativ 2,4 ani:
∆ x = z ⋅ µ x = 1,96 ⋅ 1,21 = 2,37 ani ≅ 2,4 ani,
Statistică teoretică şi economică
Observaţii:
1. Un tabel cu valorile funcţiei Gauss – Laplace corespunzând diferitelor valori ale lui z
se găseşte în volumul Bazele statisticii pentru economişti. Aplicaţii. Bucureşti, Editura
Tribuna Economică, 2002, p. 259-260.
2. Dacă s-ar fi folosit extragerea mecanică, sau extragerea repetată, eroarea limită era
ceva mai mare: ∆x = 2,41 ani (faţă de 2,37 ani); ∆w = 7,6% (faţă de 7,4%).
Coeficientul de corecţie aplicat în cazul sondajului nerepetat este întotdeauna o
mărime subunitară care restrânge mărimea erorii medii de reprezentativitate şi,
respectiv, a erorii limită, oferind o estimare mai exactă a parametrilor colectivităţii
generale.
3. Nu este obligatoriu ca probabilitatea cu care se estimează diverşi parametrii ai
colectivităţii generale să fie aceeaşi la toate variabilele cerectate.
Statistică teoretică şi economică
Probleme şi aplicaţii.
5.1. Un echipament de ambalare este astfel reglat încât să împacheteze câte 20 de
bomboane cu o toleranţă de ±1 bucată.
Pentru a aprecia calitatea reglajului, din producţia unei zile s-a prelevat prin
extragere mecanică un eşantion de 150 pachete care conţineau în total 3015
bomboane în loc de 3000 bomboane. Din cercetarea eşantionului rezultă că în jurul
mediei de 20,1 bomboane/pachet, intensitatea împrăştierii era de 7,2%, în condiţiile
în care 129 pachete conţineau exact 20 bomboane, 12 pachete aveau 21 sau mai
multe bomboane, iar 9 pachete erau cu 19 sau mai puţine bomboane.
Se cere:
Să se estimeze cu o probabilitate Φ(z) = 0,9973 (z = 3) numărul total de
bomboane ambalate în lotul de N = 3000 pachete realizate în cursul zilei şi să se observe
dacă echipamentul se încadrează în toleranţa admisă.
Rezolvare:
Din enunţul problemei rezultă că eşantionul se caracterizează prin:
• Volumul n = 150 pachete;
• Media x = 20,1 bomboane/pachet;
• Abaterea standard σ = 1,4472 bomboane/pachet (din relaţia coeficientului de
σ
variaţie v = ⋅ 100 = 7,2% )
x
Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, ştiind
că în cazul extragerii mecanice se aplică relaţia de la sondajul simplu, aleator, repetat:
σ2 2,0944
µx = = = 0,118 bucati
n 150
Întrucât intervalul de estimare (59.250, 61.350) este mult mai mic decât toleranţa
admisă (57.000, 63.000), rezultă că reglajul este corespunzător.
Răspuns: Numărul total de bomboane ambalate este situat, cu Φ(z) = 0,9973 între
59.250 şi 61.350 bucăţi. Echipamentul se încadrează în tolerenţa admisă.
Cât de mare ar trebui să fie un eşantion, dacă numărul mediu de bomboane/pachet
ar trebui estimat cu Φ(z) = 0,9545 (z = 2) în limitele unui interval de ±0,5 bucăţi?
Rezolvare:
z 2 ⋅ σ 2 4 ⋅ 2,0944
n= = = 33,5104 ≅ 34 pachete .
∆2x 0,52
m 21
w= = = 0,14 , ceea ce înseamnă că 14% din eşantion nu corespunde
n 150
standardului de ambalare.
σ w2 0,1204
µw = = = 0,0283 sau 2,83%
n 150
5.2. Dintr-o comandă de 1000 piese, se prelevă un eşantion de 65 piese prin extragere
aleatoare, simplă, nerepetată. Potrivit comenzii, fiecare piesă ar trebui să cântărească
85 grame. După examinarea eşantionului, se constată că greutatea medie a pieselor
este de 87,2g, dispersia eşantionului fiind de 70,6746, abaterea standard de 8,4g,
coeficientul de variaţie 9,6%. Între piesele eşantionului se află 26 piese cu greutatea
mai mare decât cea prevăzută de comandă.
Se cere:
Estimarea cu Φ(z) = 0,9545 (z = 2) limitele intervalului în care se înscrie
greutatea medie a celor 1000 piese din lot.
Rezolvare:
Eroarea medie de reprezentativitate în cazul sondajului aleator, simplu, nerepetat,
se estimează astfel:
σ2 n 70,6746 65
µx = 1 − = 1 − = 1,0083 g
n N 65 1000
Statistică teoretică şi economică
Eroarea limită:
σ w2 n
µw = 1 − , unde σ w = w(1 − w) = 0,4 ⋅ 0,6 = 0,24
2
n N
Răspuns:
z 2 ⋅ σ w2 4 ⋅ 0,24
n= = = 974,62 ≅ 975 piese
z ⋅ σ w 0,05 + 0,00096
2 2 2
∆w +
2
Vânzări
medii (mil lei)
Până la 3 3 --- --- 2 5
3–5 5 3 12 8 28
5–7 2 5 12 10 29
7 şi peste --- 12 6 --- 18
Total 10 20 30 20 80
Se cere:
Să se caracterizeze acest eşantion.
Rezolvare:
Vânzarea medie săptămânală realizată de cele 80 persoane este x = 5,5 mil lei.
Amplitudinea variaţiei este de 6 mil lei, adică 109,09% faţă de medie. Acest indicator
permite aprecierea că cele 80 de elemente ale eşantionului prezintă o împrăştiere relativ
mare (peste 100%).
Dispersia eşantionului: σ 2 = 3,05 .
Abaterea standard: σ = 1,7464 mil lei.
Coeficientul de variaţie: v = 31,75%.
În pofida întinderii relativ mari a împrăştierii, colectivitatea este destul de
omogenă (intensitatea împrăştierii este sub 35%).
Analiza variaţiei vânzărilor medii săptămânale în cadrul celor 4 grupe constituite
după felul mărfurilor comercializate şi elementele de calcul pentru verificarea regulii de
adunare a dispersiilor sunt prezentate în tabelul 53.2. Pe baza acestei identităţi se
stabileşte în ce măsură influenţează felul mărfurilor variaţiei volumului vânzărilor
săptămânale.
Raionul j nj xj σ 2j xj − x ( x j − x)2 ⋅ n j σ 2j ⋅ n j
Anticariat 1 10 3,8 1,96 -1,7 28,9 19,6
Jucării 2 20 6,9 2,19 +1,4 39,2 43,8
Librărie 3 30 5,6 2,24 +0,1 0,3 67,2
Papetărie 4 20 4,8 1,76 -0,7 9,8 35,2
Total --- 80 --- --- --- 78,2 165,8
Σσ 2 ⋅ n j 165,8
Dispersia reziduală: σ = 2
= = 2,0725
Σn j 80
Statistică teoretică şi economică
δ2 0,9775
D= ⋅ 100 = ⋅ 100 = 32%
σ 2
3,05
σ2 n 2,0725 80
µx = 1 − = 1 − = 0,15 mil lei
n N 80 760
Eroarea limită:
z2 ⋅σ 2 4 ⋅ 2,0725
n= = = 31,74 ≅ 32 persoane
z ⋅σ
2 2
8,28
∆2 + 0,5 +
2
N 760
N j ⋅ σ 2j
nj = n⋅
ΣN j ⋅ σ 2j
Mai sus s-au arătat valorile Nj, iar în tabelul 53.2, coloana a cincea, se află σ 2j . Cu
aceste date, pentru aflarea numărului de persoane care urmează să intre în alcătuirea
eşantionului din rândul celor care se ocupă de anticariat este:
72 ⋅ 1,96
n1 = 32 ⋅ = 2,88 ≅ 3 persoane.
1568,6
Statistică teoretică şi economică
Se cere:
1. să se reprezinte grafic repartiţia;
2. se consideră că cele 100 de persoane constituie un eşantion extras aleator, simplu,
nerepetat dintr-o colectivitate generală de 1000 persoane; să se determine intervalele de
vârstă între care se situează vârsta medie a celor 1000 persoane considerându-se
Φ( z ) = 0,9545; z = 2.
5.7. În tabelul următor sunt prezentaţi numărul de enoriaşi ai unei biserici ortodoxe
pe grupe de vârstă:
Se cere:
1. dacă se efectuează o selecţie stratificată de volum n=100, să se determine numărul de
enoriaşi care trebuie să facă parte din fiecare strat;
2. aceeaşi cerinţă în cazul în care se cunosc abaterile standard ale celor trei straturi:
σ 1 = 1,2; σ 2 = 4,8; σ 3 = 2,3.
Statistică teoretică şi economică
5.8. Care este valoarea erorii standard a mediei unui eşantion de volum n=100,
selectat simplu, aleator repetat, dacă dispersia este egală cu 25?
CAPITOLUL 6
ANALIZA STATISTICĂ A LEGĂTURILOR DINTRE
VARIABILE
Cuvinte cheie:
- coeficientul de corelaţie;
- covarianţa;
- coeficientul de asociere propus de Yule;
- coeficientul de corelaţie a rangurilor Spearman;
- coeficientul de corelaţie a rangurilor Kendall
- indicele sau raportul de corelaţie.
- metoda regresiei
y i = f ( xi ) = a + b ⋅ xi .
n ⋅ a + b ⋅ ∑ xi = ∑ y i
a ⋅ ∑ xi + b ⋅ ∑ xi = ∑ xi ⋅ y i .
2
y i = f ( xi ) = a + b ⋅ xi + c ⋅ xi2 .
n ⋅ a + b ⋅ ∑ xi + c ∑ xi2 = ∑ y i
a ⋅ ∑ x i + b ⋅ ∑ x i + c ⋅ ∑ x i = ∑ x i ⋅ y i
2 3
a ⋅ ∑ xi + b ⋅ ∑ xi + c ⋅ ∑ xi = ∑ xi ⋅ y i .
2 3 4 2
Regresia multiplă.
Regresia multiplă presupune luarea în considerare a influenţei concomitente a doi
sau mai mulţi factori. De exemplu, cea mai simplă funcţie polinomială de gradul unu
este:
y x1 , x2 ,... xk = a 0 + a1 ⋅ x1 + a 2 ⋅ x 2 + ... + a k ⋅ x k .
a 0 ⋅ ∑ x 2i +a1 ⋅ ∑ x1i ⋅ x 2i + ... + a1 ⋅ ∑ x 2i ⋅ x1i + ...a k ⋅ ∑ x 2i ⋅ x ki = ∑ x 2i ⋅ y i
...........
a 0 ⋅ ∑ x ki + a1 ⋅ ∑ x1i ⋅ x ki + ... + a1 ⋅ ∑ x1i ⋅ x ki + ... + a k ⋅ ∑ x ki2 = ∑ x ki ⋅ y i .
n ⋅ a + b ⋅ ∑ xi ⋅ n x = ∑ y i ⋅ n y
.
a ⋅ ∑ xi ⋅ n x + b ⋅ ∑ xi ⋅ n x = ∑∑ xi ⋅ y i ⋅ n xy
2
S yi / Yi =
∑(y i − Yi ) 2
.
n
S yi / Yi
e= ⋅ 100 .
y
∑ ( y i − Yi ) 2
D = 1 −
2
2
⋅ 100 .
∑ ( y i − y )
1
cov( x, y ) =
n
∑ ( xi − x )( yi − y ).
Dacă rezultatul este egal cu zero sau tinde către zero atunci între variabile nu
există legătură statistică. Dacă rezultatul este pozitiv legătura dintre variabile este directă.
Dacă rezultatul este negativ legătura dintre variabile este inversă. Valoarea maximă pe
care o poate lua covarianţa a două variabile este egală cu produsul dintre abaterea medie
pătratică a celor două variabile şi este întâlnită în cazul unei legături perfecte:
cov( x, y ) max = σ x ⋅ σ y .
rxy =
cov( x, y )
=
∑ (x i − x )( y i − y )
.
σ x ⋅σ y n ⋅σ x ⋅σ y
De asemenea, este folosită şi următoarea formulă dedusă din cea de mai sus:
n ⋅ ∑ x i ⋅ y i − ∑ xi ⋅ ∑ y i
rxy = .
[n ⋅ ∑ xi2 − (∑ xi ) 2 ][n ⋅ ∑ y i2 − (∑ yi ) 2 ]
n ⋅ ∑∑ xi ⋅ y i ⋅ n xy − ∑ xi ⋅ n x ⋅ ∑ y i ⋅ n y
rxy = .
[n ⋅ ∑ xi2 ⋅ n x − (∑ xi ⋅ n x ) 2 ][n ⋅ ∑ y i2 ⋅ n y − (∑ y i ⋅ n y ) 2 ]
rxy
t= ⋅ n − 2.
1 − rxy2
Pentru a accepta ipoteza unei legături reale, valoarea calculată a lui “t” trebuie să
fie mai mare decât valoarea tabelată pentru “n-2” grade de libertate.
R xy = 1−
∑(y i − Yi ) 2
.
∑(y i − y) 2
X Y Total
Y1 Y2
X1 A B A+B
X2 C D C+D
Total A+C B+D A+B+C+D
A⋅ D − B ⋅C
Q= .
A⋅ D + B ⋅C
6 ⋅ ∑ d i2
rS = 1 − .
n(n − 1)
2⋅S
rK = .
n(n − 1)
Probleme şi aplicaţii
6.1. Potrivit publicaţiilor OCDE, ţările membre s-au caracterizat în anul 1998 prin
niveluri ale performanţei interne (exprimate prin indicatorul PNB/locuitor) şi,
respectiv, ale performanţei externe (sintetizate sub forma exportului de bunuri şi
servicii/locuitor) cuprinse în tabelul de mai jos:
mii USD
Ţara PNB/locuitor Export de bunuri şi
servicii/locuitor
Australia 18,7 4,5
Austria 26,2 10,8
Belgia 24,4 17,4
Canada 19,1 8,2
R. Cehă 5,4 2,9
R. Coreea 6,4 3,7
Danemarca 32,9 11,6
Elveţia 36,9 14,4
Finlanda 24,5 9,3
Franţa 24.4 6,3
Germania 26,1 6,8
Grecia 11,4 1,8
Islanda 29,8 9,9
Irlanda 22,3 16,8
Italia 20,3 5,5
Japonia 30,0 3,7
Luxemburg 38,6 34,0
Marea Britanie 23,0 6,2
Mexic 4,4 1,3
Norvegia 32,9 14,4
Noua Zeelandă 13,8 4,9
Olanda 24,1 13,0
Polonia 3,9 0,9
Portugalia 10,6 3,2
Spania 14,1 3,8
S.U.A. 30,5 3,6
Suedia 25,9 11,3
Turcia 3,2 0,7
Ungaria 4,7 1,9
Sursa: OECD în Figures: Statistics on the Member Contries 1999 Edition, Paris,
1999
Se cere:
Să se precizeze rolul fiecărei variabile în analiza legăturii şi să se observe sensul
şi forma legăturii între cele două variabile folosind metoda seriilor paralele şi metoda
grafică.
Rezolvare
Potrivit teoriei economice a relaţiilor internaţionale, performanţa exterioară a unei
ţări depinde, în bună măsură, de cum şi ce anume produce şi oferă spre export economia
acelei ţări. Prin urmare, variabila PNB/locuitor se consideră a fi cauza sau variabila
independentă (explicativă sau factorială), variantele ei notându-se cu xi, iar variabila
export/locuitor este considerată efect sau variabilă dependentă (explicată sau rezultativă),
Statistică teoretică şi economică
n a + b ∑ x i = ∑ y i
a ∑ x i + b∑ x i = ∑ x i y i
2
se particularizează astfel:
n∑ x i y i − ∑ x i ∑ y i
r=
[n∑ x 2
i
2
][
− (∑ x i ) n∑ y i2 − (∑ y i )
2
]
Introducând datele de mai sus în această relaţie, rezultă r = + 0,7101, ceea ce
înseamnă că între PNB/locuitor şi exportul/locuitor al celor 29 ţări există în anul 1998 o
legătură directă de intensitate medie.
¾ Cum poate fi apreciată capacitatea funcţiei de regresie de a descrie
variaţia exportului/locuitor?
Răspuns
De obicei, se procedează la aflarea valorilor teoretice Yi ale caracteristicii
rezultative, înlocuind în funcţia identificată argumentul xi cu valorile succesive din
tabelul 61.1. (coloana PNB/locuitor).
Mulţimea diferenţelor (yi-Yi) alcătuieşte un domeniu de dispersie în jurul funcţiei
de regresie. Intensitatea împrăştierii se exprimă print-un coeficient de eroare a regresiei –
formă particulară a coeficientului de variaţie întâlnit la analiza seriilor de repartiţie (vezi
şi problemea nr. 67).
Ţinând seama de faptul că la punctul anterior al problemei s-a aflat coeficientul de
corelaţie r = 0,7191 şi că acest coeficient este cazul particular al indicatorului general de
comensurare parametrică a intensităţii legăturii dintre variabile – raport de corelaţie, se
ştie că prin ridicarea la pătrat şi înmulţirea cu 100 se află coeficientul de determinaţie
(D):
D = r2 ⋅ 100 = 0,71012 ⋅100 = 50,43%
Coeficientul de determinaţie este o altă modalitate de apreciere a calităţii funcţiei
de regresie. El arată că, funcţia sintetizează 50,43% din variaţia totală a
exportului/locuitor al ţărilor membre ale OCDE în anul 1998. Cota ridicată a
determinaţiei arată implicit faptul că PNB/locuitor este un factor important de influenţă,
iar aprecierea liniară a acestei influenţe satisfăcătoare.
Nivel de calificare
Calificat 18 7
Necalificat 9 16
ad − bc 18 ⋅ 16 − 7 ⋅ 9
Q= = = +0,641
ad + bc 18 ⋅ 16 + 7 ⋅ 9
Statistică teoretică şi economică
Vârsta (ani)
20 – 40 7 956 5 712 1 682 15 350
40 – 60 7 548 4 703 1 025 13 276
peste 60 3 718 842 122 4 682
Total 19 222 11 257 2 829 33 308
Se cere:
¾ Să se estimeze parametrii funcţiei liniare de regresie care exprimă influenţa
vârstei asupra dorinţei de a utiliza surse diversificate de informare.
Rezolvare
Sistemul de ecuaţii normale pentru estimarea parametrilor unei drepte:
f (xi) = a + b xi ,
atunci când analiza de regresie se face pe baza unei repartiţii bidimensionale de frecvenţe
se scrie astfel:
n a + b∑ x i n x = ∑ y i n y
a ∑ x i n x + b∑ x i n x = ∑ ∑ x i y i n xy
2
n∑ ∑ x i y i n xy − ∑ x i n x ⋅ ∑ y i n y
r= = −0,1688 ,
[n∑ ( x n ) ][n∑ y
2
i x
2 2
i n y − (∑ y i n y ) 2 ]
ceea ce exprimă o legătură inversă slabă între cele două variabile.
Observaţie: Prin ridicarea la pătrat şi înmulţirea cu 100 rezultă un coeficient de
determinaţie de numai 2,8%. Interpretarea acestui rezultat: Dacă se consideră o influenţă
liniară a lui X asupra lui Y, atunci vârsta diferită a persoanelor explică doar 2,8% din
variaţia disparibilităţii cititorilor de a folosi concomitent surse (ziare) diferite pentru
informarea lor.
¾ Este statistic consistentă o influenţă atât de redusă?
Statistică teoretică şi economică
Răspuns
Aplicarea testului Student (t):
r
t= n − p = 31,2544 ,
1− r2
y1 − y 0
Ry = ⋅ 100 = 6,6%
Y0
Se cere:
¾ să se reprezinte grafic legătura dintre cele două variabile;
¾ să se determine şi interpreteze parametrii funcţiei de regresie liniară;
Răspuns: Yˆi = 47,93 − 2,133 ⋅ x i
Statistică teoretică şi economică
Se cere:
¾ să se reprezinte grafic relaţia export-import;
¾ să se determine şi comenteze parametrii funcţiei liniare de regresie;
Răspuns: a = 0,35; b = 0,2233
Notă: Ecuaţia liniară se consideră de forma yi = a + b ⋅ xi
¾ să se caracterizeze intensitatea legăturii dintre export şi import
Răspuns: R = 0,78
6.7. Este cunoscut faptul că există o legătură inversă între dinamica producţiei
industriale şi rata şomajului, astfel încât, atunci când rata şomajului scade,
producţia industrială creşte şi invers. Să se verifice această ipoteză folosind
următoarele date:
Se cere:
¾ Să se determine şi interpreteze coeficientul de corelaţie;
Statistică teoretică şi economică
Răspuns: r = - 0,36
¾ Să se testeze semnificaţia statistică a coeficientului obţinut, admiţând o eroare
α = 0,05
Răspuns: tcalc = 1,091, faţă de nivelul critic tabelat de 2,306 pentru α = 0,05 şi k = 8
grade de libertate
¾ Să se determine coeficienţii de corelaţie neparametrică Spearman şi Kendall .
Răspuns: CSpearman = - 0,36; CKendall = - 0,16
¾ Să se estimeze şi interpreteze parametrii funcţiei liniare de regresie.
Răspuns: a = 7.59; b = -0.256
6.8. Dintr-o anchetă statistică efectuată de o firmă asupra unor aspecte cu caracter
social şi economic, au rezultate următoarele aprecieri:
Se cere:
¾ Să se stabilească intensitata asocierii dintre cele două feluri de aprecieri
folosind de coeficienţii de corelaţie neparametrică (Spearman şi Kendall) între
cele două opţiuni;
Răspuns: CSpearman = -0,36; CKendall = - 0,16.
6.9. Cercetând relaţia dintre numărul investitorilor străini provenind dintr-o ţară şi
volumul capitalului investit de aceştia în România, este logic să se avanseze ipoteza
unei asocieri directe între cele două variabile. Această ipoteză se studiază folosind
datele referitoare la primele 40 de ţări care au efectuat investiţii în România în anul
″t″.
În tabelul de mai jos, cele două variabile numerice ″număr investitoi″ şi ″capital
investit″ au fost comprimate sub forma a două variabile alternative ţinând cont de
numărul mediu al investitorilor din fiecare ţară şi respectiv de volumul mediu al
capitalului provenit din fiecare ţară.
Σxi = 15;
Σyi = 10;
Σxi2 = 55; şi
Σxiyi = 37 (i = 1,5 ).
a) ŷ = 0,7x;
b) ŷ = 0,7 – 0,1x;
c) ŷ = 0,1 – 0,7x;
d) ŷ = 2 – 0,7x;
e) ŷ = 3,7 – 5,5x;
6.13. Să se analizeze evoluţia pieţei televiziunii prin cablu din România, folosind
datele referitoare la perioada 1990-1999 preluate din revista ″Capital″ nr.
47/23 noiembrie 2000:
ANUL 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Tarif mediu 0,01 0,03 0,40 0,80 1,30 1,80 2,30 2,70 3,00 3,20
lunar (USD)
Statistică teoretică şi economică
Nr. abonaţi 0,70 0,90 1,00 1,50 2,00 2,50 3,30 3,20 3,10 3,10
(milioane)
Recomandare
Se va elabora o diagramă de corelaţie. Pe baza acestei diagrame se alege forma
funcţiei de regresie. Pentru aprecierea intensităţii legăturii, se va folosi raportul de
corelaţie. Se pot folosi şi coeficienţi de elasticitate a evoluţiei, numărului de abonaţi faţă
de mişcarea tarifului mediu lunar, în diferitele intervale ale perioadei analizate.
6.14. Este cunoscut faptul că există o legătură inversă între producţia industrială şi
rata şomajului, astfel încât atunci când rata şomajului scade, producţia industrială
creşte. În acest sens se cunosc următoarele date:
(date convenţionale)
Ţara Producţia industrială Rata şomajului
(% de modificare) (%)
Australia 6,2 7,4
Belgia 0,7 10,9
Canada 5,4 7,7
Germania 2,3 8,9
Olanda 0,1 14,0
Italia 7,8 15,7
Japonia 12,8 2,6
Elveţia 5,6 20,1
Marea Britanie 3,3 9,0
S.U.A. 5,7 5,4
Se cere:
1. să se determine ecuaţia de regresie dintre cele două variabile;
2. să se calculeze coeficentul de corelaţie;
3. să se calculeze coeficientul rangurilor Spearman şi Kendall şi să se compare cu
rezultatul obţinut la punctul anterior.
Se cere:
1. utilizând metoda celor mai mici pătrate şi cunoscând că cele două fenomene evoluează
exponenţial să se determine ecuaţia de regresie;
2. să se calculeze, pe baza ecuaţiei de regresie obţinută la punctul anterior, numărul de
bacterii după şapte ore.
6.16. Preţul pe bucată în mii lei este dat de variabila “x” şi numărul de produse
vândute pe lună timp de 8 luni “y” sunt reprezentate în tabelul următor:
(date convenţionale)
X 12 13 14 12 14 15 17 19
Y 28 20 20 25 16 12 10 7
Se cere:
1. găsiţi ecuaţia de regresie liniară;
2. estimaţi numărul de produse vândute atunci când preţul pe unitate este 18.
(date convenţionale)
Suprafaţa comercială (mp) Valoarea vânzărilor (mil.lei)
50 8
120 14
180 20
210 24
250 30
300 42
Se cere:
1. să se stabilească parametrii ecuaţiei de regresie dintre cele două variabile;
2. să se determine coeficientul de corelaţie dintre variabile;
3. dacă managerul magazinului doreşte să mărească suprafaţa destinată vânzării la 350
mp., să se determine valoarea scontată a vânzărilor având la bază legătura liniară dintre
variabile.
Se cere:
1. considerând relaţia dintre export şi import de formă liniară, să se determine şi să se
interpreteze parametrii funcţiei de regresie;
2. să se măsoare şi să se comenteze intensitatea legăturii dintre cele două variabile
folosind o metodă parametrică şi una neparametrică.
Statistică teoretică şi economică
CAPITOLUL 7.
SERII CRONOLOGICE
Cuvinte cheie:
- ajustarea seriilor cronologice
- ciclicitatea
- indicii de dinamică cu bază fixă
- indicii de dinamică cu bază în lanţ
- modificarea absolută cu bază fixă
- modificarea absolută cu bază în lanţ
- ritm cu bază fixă
- ritm cu bază în lanţ
- serie cronologică
- sezonalitatea
- trend
- valoarea absolută a unui procent de creşterecu bază fixă
- valoarea absolută a unui procent de creşterecu bază în lanţ
- variaţia reziduală
Orice proces sau fenomen al activităţii umane poate fi studiat atât în timp, cât şi în
spaţiu. Analiza presupune, în principal, o cercetare în timp cu ajutorul unor indicatori
statistici specifici de-a lungul diferitelor perioade de timp. De exemplu, putem înregistra
volumul vânzărilor zilnice dintr-un magazin electrocasnic, evoluţia lunară a producţiei de
cărbune, evoluţia zilnică a ratei dobânzii sau a ratei de schimb.
este formată din două şiruri de date paralele, un şir arătând variaţia caracteristicii
de timp, iar cel de-al doilea – variaţia fenomenului sau a caracteristicii de la o perioadă la
alta. Seriile cronologice se mai numesc şi serii de timp sau serii dinamice. Deci, se poate
spune că seriile cronologice apar ca rezultat al unor măsurători ce se efectuează la
anumite momente sau intervale de timp, care pot fi egale sau neegale, asupra unei
colectivităţi în ansamblul său sau a unei părţi dintr-o colectivitate.
La construirea şi la analiza seriilor cronologice trebuie avute în vedere
proprietăţile acestora:
- variabilitatea termenilor;
- omogenizarea termenilor;
- periodicitatea termenilor;
- interdependenţa termenilor.
Să încercăm să explicăm fiecare dintre aceste proprităţi:
Variabilitatea termenilor unei serii cronologice rezultă din faptul că fiecare
termen este obţinut prin centralizarea unor date individuale. Acest lucru face să existe
anumite diferenţieri între termenii seriei, fie ca urmare a acţiunii factorilor aleatori, fie ca
urmare a faptului că în viaţa economică-socială legile se manifestă ca tendinţă generală,
imprimând fenomenelor şi proceselor diferite forme de variaţie.
Omogenitatea termenilor este înţeleasă în sensul că o anumită în sensul că o
anumită serie nu cuprinde decât fenomene şi procese de acelaşi gen, care sunt efecte ale
aceluiaşi tip de cauze. Pentru a asigura omogenitatea termenilor trebuie utilizată aceeaşi
Statistică teoretică şi economică
Y = T + S + C + R;
b) modelul multiplicativ, adică reprezentarea cantitativă a raportului dintr valorile
seriei cronologice şi componentele sale, presupunând o relaţie de proporţionalitate a
factorilor:
Y = T ⋅ S ⋅ C ⋅ R.
∆ t / 1 = y t − y1 .
Statistică teoretică şi economică
∆t / t −1 = yt − y t −1 .
∑∆ t / t −1 = ∆t / 1
Indicatorii relativi sunt utilizaţi pentru a arăta de câte ori nivelul dintr-o anumită
perioadă se modifică faţă de nivelul atins de perioada de bază, sau pentru a determina
acelaşi lucru în procente.
Indicii de dinamică arată de câte ori s-a modificat un proces sau un fenomen de-a
lungul timpului.
Indicii se pot calcula:
- cu bază fixă, determinaţi după relaţia:
yt
I t /1 = ⋅ 100 ;
y1
yt
I t / t −1 = ⋅ 100 .
y t −1
∏I t / t −1 = I t /1
y y − y1 ∆
Rt / 1 = ( I t / 1 − 1) ⋅ 100 = t − 1 ⋅ 100 = t ⋅ 100 = t / 1 ⋅ 100 ;
y1 y1 y1
y y − y t −1 ∆
Rt / t −1 = (I t / t −1 − 1) ⋅ 100 = t − 1 ⋅ 100 = t ⋅ 100 = t / t −1 ⋅ 100
y t −1 y t −1 y t −1
Statistică teoretică şi economică
Trecerea de ritmuri cu bază în lanţ la ritmuri cu bază fixă sau invers se face numai
prin transformarea acestora în indici de dinamică, fapt ce ne conduce la concluzia că în
cazul ritmurilor există inegalitatea:
∏R t / t −1 ≠ Rn / 1
Valoarea absolută a unui procent de creştere exprimă câte unităţi din sporul
înregistrat într-o perioadă revin la fiecare procent al ritmului. Acest indicator face
legătura între indicatorii absoluţi şi cei relativi.
Valoarea absolutã a unui procent se poate calcula:
- cu bază fixă,determinată pe baza relaţiei:
∆ y t − y1 y
At / 1 = t%/ 1 = = 1
R t / 1 y t − y1 100
⋅ 100
y1
y=
∑y t
∆=
∑∆ t / t −1
=
y t − y1
n −1 n −1
yn
I = n −1 ∏ I t / t −1 = n −1
y1
Statistică teoretică şi economică
R = (I ⋅ 100) − 100
y1 + y 2 y 2 + y 3 y + yn
+ ... + n −1
y cr = 2 2 2
n −1
Sunt (n-1) termeni la numitor, deoarece, faţă de numărul termenilor seriei, se pot
calcula (n-1) medii parţiale, pe fiecare interval.
După efectuarea calculelor obţinem:
y1 y
+ y 2 + y 3...+ y n −1 + n
y cr = 2 2
n −1
t1 t1 + t 2 t 2 + t 3 t n −1
; ; ...
2 2 2 2
t t t t
y1 1 + y 2 1 + 2 + ... y n n −1
2 2 2 2
y cr =
t 1 t1 t 2 t
+ + + ... n −1
2 2 2 2
sau:
t t +t t
y1 1 + y 2 1 2 + ... y n n −1
2 2 2
y cr = n −1
∑t
i =1
i
y1 + y 2 + y 3
y1 = ;
3
y + y3 + y 4
y2 = 2
3
y3 + y 4 + y5
y3 =
3
În cazul calcului dintr-un număr impar de termeni, fiecare medie mobilă se va
plasa în dreptul unui termen ce corespunde cu poziţia termenului central, numărul
acestora fiind egal cu: n-(n'+1)
unde: n reprezintă numărul termenilor seriei ce urmează a fi ajustată;
n' numărul termenilor din care se calculează media.
În cazul când ajustarea se face pe baza mediilor mobile calculate dintr-un număr
par de termeni, mediile mobile se obţin în două trepte: în primul rând, se determină
mediile provizorii, care se plasează între termenii seriei, şi în al doilea rând, se determină
mediile mobile definitive sau centrate, care se plasează, în dreptul termenilor seriei şi cu
care se face ajustarea termenilor seriei iniţiale.
Considerând o serie in 8 termeni, se pot calcula 5 medii provizorii:
y + y 2 + y3 + y4
Yˆ1 = 1 ;
4
y + y3 + y 4 + y5
Yˆ2 = 2 ;
4
y + y4 + y6
Yˆ3 = 3 ;
4
y + y5 + y6 + y7
Yˆ4 = 4 ;
4
y + y5 + y6 + y7
Yˆ4 = 4 4 ;
4
y + y 6 + y 7 + y8
Yˆ5 = 5 .
4
Ajustarea prin metoda sporului mediu se foloses atunci când, prelucrând seria de
date, se obţin sporuri cu bază în lanţ relativ asemănătoare ca valoare unele cu altele.
Statistică teoretică şi economică
Aceasta corespunde unei creşteri a nivelurilor cracteristicii studiate sub forma unei
progresii aritmetice cu raţia egală cu modificarea mediei absolute şi se bazează pe relaţia
care există între primul termen, modificările absolute cu bază în lanţ şi ultimul termen.
Astfel, putem considera că ultimul termen se determină după relaţia:
y n = y 0 + ∆ + ∆ + ∆....∆ ,
adică:
y n = y 0 + n∆
Relaţia care stă la baza ajustării prin procedeul modificării medii absolute va fi:
Yti = y1 + t i ∆ ,
y n = y 0 ⋅ I ⋅ I ⋅ ...I ,
adică:
yˆ n = y1 ⋅ I n
Yˆti = y1 ⋅ (I ) i
t
Yt = a + b ⋅ t ,
în care:
Yt – sunt valorile ajustate calculate în funcţie de valorile caracteristicii factoriale
(t);
a – reprezintă parametrul care are sens de mărime medie şi arată nivelul atins de
"y", dacă influenţa tuturor factorilor – cu excepţia celui înregistrat – ar fi fost constantă
pe toată perioada. Din punctul de vedere al interpretării parametrului, acesta nu are o
semnificaţie economică;
b – reprezintă parametrul care sintetizează numai influenţa caracteristicii
factoriale (t) şi arată cu cât se modifică rezultanta la modificarea cu o unitate a factorului
de influenţă. Dacă b > 0, rezultă o relaţie directă (pozitivă); în cazul b < 0, rezultă o
relaţie inversă (negativă) între cele două fenomene;
t – reprezintă valorile caracteristicii factoriale care, în cazul seriilor cronologice,
este timpul.
Dacă graficul are o tendinţă de creştere exponenţială, atunci se poate aprecia că
fenomenul are forma unei funcţii exponenţiale a cărei ecuaţie de estimare este:
Yt = a ⋅ b t
Când pe grafic se obţine o curbă care are fie un punct de maxim, fie un punct de
minim, atunci se apreciază că fenomenul studiat se modifică în timp sub forma unei
parabole de gradul doi.
Ecuaţia de estimare a unei parabole de gradul doi exprimată în funcţie de timp
este:
Y1 = a + b ⋅ t + c ⋅ t 2
∆(tt /) t −1 = y t − y t −1
∆(t2/)t −1 = k 2 ,
min ∑ ( y t − y t )
2
t = 1, 2, …,n.
na + b∑ t i = ∑ y i
a ∑ t i + b∑ t i = ∑ t i y1
2
de unde rezultă:
a=
∑ yi ; b = ∑ ti ⋅ yi
n ∑ t i2
Se observă că valoarea lui "a" este egală cu media seriei:
a=
∑y i
=y
n
Statistică teoretică şi economică
Seria t1 t2 t3 t4 t5 t6
var. I -5 -3 -1 1 3 5
var. II -2,5 -1,5 -0,5 0,5 1,5 2,5
na + c ∑ t i2 = ∑ y1
b∑ t i = ∑ t i y i
2
a ∑ t i + c∑ t i = ∑ t i ⋅ y i
2 4 2
Din sistemul de mai sus se determină parametrii a, b şi c. Dacă b > 0, atunci are
loc o creştere accelerată de-a lungul perioadei, iar în cazul când c < 0, creşterea se
încetineşte.
Verificarea calculării ecuaţiilor de regresie se face pe baza relaţiei:
∑Y yi = ∑ yi
∑y t − Yt = min ;
d y (t )
v y (t ) = ⋅ 100
y
Statistică teoretică şi economică
d y (t ) =
∑y t − yt
n
Alegerea se face după valoarea coeficientului de variaţie. Valoarea cea mai mică
arată metoda de ajustare cea mai bună.
Pentru aprecierea calităţii sau capacităţii de exprimare a funcţiei de ajustare
analitică, se utilizează următorii doi indicatori:
- abarerea standard sau eroarea standard a valorilor teoretice faţă de valorile
reale:
S yt / Yt =
∑ (y t − Yt )
2
- coeficientul de eroare:
S yt / Yt
e= ⋅ 100
y
Cu cât aceşti indicatori au valori mai mici, cu atât mai bună este funcţia de
ajustare aleasă.
7. 5. Calculul sezonalităţii.
Determinarea cantitativă sau statistică a sezonalităţii este necesară în procesul
decizional atât la nivel microeconomic, cât şi la nivel macroeconomic. În practica
internaţională se utilizează coeficientul de sezonalitate, stabilit ca raport între trimestrul
sau luna calendaristică cu activitatea maximă şi trimestrul sau respectiva lună
calendaristică cu activitatea minimă.
Pentru caracterizarea sezonalităţii se utilizează indici de sezonalitate, stabiliţi în
felul următor, pe o serie de date lunare sau trimestriale, complete, pentru o perioadă de 3-
5 ani consecutivi, se calculează pentru fiecare lună sau trimestru câte o medie yi. De
asemenea, se stabileşte o medie generală lunară sau trimestrială y0 pentru întreaga
perioadă. Comparând fiecare medie lunară sau trimestrială cu media generală, rezultă un
indice de sezonalitate; acest indice exprimă cât la sută reprezintă media lunii sau
trimestrului faţă de media generală:
yi =
∑y ij
y0 =
∑⋅ ∑ y ij
IS % =
yi
⋅ 100
n n⋅m y0
unde:
n este numărul anilor;
m - numărul subperioadelor.
Această metodă de determinare prin medii aritmetice a indicelui de sezonalitate
este acceptată în cazul seriilor cronologice care nu sunt foarte dinamice.
Statistică teoretică şi economică
Probleme si aplicatii:
7.1.Comerţul exterior al României a evoluat în perioada 1991-1996 conform cu
datele de mai jos:
Se cere:
1. să se analizeze evoluţia exportului României în perioada 1991-1996 cu ajutorul
indicatorilor absoluţi, relativi şi medii;
2. să se reprezinte grafic evoluţia importului României în perioada analizată;
3. să se ajusteze seria de date referitoare la comerţul exterior al României
(export+import) în perioada analizată prin metode simple (elementare sau mecanice).
7.2. Evoluţia numărului populaţiei din mediul urban în perioada 1989-1995 a fost:
Se cere:
1 să se ajusteze seria de date utilizând metode elementare şi analitice de ajustare;
2. să se arate care din metodele folosite este cea mai potrivită;
3. să se efectueze extrapolarea seriei pentru următorii doi ani folosind metoda rezultată de
la punctul anterior.
7.3. În tabelul de mai jos sunt prezentate modificările absolute cu bază mobilă ale
dinamicii populaţiei ocupate în perioada 1991-1995 în România:
Se cere:
1. să se reconstituie seria cunoscând că nivelul atins de populaţia ocupată în 1990 a fost
de 10840 mii persoane;
2. să se ajusteze seria de date cu ajutorul ecuaţiei liniare de ajustare.
Statistică teoretică şi economică
Se cere:
1. să se reconstituie seria cunoscând numărul de studenţi înscrişi în 1991/1992;
2. să reprezinte grafic seria cronologică reconstituită;
3. să se ajusteze seria cronologică prin metoda mediilor mobile şi să se determine
calitatea acestei metode de ajustare comparativ cu metoda indicelui mediu.
Se cere:
1. să se determine indicatorii medii care caracterizează seria coronologică prezentată;
2. să se extrapoleze seria pentru anul 1996 utilizând cea mai bună metodă de ajustare.
7.6. Numărul de născuţi-vii după luna naşterii în perioada 1991-1995 este prezentat
în tabelul următor:
Se cere:
1. să se caracterizeze şi să se măsoare sezonalitatea folosind metoda mediilor mobile;
2. să se măsoare sezonalitatea folosind cea mai bună metodă analitică;
3. să se determine şi interpreteze componenta reziduală.
Statistică teoretică şi economică
CAPITOLUL 8.
SERII TERITORIALE
Cuvinte cheie:
- coeficientul repartiţiei teritoriale
- indicele dezvoltării umane
- indicele libertăţii economice
- metoda rangurilor
- rata de decalaj (devansare)
- seriile teritoriale
Seriile teritoriale numite şi serii de spaţiu sunt şiruri de valori ale unor
caracteristici statice ordonate in raport cu unităţile administrative sau diviziile teritoriale
de care aparţin.
Termenii unei astfel de serii sunt fie indicatori absoluţi, ce se obţin prin
cumularea în cadrul fiecărei unităţi administrativ-teritoriale a tuturor elementelor
(manifestărilor) referitoare la caracteristica cercetată, fie indicatori derivaţi, ce rezultă
din aplicarea unor procedee de calcul la nivelul fiecărei unităţi observate.
Prin urmare, seriile teritoriale operează cu unităţi complexe, ca de exemplu:
judeţul, regiunea, zona, ţara, continentul etc. Aceasta face ca fiecare unitate
administrativ-teritorială să poată fi caracterizată atât în mod independent, sub forma unui
studiu monografic, cât şi ca parte sau nivel al unei variabile studiate în profil teritorial.
De exemplu, populaţia unui judeţ poate constitui obiectul unei monografii, în care
se prezintă toate aspectele legate de numărul, structura pe sexe şi grupe de vârstă,
natalitate, mortalitate, nupţialitate, fertilitate, repartiţie socio-profesională, pe tipuri de
localităţi etc.La nivelul ţării, însă, populaţia judeţului este privită ca parte a întregului ce
se constituie în populaţia României.
Complexitatea unităţilor administrativ-teritoriale determină selectarea cu mult
discernământ a acelor indicatori, care au capacitatea de a exprima specificitatea variaţiei
în spaţiu, pornind de la compatibilitatea informaţiilor şi relevanţa expresiilor lor
cantitative.
Pe de altă parte, pentru a realiza o cunoaştere cât mai completă a colectivităţilor
analizate în profil teritorial, se recomandă folosirea în paralel a mai multor şiruri de date,
care reflectă variaţia în interiorul aceluiaşi spaţiu a mai multor caracteristici, de regulă,
interdependente. Rezultatul acestei conduite este o serie teritorială multidimensională.
De exemplu, în tabelul de mai jos se prezintă câteva caracteristici ale populaţiei
României observată pe cele opt regiuni statistice constituite prin gruparea judeţelor. În
prima coloană, se prezintă numărul de persoane la data de 1 iunie 1997, iar în coloana a
doua ponderea regiunilor în totalul populaţiei.
Comparaţia între regiuni sunt însă mult mai interesante dacă se folosesc indicatori
derivaţi, precum cei cuprinşi în coloanele 3-5 ale aceluiaşi tabel. Desigur pot fi adăugaţi
şi alţi indicatori pentru a avea o imagine mai exactă a populaţiei ţării repartizată pe cele
opt regiuni.
Populaţia României în 1997 observată pe regiuni statistice
Statistică teoretică şi economică
Sporul
Numărul Densitatea Ponderea natural
Ponderea în
Regiunea populaţiei populaţiei populaţiei (pers/100
total (%)
(persoane) (pers/km2) urbane (%) 0
loc)
Nord-Est 3.785.530 16.8 102.7 44.4 1.8
Sud-Est 2.973.256 13.1 82.3 57.5 -1.3
Sud 3.496.579 15.5 101.5 41.9 -3.3
Sud-Vest 2.419.686 10.7 82.8 45.4 -3.2
Vest 2.073.740 9.2 64.7 62.6 -3.6
Nord-Vest 2.861.521 12.7 83.8 52.7 -2.1
Centru 2.660.679 11.8 78.0 60.6 -1.1
Bucureşti 2.304.934 10.2 1265.8 88.8 -4.4
Total 22.545.925 100.0 - - -
Media pe - - 94.6 55.0 -1.9
toată ţara
Sursa: Anuarul Statistic al României 1998,CNS,Bucureşti,1999, p863-865
∆ y j i = y i -y
Statistică teoretică şi economică
În funcţie de scopul analizei, comparaţiile în profil teritorial între două unităţi pot
fi făcute fie în sensul dat de relaţia, fie în sens invers:
∆ y i j = y j -y i
Înainte de a trece la compararea a două unităţi teritoriale fie prin scădere, fie prin
raportare, se va analiza dacă are logică şi conţinut economic rezultatul comparării.
Dacă seria este alcătuită din mărimi derivate, se recomandă folosirea rapoartelor
pentru a efectua comparaţiile între unităţile teritoriale, deoarece 1% înseamnă pentru
fiecare unitate a seriei altceva.
În acest context, se trece la utilizarea indicatorilor relativi. Indicii teritoriali sunt
mărimi relative de coordonare, care se obţin prin raportarea termenilor unei serii de
spaţiu. Ei măsoară variaţia unor colectivităţi coexistente în timp, dar situate în spaţii
diferite din punct de vedere al diferitelor caracteristici ce fac obiectul studiului în profil
teritorial. De exemplu, dacă se studiază o variabilă y pentru două unităţi teritoriale i şi j
se obţin doi indici individuali :
yi yj
i iy j = şi i yj i =
yj yi
Operând cu unităţi statistice complexe, analiza în profil teritorial presupune
uneori menţinerea la nivelul totalizator al unităţilor comparate, aşa cum s-a procedat mai
sus. Alteori, însă, este necesară pătrunderea în profunzimea structurii unităţilor teritoriale
comparate, iar descompunerea pe factori de influienţă a variaţiei unor caracteristici
complexe necesită alegerea unui sistem de pondere şi a unei baze de raportare. Pentru
rezolvarea acestor cerinţe se recurge la utilizarea indicilor teritoriali de grup, care se
prezintă în paragraful final al capitolului.
Rata de decalaj (devansare), numită frecvent şi decalaj (avans) relativ este
expresia procentuală a diferenţei absolute dintre termenii unei serii teritoriale. Notăm cu
( ∆%y ) această rată, se calculează astfel :
- de pe poziţia unităţii teritoriale j:
y1 − y j
∆%yi j = .100 = 100 (i iy j – 1 )
yj
y j − yi
∆%y j i = .100 = 100 (i yj i – 1 )
yi
sau modul seriei. Notând cu ( y ) nivelul mediu, relaţiile de mai sus devin :
∆yi y
= yi – y ,
yi yi
i j
=
y
yi
∆%yi y =100(i y
–1 )
Nivelul mediu al seriei teritoriale ( y ) trebuie determinat în funcţie de natura
termenilor. Pentru o serie formată din mărimi absolute, se stabileşte media aritmetică
simplă, dar ea tinde să fie lipsită de valoarea analitică în contextul determinării complexe
a variaţiei în spaţiu.
Nivelul mediu al seriilor teritoriale alcătuite din mărimi relative de structură sau
de intensitate se calculează ca medii aritmetice ponderate.
In cazul seriilor teritoriale, alcătuite din mărimi relative de dinamică, nivelul
mediu poate fi aflat prin aplicarea mediei geometrice simple. Această relaţie se
recomandă şi pentru seriile formate din mărimi relative de coordonare (cu condiţia ca
baza de raportare să fie aceeaşi pentru toţi termenii seriei).
Un aspect distinct al analizei seriilor teritoriale, îl constituie caracterizarea
gradului de uniformitate (sau de diformitate) a repartiţiei în spaţiu. Acest aspect se
exprimă prin coeficientul repartiţiei teritoriale1 aplicabil numai seriilor cu termeni direct
însumabile, deci, numai seriilor alcătuite din mărimi absolute. In prealabil, se determină
mărimiile relative de structură pentru fiecare din termenii seriei.
Există mai multe procedee, de determinare a acestui indicator. Astfel,
statisticianul italian Corrado Gini a propus utilizarea rădăcinii pătrate din suma pătratelor
ponderilor celor (n) unităţi administrativ teritoriale din totalul colectivităţii cercetate.
Notând cu gi poderea unităţii (i), coeficientul Gini (C ) se obţine potrivit relaţiei:
C= ∑g 2
i , unde i = 1, n .
1
Coeficientul Gini ia valori în intervalul [ ,1 ]. Atunci când cele (n) unităţi au
n
ponderi egale în colectivitate, adică repartiţia teritorială este absolut uniformă, rezultă
1
C=
n
n∑ g i2 − 1
C’ =
n −1
Ii
I iy j = ,
Ij
It = K ,
Statistică teoretică şi economică
în care :
I reprezintă indicele mediu de creştere în timp a fenomenului ;
t reprezintă numărul de ani după care se va produce schimbarea de K ori ;
K reprezintă coeficientul de schimbare a fenomenului după trecerea celor t ani
( pentru dublare K=2, pentru triplare K=3 etc.).
Unităţile teritoriale evolueză cu niveluri şi ritmuri de dezvoltare diferite. In acest
contex, se pune problema de a afla când va ajunge din urmă o unitate teritorială pe alta,
considerând că evoluţia lor se face în progresie geometrică cu raţia egală cu indicele
mediu de creştere. Pentru aceasta este necesar să se cunoască nivelurile absolute pentru
momentul de calcul şi indicii de creştere, existând relaţia:
yi < yj şi Ii > Ij .
y’i = y’j
în care: y’ reprezină nivelul fenomenului din momentul final t. Aceasta înseamnă că ,între
y şi y’ există relaţiile:
de unde rezultă:
log y j − log y i
t=
log I i − log I j
Dacă orizontul egalizării nivelelor este prea mult îndepărtat (t este prea mare), se
poate estima ritmul mediu necesar de dezvoltare pentru unitatea teritorială rămasă în
urmă, presupunând că intervalul de recuperare a decalajului este dat (t = numărul de ani
în care se produce recuperarea integrală a decalajului). Pornind de la relaţiade mai sus,
dacă unitatea i îşi propune recuperarea decalajului faţă de unitatea j, rezultă:
1
log Ii = log Ij + ( log yj - log yi )
t
Desigur este de competenţa factorilor de decizie din fiecare unitate administrativ
eritorială, din fiecare ţară de a stabili dacă o asemenea creştere rapidă (exprimată de Ii)
este necesară, pornind de la efortul economic şi financiar pe care o asemenea creştere îl
presupune.
Statistică teoretică şi economică
x − xmin
I=
xmax − xmin
Determinarea indicolor "I" pentru calculul IDU populaţiei României în anul 1998
"x"
Indicatorul observat xmin xmax I
în 1998
Speranţa de viaţă 62,2 25 85 0,737
(ani)
Statistică teoretică şi economică
Sursa: M.Molnar- Sărăcia şi protecţia socială, Ed. Fundaţiei România de Mâine, Bucureşti,
1999,pag.84.
capital şi investiţiile străine - România are o politică relativ echilibrată în ceea ce priveşte
investiţiile străine, multe dintre barierele în acest domeniu sunt formale, ele rezultând din
menţinerea unei anumite birocraţii; C6 - politica bancară - scorul este de "3" datorită
faptului că băncile sunt în continuare sub un control strict exercitat de guvern. De
remarcat că există totuşi anumite oportunităţi faţă de băncile străine care operează în
România; C7 - controlul asupra salariilor şi preţurilor - are scorul "2" deoarece preţurile
sunt stabilite prin intermediul pieţei, iar în domeniul salariului România are legislaţie
privitoare la salariul minim şi la salariul mediu pe economie; C8 - dreptul de proprietate
- are scorul "4+" datorită nivelului redus în legislaţie asupra proprietăţii private;
C9 - alte reglemăntări - are scorul "4" datorită inexistenţei unei reglementări eficiente
asupra corupţiei şi datorită existenţei unor bariere legislative în domeniul afacerilor;
C10 - piaţa neagră - cu scorul de "5" datorită unui nivel ridicat al activităţii pe această
piaţă.
Din notele astfel acordate se face o medie aritmetică simplă, rezultând valoarea de
3,55 pentru România, ceea ce o situează pe poziţia 82 în rândul a 100 de ţări observate în
1995.
Probleme si aplicatii
8.1. Pentru a efectua o ierarhizare multicriterială a unor ţări europene în privinţa
dezvoltării învăţământului superior se cunosc următoarele date:
Ţara C1 C2 C3
Bulgaria 4,2 2942 10
Grecia 3,7 2846 17
România 3,6 1568 16
Turcia 3,4 1960 27
Sursa: Economia mondială în cifre, 1998, C.N.S., pag.109, 111.
unde:
C1 = popnderea cheltuielilor totale pentru învăţământ în PNB;
C2 = numărul studenţilor la 100000 locuitori ;
C3 = numărul de studenţi la un cadru didactic.
Se cere:
1. să se calculeze indicii de concentrare pentru fiecare caracteristică în parte;
2. să se calculeze energia informaţională pentru fiecare caracteristică în parte;
3. să se efectueze ierarhizarea ţărilor luând în considerare toate cele trei criterii.
Statistică teoretică şi economică
CAPITOLUL 9.
INDICII STATISTICI
Cuvinte cheie:
- indice cronologic
- indice individual
- indice de grup
- indice agregat
- indice al factorului cantitativ
- indice al factorului calitativ (intensiv)
y1 x1 ⋅ f 1
i1y/ 0 = = ;
y 0 x0 ⋅ f 0
f1
i1f/ 0 = ;
f0
x1
i1x/ 0 = .
x0
iy = ix ⋅ if
• indici de grup sau sintetici, care exprimă nivelul relativ al întregului ansamblu de
elemente şi se notează cu ″I″; de exemplu:
- indicele de grup al volumului valoric (Iy);
- indicele de grup al volumului fizic (Iq);
- indicele de grup al preţului (Ip);
De asemenea indicii de grup verifică sistemul Iy = Iq ⋅ Ip.
c) Din punctul de vedere al naturii elementelor colectivităţii (indicii se
diferenţiază ca metodă de calcul):
- în cazul unei colectivităţi eterogene, indicii pot fi calculaţi ca:
• indicii agregaţi, care recurg la o combinaţie teoretică ca mijloc de izolare a
influenţei fiecărui factor explicativ;
• indicii medii, care se formează ca medii aritmetice sau armonice ale indicilor
individuali;
Statistică teoretică şi economică
I Lf =
∑f 1 ⋅ x0
I Lx =
∑f 0 ⋅ x1
I y ≠ I Lf ⋅ I Lx ;
∑f 0 ⋅ x0 ∑f 0 ⋅ x0
I pf =
∑f 1 ⋅ x1
I px =
∑f 1 ⋅ x1
I y ≠ I pf ⋅ I px ;
∑f 0 ⋅ x1 ∑f 1 ⋅ x0
If =
∑f 1 ⋅ x0
Ix =
∑f 1 ⋅ x1
I y = If ⋅Ix;
f 0 ⋅ x0 ∑f 1 ⋅ x0
I Ff =
∑f 1 ⋅ x0
⋅
∑f 1 ⋅ x1
= I Lf ⋅ I pf ;
∑f 0 ⋅ x0 ∑f 0 ⋅ x1
I Fx =
∑f 0 ⋅ x1
⋅
∑f 1 ⋅ x1
= I Lx ⋅ I px I y = I Ff ⋅ I Fx
∑f 0 ⋅ x0 ∑f 1 ⋅ x0
1
Etiene Laspeyres (1834 -1913), economist şi statistician german, profesor la universităţile din Basel,
Riga, Karlsruhe şi altele. În statistica preţurilor a formulat, în 1864, un indice care îi poartă numele.
Principalele sale lucrări sunt: HamburgerWarenpreise, 1851-1863 und die californischaustralischen
Goldetfeckungen seit 1848; Die Berechnung einer mitttleren Warenpreissteigerung.
2
Herman Paasche (1851-1925), economist şi statistician german, agent de bursă la Hamburg în perioada
formulării variantei de indice de preţuri cu pondere curentă. Principalele lucrări: Ulber die
Preisentwicklung der letzten Jahre nach den Hamburger Preisnoteierungen (1874); Studien uber die Natur
der Gerdwertung und ihre praktische Bedeutung in den lotzten Jahrzehnten auf Grund statistischen
Detaillmaterials entnommen der Stadt Halle a/S (1878).
3
Irving Fisher (1867-1947), economist şi statistician din S.U.A., a descoperit nu mai puţin de 352 de
variante, formulând şi varianta: ″indicele geometric″, care este cunoscut sub denumirea de ″indicele 353″
sau ″indicele ideal″, pentru că satisface toate testele de verificare, consemnate, de altfel, de acelaşi autor.
Lucrările principale: Mathematical Investigation in the Theoryof Value and Prices (1922); The Marking of
Index Numbers (1922); The Best From of Index Number (1921).
Statistică teoretică şi economică
1
ib / a =
ia / b
Reversibilitatea trebuie să o întâlnim la toţi indicii. Deci, între cele două tipuri de
indici există relaţia:
ib / a ⋅ i a / b = 1
I 1y/(0x ) =
∑x
1 ⋅ f1
devine I 1y/(0x ) =
∑f 1 ⋅ x1
∑x 0 ⋅ f1 ∑f 0 ⋅ x1
şi respectiv:
I 1y/(0f ) =
∑x 0 ⋅ f1
devine I 1y/(0x ) =
∑f 0 ⋅ x1
∑x
0 ⋅ f0 ∑f 0 ⋅ x0
Statistică teoretică şi economică
Produsul noilor indici factoriali obţinuţi este egal cu indicele general al variaţiei
fenomenului complex;
- tranzitivitatea: presupune obţinerea indicelui cu bază fixă prin înmulţirea unui
şir de indici cu bază mobilă pentru peroada analizată.
Fie:
y1 y 2 y 3 y 4 y 5
i1 / 0 ⋅ i 2 / 1 ⋅ i3 / 2 ⋅i 4 / 3 ⋅i5 / 4 = ⋅ ⋅ ⋅ ⋅ = i5 / 0 ;
y 0 y1 y 2 y 3 y 4
ib / a ⋅ i c / n = i c / a
În acest caz:
ib / a ⋅ i c / b ⋅ i a / c = 1
I 1q/ 0 =
∑ q1 ⋅ p 0 şi I 1p/ 0 =
∑q 0 ⋅ p1
∑ q0 ⋅ p0 ∑q 0 ⋅ p0
Se observă că, în cazul primului indice, cel al cantităţii (variabila cantitativă), s-a
utilizat ponderea (preţul) din perioada de bază, iar în cazul celui de-al doilea indice, cel al
preţului (variabila calitativă), s-a utilizat ponderea (cantitatea) din perioada de bază.
Acest tip de indice se mai numeşte şi cu pondere constantă sau fixă.
În 1874, economistul german Hermann Paasche a produs un indice, folosind
ponderile perioadei curente:
I 1q/ 0 =
∑q 1 ⋅ p1
şi I 1p/ 0 =
∑q 1 ⋅ p1
∑q 0 ⋅ p1 ∑q 1 ⋅ p0
I 1q/ 0 =
∑ p ⋅q ⋅ ∑ p
0 1 1 ⋅ q1
şi I 1p/ 0 =
∑p 1 ⋅ q0
⋅
∑q 1 ⋅ p1
∑p q ∑p
0 0 1 ⋅ q0 ∑p 0 ⋅ q0 ∑q 1 ⋅ p0
Statistică teoretică şi economică
v
I p = I Fq ⋅ I Fp
Indicele Fischer se foloseşte la calcul indicilor teritoriali, în situaţia comparării
mai multor ţări: de exemplu, indicele consumului populaţiei, unde preţurile luate ca
ponderi se referă la ţările comparate.
Indicele prezintă însă un dezavantaj destul mare, şi anume, necesită cunoaşterea
separată a tuturor elementelor de calcul, precum şi combinarea tuturor variabilelor
posibile, mai ales în cazul în care sfera de cuprindere a colectivităţii la care se referă
indicii este foarte mare. Bineînţeles, indicii calculaţi după aceste trei variante de
ponderare nu dau aceleaşi rezultate. Având în vedere aceste neajunsuri, cercetările cu
continuat pentru găsirea unui indice mai bun însă până în prezent nu s-au găsit decât noi
formule de compromis.
Astfel, Y.F. Edgenworth4 a propus următorul indice:
I 1p/ 0 =
∑p 1 ⋅ (q1 + q 0 )
∑p 0 ⋅ (q1 + q 0 )
Indicele cumulează cantităţile din perioada de bază cu cele din perioada curentă,
cumul folosit la studiul variaţiei preţului, adică variaţiei calitative. Însă, indicele are un
dezavantaj, el nu poate fi utilizat decât pentru studiul variaţiei variabilei calitative,
deoarece ponderea (variabila calitativă) poate fi cumulată; în schimb, la studiul variabilei
cantitative nu se poate aplica, deoarece factorii calitativi nu au sens să fie cumulaţi de la o
perioadă la alta.
O altă formulă de compromis a fost propusă de statisticianul polonez Jean
Wisniewski, în sensul unui indice mediu, elaborat cu ajutorul calculului integral.
Unii statisticiani au propus un procedeu simplu şi rapid, prin calcularea indicelui
pe baza medianei.
De asemenea, un alt procedeu de ponderare este şi cel propus de matematicianul
şi filosoful german Mortiz Wilhelm Drobisch:
I=
∑ p ⋅q :∑ p ⋅q
1 1 0 0
∑q ∑p 1 0
4
Francis Ysidor Edgeworth (1845-1926), statistician, matematician şi economist englez. Profesor în
economie la Oxford (1891) şi la Londra. A fost influenţat de concepţia bayesiană. A avut o importantă
contribuţie la teoria indicilor şi la aplicarea statisticii matematice în economie; autor al unor lucrări
fundamentale de teoria statisticii. Lucrări principale: On the Method of Ascertaining a Change in the Value
of Gold (1883); Defence of Index-Numbers (1896); Metretica sau metodica de măsurare a probabilităţii şi
unităţii (1887); Despre metodele statisticii (1885).
Statistică teoretică şi economică
p1
∑p ⋅ q1
I= 0
∑q 1
I 1y/ 0 =
∑x
1 ⋅ f1
,
∑x
0 ⋅ f0
unde ″x″ este factorul calitativ şi ″f″ este factorul cantitativ. Corespunzător,
descompunerea analitică va fi:
∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0
I 1y/(0x ) =
∑x 1 ⋅ f1
sau I 1y/(0x ) =
∑x 1 ⋅ f0
;
∑x 0 ⋅ f1 ∑x 0 ⋅ f0
I 1y/(0f ) =
∑x 1 ⋅ f1
sau I 1y/(0f ) =
∑x 0 ⋅ f1
∑x 1 ⋅ f0 ∑x 0 ⋅ f0
I 1y/ 0 =
∑x 1 ⋅ f1
; ∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
I 1y/(0x ) =
∑x 1 ⋅ f1
; ∆ y1(/ x0) = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 1 ;
∑x 0 ⋅ f1
I 1y/(0f ) =
∑x 0 ⋅ f1
; ∆ y1(/ x0) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
- varianta b:
I 1y/ 0 =
∑x 1 ⋅ f1
; ∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
Statistică teoretică şi economică
I 1y/(0x ) =
∑x 1 ⋅ f0
; ∆1y/(0x ) = ∑ x1 ⋅ f 0 − ∑ x0 ⋅ f 0 ;
∑x 0 ⋅ f0
I 1y/(0f ) =
∑x 1 ⋅ f1
; ∆ y1(/ 0f ) = ∑ x1 ⋅ f 1−∑ x1 ⋅ f 0 .
∑x 1 ⋅ f0
∆ y1 / 0 = y1 − y 0 ; ∆x1 / 0 = x1 − x 0 ; ∆ 1f / 0 = f 1 − f 0 .
Prin urmare, sporul variabilei complexe ″y″ în funcţie de factorul ″x″ va fi:
- pentru varianta a:
- pentru varianta b:
iar sporul variabilei complexe ″y″ în funcţie de factrul cantitativ ″f″ va fi:
∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 = ∑ x 0 ( f 1 − f 0 ) = ∑ x 0 ⋅ ∆ 1f / 0 ;
- pentru varianta b:
∆ y1(/ 0f ) = ∑ x1 ⋅ f 1 − ∑ x1 ⋅ f 0 = ∑ x1 ⋅ ( f 1 − f 0 ) = ∑ x1 ⋅ ∆ 1f / 0 .
Însă, din inegalitatea f1>f0 rezultă că sporul factorului ″x″ în prima variantă este
mai mare decât în cea de-a doua variantă cu produsul diferenţei dintre ponderi şi creşterea
variabilei calitative.
Dacă analizăm cel de-al doilea factor, sporul variaţiei complexe ″y″ în funcţie de
factorul cantitativ ″f″, rezultă că influenţa este mai mare cu aceeaşi valoare, deoarece
ponderea folosită x1 > x0 se multiplică pentru toată creşterea factorului ″f″. Cei mai mulţi
statisticieni şi economişti atribuie această diferenţă inlfuenţei factorului calitativ,
considerând faptul că modificarea acestuia este condiţionată de modificararea factorului
cantitativ şi deci este justificată folosirea ponderii din perioada curentă.
În general, dacă substiuirea începe cu factorul calitativ, atunci, pe măsură ce am
luat în considerare un factor, el rămâne în perioada de bază ca pondere, factorii neluaţi în
calcul însă vor fi stabiliţi în perioada curentă.
Statistică teoretică şi economică
I 1y/ 0 =
∑ x ⋅ f ⋅t
1 1 1
∆ y1 / 0 = ∑ x1 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t 0 ;
∑ x ⋅ f ⋅t
0 0 0
I 1y/(0x ) =
∑ x ⋅ f ⋅t1 1 1
∆ y1(/ x0) = ∑ x1 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 1 ⋅ t1 ;
∑ x ⋅ f ⋅t0 1 1
I 1y/(0f ) =
∑x 0 ⋅ f 1 ⋅ t1
∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t1 ;
∑x 0 ⋅ f 0 ⋅ t1
I 1y/(0f ) =
∑x 0 ⋅ f 0 ⋅ t1
∆ y1(/t0) = ∑ x 0 ⋅ f 0 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t 0 .
∑x 0 ⋅ f 0 ⋅ t0
I 1y/ 0 =
∑x 1 ⋅ f1
, respectiv ∆ 1 / 0 y = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
I 1y/(0f ) =
∑x 0 ⋅ f1
, respectiv ∆ y ( f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
I 1y/(0x ) =
∑x 1 ⋅ f0
, respectiv ∆ y ( x ) = ∑ x1 ⋅ f 0 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
- restul nedescompus:
Statistică teoretică şi economică
I 1y/(0x ∩ f ) =
∑x 1 ⋅ f1
:
∑x 1 ⋅ f0
, respectiv
∑x 0 ⋅ f1 ∑x 0 ⋅ f0
∆ y ( x∩ f ) = ∑ x1 ⋅ f1 − ∑ x0 ⋅ f 1 − ∑ x1 ⋅ f 0 + ∑ x0 ⋅ f 0
Restul nedescompus este necesar să fie repartizat pe cei doi factori de influemţă.
De regulă, repartizarea se face în funcţie de ponderea influenţei izolate a fiecărui factor în
totalul celor două influenţe izolate. Deci, se vor calcula coeficienţii de realizare:
∆y ( f ) ∆y ( x)
k = y( f )
f
şi k = y( f )
x
,
∆ + ∆y ( x) ∆ + ∆y ( x)
rezultând:
- influenţa totală a factorului cantitativ:
∆ y ( f ) = ∆y ( f ) + k f ⋅ ∆y ( x ∩ f ) ;
∆ y ( x ) = ∆y ( x) + k x ⋅ ∆y ( x ∩ f )
Metoda influenţelor izolate oferă rezultate mai exacte decât metoda substituirilor
în lanţ, care atribuie întreg sporul nedescompus factorului calitativ. MSL se utilizează
numai în cazul în care factorul cantitativ se modifică nesemnificativ şi dacă ponderea sa
în restul nedescompus este foarte mică.
I 1f/ 0 =
∑x 0 ⋅ f1
if =
f1
⇒ f1 = i f ⋅ f 0 ;
∑x 0 ⋅ f0 f0
deci:
I f
=
∑i ⋅ x ⋅ f
f
0 0
;
∑x ⋅ f
1/ 0
0 0
I 1x/ 0 =
∑x 1 ⋅ f0
ix =
x1
⇒ x1 = i x ⋅ x 0 ,
∑x 0 ⋅ f0 x0
deci:
I 1x/ 0 =
∑i x ⋅ f x
0 0
∑x ⋅ f 0 0
f
I1/ 0 =
∑x 1 ⋅ f1
if =
f1
⇒ f0 =
1
⋅ f1 ,
∑x 1 ⋅ f0 f0 if
deci:
I1/ 0 =
f ∑x ⋅ f 1 1
1
∑i ⋅x ⋅ f f 1 1
I 1x/ 0 =
∑x 1 ⋅ f1
ix =
x1
x0 =
1
⋅ x1 ,
∑x 0 ⋅ f1 x0 ix
deci:
Statistică teoretică şi economică
I 1x/ 0 =
∑x ⋅ f 1 1
1
∑i ⋅x ⋅ f
x 1 1
∑x ⋅ f = x
∑
1 1
x= ⋅ g if ,
∑f
1
1
fi
g if =
∑f i
x ( x)
I SF =
∑x ⋅ f :∑x ⋅ f
1 1 0 1
.
∑f ∑f 1 1
∑x ⋅ f ∑x ⋅ f = x
∑ ⋅ g 1f − ∑ x 0 ⋅ g 1f ;
1 1 0 1
∆xSF( x ) = −
∑f ∑f
0
1 1
x ( x)
I SV =
∑x ⋅ f :∑x ⋅ f 1 1 0 0
.
∑f ∑f 1 0
∆xSV( x , f ) =
∑x ⋅ f1 1
−
∑x ⋅ f 0 0
= ∑ x1 ⋅ g 1f − ∑ x 0 ⋅ g 0f
∑f 1 ∑f 0
I VSx ( f ) =
∑x ⋅ f :∑x ⋅ f
0 1 0 0
.
∑f ∑f 1 0
∆xVS( f ) =
∑x ⋅ f0 1
−
∑x ⋅ f 0 0
= ∑ x 0 g 1f − ∑ x 0 ⋅ g 0f .
∑f 1 ∑f 0
I SV = I SF ⋅ I VS ;
∆ SV = ∆ SF ⋅ ∆ VS .
Statistică teoretică şi economică
XA XB
i Ax / B = sau i Bx / A = ;
XB XA
fA fB
i Af / B = sau i Bf / A = ;
fB fA
yA X A f A yB X B ⋅ f B
i Ay / B = = sau i By / A = = .
yB X B f B yA X A ⋅ f A
i Ax / B ⋅ i Bx / A = 1
i af / B ⋅ i Bf / A = 1
i Ay / B ⋅ i By / A = 1
I Ay / B =
∑y A
=
∑X A ⋅ fA
sau I By / A =
∑y B
=
∑X B ⋅ fB
.
∑y B ∑X B ⋅ fB ∑y A X A ⋅ fA
Statistică teoretică şi economică
I Ax / B =
∑X A ⋅ fA
; I Ax / B =
∑X A ⋅ fB
∑X B ⋅ fA ∑X B ⋅ fB
sau
I Bx / A =
∑X B ⋅ fB
; I Bx / A =
∑X B ⋅ fA
.
∑X A ⋅ fB ∑X A ⋅ fA
I Af / B =
∑X A ⋅ fA
; I Af / B =
∑X B ⋅ fA
∑X A ⋅ fB ∑X B ⋅ fB
sau
I Bf / A =
∑X B ⋅ fB
; I Bf / A =
∑X A ⋅ fB
.
∑X B ⋅ fA ∑X A ⋅ fA
Pentru a compara cele două ţări, de fapt cele două pieţe, se va considera ca bază
de raportare piaţa ţării ″B″. Comparaţia se poate face din următoarele puncte de vedere:
- din punctul de vedere al cantităţilor vândute:
I Af / B =
∑f A
=
145
= 1,16 sau 116%
∑f B 125
Statistică teoretică şi economică
Acest rezultat arată că pe piaţa ″A″ s-au vândut cu 16% mai multe tone de marfă
decât pe piaţa ″B″:
- din punct de vedere al preţurilor:
I Ax / B =
xA
=
∑Q : ∑Q
A B
= 0,8473 sau 84,73%
xB ∑f ∑f
A B
Rezultatul arată că preţul mediu pe piaţa ″A″ a fost cu 15,27% mai mic decât
preţul mediu pe piaţa ″B″.
- din punctul de vedere al încasărilor:
I AQ/ B =
∑ Q A = 10100 = 0,9829 sau 98,29%
∑ QB 10275
Volumul valoric al tranzacţiilor pe piaţa ″A″ a fost cu 1,71% mai mic decât
volumul valoric al tranzacţiilor pe piaţa ″B″.
De remarcat, că şi în această situaţie se verifică relaţia:
I AQ/ B = I Af / B ⋅ I Ax / B
Probleme şi aplicaţii:
9.1. În exportul a trei produse se cunosc următoarele date comparative ale două
trimestre ale anului 1997:
(date convenţionale)
Denumire produs Indicii de preţuri Volumul valoric (mild.lei)
Trim III Trim IV
A 140 4 8
B 130 4 6
C 180 1 4
Se cere:
1. să se calculeze indicii individuali ai volumului valoric şi ai volumului fizic;
2. să calculeze indicii de grup care caracterizează evoluţia exportului celor trei produse;
3. să se măsoare influenţa factorilor posibili asupra evoluţiei volumului valoric al
exportului la nivelul firmei.
Se cere:
1. să se facă analiza comparativă a indicilor de preţ calculaţi după relaţiile Laspeyres,
Paasche şi Fisher;
2. să se decompună pe factori de influenţă creşterea volumului valoric al vânzărilor de
produse lactate.
Se cere:
1. să se calculeze indicele de grup al preţului ca medie artimetică ponderată;
2. să se calculeze indicele de grup al preţului ca medie armonică ponderată.