Documente Academic
Documente Profesional
Documente Cultură
STATISTICĂ ECONOMICĂ
- CURS ID -
2017
UNITATEA DE STUDIU 1
NOȚIUNI GENERALE ÎN STATISTICĂ
Cuprins:
1.1. Introducere
1.2. Obiectivele unității de studiu
1.3. Statistica – noțiuni generale
1.3.1. Definiția statisticii
1.3.2. Statistica minte sau prin statistica se poate minți?
1.3.3. Utilitatea cunoașterii statisticii
1.3.4. Noțiuni de bază utilizate în statistică
1.3.5. Prelucrarea automată a datelor prin softuri statistice
1.3.6. Teoria scalării. Tipuri de scale
1.4. Rezumatul unității de studiu, cuvinte cheie
1.5. Teste de autoevaluare
1.6. Concluzii
1.1 INTRODUCERE
„...gândirea statistică va deveni într-o zi la fel de necesară pentru un cetăţean
eficient, la fel ca şi abilitatea de a citi şi a scrie”. H.G. Wells (1866-1946)
Având în vedere complexitatea fenomenelor și a proceselor social economice
contemporane, pentru cunoașterea acestora este nevoie de utilizarea metodelor
adecvate de investigație stiințifică, în vederea analizei și evidențierii particularităților
sub care ele se manifestă. Statistica este știința care oferă instrumentarul necesar
cunoașterii detaliate, în structură, în dinamică și în corelație a fenomenelor din toate
sectoarele de activitate dintr-o economie. În cadrul acestei unități de studiu, ne
propunem o familiarizare cu conceptul de statistică și cu principalele noțiuni utilizate
în statistică, și o introducere treptată în teoria scalării, ca modalitate de măsurare a
datelor statistice.
CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie
de cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de
matematică, pentru înțelegerea calculelor care se vor realiza.
!!! Populația statistică poate fi formată din persoane, țări, firme, județe, idei, opinii,
profesii, universiăți, etc.
Unitatea statistică este elementul care compune populația statistică și poate fi:
unitate simplă (de exemplu: un student, o țară, o firmă, un obiect, o părere)
unitate complexă (de exemplu: o grupă de studenți, o grupă de țări, o grupă de
firme, o echipă de salariați, o familie)
Variabila statistică (caracteristica statistică) reprezintă versiunea măsurabilă a
însuşirii sau trăsăturii comune unităţilor unei colectivităţi, care reprezintă interes în
analiza statistică
Exemple de variabile statistice
Relația statistică este expresia matematică care arată în ce fel o variabilă este
relaționată cu una sau mai multe variabile, ignorând efectele factorilor minori din
sistem. Relația poate fi modelată în mai multe forme, cea mai cuprinzătoare fiind cea
a unei funcții matematice, de tipul y = f(x) unde cu x notăm variabila cauză iar cu y
notăm variabila efect. De exemplu putem modela legături simple între 2 variabile
cum ar fi între preț și cerere, între nivelul cunoștințelor și nivelul notei, între venit și
consum, între rata șomajului și PIB sau putem modela legături multiple, între mai
multe variabile cum ar fi între valoarea creditului care poate fi contractat și
vechimea, venitul, garanția, istoricul cu banca, nr. de copii în întreținere, valoarea
altor credite contractate, etc.
Informația statistică reprezintă conținutul specific, mesajul datelor statistice și
respectiv scopul analizei statistice.
!!! Scopul analizei statistice nu este doar să ajungem la rezultatul corect al unor
indicatori matematici și să surprindem informația oferită de acești indicatori, să o
înțelegem și să o utilizăm astfel încât să obținem o mai bună cunoaștere a realității
economice în care ne aflăm.
Interpretarea rezultatelor:
- Frecvența relativă: 10,53% din numărul total de angajați sunt
eonomiști
- Modulul sau dominanta este profesia muncitor, deoarece este varianta
variabilei care predominantă, care înregistrează cea mai mare frecvență,
respectiv 50
Scala ordinală asigură posibilitatea ca unităţile componente ale populaţiei totale să
suporte o anumită ordonare de la mic la mare sau invers, de la simplu la complex sau
invers, etc. Scala ordinală se mai numește și scală de opinie.
Observaţii:
folosirea acestei scale presupune de asemenea codificarea, care poate fi
numerică (1,2,3,4,5) sau nenumerică (a,b,c,d,e,f). În acest caz codul mai
poartă numele de rang.
prelucrarea datelor măsurate prin această scală se face prin numărare şi calcul
de frecvenţe relative, frecvențe absolute cumulate calculate ca sumă a
frecvențelor absolute înregistrate până la un anumit nivel și frecvențe relative
cumulate, calculate ca sumă a frecvențelor relative înregistrate până la un
anumit nivel; și pe o scală ordinală se poate observa modulul.
Aprecierea studenților pentru facultatea în care studiază se prezintă astfel (tabel nr.
1.2):
Tabelul nr. 1.2
Aprecierea studenților Nr. studenți
Foarte bună 285
Bună 150
Slabă 60
Foarte slabă 5
TOTAL 500
Rezolvare:
Interpretarea rezultatelor:
- Frecvența absolută cumulată – 435 de elevi au aprecierea foarte bună
și bună sau în primele 2 categorii cele mai bune
- Frecvența relativă – 12% din numărul total de studenți au aprecierea
slabă
- Frecvența relativă cumulată – 87% din totalul studenților au aprecierea
în primele 2 categorii cele mai bune
- Modulul sau dominanta este reprezentat de aprecierea foarte bună,
deoarece este varianta variabilei care predominantă, care înregistrează
cea mai mare frecvență, respectiv 285.
Denumirea
Caracteristici ale scalei Exemple de utilizare
scalei
2. Precizați care este populația și variabila statistică și apreciați scala care poate
fi folosită pentru măsurare în următoarele cazuri:
3. Veniturile angajaților unei firme se prezintă după cum urmează (tabel nr. 1.4):
Cuprins:
2.1.Introducere
2.2.Obiectivele unității de studiu
2.3.Prelucrarea primară a datelor
2.3.1. Concept și etape în prelucrarea datelor
2.3.2. Gruparea datelor. Formarea de distribuții de frecvențe.
2.3.3. Prezentarea rezultatelor prelucrării sub formă de tabele și grafice
2.4.Rezumatul unității de studiu, cuvinte cheie
2.5.Teste de autoevaluare
2.1. INTRODUCERE
Statistica oferă un instrumentar prin care volumele mari de date sunt sintetizate, pentru
a putea fi ușor analizate prin calculul de indicatori. În această unitate de studiu vor fi
evidențiate etapele în cadrul prelucrării sau sistematizării datelor și vor fi prezentate
modalitațile de prelucrare a datelor prin grupare și modalitățile de prezentare a lor prin
tabele și grafice. Cunoașterea acestor informații este foarte importantă, deoarece pe
baza acestora se pot înțelege metodele pe care le vom dezvolta în unitățile de studiu
următoare, dar în același timp trebuie să reținut faptul că prin sintetizarea datelor are
loc o pierdere inevitabilă de informații, prin eliminarea a ceea ce este neesențial și
întâmplător, dar în același timp se câștigă sub aspectul obținerii unor informații
sintetice.
CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie de
cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de matematică,
pentru înțelegerea calculelor care se vor realiza.
a) Gruparea pe variante
Pentru 20 de familie se analizează numărul membrilor și se culeg
următoarele date: 3, 5, 2, 4, 6, 2, 3, 5, 7, 2, 3, 5, 2, 3, 4, 4, 4, 7, 2, 5. Să se
realizeze sistematizarea datelor.
Având în vedere faptul că variabila este discretă și înregistrează doar 6
variante, gruparea se va realiza pe variante, conform tabelul 2.1:
Tabelul nr.2.1
Nr. de membri Nr. de familii
2 5
3 4
4 4
5 4
6 1
7 2
TOTAL 20
h= , unde:
h – mărimea intervalului de grupare
A – amplitudinea
n – numărul de elemente ale populației analizate
Se recomandă: - utilizarea unui număr potrivit de grupe (4-10 grupe)
- folosirea mărimilor rotunjite de interval
Gruparea datelor pe intervale egale se poate realiza utilizând intervale închise şi/sau
deschise. Intervalele închise prezintă amândouă limitele, şi cea inferioară şi cea
superioară, iar intervalele deschise numai pe una din acestea. Intervalele deschise se
folosesc pentru sistematizarea datelor privind colectivităţi statistice mari sau
colectivităţi statistice care înregistrează valori aberante. Pentru realizarea calculelor
pe date grupate pe intervale deschise se procedează la închiderea intervalelor
adăugând la limita dată, mărimea intervalului (sau scăzând din limita dată mărimea
intervalului, dacă primul interval de grupare este cel deschis). Această acțiune, deși
contribuie la pierderea unor date, face ca datele aberante să fie eliminate din grupare,
ceea ce va contribui la calcul de indicatori relevanți pentru valorile omogene sau
apropiate, respectiv pentru marea majoritate a valorilor.
Gruparea datelor se poate realiza și pe intervale inegale de variație, fără a utiliza
un algoritm de grupare, atunci când variabila se exprimă calitativ. În exemplul
următor este prezentată și gruparea pe intervale inegale.
Rezolvare
DE REȚINUT:
În etapele următoare de prelucrare secundară a datelor, respectiv de analiză a datelor
prin calcule de indicatori statistici, trebuie să se realizeze clar distincția între datele
neprelucrate, care formează o distribuție simplă și datele sistematizate pe grupe, care
formează o distribuție de frecvențe.
2.5 TESTE DE AUTOEVALUARE
1. Pe baza datelor grupate în tabelul 2.4. și 2.5 determinați și
interpretați indicatorii proprii unei scale interval.
Nr. Nr.
Nr.crt. Profit (mii lei) Nr.crt. Profit (mii lei)
angajați angajați
1 2 7 21 12 15
2 23 20 22 15 10
3 10 9 23 18 17
4 28 25 24 19 12
5 3 8 25 32 34
6 9 12 26 34 35
7 14 17 27 20 28
8 25 23 28 22 21
9 21 21 29 30 33
10 24 24 30 16 11
11 24 27 31 2 13
12 2 5 32 24 23
13 6 10 33 22 30
14 9 13 34 22 32
15 17 16 35 16 15
16 6 11 36 38 20
17 24 22 37 13 22
18 23 15 38 24 19
19 24 19 39 27 30
20 19 16 40 29 31
Cuprins:
3.1.Introducere
3.2.Obiectivele unității de studiu
3.3.Mărimi relative
3.3.1. Concept, dificultăți în construcție și tipuri de mărimi relative
3.3.2. Mărimi relative de structură
3.3.3. Mărimi relative de coordonare
3.3.4. Mărimi relative de intensitate
3.3.5. Mărimi relative de dinamică
3.3.6. Mărimi relative ale planului
3.4.Rezumatul unității de studiu, cuvinte cheie
3.5.Teste de autoevaluare
3.1. INTRODUCERE
După ce datele trec prin etapa de prelucrare primară, după ce sunt grupate și prezentate
sub formă de tabele și grafice, se trece la etapa de prelucrare secundară, respectiv la
etapa de calcul al unor indicatori derivați, care ajută la compararea termenilor, sub
formă de raport sau diferență. Există mai mulți indicatori derivați care se pot grupa în
următoarele categorii: mărimi relative, indicatorii tendinței centrale, indicatorii variației,
indicii statistici.
În cadrul acestei unități de studiu sunt analizate mărimile relative, pornind de la forma
lor generală de calcul și de la dificultățile care pot apărea în construirea lor și
continuând cu caracterizarea fiecărui tip de mărime relativă, din perspectiva modului de
calcul, al reprezentării grafice și al modului concret de aplicare și interpretare. De
asemenea sunt prezentate în cadrul acestei unități aplicații particulare ale unor mărimi
relative, cum ar fi caracterizarea concentrării unui fenomen și analiza poziției pe piață a
unei firme prin cota de piață și cota relativă de piață.
CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie de
cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de matematică,
pentru înțelegerea calculelor care se vor realiza.
ks = ,
unde xi – variabila statistică
f*=
ponderi (ks)
ks = ,
unde xi – variabila statistică
f i – frecvența statistică absolută
Tabelul de prezentare a calculului mărimilor relative care cuprinde atât
frecvențele relative cât și ponderile poartă denumirea de tabel centralizator.
Reprezentarea grafică a mărimilor relative de structură se realizează prin diagrame
de structură sub formă de pătrat, cerc sau alte figuri geometrice.
Exemplu de analiză prin mărimile relative de structură
Tabelul 3.1.
Categorie de
burse Fond de bursă ks =
(mii u.m.) (xi)
(%)
Bursa socială 3.106,6 = 49
Bursă de studiu 2.662,8 42
Bursă de merit 570,6 9
TOTAL 6340 100
Interpretarea rezultatelor:
- pondere: 42% din fondul total de bursă este reprezentat de bursele de studiu.
Interpretarea rezultatelor
- frecvența relativă - 17,95% din numărul total de angajați realizează vânzări
cuprinse între 1000 și 1500 u.m
- pondere - 12,2% din valoarea totală a vânzărilor este realizat de cei 7 angajați cu
vânzări între 1500-2000 u.m.
Tabelul 3.3.
Grupe de elevi după
Nr. de elevi Ponderi (pi)*
ciclul de învățământ
Învătământ preșcolar 17378 = 0,22 0,0484
Învătământ primar 21046 0,26 0,0676
Învătământ gimnazial 19046 0,24 0,0576
Învătământ profesional 6160 0,08 0,0064
Învătămât liceal 15452 0,19 0,0361
Învătământ postliceal 706 0,01 0,0001
TOTAL 79788 1 0,2162
KH= = 0,2162
KH € ( respectiv ( sau (0,17; 1)
Având în vedere că KH în acest exemplu se apropie mai mult de limita
inferioară, respectiv de 0,17 → concentrare redusă a populației școlare pe cicluri
de învățământ
KG= = = 0,47
Ks € (
Având în vedere că Ks în acest exemplu se apropie mai mult de limita
inferioară, respectiv de 0 → concentrare redusă a populației școlare pe cicluri de
învățământ
kc = ,
unde xA, respectiv xB – reprezintă indicatorul corespunzător grupei A, respectiv B
- pentru distribuțiile de frecvențe, mărimea de coordonare se poate determina
fie pe baza frecvențelor diferitelor grupe, fie pe baza valorilor centralizate ale
diferitelor grupe, astfel:
kc =
unde fA, respectiv fB este frecvența absolută a grupei A, respectiv B
sau kc = ,
unde xAfA – valori centralizate ale grupei A
xBfB – valori centralizate ale grupei B
Reprezentarea grafică a mărimilor relative de structură se realizează prin diagrame
prin benzi sau prin coloane.
Interpretarea rezultatelor
- 80% - numărul de angajați care realizează vânzări între 2000-2500 u.m.
reprezintă 80% raportat la numărul de angajați cu vânzări între 1500-2000 u.m.
- 32,41% - valoarea vânzărilor celor 7 angajați care realizează vânzări între 1000-
1500 u.m. reprezintă 32,41% raportat la valoarea vânzărilor realizată de cei 12
angajați care realizează vânzări între 2000-2500 u.m.
Interpretarea rezultatelor:
- cota de piață de 14,63% arată faptul că activele BRD reprezintă 14,63% din
totalul activelor bancare din sectorul bancar românesc.
- cota relativă de piață de 33,12% arată faptul că activele Volksbank reprezintă
33,12% raportat la activele liderului bancar BCR
Productivitatea muncii:
W= sau
Rentabilitatea = sau
În funcție de modul în care se alege baza de comparație, se pot calcula două tipuri de
mărimi relative de dinamică:
- Mărimi relative de dinamică cu bază fixă (kd n/o) care arată evoluția unui
fenomen față de o perioadă fixată în timp (prima perioadă sau o perioadă
relevantă fixată din trecut).
kd n/o = × 100
- Mărimi relative de dinamică cu bază în lanț (kd n/n-1) care arată evoluția unui
fenomen într-o perioadă față de nivelul înregistrat în perioada imediat
anterioară.
kd n/n-1 = × 100
kd n/o = kd n/n-1 =
Încasări medii /
Luna
salariat (mii u.m.) × 100 (%) × 100 (%)
Interpretarea rezultatelor:
- 143% - încasările medii pe salariat în septembrie au crescut la 143%, sau au
crescut cu 43% sau au crescut de 1,43 ori față de încasările medii pe salariat din
luna iulie.
- 98,8% – încasările medii pe salariat în noiembrie au scăzut la 98,8%, sau au
scăzut cu 1,2%, sau au scăzut de 0,988 ori față de încasările din luna anterioară
(octombrie)
k pl/0 = ×100
k 1/pl = ×100
DE REȚINUT:
Pentru determinarea indicatorilor pe distribuții de frecvențe cu date grupate pe intervale,
este necesară determinarea centrului de interval, care reprezintă valoarea medie a
variabilei pe fiecare interval și se determină ca semisumă a limitelor intervalului.
3.5. TESTE DE AUTOEVALUARE
1. Se cunosc următoarele date despre valoarea pensiilor înrgistrate la
nivelul unei regiuni (tabelul nr. 3.9) .
Tabelul nr. 3.9.
Grupe de persoane după
Nr. pensionari
valoarea pensiei (mii u.m.)
Sub 700 45
700-1000 70
1000-1300 120
1300-1600 250
1600-1900 95
1900 și peste 25
Să se construiască tabelul centralizator și să se analizeze rezultatele obținute.
2. Se cunosc următoarele date despre rezervele valutare internaționale ale unor țări
(tabelul 3.10.):
Tabelul nr. 3.10.
Valoarea rezervelor
Țara
valutare (mil USD)
Brazilia 237.000
China 2.416.000
Japonia 1.022.000
România 40.000
Coreea 270.000
Germania 60.000
TOTAL 4.045.000
Cuprins:
4.1.Introducere
4.2.Obiectivele unității de studiu
4.3.Indicatori de poziție
4.3.1. Media
4.3.2. Mediana
4.3.3. Modulul
4.3.4. Relația între medie, mediana și modul
4.4.Rezumatul unității de studiu, cuvinte cheie
4.5.Teste de autoevaluare
4.1. INTRODUCERE
În cadrul acestei unități de studiu sunt abordați indicatorii de poziție, mărimile medii,
mediana și modulul, locul și rolul acestora într-o analiză economică precum și modul de
calcul și interpretarea acestora. Modul de determinare al indicatorilor este prezentat în
mod particular în funcție de tipul de distribuție utilizat pentru prezentarea datelor. La
finalul unității de studiu este prezentată relația între indicatorii de poziție, respectiv
medie, mediană și modul.
CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie de
cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de matematică,
pentru înțelegerea calculelor care se vor realiza.
͞x = ,
unde xi sunt valorile variabilei și n este numărul de elemente ale populației
Media aritmetică în forma ponderată se folosește pentru distribuții de frecvențe
͞x =
͞xp =
͞xp =
͞xg =
unde xi sunt valorile variabilei și n este numărul de elemente ale populației
Media geometrică în forma ponderată se folosește pentru distribuții de frecvențe
͞xg =
4.3.2. MEDIANA
Mediana, alături de modul sunt variante ale caracteristicii care, prin poziția ocupată în
distribuție exprimă cu aproximație nivelul mediu în jurul căruia tinde să se grupeze fie
întreaga populație, fie o parte preponderentă a acesteia.
Mediana este acea valore a variabilei care ocupă locul central în cadrul distribuției
ordonată crescător sau descrescător, cea care împarte seria statistică în două părți
egale. Numărul valorilor individuale inferioare medianei este egal cu numărul
valorilor individuale superioare acesteia, motiv pentru care mediana se mai numește
și valoarea echiprobabilă a variabilei.
Pentru distribuțiile simple, deteminarea medianei depinde de numărul de termeni ai
seriei, astfel:
Dacă distribuția are un număr impar de termeni mediana se află pe poziția
(n+1) / 2, în distribuția ordonată crescător sau descrescător
Dacă distribuția are un număr par de termeni, mediana este dată de semisuma
termenilor centrali, pentru distribuția ordonată crescător sau descrescător.
Pentru distribuțiile de frecvențe, mediana se estimează printr-un algoritm în doi pași:
Pas 1. Se determină intervalul median (intervalul în care se află mediana) ca
fiind primul interval cu frecvența cumulată mai mare decât ∑fi / 2.
Pas 2. Se determină mediana, în mod diferit în funcție de numărul de
elemente ale populației, astfel:
Dacă distribuția are un număr par de termeni:
Me = xMe + h
Dacă distribuția are un număr impar de termeni:
Me = xMe + h
Unde:
- Me este mediana
- h este mărimea intervalului median
- xMe este limita inferioară a intervalului median
- fi sunt frecvențele de apariție ale variabilei
- fcum este frecvența cumulată până la intervalul median
- fMe este frecvența absolută a intervalului median
Cu cât diferența (͞x – Me) este mai mică, cu atât media aritmetică este mai
reprezentativă.
4.3.3. MODULUL
Modulul reprezintă acel nivel al variabilei care înregistrează frecvența cea mai mare,
respectiv valoarea care predomină, care se repetă de cele mai multe ori. Modulul se
poate determina doar pe distribuții de frecvențe
Dacă distribuția de frecvențe este pe variante, atunci modulul se observă ca fiind
varianta variabilei care înregistrează cea mai mare frecvență (exemplificarea am
realizat-o în unitatea de studiu 1, pe baza datelor din tabelul 1.1).
Dacă distribuția de frecvențe este pe intervale, modulul se stabilește printr-un
algoritm în doi pași
Pas 1. Se determină intervalul modal (intervalul în care se află modulul) ca
fiind intervalul cu frecvența absolută cea mai mare, sau dacă există 2 intervale cu
frecvența cea mai mare, atunci intervalul modal este primul interval cu frecvența
cumulată mai mare sau egală cu ∑fi / 2.
Pas 2. Se estimează nivelul modulului astfel:
Mo = xMo + h
Unde:
- Mo este modulul
- h este mărimea intervalului modal
- Δ1 este diferența dintre frecvența intervalului modal și frecvența intervalului
imediat anterior
- Δ2 este diferența dintre frecvența intervalului modal și frecvența intervalului
imediat următor
Pe graficul unei distribuții statistice (histograma sau poligonul frecvențelor) valoarea
modală corespunde punctului în care graficul atinge maximul respectiv vârfului
graficului. În practica statistică există distribuții multimodale.
4.3.4. RELAȚIA ÎNTRE MODUL, MEDIANĂ ȘI MEDIA ARITMETICĂ
Relația matematică formulată de Pearson pentru o distribuție ușor asimetrică, adică
distribuția ale cărei frecvențe se abat puțin de la curba normală (Gauss Laplace) a
frecvențelor este următoarea:
Mo = 3Me – 2͞x
În cazul distribuțiilor asimetrice sau care conțin date aberante, relația lui Pearson nu
se verifică. Mediana și modulul, ca indicatori nu sunt influențați de termenii seriei,
deci nici de valorile aberante, în timp ce media sintetizează influența tuturor
termenilor, și de aici este afectată și relația lui Pearson.
Mediana
Pentru determinarea medianei se ordonează valorile seriei crescător:
1300, 1300, 1400, 1400, 1500, 1500, 1500, 1500, 1500, 1500, 1600, 1700, 1700,
1720, 1730, 1800, 1800, 1820, 1850, 1880
Media pătratică
Modulul
Pas 1 – intervalul modal este intervalul 1409-1518, deoarece înregistrează cea mai
mare frecvență (6)
Pas 2 – determinarea modulului:
Tabelul 4.3
Intervale de variație a
numărului de zile de Nr. debitori
întârzâiere a plății
10-20 120
20-30 85
30-40 37
40-50 16
50-60 7
60-70 2
Cuprins:
5.1.Introducere
5.2.Obiectivele unității de studiu
5.3.Analiza de variație
5.3.1. Indicatorii simpli ai variației
5.3.2. Indicatorii sintetici ai variației
5.3.3. Caracterizarea asimetriei într-o disribuție
5.4.Rezumatul unității de studiu, cuvinte cheie
5.5.Teste de autoevaluare
5.1. INTRODUCERE
În analiza populațiilor statistice, un rol important îl au indicatorii medii, respectiv
caracterizarea populației prin nivelul mediu al variabilelor analizate. Un aspect
semnificativ este asigurarea reprezentativității nivelului mediu calculat. Așa cum arătam
în unitatea de studiu 4, o condiție importantă pentru reprezentativitatea mediei este
omogenitatea populației, ceea ce înseamnă un nivel redus al variației sau al diferențelor
care există între elementele populației. Așadar în cadrul acestei unități vor fi prezentați
indicatorii analizei de variație, care au ca obiectiv stabilirea existenței unei variații mari
sau mici în cadrul populației, stabilirea existenței unei populații omogene sau eterogene,
caracterizarea reprezentativității nivelului mediu și stabilirea realizării unei grupări
calitative sau nu.
Analiza de variație este o analiză care trebuie să însoțească deteminarea nivelului mediu
al variabilei și să confirme reprezentativitatea științifică a acestui nivel.
Indicatorii de variație au forme particulare în funcție de tipul de distribuție pe care se
face analiza, respectiv distribuția simplă și distribuția de frecvențe.
CUNOȘTINȚE PRELIMINARE
Pentru înțelegerea noțiunilor discutate în cadrul acestei unități de studiu este nevoie de
cunoștințe de microeconomie, pentru înțelegerea exemplificărilor, și de matematică,
pentru înțelegerea calculelor care se vor realiza.
A% = × 100
di% = × 100
Abaterea valorilor individuale nu poate oferi informații decât la nivelul fiecărei variante
și nu oferă informații despre împrăștierii pe ansamblul distribuției. Acest aspect este
realizat prin intermediul indicatorilor sintetici.
Indicatorii simpli ai variației, deoarece se referă la valorile extreme sau la diferențele
valorilor față de valoarea medie, nu sunt influențați în modul de calcul de tipul de
distribuție.
͞d =
͞d =
Abaterea medie pătratică (σ) se mai numește și abatere standard exprimă cu cât se
abate în medie fiecare valoare individuală de la media valorilor, evidențiind influența
abaterilor mari și se calculează ca medie pătratică simplă sau ponderată a abaterilor
valorilor individuale, considerate în mărime absolută de la medie. Acest indicator se
exprimă în unitatea de măsură a variabilei. Este un indicator important în analiza
variației, se utilizează la estimarea erorilor de selectție și în calcule de corelație.
Pentru distribuții simple
σ=
Pentru distribuții de frecvențe
σ=
v= sau v =
as= ͞x - Mo
Coeficientul de asimetrie (Cas)
Cas =
Coeficientul de variație
v1 = = = 48%
v2 = = = 55,6%
σ = = =
182,06 lei (salariul fiecărui angajat se abate în medie cu 182,06 lei de la salariul
mediu, evidențiind abaterile mari)
Coeficientul de variație
v= = = 10,39%
v= = = 11,50%
CARACTERIZAREA ASIMETRIEI
Ținând cont de modulul calculat la unitatea nr. 4 pe aceeași distribuție
(Mo=1440,14 lei), asimetria o să fie caracterizată prin coeficienții de asimetrie ai
lui Pearson
Asimetria absolută
as= x͞ – Mo = 1583,4 – 1440,14 = 143,26
Coeficientul de asimetrie
Cas = = = 0,79
Deoarece Cas → +1 distribuția este caracterizată printr-o asimetrie pronunțată
DE REȚINUT:
Modul de determinare al indicatorilor variației se realizează în mod diferit pe distribuții
simple și pe distribuții de frecvențe.
Dacă coeficienții de variație calculați pe baza abaterii medii liniare și abaterii medii
pătratice sunt încadrați în intervale de interpretare diferiți, se ia în considerare nivelul
determinat prin abaterea medie pătratică, deoarece aceasta evidențiază abaterile mari,
care contribuie la eterogenitatea populației.
5.5. TESTE DE AUTOEVALUARE
1. Folosind datele nesistematizate din cadrul tabelului 2.10 și apoi
datele prelucrate în cadrul aplicației 2b din unitatea de studiu 2 să se determine și să
se interpreteze indicatorii de variație.