Sunteți pe pagina 1din 47

Statistic

Prof.dr. Zizi Goschin Departamentul de Statistic i econometrie Cam.2610 zizigoschin@hotmail.com

Noiuni introductive
1. Definirea statisticii 2. Concepte de baz 3. Gruparea datelor

I.Ce este statistica?


Accepiuni: Date ex.: statistici ale cursului valutar, omajului, ratei inflaiei etc. tiina care studiaz aspectele cantitative ale fenomenelor de mas. Caracteristici: Colectiviti mari Variabilitatea formelor de manifestare Incertitudine

II. Concepte de baz 1. Colectivitate (populaie)


= un ansamblu de elemente de aceeai natur (cel puin o trstur comun) Un grup de persoane/ obiecte /evenimente Are caracter obiectiv, finit Delimitat dup coninut, spaiu i timp. Ex. agenii economici privai din Bucureti n 2009; falimentele din industria turismului n 2008, n jud. Constana

1.Colectivitate static: un stoc existent la un moment dat. Ex. Populaia Romniei la 1 iulie 2009, stocul de produse finite al unui agent economic la 1.02.2012

2. Colectivitate dinamic: un proces, o evolutie pe o perioad de timp. Ex. Cheltuielile de consum ale populaiei Romniei n anul 2009, produse fabricate de un agent economic n luna februarie 2012.

2. Unitate statistic
= elementul de baz al populatiei investigate A. simpl: o persoan/ obiect B. complex: un grup de uniti simple (subansamblu independent) familia, echipa, firma

Datele sunt nregistrate pentru fiecare unitate statistic.

3.Caracteristica (variabila)
= o proprietate, un atribut al unitilor statistice Ex. Vrsta persoanei, cifra de afaceri a agentului economic, preul bunului Variaz de la o unitate statistic la alta

Variante= mrimi distincte ale unei variabile ntro colectivitate

Frecvena= numrul unitilor statistice cu


aceeai variant (valoare a caracteristicii)

1. Variabil cronologic (timp) 2. Variabil teritorial (spaiu) 3. Variabil atributiv: 3.1. Calitativ= exprimat n cuvinte (profesia, ramura economic) 3.1.1.Alternativ (binar)= doua forme de manifestare (urban/rural, admis/respins) 3.1.2.Nealternativ 3.2. Cantitativ= numeric 3.2.1.Discret= se obine prin numrare; valori ntregi (nr. copii pe familie, nr. de falimente/an) 3.2.2.Continu = se obine prin msurare; orice valoare ntr-un interval de variaie (greutatea, profitul)

III. Gruparea datelor


= separarea unitilor colectivitii n subansambluri omogene, dup o caracteristic de grupare -Variabile calitative clasificate pe variante -Variabile cantitative grupate pe variante (cnd sunt puine valori distincte) grupate pe intervale de variaie egale (A moderat, variaie uniform) grupate pe intervale de variaie neegale (A mare, variaie neuniform). Amplitudinea variaiei:

A=Xmax Xmin

Grupare pe intervale egale de variaie: 1. Amplitudinea variaiei: A=Xmax-Xmin 2. Nr. de grupe k: a. Ales dup mrimea colectivitii, scopul analizei; n general: 5-20 grupe b. Calculat (formula Sturges): k=1+3.322 lg n, unde n=volumul colectivitii. 2.Mrimea unui interval de grupare: h = A/k (rotunjire n plus !). 3.Definirea intervalelor (pornind de la Xmin i adunnd repetat h pn se ajunge la Xmax):

xmin - xmin+h ; xmin+h - xmin+2h ; xmin+2h xmin+3h etc.


4.Numrarea unitilor care aparin fiecrui interval (frecvene absolute)

Ex. Gruparea salariailor unei firme dup vrst Vrsta: 22, 25, 29, 30, 30, 31, 32, 34, 45, 61.
1.Amplitudinea variaiei A=61-22=39 2.Nr. grupe ales k=4 3.Mrimea intervalului de grupare h=A/k=9.7510 4.Intervalele de variaie (col.1) i frecvenele absolute (col.2)
Grupe dup vrst* (ani) Numr de persoane (frecven absolut)

22-32 32-42 42-52 52-62 Total

6 2 1 1 10

*Limita inferioar inclus n interval

Gruparea pe intervale neegale de variaie: cnd A este mare i variaia neuniform. Ex. Firme de construcii pe clase de mrime, dup nr.de salariai, n 2006
Clasa de mrime Nr de firme (persoane) 0-9 24799 10-49 4211 50-249 1194 250 i peste 168 Total 30372
Sursa: Anuarul statistic al Romniei, 2007

Prezentarea datelor
1.Serii statistice 2.Tabele 3.Grafice

1.

SERII STATISTICE
=iruri de date ordonate rezultate din grupare

1.1. Serii cronologice (de timp) : prezint valorile unei caracteristici n uniti de timp succesive.
Exemplu. Producia lunar a unui bun n 2011
Luna Producia (mii Euro) Mar Apr Mai Jun Jul Aug Sept ... 35 51 60 59 62 63 63 ...

1.2.Serii teritoriale: prezint variaia n spaiu a valorilor unei caracteristici statistice.


Exemplu. Vnzarea automobilelor pe regiuni in 2009
Regiunea Nr. automobile Nord 860 Sud Est 750 300 Vest Total 90 2000

1.3.Serii (distribuii) de frecvene

- rezult din gruparea datelor n funcie de o variabil:


-cantitativ (ex.distribuia salariailor dup venit) sau -calitativ (ex. distribuia salariailor dup profesie).

- sunt formate din dou iruri corelate:


1. variantele/ intervalele de variaie 2. frecvenele (absolute/relative).

Frecvenele absolute ni = numrul de observaii incluse ntr-un interval de variaie. Frecvenele relative ni* = ponderea frecvenelor absolute corespunztoare grupelor n total (n suma tuturor frecvenelor).
*

ni ni * ni % 100 ni ni ni

Distribuii de frecvene absolute i relative


Exemplu: distribuia muncitorilor dup salariu
Salariu (RON) Numr de muncitori (ni) 765810 7 810855 14 855900 7 900945 5 945Total 990 3 40

Ponderea muncitorilor (n*i%)

17,5

35,0

17,5

12,5

7,5

100

2.TABELE
Toate seriile statice sunt prezentate n tabele.
Elemente: titlul general, titlurile interne, unitile de msur a datelor, sursa datelor, note explicative. Tipuri:
Tabele simple pentru date grupate dup o singur variabil Tabele bidimensionale (cu dubl intrare) pentru date grupate dup dou variabile simultan.

Distribuia salariailor dup vechimea n munc i salariu


Vechimea n munc (ani) 2-8 8-14 14-20 20-26 26-32 32-38 Total dup salariu Salariu (RON) 720765 4 4 765810 2 2 3 7 810855 3 5 5 1 14 5 1 1 7 855900 900945 4 1 5 Total dup 945vechime 990 1 2 3 6 5 8 14 4 3 40

3.GRAFICE
Evideniaz ntr-o form sugestiv distribuia valorilor, tendiele de evoluie, legturile dintre variabile sau structura colectivitii.

Elemente: titlul, coordonatele (X i Y), scara de reprezentare, legenda, sursa datelor, note explicative. Fiecare punct al graficului este definit n funcie de coordonatele sale.

3.1.Pictograma folosete simboluri pentru a reprezenta informaia statistic. Variante: a) simboluri multiplicate b) simboluri proportionale sugestive, uor de neles, dar cu nivel mai redus de precizie

a) Pictogram cu simboluri multiplicate

b) pictogram cu simboluri proporionale

3.2. Grafice prin coloane = valorile variabilei sunt reprezentate grafic prin coloane cu baze egale i nlimea proporional cu mrimea variabilei.
Coloane simple una pentru fiecare grup

Coloane multiple (grupate) compar variabile diferite pentru aceleai grupe.

Coloane de structur - compar structura grupelor

3.3.Benzi

Simple Grupate De structur

Ex.Distribuia elevilor unei coli dup desertul preferat (benzi grupate)

Piramida vrstelor

3.4.Cercuri de structur
sectoarele cercului reprezint proporiile grupelor colectivitii Etape: 1.Se calculeaz frecvena relativ a fiecrei grupe. 2.Se nmulesc frecvenele cu 360 pentru a obine dimensiunile sectoarelor n grade. 3.Se delimiteaz sectoarele cercului i se coloreaz/haureaz diferit.

Student response to the poll 'Should the college adopt student uniforms?'

Cercurile proporionale arat simultan dimensiunea i structura.

3.5. Cronograma > pentru serii cronologice


- Valorile variabilei sunt msurate pe OY, iar pe OX se trec unitile de timp - arat variaia n timp i tendina de evoluie, dar imaginea poate fi distorsionat de alegerea scrii de reprezentare.
Ex. Evoluia costurilor de producie (aceleai date, scri de reprezentare diferite)

originea diferit de zero

3.6.Corelograma (scatterplot)
identific legturile dintre variabile: variabila independent pe axa OX, variabila dependent pe axa OY originea graficului este ntotdeauna zero (0,0). fiecare unitate statistic e reprezentat printr-un punct; punctele nu sunt unite
300 250

200

150

100

50

0 0 200 400 600 800 1000 1200 1400

Venit saptamanal Xt

Cartogram: PIB/locuitor in 2004 (% din media UE 27) pe regiuni

Source: Eurostat Regional Yearbook 2007

3.7. Grafice pentru distribuii de frecvene


Histograma - fiecare grup e reprezentat printr-o coloan cu suprafaa proporional cu frecvena absolut a grupei respective - atunci cnd caracteristica reprezentat grafic are variaie continu, coloanele sunt lipite - cnd variaia e discret, exist spaii ntre coloane

Ex. Distributia muncitorilor dup producia zilnic (histogram)

nr. muncitori

producie (buc)

Poligonul frecvenelor se obine unind vrfurile coloanelor histogramei. Ex. Distributia muncitorilor dup producia zilnic (histogram i poligonul frecvenelor)

nr. muncitori

producie (buc)

Curbele frecvenelor cumulate (cresctor/ descresctor) Frecvena cumulat cresctor a unei grupe este numrul de uniti statistice cu valori sub limita superioar a intervalului de variaie. -> pentru reprezentarea grafic se folosesc limitele superioare ale intervalelor de grupare. Frecvena cumulat descresctor a unei grupe este numrul de uniti statistice cu valori peste limita inferioar a intervalului de variaie. -> pentru reprezentarea grafic se folosesc limitele inferioare ale intervalelor de grupare

Productia (buc)
0

Numr de Frecvene cumulate muncitori Cresctor Descresctor (ni)


1 3 4

sub 120 120-140 140-160 160-180 180-200 200-220 220-240 240 i peste Total

10 18 23 38 51 40 15 5 200

10 28 51 89 140 180 195 200 -

200 190 172 149 111 60 20 5 -

Ex. Curbele frecvenelor cumulate


225 200 175

nr. muncitori

150 125 100 75 50 25 0 100 120 140 160 180 200 220 240 260 produci a (bu c.)

Selectarea tipului de grafic


cerc sau coloan de structur pentru descrierea componentelor colectivitii (structura) coloane/ benzi pentru compararea unor variabile diferite pentru aceleai grupe, pt serii de timp i teritoriale cronograma pentru serii de timp corelogram pentru evidenierea legturii dintre dou variabile histogram, poligonul frecvenelor i curbele frecvenelor cumulate pentru distribuii de frecvene

Erori de reprezentare grafic


Prea multe variabile

Variatie nesemnificativ:
Fig. Numrul adulilor tineri care fac drumeii sptmnale, dup vrst, 1996 - 2002

Incorect:

Corect:

lips

origine incorect a graficului

Valori absolute, nedeflaionate (fig.1) n locul mrimilor relative (fig.2

1.Cheltuieli guvernamentale, 1930-1980

2.Ponderea cheltuielilor guvernamentale n PIB, 1930-1980

n timpurile strvechi nu exista

statistica, aa c oamenii erau nevoii s recurg la poveti. De aici exagerrile grosolane ale literaturii primitive: gigani, minuni, miracole... Ceea ce ei obineau cu minciuni, noi realizm cu statistica. n fond e acelai lucru! Anonim