Sunteți pe pagina 1din 78

INFORMATIC JURIDIC

Conf. univ. dr. Silvia LUCHIAN

SUPORT CURS

UNIVERSITATEA ALEXANDRU IOAN CUZA IAI


FACULTATEA DE DREPT

INFORMATIC JURIDIC

Conf. univ. dr. Silvia LUCHIAN

SUPORT DE CURS

Anul IV
Semestrul II

2014-2015

Cuprins

I. ROLUL STATISTICII N CUNOATERE........................................................................................................ 1


1. EVOLUIA TERMENULUI DE STATISTIC............................................................................................. 1
2. FENOMENE TIPICE VS FENOMENE COLECTIVE. .................................................................................. 3
3. SEMNIFICAII ALE TERMENULUI DE STATISTIC .................................................................................. 5
II. ELEMENTELE DEFINITORII ALE UNUI STUDIU STATISTIC ................................................................ 8
1. POPULAIE..................................................................................................................................... 8
2. CARACTERISTICA STATISTIC........................................................................................................... 9
3. EANTIONUL ................................................................................................................................ 12
4. OBSERVAIILE .............................................................................................................................. 14
Observaiile................................................................................................................................ 14
Prelucrarea statistic primar ................................................................................................... 15
Serii statistice............................................................................................................................. 18
1.
2.
3.

Serii cronologice ...............................................................................................................................................18


Serii teritoriale...................................................................................................................................................18
Serii de distribuie de frecvene pentru o variabil atributiv ..........................................................................19

Reprezentarea grafic a distribuiei frecvenelor ........................................................................ 20


III. TIPURI DE DIAGRAME N MICROSOFT OFFICE EXCEL...................................................................23
1. DIAGRAMA COLOAN .................................................................................................................... 23
2. DIAGRAM COLOAN STRATIFICAT ............................................................................................... 24
3. DIAGRAM STRUCTUR RADIAL .................................................................................................... 26
4. DIAGRAM LINIE ........................................................................................................................... 27
5. DIAGRAMELE RADAR ..................................................................................................................... 31
6. DIAGRAMELE ZON ....................................................................................................................... 31
IV. STATISTICA DESCRIPTIV........................................................................................................................33
1. ANALIZA SERIILOR STATISTICE ....................................................................................................... 33
2. STATISTICI DESCRIPTIVE PENTRU UN ATRIBUT CANTITATIV ................................................................ 33
2.1. Indicatorii tendinei centrale ................................................................................................ 33
2.2. Indicatorii variaiei ............................................................................................................... 37
2.3. Indicatori de asimetrie si aplatizare(Skewness i kurtosis).................................................. 41
V. LEGTURILE DINTRE FENOMENELE COLECTIVE .............................................................................54
1. SERIILE INTERDEPENDENTE.................................................................................................. 56
1.1. Tipuri de legturi ................................................................................................................. 56
1.2. Metode elementare de verificare a existenei legturilor ..................................................... 58
2. CORELAIA STATISTIC ................................................................................................................. 59
3. DREAPTA DE REGRESIE. ................................................................................................................ 64
4. COEFICIENT DE DETERMINARE ....................................................................................................... 65
MODELE DE TESTE DE VERIFICARE A CUNOTINELOR.69
BIBLIOGRAFIE .....................................................................................................................................................70

I. ROLUL STATISTICII N CUNOATERE


Chiar dac v-ai dat sau nu seama, cu siguran c majoritatea dintre dumneavoastr ai
fcut o analiz statistic la un moment dat. Situaia dumneavoastr bancar lunar, notele
dumneavoastr de la sfritul unui semestru, factura de telefon sunt exemple de date ce pot fi
colectate, n cursul a diferite perioade de timp, formnd seturi de date.
Deseori, n viaa de zi cu zi, folosim sau auzim expresii cum ar fi: "statisticile arat
c .", "o statistic simpl sugereaza c .." etc.. De multe ori, oamenii asociaz
statistica cu o simpl "colecie" de date.
1. Evoluia termenului de statistic
Faza descriptiv a statisticii echivala cu descrierea statului (de aici i denumirea
de statistic). , expunerea situaiei geografice, economice i politice. Se cunosc lucrri din
antichitate n care sunt informaii privind resursele umane, materiale militare, comerciale, etc.
In evul mediu existau deja coli de statistic ( nc din sec. XIII - XIV n Republica Veneia
se elaborau diferite rapoarte care conineau informaii privitoare la partenerii si comerciali i
au fost utilizate n politica comercial oficial ) care elaborau tratate n care toate aceste
informaii erau susinute cu cifre. In aceast perioada statistica devine un puternic instrument
n conducerea statal. Acest gen de statistic a fost cultivat mai nti de italieni. Curentul
"descrierea statului" a atins apogeul n sec. XVII- XVII cnd, n Germania, s-a constituit o
adevrat coal cunoscut sub denumirea de coala descriptiv german. Descrierea statului
a devenit disciplin de predare acadamic, ncadrat ntr-un sistem construit dup norme
teoretice i practice, care s-au elaborat i dezvoltat n universitile germane. Noua disciplin
a primit numele de statistic (Statistik).
Faza aritmeticii politice s-a dezvoltat n Anglia secolului XVI. Reprezentanii
acestei coli au pus accentul mai ales pe cercetarea fenomenelor demografice, recurgnd la
instrumentul matematic n cutarea legitilor unor fenomene. Studiile demografice lsau s
se ntrevad c previziunea fenomenelor colective putea avea o nsemntate practic
deosebit (de altfel tabelele de mortalitate i natalitate ntocmite n secolul XVIII au constituit
punctul de plecare al societilor de asigurare).
Faza probabilistic ncepnd cu secolul XVII statistica descriptiv devine obiect al
instituiilor publice iar domeniul conceptual al aritmeticii politice capt o nou dimensiune
odat cu introducerea calculului probabilitilor. Promotorii calculului probabilitilor:
1

Jacob Bernoulli (1645-1705)- n lucrarea Ars conjectandi formuleaz legea numerelor


mari, definete probabilitatea apriori

(deductiv), probabilitatea aposteriori (statistica

inductiv) i a schiat posibilitatea aplicrii calculului probabilitilor n economie.


Pierre-Simon Laplace (1749-1827)- n lucrarea Theorie analytique des probabilites a
evideniat avantajele calculului probabilitilor n studiul fenomenelor dependente de cauze
complexe.
Karl Friderick Gauss (1775-1855) definete legea de repartiie normal.
Simon Denis Poisson (1781-1840) descoper legea de repartiie a evenimentelor rare i
dezvolt aplicaii ale calculului probabilitilor n demografie
Faza modern a teoriei probabilitilor este marcat de A.N. Kolmogorov (1903) care, prin
axiomatizarea noiunii de probabilitate, a transformat teoria probabilitii ntr-o ramur a
tiinei matematice, logic construit, asemenea geometriei, pe baza unor axiome. Kolmogorov
este reprezentantul colii ruse din care mai fac parte Lyapunov, Hincin, Smirnov, Gnedenko
i alii. Datorit unor teoreme demonstrate de Kolmogorov se face conexiunea mai strns
ntre teoria probabilitilor i statistica experimental punndu-se bazele statisticii moderne.
Karl Pearson (1857-1936) i Ronald Fisher (1890-1962) extind preocuprile statisticii la trei
categorii de probleme, specificarea legii de repartiie, estimarea parametrilor, repartiia
estimatorilor i introduc noiunea de ipotez statistic.
Etapa informaional a statisticii se dezvolt dup apariia teoriei informaiei
(Shannon- 1948), considerat drept ramur a matematicii nrudit cu calculul probabilitilor,
care se ocup cu problemele matematice ale obinerii, transmiterii i stocrii informaiei,
modelul lui Shannon fiind statistico-probabilistic.
Etapa sistemic a gndirii statistice este o explicitare a ceea ce s-a realizat de-a lungul
timpului ntr-o nou terminologie impus de teoria general a sistemelor (L. von Bertalanffy)
i de cibernetic (N. Wiener).
Pe terenul statisticii au aprut i s-au dezvoltat numeroase discipline i teorii noi (biometria,
econometria, sociometria, jurimetria, cercetarea operaional, teoria deciziilor, etc.). Aceast
explozie de noi teorii justific afirmaia lui M. G. Kendall; Statistica n sensul cel mai larg
este baza oricrei tiine experimentale, adic o disciplin metodologic care ar trebui s fie
familiar tuturor cercettorilor ca i logica de altfel. Statistica, ca principal furnizor de
informaii, este indispensabil n activitatea de conducere, fie ea a unor procese economice,
politice, sociale etc. fie n conducerea unor procese tehnologice (de producie).
Dac cutm n Dicionarul explicativ gsim urmtoarea definiie pentru statistic:
2

tiin care culege, sintetizeaz, descrie i interpreteaz date referitoare la


fenomene generale(fenomene colective)
2. Fenomene tipice vs fenomene colective.
Fenomenele naturale, pe care diferitele discipline caut s le studieze izolat sau n
raporturile dintre ele se mpart , din punct de vedere al metodei de studiu n dou grupe distincte:
fenomene tipice i fenomene colective.
nainte de apariia tiinei, toate fenomenele preau atipice ,

grania dintre fenomenele

considerate tipice i cele considerate colective s-a modificat mereu

prin identificarea,

observarea i msurarea a noi factori ce influeneaz respectivele fenomene.


Fenomene tipice sunt caracteristice pentru anumite niveluri ale lumii anorganice care:
1. n condiii identice sau similare, se produc n aceeai form.; au numr restrns i precis
de cauze ;
2. experienele fcute n domeniul castor fennomane bonduc , prion repaitre , la acelai
rezultat, deci au legi rigide de guvernare, explicate prin formule matematice; exemple: P
= U*I, S=V*t
3.

pentru studiu se folosete experiena de laborator unit cu modelarea matematic

Fenomene colective: (generale) sau de mas spre deosebire de cele tipice, sunt fenomene
complexe, atipice, rezultate din aciunea combinat i reperat a unui numr mare de
factori de influen.
Fenomenelecolective, prin definiie, se caracterizeaz prin mai multe elemente specifice:
1. nu se pot reproduce identic aproape niciodat:
fenomene sociale , fenomene biologice, unele fenomene anorganice (meteorologie) ;
exemple: variaia preului petrolului, rate de schimb, variaia incidenei unei boli etc Astfel ,
pentru ca, din punct de vedere statistic, esena lor s fie pus n eviden este nevoie de un
numr mare de cazuri individuale. De exemplu, pentru formarea preului petrolului este
necesar un numr mare de productori i consumatori;
a. cauze foarte numeroase i foarte variate ;
b. caracterul esenial al variabilitii efectului unei cauze asupra manifestrii
fenomenului, adic o aceeai cauz ,adesea de minim importan, poate avea
cnd un efect neglijabil , cnd un efect de preponderen capital ;acest fapt d
fenomenelor colective nfiarea ntmplrii ,a hazardului ;
2. fenomenele de mas prin definiie - se caracterizeaz prin variabilitate. Variabilitatea
este un concept cheie n statistic. Indivizii n aparen asemntori prezint, de fapt,
numeroase trsturi distinctive.Astfel de diferene, mai mult sau mai puin
3

semnificative, pot fi nregistrate prin observaii sau msurtori. Aceast particularitate


se observ din faptul c fenomenele de mas sunt rezultate ale aciunii unui numr mare
de factori de influen cu esenialitate i natur diferit, asociai cu sensuri, direcii i
intensiti multiple. Aciunile unor factori de influen se pot compensa reciproc
deoarece ei se manifest n sensuri diferite;
-

fenomenele de mas sunt fenomene deterministe, de tip stohastic, produse n


condiii de incertitudine;

forma individual de manifestare a fenomenelor de mas este diferit.


Legitatea de manifestare a acestor fenomene nu poate fi cunoscut i verificat
n fiecare caz n parte ci numai la nivelul ntregului ansamblu de cazuri
individuale.

propriu statisticii este faptul c dei accept variabilitatea ca pe un dat natural,


nu nceteaz nici o clip s studieze sistemul de cauze (legile de probabilitate)
care o genereaz,n scopul de a institui asupra lor un control ct mai strict. n
viaa real nu exist constant venic. Rezultate produse de un sistem
constant de cauze variaz i, de fapt, ele pot varia ntre limite largi sau nguste.
Ele variaz, dar pun n eviden o caracteristic important numit stabilitate.
De ce aplicm termenii de constan i stabilitate unui sistem de cauze ce
genereaz rezultate care variaz? Deoarece o aceeai proporie a acestor
rezultate ce variaz continu s cad ntre dou limite bine stabilite, or de or,
zi de zi,atta timp ct sistemul constant de cauze continu s opereze. Deci, se
comport ca un sistem controlat de cauze, iar rezultatele lui pun n eviden
stabilitatea, se spune c acest proces este ntr-o stare de control statistic.

3. conceptul de fenomen de mas presupune luarea n considerare a raportului dintre


necesitate i ntmplare, dintre legea statistic (stohastic) i legea dinamic, dintre modelul
stohastic i modelul determinist.
Legea statistic (lege stochastica) nu poate fi cunoscut dect dac se ia n studiu un numr
mare de cazuri individuale care sunt legate ntre ele datorit aciunii diferite a acelorai
factori de influen.
Legile statistice, spre deosebire de cele dinamice, se manifest sub form de tendin i sunt
valabile pentru un ansamblu de uniti individuale.
n esen, rolul statisticii este de a determina, pe baza datelor empirice, informaii ct mai
precise asupra legii statistice de repartiie a formelor individuale ,ale fenomenelor de mas
care ne intereseaz.

Legitile statistice, tendinele obiective de dezvoltare a fenomenelor de mas necesit


depistarea tuturor cazurilor individuale, abstractizarea succesiv i eliminarea a tot ce
este neesenial i ntmpltor n producerea fenomenelor. Aceasta nseamn c statistica
studiaz fenomenele de mas din punct de vedere cantitativ i le interpreteaz ca fenomene
probabile. Ele au un grad mare de variaie de la o unitate la alta chiar dac aparin aceleiai
esene. Prin urmare, n cercetarea statistic este necesar s se in seama n mod obiectiv de
principiile teoriei probabilitilor, de cerinele legii numerelor mari (formulat de J.
Bernoulli n 1713). Aceast lege a statisticii arat c ntr-un numr suficient de mare de

cazuri individuale influenele factorilor se pot compensa n aa fel nct s


ajung la o anumit valoare tipic pentru ntreg ansamblul. O alt particularitate a
obiectului de studiu al statisticii este aceea c aceasta studiaz fenomenele de mas din punct
de vedere cantitativ n condiii specifice de timp, spaiu i organizare.
Prin abordarea statistic a fenomenelor de mas se realizeaz trecerea de la datele
individuale numeroase, amorfe, la un sistem de indicatori specifici unui ansamblu.
Prin urmare, obiectul statisticii l reprezint studiul cantitativ al fenomenelor de mas n
scopul cunoaterii legitilor lor de manifestare la nivelul ntregului ansamblu. Pentru
atingerea acestui obiectiv statistica apeleaz att la metodele generale de abordare, ct i la
numeroase metode specifice, pe care ea nsi le-a elaborat.
Definindu-se ca tiina fenomenelor de mas, statistica privilegiaz raionamente de tip
inductiv. Ea utilizeaz detaliul individual doar pentru a propune caracterizri de ansamblu.
Metodele statistice sunt inductive prin natura lor, deoarece generalizrile rezult din
observaii individuale. n plus, generalizrile deduse dintr-o investigaie statistic sunt
adevrate doar n medie. Ele pun n eviden numai comportamentul tipic al tuturor
obiectelor luate n studiu,dar nu descriu comportamentul elementelor luate separat, deoarece
exist o stabilitate mai mare n colectivitate dect n individ1.

3. Semnificaii ale termenului de statistic


Obiectul activitii de cercetare statistic presupune aciuni de proiectare i
organizare, de culegere, prelucrare, analiz i interpretare a datelor statistice. n urma
acestor operaii se obin informaiile necesare cunoaterii fenomenelor colective ce se
manifest n diferite forme de manifestare. Activitatea statistic este structurat nu numai n
1

B. N. Gupta n AnIntroduction to Modern Statistics, Brokland Private Ltd.,


Calcutta,1962,p.10.
5

funcie de etapele demersului statistic, ci i n funcie de diviziunea social a muncii, de


dezvoltarea sistemului informatic, de alte criterii. Din aceast cauz statistica se ntlnete ca
disciplin tiinific i ca domeniu de activitate: statistica teoretic, statistica matematic,
statistici de ramur (industrie, comer, agricultur, transporturietc.), statistica economiei
naionale, statistica financiar i actuarial, statistica muncii , etc. n funcie de obiectivul
urmrit, gradul de generalitate al concluziilor i de mijloacele utilizate, cercetarea statistic
presupune dou faze:

o faz descriptiv (exploratorie) = statistica descriptiv i

o faz inferenial (decizional) = statistica inferenial (statistica matematic)

ambele faze avnd scop subordonat cunoaterii.


Scopul principal i specific statisticii descriptive este acela de a sintetiza i
structura ntr-o manier ct mai direct i mai intuitiv, datele de observaie i informaia
coninut n acestea. n acest sens utilizeaz, de regul, tabele, grafice, indicatori numerici
etc. Atunci cnd observarea s-a fcut prin cercetare selectiv (eantionare) statisticii
descriptive i revine rolul de a pune n eviden proprietile eantionului i, pe aceast baz,
de a sugera diverse ipoteze cu privire la o posibil extindere a concluziilor la nivelul ntregii
populaii. Statistica descriptiv nu-i asum, ns, i rolul de a verifica valoarea de adevr a
acestei ipoteze. Un asemenea studiu reclam explicit apelul la modelele probabilistice i, n
consecin, face obiectul fazei infereniale a cercetrii statistice.
Dac statistica descriptiv, din punctul de vedere menionat anterior,mai este
denumit de unii autori statistica fr modele aleatoare, statisticii infereniale i revine rolul
de a extinde rezultatele obinute pe baza datelor din eantion la nivelul populaiei generale i
de a confirma sau invalida ipotezele emise a priori sau formulate dup faza exploratorie.
Metodologia statisticii infereniale se bazeaz pe teoria probabilitilor i prezint
caracteristici specifice cum ar fi:

caracterul aleator al eantionrii;

generalizarea concluziilor de la eantion la populaia statistic total prin


marje specifice de incertitudine;

recunoaterea explicit a nesiguranei prediciilor, deoarece incertitudinea


implicat este msurat n mod obiectiv i este supus unui control statistic n
limite ct mai strnse cu putin

.Considerentele privitoare la raportul statistic descriptiv statistic


inferenial prezentat anterior, sunt evideniate i n figura 1.

Figura 1.Raportul descriptiv inferenial n cercetarea statistic

II. ELEMENTELE DEFINITORII ALE UNUI STUDIU STATISTIC

1. Populaie
Populaie sau colectivitate statistic este o colecie de obiecte (entiti elementare,
indivizi), posednd toate o anumit caracteristic comun i care sunt supuse unui studiu
statistic( reprezint totalitatea elementelor de aceeai natur, care au trsturi eseniale
comune )
Colectivitatea statistic (sau populaia statistic) este o noiune fundamental a statisticii i
reprezint principala form sub care se delimiteaz i se definesc fenomenele
colective.Colectivitatea statistic este ntlnit i sub denumirea de populaie statistic sau
pur i simplu populaie.
Ea desemneaz totalitatea elementelor de aceeai natur care sunt supuse studiului statistic.
Aceasta nseamn c o mulime de elemente formeaz o colectivitate statistic numai dac au
aceeai natur, sunt asemntoare sau sunt omogene din punctul de vedere al anumitor
criterii. Populaiile pot fi finite sau infinite; concrete sau abstracte
Colectivitatea statistic se prezint ntr-o varietate de forme. Din acest motiv, una din
problemele eseniale ale unei cercetri statistice o reprezint delimitarea colectivitii
statistice n timp i spaiu, din punctul de vedere al coninutului i al formei de organizare.
n funcie de natura unitilor, colectivitile statistice sunt alctuite dintr-un ansamblu de:
persoane (populaia Romniei la recensmntul din 2011),
obiecte (parcul de maini din unitile de turism din Romnia la o anumit dat),
evenimente (cstoriile n cursul unei perioade; intrrile n contul unei societi
comerciale ntr-un trimestru etc.),
idei sau opinii (opiniile consumatorilor despre calitatea unor tipuri de mobil, maini de
uz casnic etc.).
De exemplu, dac dorim s studiem problema neparticiprii colare, atunci populaia va
consta din totalitatea copiilor de vrst colar din Romnia. Dac ns obiectul studiului este
gradul de poluare a localitailor urbane, atunci populaia va consta din toate oraele
Romniei. n statistic aadar, cnd ne referim la populaie avem n vedere mulimea
unitailor de analiz, indiferent ce reprezint acestea (coli, orae,ntreprinderi, ri, oameni
sau chiar procese, fenomene i aciuni).
Aceste exemple pun n eviden faptul c n statistic colectivitile statistice pot fi privite:
static (cnd exprim o stare, un nivel la un moment dat ) i
dinamic (cnd exprim un proces sau o devenire n timp).
8

Unitile colectivitii statistice sunt purttoare de informaii sau sunt subiectele logice ale
informaiei statistice deoarece asupra lor se efectueaz nemijlocit observarea. Unitile
colectivitii statistice exist la un moment dat. Unitile colectivitilor dinamice
desemneaz evenimente, procese sau fluxuri i se produc n decursul timpului, se refer la
perioada sau intervalul de timp n care se produc evenimente statistice.
Unitile statistice sunt simple i complexe.
Unitile simple reprezint elementele constitutive specifice naturii fenomenelor (de
exemplu, persoana fizic, angajatul, produsul etc.) i care formeaz aceeai
colectivitate.
Unitile complexe sunt formate din mai multe uniti simple, organizate n funcie de
criterii social-economice (de exemplu, ara,familie, echipa de lucru, grupe de studeni,
unitatea economic etc.). inteligenta unui student, poate fi exprimat printr-un
ansamblu de variabile.

2. Caracteristica statistic
Caracteristica statistic sau atributul variabil: desemneaz nsuirea, proprietatea,
trstura comun unitilor unei colectiviti statistice, reinut n programul statistic pentru a
fi nregistrat i care capt accepiuni sau valori diferite de la o unitate la alta sau de la un
grup de uniti la altul.
Exemple de caracteristici statistice pot fi: vrsta, greutatea, sexul, culoarea ochilor,numrul
de infraciuni , statutul matrimonial, naionalitatea, ocupaia, cifra de afaceri, nivelul
extrasului de cont etc.
Caracteristicile statistice se mai numesc variabile statistice sau variabile aleatoare ,
deoarece au proprietatea de a-i modifica valoarea n timp i spaiu de la o unitate la alta.
Asadar, o caracteristica studiata (de exemplu gradul de corupie ) ar putea fi reprezentat,
direct sau indirect, prin mai multe variabile statistice
Caracteristicile (variabilele) statistice pot fi clasificate n funcie de diferite criterii
a) n funcie de variaia manifestat de caracteristici acestea pot fi cu variaie continu sau
cu variaie discret (discontinu).
9 Variabila discret ia numai valori ntregi (numrul persoanelor dintr-o familie,
numrul de cauze soluionate de un judector , numrul de piese rebut dintr-un lot;
numrul de turiti la o staiune de turism montan etc.).

9 Variabila continu poate lua orice valoare ntr-un interval finit sau infinit. ,adic ,
ntre dou valori succesive ale variabilei pot exista o infinitate de valori
(greutatea,tonajul unui vas,cifra de afaceri).
Datele discrete sunt rspunsuri numerice care apar n urma unui proces de
numrare, n timp ce datele continue sunt rspunsuri numerice care apar n urma
unui proces de msurare.
b) Nivelul de msurare al variabilelor este un alt criteriu de clasificare a acestora,
. Putem distinge ntre patru niveluri de msurare (nominal, ordinal, de interval i de raport),
n funcie de trei criterii:
posibilitatea de a ordona valorile variabilei,
egalitatea intervalelor dintre valorile variabilei (sau altfel spus existena unei uniti de
msur),
existena unei "origini" a variabilei sau, cu alte cuvinte, a unui "zero absolut".
1. Nivelul de msurare nominal (de clasificare ) presupune clasificarea valorilor
posibile ale caracteristicii n categorii care trebuie s fie distincte, mutual exclusive
i exhaustive.
Acest tip de variabile (respectiv scalele folosite n msurare) indic numai faptul c
exist o diferen calitativ ntre categoriile studiate, nu i magnitudinea acestei
diferene. La limit, putem privi aceste variabile ca pe nite tipologii. Cteva
exemple de variabile msurate la nivel nominal sunt:
statutul

ocupaional

al

indivizilor

(agricultor,

salariat,

mic

ntreprinzator, omer etc.),

religia (ortodox, romano-catolic, greco-catolic etc.)

apartenena etnic (romn, maghiar, rrom etc.),

mediul de reziden (rural, urban) ,

tip de infraciune economic,juridic,de alt natur .a.m.d.).

Valorile acestui tip de variabile nu pot fi ordonate, sau cu alte cuvinte nu exist o
ierarhie (dect eventual conform unor criterii extrinseci) i n consecin problema
"distanei" sau a intervalelor dintre valori nici nu poate fi pus.
Numerele sunt atribuite observaiilor pentru a face doar judeci despre identiti sau
diferenieri de categorie. Cu ajutorul scalei nominale numerele repartizate unor
observaii servesc drept numele lor. Numerele sunt atribuite fiecrei categorii doar
pentru a identifica uniti similare din interiorul unei categorii i pentru a diferenia
aceste uniti similare de elementele unei alte categorii diferite.
Se face, astfel, o difereniere de specie, dar nu i de grad.
10

2. Nivelul de masurare ordinal implic nu numai clasificarea elementelor n categorii ci


i posibilitatea ordonrii acestora de la minim la maxim (existena tranzitivitii:
dac a>b i b>c, atunci a>c). Totui, la acest nivel de msurare nu este oferit nici o
informaie cu privire la "distana" dintre valorile scalei de msur. Cu alte cuvinte,
diferena dintre prima valoare i cea de-a doua poate fi diferit de diferena dintre a
patra i a cincea.
Exemple de variabile msurate la nivel ordinal sunt calificativele colare (cu
valorile "insuficient", "suficient", "bine" i "foarte bine"), satisfacia fa de anumite
aspecte ce apar n chestionare (cu valorile "foarte nesatisfcut", "nesatisfcut",
"satisfcut )
Unitile pot fi niruite una relativ cu cealalt i se poate realiza astfel, o
ierarhizare, dar distana ntre numerele acordate nu este obligatoriu egal.
Numerele pe scala ordinal nu reprezint intervale egale pe scala de msurare.
3. Msurarea la nivel de interval, ofer n plus fa de nivelul anterior (cel ordinal) i
informaie referitoare la distana dintre valorile scalei i este caracterizat de
existena unor intervale egale. Totui, la acest nivel de msurare nu exist un zero
absolut, ci mai degrab unul convenional. Exemple de astfel de scale de msurare
sunt temperatura msurat n grade Celsius (intervalele dintre valori sunt egale, dar
punctul 0 este convenional ales ca fiind temperatura la care apa inghea),
coeficientul de inteligen - IQ - (dac dou persoane au scoruri de 100 i respectiv
150, putem spune ca diferena dintre cei doi este de 50 de puncte, dar nu putem
spune c cel de-al doilea este cu 1/2 mai inteligent dect primul sau c scorul 0
semnific absena inteligenei).
Se face astfel posibil nu numai interpretarea ordinii notrilor pe scal, dar i a
diferenelor dintre ele.
4. Msurarea la nivel de raport include toate caracteristicile nivelurilor anterioare
(ordonare i intervale egale), plus existena unei "origini" sau zero absolut. Acest
lucru permite formularea unor afirmaii n termeni de proporii (raporturi) ntre
valori. De exemplu, vitezele de raspuns a doi subieci la un acelai stimul pot fi
comparate n termeni de "timpul de rspuns a fost de dou ori mai mare" etc..
Exemple de variabile masurate la acest nivel sunt vrsta, greutatea, nlimea,
distana, numrul de copii )
Corecta identificare a nivelului de msurare utilizat este foarte important n alegerea
procedurilor statistice de analiz. Dup cum se poate observa din descrierea de mai sus,
pentru fiecare nivel exista operaii matematice permise i operaii interzise. Astfel, la primul
11

nivel, cel nominal nu sunt permise nici ordonarea, nici operaii aritmetice (adunarea/scderea
,nmulirea/mprirea.) La nivelul ordinal este permis numai ordonarea, la cel de interval
sunt permise n plus i operaiile de adunare/scdere, iar la ultimul nivel, cel de raport sunt
permise toate operaiile.
n funcie de nivelul de msurare, vom vorbi despre variabile msurate la nivel nominal,
variabile msurate la nivel ordinal etc., sau, mai pe scurt, variabile nominale,
ordinale, de interval i de raport.
c) n funcie de modul de exprimare

9
9

variabile calitative (nivelurile nominal i ordinal) i


variabile cantitative (interval i raport) Sunt caracteristici msurabile..

d) n funcie de numrul variantelor/valorilor de rspuns pe care le pot lua,


9

caracteristici alternative (binare sau dihotomice), acelea care pot lua doar
dou variante de rspuns, dup modelul adevrat/fals din logic: sex (M/F),
stagiul militar (efectuat/neefectuat), starea civil (cstorit/necstorit);

caracteristici nealternative cele care pot lua mai multe valori/variante de


rspuns: salariu, profesie, cifr de afaceri, localitate de domiciliu etc.

3. Eantionul
Eantionul este o submulime a populaiei analizate.
Cu ct este mai numeroas o colectivitate, cu att devine mai dificil cercetarea tuturor
elementelor ei.. Soluia poate s fie, atunci, s extragem o subcolectivitate din colectivitatea
general (numit i colectivitate parial, eantion sau colectivitate de selecie).
Extragerea unui eantion din populaie este util i chiar necesar n condiiile n care
resursele (financiare, de timp etc.) de care dispun iniiatorii studiului nu sunt suficiente pentru
a asigura investigarea ntregii populaii.
Eantionul reprezint un subset de elemente selectate aleatoriu dintr-o colectivitate
statistic.
n felul acesta, se vor estima parametrii colectivitii totale pe baza rezultatelor obinute n
colectivitatea de selecie, iar ceea ce a fost determinat ca fiind tipic, esenial i caracteristic n
eantion, se presupune c ar fi fost gsit dac s-ar fi cercetat colectivitatea general.
Soliditatea acestei presupuneri depinde de modul cum a fost extras eantionul, iar de
acurateea acestui proces depinde succesul demersului statistic. Reprezentativitatea

12

eantionului este, aadar, aspectul crucial al oricrui proces de cercetare pe baz de sondaj
statistic.
Exemplu :Dac s-ar dori s se studieze problema srciei n Romnia.
n absena unui eantion, trebuie investigate peste 7 milioane de gospodrii, ceea ce ar duce la
costuri financiare mari i la o extindere a timpului rezervat culegerii de informaii. n acelai
timp, un subset din populaia analizat, extras conform unei scheme de eantionare riguroase,
poate furniza toat informaia necesar la un nivel de acuratee foarte ridicat.
Ratiunea eantionarii este limpede: prin efectuarea de studii asupra unei pari relativ mici
din populatie s strngem suficient informatie care sa ne permita sa inferam la nivelul
ntregii populaii asupra caracteristicilor studiate. Statistica

ne permite prin tratamentul

datelor obinute din grupuri mici de indivizi s extindem rezultatele la populatii mari.
Numarul indivizilor din esantionul ales este numit volumul eantionului si este notat de
obicei, atunci cnd ne referim la un esantion potential (esantionul nu a fost
precizat) prin litera n.
Eantionare subiectiv (exemple: selecia rocilor, pacieni pentru tratamente diferite)
Un eantion simplu aleator este aadar selectat astfel nct:
fiecare unitate statistic are o probabilitate egal de a fi aleas n eantion i
unitile sunt alese independent, fr legtur una cu cealalt.
Extragerea ntmpltoare a unitilor i alctuirea eantioanelor aleatoare se poate realiza prin
unul din urmtoarele procedee de selecie:
1.

metoda seleciei aleatoare (etichetarea tuturor indivizilor)

Procedeul urnei cu bile (procedeul loteriei), este un procedeu de selecie aleatoare care
poate fi realizat n varianta cu revenire sau fr revenire.
Se stabilete un cadru de identificare, astfel nct fiecare unitate din colectivitatea general
este numerotat de la 1 la N. Numerele sunt notate pe cartonae, bileele sau bile iar acestea
sunt amestecate atent. Se extrage apoi, la ntmplare, un cartona (bil) iar numrul citit
identific unitatea ce este considerat ca fcnd parte din eantion. Pentru aceast unitate se
nregistreaz toate caracteristicile ce fac parte din programul cercetrii.
n continuare, n varianta cu revenire (sondaj repetat), cartonaul (bila) este reintrodus n
urn, se repet amestecarea iar extragerea se repet pn cnd se obine eantionul de volum
n.
n varianta sondajului fr revenire (sondaj nerepetat), cartonaul

(bila) nu este

reintrodus n urn, ceea ce nseamn c o unitate statistic, o dat extras n eantion nu mai
are anse s mai reintre n colectivitatea de origine i s fie extras din nou.
13

2.

selecia sistematic (din k n k; periodiciti?)

Procedeul mecanic de selecie a eantionului presupune prelevarea unitilor din


colectivitatea general dup un interval predeterminat, denumit frecvent pas de numrare
aplicat bazei de sondaj.
Pasul de numrare se calculeaz ca N/n=k
Numrul iniial de la care se ncepe citirea se alege aleator ntre 1 i k, dup care se citete tot
a k-a unitate pn la completarea eantionului de n uniti statistice.
3.

selecia stratificat (proporiile straturilor)

Stratificarea const n divizarea colectivitii generale de studiat nstraturi, clase tipice ct


mai omogene, cu caracteristici ct mai asemntoare, astfel nct unitile statistice din
interiorul fiecrui strat s prezinte, cel puin din punct de vedere teoretic, caracteristici
comune specifice fiecrei clase. Straturile pot fi constituite din regiuni, judee, localiti,
medii, sexe, subdiviziuni economice, grupe de vrst etc. Cel mai frecvent, stratificarea se
folosete n studiul populaiei care se separ folosind clasificrile
oficiale sau, n funcie de scop, cercettorul i va face propria sa grupare, ca
de exemplu, dup profesie sau vechimea n producie.
4.

selecia pe grupe: strzi, careuri de teren, circumscripii

5.

selecia ierarhic: aleator judee .> comune > strzi >persoane.

4. Observaiile
Observaiile
Valorile nregistrate de aceeai caracteristic la unitile colectivitii statistice (populaie sau
eantion ) se numesc observaii.
Varianta/valoarea reprezint nivelul concret pe care l poate lua o variabil la
nivelul unei uniti sau grup de uniti statistice.
Frecvena de apariie a unei variante/valori reprezint numrul de apariii al acestei
variante/valori n colectivitate.
Datele statistice reprezint caracterizarea numeric obinut de statistic n legtur
cu unitile, grupele sau colectivitatea studiat.Datele statistice sunt mrimi
concrete, rezultate din studiile efectuate prin numrare, msurare sau calcul
statistic. Ele pot fi primare, prelucrate, publicate sau stocate n baze sau bnci de
date. Mesajul datelor statistice este informaia statistic.
14

Indicatorul statistic reprezint expresia numeric a unor fenomene, procese,


activiti sau categorii economice i sociale, definite n timp, spaiu i structur
organizatoric.
Procesul cunoaterii statistice presupune organizarea i parcurgerea unor etape distincte i
succesive care includ operaiile de observare sau culegere a datelor, de sistematizare i
prelucrare, de analiz i interpretare a rezultatelor.
Etapele cercetrii statistice sunt:
observarea statistic etap n care se culeg date i informaii statistice de la unitile
colectivitii, pentru toate caracteristicile urmrite;
prelucrarea statistic etap n care datele sunt sistematizate i sunt calculai
indicatorii statistici primari i derivai, absolui i sintetici ce caracterizeaz fenomenul
studiat;
analiza i interpretarea rezultatelor etap n care sunt verificate ipotezele, formulate
concluziile i fundamentate procesele decizionale.

Prelucrarea statistic primar


Dup ce datele statistice au fost colectate din surse de date publicate, din observri totale sau din
observri pariale ele trebuie organizate, n scopul de a avea o form care s permit prelucrarea
lor statistic divers. Cel mai bun mod de a le examina este s le sistematizm i apoi s le
prezentm n tabele i grafice. Putem atunci, s extragem cele mai importante trsturi, prin
analiza seriilor i graficelor statistice.
Principiile gruprii/clasificrii
Sistematizarea datelor se realizeaz prin gruparea i clasificarea
datelor statistice, adic prin mprirea lor n grupe/clase omogene, dup unul sau mai multe
criterii de grupare/clasificare.
O grup/clas este omogen dac unitile din interiorul ei tind s se asemene ct mai mult ntre
ele din punctul de vedere al criteriului utilizat, adic dac ntre unitile din aceeai grup/clas
exist variaii ct mai mici,

date de prezena factorilor aleatori, ntmpltori. Criteriul de

grupare/clasificare reprezint variabila (caracteristica) statistic n funcie de care sistematizm


datele.
Dac sistematizarea datelor se face dup o variabil nenumeric, procesul se numete
clasificare.
Gruparea reprezint sistematizarea datelor dup o variabil (caracteristic) numeric. n
funcie de tipul acesteia, gruparea se poate face dup o variabil discret sau continu.

15

2.2. Prelucrarea primar cuprinde operaii de clasificri, de grupri, de comparri, de

prezentare sub form de tabele, grafice sau serii statistice.


Datorit caracterului "ierarhic" i cumulativ al nivelurilor de msurare (de la multe restricii
ctre nici o restricie n ceea ce privete operaiile permise, sau de la "calitativ" la
"cantitativ"), vom putea ntotdeauna trata o variabil aflat la un nivel "superior" de msurare
ca i cum ar fi fost msurat la un nivel "inferior". Atunci cnd avem de-a face cu un esantion
mare (adic are un numr mare"de indivizi), de obicei variabilele numerice sunt nlocuite
prin variabile calitative, ordinale (care reprezint aceeasi caracteristica). Mai precis, datele
numerice sunt grupate ntr-un numar mic de clase. De exemplu, vrsta masurata n ani de
via va putea oricnd fi tratat ca o variabil ordinal, dac i grupm valorile (sub 20, 2130, 31-50, peste 50). Niciodat ns nu vom putea trata o variabil aflat la un nivel "inferior"
ca pe una aflat "mai sus" n ierarhie. (Cteodat, cercettorii fac excepie de la aceast
regul, tratnd variabilele ordinale ca i cum ar fi msurate la nivel de interval. Totui, o dat
cu dezvoltarea unor noi tehnici de analiz, dedicate special nivelelor de msurare "calitativ",
aceste practici devin din ce n ce mai rare.)
Gruparea pe intervale de variaie
Intervalul de variaie reprezint un ir de valori ale variabilei studiate, delimitat de intervalele
vecine prin limita inferioar i limita superioar. Intervalele de variaie pot fi de mrime egal
sau neegal.
Pentru gruparea pe intervale de variaie se recomand utilizarea unui numr moderat de
grupe. Deseori, un numr de 4 pn la 10 grupe este arbitrar recomandat, dar felul datelor poate
necesita un alt numr de grupe.

Numarul K deintervale este ales n strns dependen de problema studiat. Un numr prea
mic de intervale are dezavantajul c ascunde particularitile grupelor; din contra, un numr
mare de intervale face dificil reprezentarea grafic a rezultatelor.i deducerea modelului
probabilistic se face eronat
. Pentru structurarea colectivitii, pentru evidenierea grupelor (straturilor) tipice din
colectivitate, se pot forma grupri pe intervale egale de variaie sau pe intervale neegale.
Gruparea datelor pe intervale de variaie necesit stabilirea numrului

k de

grupe(intervale) i a mrimii intervalelor.


Nu exist o regul general valabil de determinare a numrului de grupe care trebuie s se
formeze. Cu toate acestea, alegerea numrului de grupe nu se face mecanic, ci presupune
cunoaterea variaiei caracteristicii numerice, elaborarea mai multor variante de grupe pn
se ajunge la soluia cea mai potrivit, conform cu forma concret de manifestare a
fenomenului urmrit. Scopul operaiei de grupare necesit formarea unui numr de grupe care
16

s nu fie nici prea mare, dar nici prea mic. Cert este faptul c numrul de grupe (k) trebuie s
fie direct proporional cu amplitudinea variaiei.

A = xmax - xmin , unde:


xmin = min (x1, x2, ..., xn)

xmax = max (x1, x2, ..., xn).

Pe baza amplitudinii i a numrului de grupe =k , se determin mrimea intervalelor de


variaie (h) dup relaia

h=A/k
n literatura de specialitate se recomand, n ipoteza repartiiei aproximativ normale a
unitilor colectivitii dup caracteristica urmrit, utilizarea relaiei lui Sturges pentru
determinarea mrimii intervalelor de variaie.

h =(xmax xmin)/(1+3,322 log10n)


Dup determinarea mrimii intervalelor de variaie este necesar s se determine limitele
inferioare i superioare ale intervalelor de grupare.
Stabilirea limitelor se poate face astfel:
- limita superioar a fiecrui interval s se preia ca limit inferioar a intervalului urmtor.
n felul acesta se obin intervale cu limit repetabil
- limitele inferioare i superioare ale intervalelor de grupare distincte, difereniate printr-o
unitate
La repartizarea amplitudinii variaiei pe intervale de grupare trebuie s se in seama de
urmtoarele recomandri:
- limitele de interval s se exprime prin numere ntregi;
- s se formeze un astfel de numr de intervale de grupare pentru a se obine informaii,
suficient de analitice, n vederea caracterizrii colectivitii;
- intervalele de grupare formate trebuie s permit, la nevoie, regruparea datelor fr s se
reia operaia de grupare sau de divizare a intervalelor;
- fiecare interval de grupare trebuie s cuprind un numr suficient de mare de valori
individuale care s faciliteze analiza statistic a frecvenelor.
n cazul n care se urmrete structura colectivitii (populaiei) simultan dup dou sau
mai multe caracteristici numerice, sau n cazul n care se urmrete analiza modului de
manifestare a interdependenelor dintre dou variabile, se elaboreaz gruparea combinat.
Pentru elaborarea gruprii combinate este necesar ca intervalele de variaie fixate pentru o
prim caracteristic (x) - de regul, caracteristica factorial, cauzal - s se divid n subgrupe
dup o a doua caracteristic rezultativ (efect). Aceasta din urm la rndul lor sunt divizate n
subsubgrupe dup o a treia caracteristic .a.m.d. Aceast caracterizare ierarhic adncete
analiza structurii colectivitii, ea reprezentndu-se sub forma unui graf arborescent.
17

Serii statistice
Seriile statistice reprezint o alt modalitate de prezentare a datelor. Rezultatul sistematizrii
datelor prin grupare/clasificare se constituie sub forma seriilor statistice.
Seria statistic este prezentarea ordonat a datelor referitoare la manifestrile unui fenomen
colectiv sub forma a dou iruri de date: unul privete variabila i modul cum a fost sistematizat,
iar al doilea frecvena de apariie sau nivelul unei variabile n raport cu primul ir.

Seria statistic, ca rezultat al sistematizrii i/sau gruprii, definete corespondena dintre


dou iruri de date statistice n care primul reprezint variaia caracteristicii urmrite, iar al
doilea ir cuprinde frecvenele de apariie a variantelor caracterisiticii.
1. Serii cronologice
Seriile cronologice (de timp sau dinamice) prezint evoluia n timp a unui fenomen sau

descriu un anumit proces;


Seriile cronologice reprezint seriile statistice ce se obin prin sistematizarea datelor dup o
variabil de timp. O serie cronologic este alctuit din dou iruri de date: unul cu privire la
unitile de timp, care pot fi momente sau intervale de timp, iar cel de-al doilea cu privire la
frecvena de apariie sau nivelul unui fenomen, nregistrat n aceste uniti de timp.
Dac unitile de timp sunt momente, atunci seria cronologic se numete de stoc (de momente),
iar dac unitile de timp sunt intervale (perioade), seria cronologic se numete de flux (de
intervale).

Anul
Infraciuni

2002

2003

2004

2005

2006

22.998

21.537 22.405 24.904 20.309

la

regimul
circulaiei

Infraciuni la regimul circulaiei www.politiaromana.ro


2. Serii teritoriale
Dac variabila pentru care se sistematizeaz datele este o variabil de spaiu (teritorial), adic
elementul ce difereniaz manifestrile fenomenului analizat este locul unde acestea s-au produs,
atunci rezultatul este o serie teritorial (de spaiu).
Regiunea de

Nord

dezvoltare

Est

Sud
Est

Sud
Muntenia

Sud
Vest
Oltenia

18

Vest

Nord
Vest

Centru

Bucureti Ilfov

Persoane

12115

condamnate

7735

7075

6715

5343

7375

6200

4147

definitiv

www.insse.ro
3. Serii de distribuie de frecvene pentru o variabil atributiv
n forma cea mai general o serie statistic cu o singur caracteristic x se prezint astfel:

x1 x2 ... x r. xn
n1 n2 ... nr.. nn
Unde: x1, x2, ..., xn sunt variante nregistrate pentru caracteristica x

n1, n2, ..., nr sunt frecvenele de apariie ale variantelor caracteristicii x.


Infractiuni Infractiuni
judiciare

economice

75076

74339

Infractiuni
de

alta

natura
82222

www.politiaromana.ro
Seriile de distribuie de frecvene alctuite dup o variabil cantitativ (numeric), poart numele
de distribuii heterograde.
Seriile de distribuie de frecvene alctuite dup o variabil calitativ (nenumeric) poart numele
de distribuii homograde.

FRECVEN
Frecvena unei observaii n eantion:este numrul de apariii ale acelei observaii (valori)
n eantion.
Frecvena relativ a unei observaii n eantion: raportul dintre numrul de apariii ale
observaiei n eantion i numrul total de observaii(dimensiunea eantionului)
Distribuia frecvenelor
a) Distribuia frecvenelor ( pentru un atribut variabil discret): mulimea tuturor
observaiilor distincte, mpreun cu frecvenele lor relative n eantion.

fumat

Intens

Rar

Nu

Frecvena absolut

7149

2818

6563

16500

Frecvena relativ

0.433

0.170

0.397

1.00

b) Distribuia frecvenelor ( pentru un atribut variabil continuu )


Clas interval: un subinterval inclus ntre valorea minim i cea maxim.
Frecvena clasei interval: numrul de observaii ce aparin clasei respective.
19

Total

Distribuia frecvenelor unui atribut variabil continuu: mulimea claselor interval mpreun
cu frecvena fiecreia.

Numar

mijlocul

frecvente

frecvente

amnri intervalului absolut

relative

cumulate

0.5

0.03

1.5

0.14

2.5

0.24

12

3.5

0.10

15

4.5

0.14

19

5.5

0.10

22

6.5

0.07

24

7.5

0.03

25

8.5

0.03

26

9.5

0.07

28

10

10.5

0.03

29

29

1.00

total

Frecvena

Forma general a seriei statistice conine informaii cu privire la succesiunea, mrimea


valorilor nregistrate i a frecvenelor (absolute sau relative )corespunztoare;
- ntre cele dou iruri de date exist o legtur univoc, n sensul c unei valori individuale
oarecare i corespunde o anumit frecven, respectiv un numr care arat de cte ori se
repet valoarea individual respectiv.
Elaborarea seriilor i tabelelor statistice reprezint nu numai un mijloc eficient de prezentare
a datelor statistice dar i o operaie premergtoare pentru reprezentarea grafic.

Reprezentarea grafic a distribuiei frecvenelor

Histograme:

X axa valorilor;

Y axa frecvenelor(absolute sau relative);


20

aria fiecrui dreptunghi proporional cu frecvena relativ respectiv.


histograma nr.aminari
0.30
frecvente relative

0.25
0.20
0.15

frecvente relative

0.10
0.05
0.00
0

10

nr.am inari

Figura 2. Histograma

Poligonul frecvenelor: se unesc centrele laturilor superioare ale dreptunghiurilor din


histogram.
poligonul frecventelor nr. aminari
0.30
frecvente relative

0.25
0.20
histograma

0.15

poligonul frecventelor

0.10
0.05
0.00
0.5

1.5

2.5

3.5

4.5

5.5

6.5

7.5

8.5

9.5 10.5

nr aminari

Figura 3. Histograma i poligonul frecvenelor

Frecvene cumulate (ogiva): suma frecvenelor valorilor mai mici dect o valoare
dat
se aplic n special pentru variabile continue.

21

frecvente cumulate nr.aminari


35
frecvente absolute

30
25
20

frecvente cumulate

15
10
5
0
0

nr aminari

Figura 4. Ogiva

22

10

III. TIPURI DE DIAGRAME n Microsoft Office Excel


Diagramele transform datele n imagini. Diversele tipuri de diagrame pot transmite
mesaje diferite pornind de la aceleai date.
Serie de date: puncte de date nrudite care sunt reprezentate grafic ntr-o diagram.
Fiecare serie de date dintr-o diagram are o culoare sau un model unic i este reprezentat
n legenda diagramei. ntr-o diagram se pot reprezenta grafic una sau mai multe serii de
date.

2004

2005

2006

2007

2008

75.076

70.344

82.359

122.903

124.815

74.339

56.492

59.85

56.356

55.871

82.222

81.403

90.45

102.198

108.645

1.006

961

1.077

1.305

1.344

Infraciuni
judiciare
Infraciuni
economice
Infraciuni

de

alt natur

volumul
criminalitatii
=infraciuni la
100.000
locuitori

http://www.politiaromana.ro/infractiuni_2002_2008.htm

Prin selectarea celui mai eficient tip de diagram datele vor deveni mai clare, mai puternice i
mai informative. Microsoft Office Excel ofer o varietate larg de tipuri de diagrame i de
metode simple pentru selectarea i examinarea acestora.

1. Diagrama Coloan
O diagram Coloan compar direct valorile
ncepei prin selectarea datelor pe care le reprezentai pe diagram, precum i titlurile
coloanelor i ale rndurilor. Apoi, pentru a deschide Expert diagram, facei clic pe butonul
Expert diagram

de pe bara de instrumente Standard.

Cnd se deschide expertul, avei selectat tipul de diagram Coloan. O diagram Coloan
este un tip de diagram bun pentru compararea direct a valorilor. Cnd selectai un tip de
diagram, este bine s o meninei simpl, astfel nct mesajul redat s fie clar.
23

Compararea tipurilor de infractiuni


140
numar infractiuni

120
100
Infraciuni judiciare

80

Infraciuni economice

60

Infraciuni de alt natur

40
20
0
2004

2005

2006

2007

2008

anii

Figura 5. Diagram Coloan(datele pe coloan)

Compararea anilor pentru fiecare tip de infractiune


140

numar infractiuni

120
100

2004
2005

80

2006

60

2007

40

2008

20
0
Infraciuni judiciare

Infraciuni economice

Infraciuni de alt natur

Figura 6. Diagram Coloan(datele pe linie)

2. Diagram Coloan stratificat


O diagram Coloan stratificat compar componente din mai multe totaluri
Ce se ntmpl dac dorii s comparai contribuiile fiecrui tip de infraciune, la totalul
anului? Avei posibilitatea s scoatei n eviden n mod diferit aceleai date prin crearea
unui alt tip de diagram, Coloan stratificat.
24

Pentru a modifica din Coloan n Coloan stratificat, facei clic cu butonul din dreapta al
mousului pe bordura diagramei pentru a o selecta, apoi facei clic pe Tip de diagram din
meniul de comenzi rapide. (Alegem diagrama din figura 5)Se va deschide caseta de dialog
Tip de diagram n care este selectat tipul de diagram Coloan. n partea dreapt a casetei
de dialog, selectai din diferitele forme de diagrame Coloan prezentate n zona Subtip de
diagram. Tipul de diagram se modific atunci cnd facei clic pe un subtip, apoi pe OK.
Compararea anilor dupa total infractiuni/an
350

numar infractiuni

300
250
Infraciuni de alt natur

200

Infraciuni economice

150

Infraciuni judiciare

100
50
0
2004

2005

2006

2007

2008

Figura 7. Diagram Coloan stratificat

O diagram Coloan stratificat compar participrile diferitelor valori la un total, afind


uniti sau procente.
Compararea anilor dupa evolutia fiecarui tip de infractiune

numar infractiuni

100%
80%
Infraciuni de alt natur

60%

Infraciuni economice
40%

Infraciuni judiciare

20%
0%
2004

2005

2006

2007

Figura 8. Diagram Coloan stratificat procentual


.

25

2008

Diagrama de aici este o diagram Coloan stratificat 100%, care afieaz participrile sub
form de procente.
Utilizarea subtipului Coloan stratificat sau a subtipului de baz Coloan grupat depinde de
mesajul pe care dorii s-l clarificai; probabil c le-ai utiliza pe ambele. Fr s modificai
diagrama, avei posibilitatea s ncercai caseta de dialog Tip de diagram pentru a vedea
modul n care vor arta datele n diferite tipuri i subtipuri de diagrame. Selectai un tip i
examinai-l executnd clic i meninnd apsat butonul Apsai i inei apsat pt.
vizualizare eantion. Cnd tii exact ceea ce dorii, apsnd pe OK facei modificarea.

3. Diagram Structur radial


O Diagram de structur radial compar prile dintr-un total
Ce se ntmpl dac dorii imaginea mare? Avei posibilitatea s creai o Diagram de
structur radial. Aceasta este destinat prezentrii comparaiilor din cadrul unui singur set de
valori i prezentrii modului n care componentele contribuie la ntreg.. Spre deosebire de o
diagram Coloan, care poate s reprezinte un numr mare de valori, o Diagram de
structur radial nu poate s afieze dect un singur set de valori
Cum se obine o asemenea structur? n primul rnd, trebuie s selectai titlurile i totalurile
coloanelor de pe foaia de lucru . Apoi facei clic pe butonul Expert diagram

de pe bara

de instrumente Standard pentru a deschide expertul, n care trebuie s selectai tipul


Diagramei de structur radial.
2002

Infraciuni judiciare
31%

33%
Infraciuni
economice
Infraciuni de alt
natur

36%

Figura 9. Diagram structur radial

26

Diagramele de structur radial sunt disponibile n numeroase subtipuri, precum 3-D,


care are aspect vizual atractiv dar poate s fie mai dificil de neles dac are multe seciuni.
Din nou, selectai forma de diagram care este cea mai eficient pentru reprezentare.

4. Diagram Linie
O diagram linie compar datele n timp
Diagrama linie este un tip de diagram corespunztor pentru prezentarea modificrilor i a
tendinelor n timp. Pentru aceasta, facei clic cu butonul din dreapta al mousului pe bordura
diagramei pentru a o selecta, apoi facei clic pe Tip de diagram din meniul de comenzi
rapide. Dup deschiderea casetei de dialog Tip de diagram, selectai o Diagram linie din
lista Tip de diagram.
Compararea anilor dupa evolutia fiecarui tip de infractiune
140

numar infractiuni

120
100
Infraciuni judiciare

80

Infraciuni economice

60

Infraciuni de alt natur

40
20
0
2004

2005

2006

2007

2008

Figura10. Diagram linie

Selectarea ntre o Diagram linie i o diagram XY prin puncte


Cnd deschidei Expert diagram sau caseta de dialog Tip de diagram, diagramele Linie i
diagramele XY (prin puncte) arat similar n lista Tip de diagram. Este important s o
selectai pe aceea care v ajut. Aici sunt cteva linii de ghidare care s v ajute n alegere.
Diagramele Linie sunt bune pentru afiarea tendinelor n timp ale unor cifre de afaceri
precum vnzri, venituri i profituri. Utilizai o Diagram linie dac dorii date n partea
inferioar a diagramei, pentru a face dezvoltrile istorice vizibile dintr-o privire. Diagramele
linie au de obicei un singur set de numere, prezentat pe axa vertical.
O Diagram XY (prin puncte) compar odat dou seturi de numere, unul de pe axa
orizontal X, altul de pe axa vertical Y. Valorile datelor sunt mprtiate n diagram. Avei
opiunea s conectai valorile prin linii, dar aceste linii nu arat tendinele n timp.
27

infractiuni la 100000
locuitori

evolutia in timp a volumului criminalitatii =infraciuni la 100.000


locuitori
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0
2003

volumul criminalitatii
=infraciuni la 100.000
locuitori

2004

2005

2006

2007

2008

2009

anii

Figura11. Diagram XY (prin puncte)


Diagramele XY (prin puncte) sunt bune pentru afiarea comparaiei de numere
precum date tiinifice sau statistice, unde mai multe msurri trebuie reprezentate grafic pe o
singur diagram. (de exemplu pentru a prezenta cte cazuri de infraciuni sunt pentru diferite
grupe de vrst n funcie de veniturile medii ).
O diagram XY (prin puncte)poate s fie un tip eficient de reprezentare a datelor.
Pentru a aranja date ntr-o foaie de lucru pentru o diagram prin puncte, ar trebui s plasai
valorile x ntr-un rnd sau coloan, apoi s introducei valorile y corespondente n rndurile
sau coloanele adiacente.

Figura12. Diagram XY (prin puncte)


Diagramele prin puncte au urmtoarele subtipuri de diagrame:

28

Prin puncte doar cu marcaje Acest tip de diagram compar perechi de valori.
Utilizai o diagram prin puncte fr linii cnd avei date ntr-o anumit ordine.

Prin puncte cu linii fine i prin puncte cu linii fine i marcaje Acest tip de
diagram poate fi afiat cu sau fr o curb fin care conecteaz punctele de
date. Aceste linii pot fi afiate cu sau fr marcaje. Utilizai diagrama prin
puncte fr marcaje dac exist multe puncte de date.

Prin puncte cu linii drepte i prin puncte cu linii drepte i marcaje Acest tip
de diagram poate fi afiat cu sau fr linii drepte care conecteaz punctele de
date. Aceste linii pot fi afiate cu sau fr marcaje.

Preluarea mai multor informaii n diagrame


Utilizai dou tipuri de diagrame n cadrul unei diagrame pentru a crea o diagram
combinaie.
Uneori, un anumit tip de diagram este cel mai potrivit pentru o parte a datelor, dar
pentru restul datelor este mai potrivit un alt tip de diagram. Nu trebuie s alegei dintre cele
dou, deoarece Excel ofer posibilitatea combinrii a dou sau mai multe tipuri ntr-o singur
diagram
O diagram combinaie este uor de creat.
n acest exemplu, trebuie s facei clic pe o coloan a infraciunilor de alt natur
pentru a selecta toate coloanele acelei serii de date. Apoi trebuie s selectai un tip de
Diagram linie din caseta de dialog Tip de diagram.
Compararea anilor dupa evolutia fiecarui tip de infractiune
140

numar infractiuni

120
100
Infraciuni judiciare

80

Infraciuni economice

60

Infraciuni de alt natur

40
20
0
2004

2005

2006

2007

Figura 13.Diagram combinaie (coloan cu linie)

O a doua ax prezint valori foarte diferite

29

2008

Uneori diferitele seturi de date dintr-o diagram combinaie sunt att de diferite nct necesit
ceva mai mult clarificare. Chiar dac sunt afiate diferit, nu avei posibilitatea s vedei
valorile mai mici.

numar infractiuni

Compararea anilor dupa evolutia fiecarui tip de infractiune si


adaugarea criminalitatii
140

1.6

120

1.4

100

1.2
1

80

Infraciuni judiciare

Infraciuni economice

0.8

60

0.6

40

0.4

20

0.2

0
2004

2005

2006

2007

2008

Infraciuni de alt natur

volumul criminalitatii
=infraciuni la 100.000
locuitori

Figura 14 Diagram combinaie cu dou axe Oy

Aceast problem se poate rezolva prin adugarea unei alte axe a diagramei, secundar. Prin
reprezentarea valorilor criminalitii pe propria ax se uureaz nelegerea Diagramei linie,
Pentru a crea o ax secundar, trebuie s selectai tipul de diagram pentru care dorii axa,
apoi trebuie s efectuai cteva selecii n caseta de dialog Formatare serie de date.

O diagram care utilizeaz datele din list adaug automat informaiile


noi
Exist o nou modalitate de a menine actualitatea diagramelor n Excel.
Cnd modificai datele din foaia de lucru, Excel actualizeaz automat toate diagramele care
utilizeaz datele. Dar ce se ntmpl dac adugai un ntreg rnd de date la o foaie de lucru?
Diagrama nu se modific. Aceasta dac nu este o diagram care utilizeaz datele la care ai
aplicat noua caracteristic List.
Dac utilizai comanda List din meniul Date din Excel pentru a trece datele ntr-o list,
apoi creai o diagram cu acele date, toate rndurile noi care au fost adugate n partea
inferioar a listei sunt adugate automat la diagram.

30

5. Diagramele radar
Datele care sunt aranjate n coloane sau rnduri ntr-o foaie de lucru pot fi reprezentate ntr-o
diagram radar. Diagramele radar compar valorile agregate ale unui numr de serii de date
care indica evolutia in timp Diagramele de structur radial au numai o serie de date.
volumul criminalitatii =infraciuni la 100.000 locuitori
2004
1.4
1.2
1
0.8
0.6
2008

2005

0.4
0.2
0

2007

volumul criminalitatii
=infraciuni la 100.000
locuitori

2006

Figura 15. Diagrama radar

Diagramele radar au urmtoarele subtipuri de diagrame:

Radar i radar cu marcaje Cu sau fr marcaje pentru punctele de date


individuale, diagramele radar afieaz modificrile valorilor relativ la un punct
central.

Radar plin ntr-o diagram radar plin, suprafaa acoperit de o serie de date
este umplut cu o culoare.

6. Diagramele zon
Datele care sunt aranjate n coloane sau rnduri pot fi reprezentate ntr-o diagram zon.
Diagramele zon accentueaz magnitudinea schimbrii n timp i pot fi utilizate pentru a
atrage atenia asupra valorii totale n funcie de o tendin. De exemplu, datele care reprezint
profitul n timp pot fi reprezentate ntr-o diagram zon pentru a accentua profitul total.
Afind suma valorilor reprezentate, o diagram zon arat i relaia prilor cu ntregul.
Diagramele zon au urmtoarele subtipuri de diagrame:

Zon i zon n 3-D Diagramele zon afieaz tendina valorilor n timp sau n
categorii. O diagram zon n 3-D afieaz n acelai mod dar prezint zonele n
31

format 3-D. Pentru a prezenta datele n format 3-D, care utilizeaz trei axe
(axele orizontal, vertical i adncime) ce pot fi modificate, ar trebui s utilizai
subtipul de diagram zon 3-D.

Zon stratificat 100% i zon stratificat 100% n 3-D Diagramele zon


stratificat 100% afieaz tendina procentului cu care contribuie fiecare valoare
n timp sau n categorii. O diagram zon stratificat 100% n 3-D afieaz n
acelai mod dar prezint zonele n format 3-D;

evolutia tipurilor de infractiuni in timp

Infraciuni
judiciare

50
Infraciuni
economice

Infraciuni de
alt natur

100

2004

2005

2006

2007

nr.infractiuni

150

0
2008

anii

Figura 16. Diagrama zon n 3-D


evolutia tipurilor de infractiuni in timp
100%

nr.infractiuni

80%

60%

Infraciuni de alt natur


Infraciuni economice
Infraciuni judiciare

40%

20%

0%
2004

2005

2006

2007

anii

Figura 17. Diagrama zon stratificat 100%

32

2008

IV. STATISTICA DESCRIPTIV

1. Analiza seriilor statistice


Evaluarea anumitor indicatori (parametri) statistici implic stabilirea caracteristicilor
(proprietilor) principale ale seriilor statistice. Acestea sunt: variabilitatea, omogenitatea,
independena i concentrarea/mprtierea (dispersia) ctre/fa de un una sau mai multe
valori ale seriei.
Variabilitatea termenilor unei serii statistice este determinat de faptul c fenomenul
pe care l reprezint nu este univoc determinat, ci apare ca un rezultat al aciunii combinate a
mai multor cauze (permanente sau ntmpltoare). Cu ct aciunea cauzelor ntmpltoare
este mai mare, cu att variabilitatea este mai mare i gradul de omogenitate mai mic.
Omogenitatea presupune o variaie minim ntre termeni. Dac n urma analizei se
constat c o serie nu prezint omogenitate, nseamn c n acest caz colectivitatea este
format din mai multe tipuri calitative i seria trebuie descompus n subserii componente.
Independena termenilor unei serii provine din faptul c fiecare valoare individual
reprezint un element distinct i obiectiv al unei populaii statistice. Termenii ce aparin
aceleiai colectiviti se supun acelorai legi care se manifest sub form de tendin.
Concentrarea/mprtierea (dispersia) ctre/fa de un /una sau mai multe valori ale
seriei apare ca rezultat al intensitii unui efect produs de cauze eseniale i ntmpltoare.
Acest lucru determin frecvenele diferite de apariie a diferitelor valori din serie. Dac
intensitatea factorilor este uniform, frecvenele de apariie sunt apropiate. n caz contrar,
frecvenele de apariie se concentreaz fie la un singur capt al seriei, fie ctre o valoare
central.

2. Statistici descriptive pentru un atribut cantitativ


2.1. Indicatorii tendinei centrale
n urma observrii caracteristicii cantitative X n n probe se obin urmtoarele date
primare:
x1, x2,..., xn

(1)

33

Gruparea datelor se face n funcie de tipul caracteristicii X. Astfel, dac X este o


variabil discret ce poate lua valorile distincte v1, v2 ,..., vn , atunci n locul datelor iniiale se
va reine repartiia empiric:

v1.v2 ...vm

n1.n2 ...nm

(2)

Unde ni, (i=1, m) reprezint frecvena apariiei (numrul de apariii) valorii vi, iar n reprezint
numrul valorilor din irul iniial (1) i se numete frecven absolut a valorii v. Valoare m
reprezint numrul de clase.
Raportul fj =nj/n dintre frecvena absolut i numrul total de probe se numete
frecven relativ. Se observ c

f1 + f2 ++ fm =1 ntruct n1 +n2 + ... +nm = n.


Frecvenele relative, numite impropriu i probabiliti de apariie, stau la baza calculrii
densitii de repartiie a frecvenelor i a indicatorilor care exprim gradul de concentrare. De
asemenea permit compararea a dou repartiii construite pe aceeai variabil, care difer
numai prin numrul unitilor pe grupe.
Atenuarea datelor, care accidental sunt prea mari sau prea mici dintr-o populaie
statistic se face prin calcularea unor medii, n felul acesta fcndu-se o compensare a
valorilor individuale. Acest calcul ne arat o anumit tendin a fenomenului studiat, media
statistic fiind o valoare ce sintetizeaz ntr-o singur expresie numeric toate valorile din
seria msurtori sau observaii. Termenii seriei difer de medie deoarece au fost influenai de
diferii factori.
Media aritmetic

Media aritmetic simpl exprim un nivel mediu, anihilnd abaterile individuale,


netipice. Ea este cuprins ntre valoraea cea mai mare i cea mai mic.
Definiia 1. Dac n urma unei selecii apar valorile distincte x1, x2,..., xn, atunci media

aritmetic este dat de formula:

x=

x1 + x2 + ... + xn 1 n
= xi
n
n i =1

34

n cazul datelor centralizate (n care avem repartiia de frecven (2)):

x=

n1v1 + n2 v2 + ... + nn vn 1 n
= ni vi
n
n i =1

care se mai numete medie aritmetic ponderat. Numrul care arat de cte ori se repet
fiecare valoare (nj) este "ponderea" valorii respective.
Observaia 1. Media aritmetic are dezavantajul c este sensibil la valori extreme,

iar dac termenii sunt prea "mprtiai", tinde s devin o valoare nereprezentativ. Media
aritmetic este o valoare lipsit de coninut dac elementele sunt deosebite din punct de
vedere calitativ, caz n care este mai util s se fac medii pariale pentru fiecare tip de
colectivitate.
Observaia 2. Dac avem mai multe medii, fiecare referindu-se la o anumit

categorie, fiecare medie va fi ponderat n funcie de importana categoriei sale.


Media geometric

Media geometric este mai puin sensibil la valorile extreme dect celelalte medii,
deci se ntrebuineaz cnd dorim s atenum divergenele mari dintr-o serie de determinri
cu frecvene egale, fiind dup o expresie "cea mai exact medie". Se utilizeaz cnd valorile
au o evoluie (de cretere sau scdere) permanent, nentrerupt, sau o raie din ce n ce mai
mare, termenii fiind legai ntre ei printr-o relaie de produs. De asemenea se mai
ntrebuineaz cnd vrem s dm o importan mai mare termenilor mai mici, n valoare
absolut, sau cnd diferenele ntre termeni sunt foarte mari. Are dezavantajul c nu se poate
ntrebuina cnd avem valori nule sau negative.
Definiia 2. Dac x1, x2,..., xn sunt n valori, media geometric se definete prin

M g = n x1 x2 ...xn

Calculul se face mai uor cu ajutorul logaritmilor:

lg M g =

1 n
lg xi
n i =1

35

Datorit faptului c se calculeaz mai uor cu ajutorul logarimilor, se mai numete


"medie logaritmic". Ea se utilizeaz i la calcularea ritmului (de cretere sau descretere)
numindu-se astfel i "medie de ritm". n rezumat, se ntrebuineaz cnd:
- seria are o mare dinamicitate;
- termenii au variaii mari;
- distribuia are un caracter pronunat de asimetrie.
Observaia 3. Media geometric se folosete atunci cnd prezint importan

variaiile relative. De asemenea media geometric poate fi folositoare pentru calculul unor
rapoarte.
Media ptratica se ntrebuineaz cnd valorile prezint creteri din ce n ce mai

mari. Ea constituie modelul matematic pentru abaterea medie ptratic. Media este sensibil
la valori extreme, din care cauz este ntotdeauna mai mare dect celelalte medii. Are
avantajul c se poate aplica i n cazul valorilor nule sau negative (care prin ridicare la ptrat
devin pozitive). Se ntrebuinzeaz cnd dm importan valorilor mari.
Definiia 3. Media ptratic este definit prin formula:

x patr , s =

1 n 2
xi
n i =1

sau n cazul datelor centralizate (media ponerat):

x patr , p =

1 n
ni vi2

n i =1

Media Armonic
Definiia 4. Media armonic este valoarea invers a mediei aritmetice ale valorilor
inverse datelor de observaie:

Mh =

n
n

x
i =1

36

Exprim caracterul sintetic al unor valori ce se afl n raport invers. Se utilizeaz cnd
frecvenele sunt egale. Pentru o repartiie de frecven, media armonic se folosete rar. Se
utilizeaz cu predilecie n economie.

Media glisant numit i "medie mobil", se utilizeaz n cazul n care irul valorilor
prezint fluctuaii mari, brute i e greu de apreciat tendina (trendul). Se presupune c media
glisant corespunde mijlocului intervalului sintetic. Calculul se face mediind 3 sau 5 valori
alturate.

Definiia 5. Media glisant pentru 3, respectiv 5 valori alturate sunt date de formulele

xglis ,3 =

xi 1 + xi + xi +1
3

xglis ,5 =

xi 2 + xi 1 + xi + xi +1 + xi + 2
5

Mediana
Definiia 6. Mediana este elementul dintr-un ir de date statistice care ar mpri intervalul n
dou grupe egale ca numr, dup ce acestea au fost ordonate dup mrimea lor. Dac seria
are 2n+1 elemente, atunci mediana este elementul n+1, iar dac are 2n elemente mediana este
media aritmetic a celor doi termeni din mijloc.

2.2. Indicatorii variaiei


O medie este reprezentativ numai atunci cnd se calculeaz din valori omogene ntre
ele. Cu ct fenomenele sunt mai complexe (dependente de mai multi factori), cu att variaia
este mai mare i utilizarea mrimilor medii devine insuficient. De aceea este important de
cunoscut ct de departe sunt valorile sumei statistice fa de medie. Comparaia se face cu
media seriei, considerat ca fiind valoarea cea mai reprezentativ pentru populaia statistic.
Analiza statistic a unei repartiii poate fi aprofundat prin calculul indicatorilor de
variaie. Aceti indicatori trebuie s serveasc la:
-verificarea reprezentativitii mediei ca valoare tipic a unei populaii statistice;
-verificarea gradului de omogenitate a seriei;
-caracterizarea statistic a formei i gradului de variaie a unui indicator;
-cunoasterea gradului de influen a factorilor dup care s-a facut gruparea unitilor
observate.

37

Indicatorii simpli ai variaiei


Indicatorii simpli ai variaiei servesc la caracterizarea gradului de mpratiere a mrimilor
seriei statistice. Se pot exprima att n mrimi absolute ct i n mrimi relative.
Din aceasta grup fac parte:
-amplitudinea variaiei (absolut i relativ);
-abaterile individuale (absolute i relative).

Amplitudinea absolut se calculeaza ca diferena dintre valoarea maxim i valoarea


minim al caracteristicii:
Aa = xmax xmin

Amplitudinea relativ se exprima de regul n procente i se calculeaz ca un raport ntre


amplitudinea absolut i media aritmetic:
Ar=

Aa
100
x

Abaterile individuale absolute (di) se calculeaz ca diferena ntre fiecare valoare i media

aritmetic:
di = xi - x , i = 1,...,n
Abaterile individuale relative (dr) se calculeaz ca raportul dintre abaterile individuale

absolute i media aritmetic (se exprima n procente):


dr =

di
x

100 , i = 1,...,n
Gradul de variaie al unei caracteristici depinde de toate abaterile variantelor

nregistrate i de frecvena lor de apariie i prin urmare indicatorii simpli ai variaiei nu pot
exprima ntreaga variaie a unei populaii statistice. De aceea a fost necesar introducerea
indicatorilor sintetici ai variaiei.

Indicatorii sintetici ai variaiei


Indicatorii sintetici ai variaiei, la fel ca i indicatorii tendintei centrale trebuie s se
bazeze pe toate observaiile, sa fie uor de calculat, uor de nteles i s fie ct mai puin
afectai de fluctuaiile de selecie.
Indicatorii sintetici ai variaiei sunt:
-abaterea medie liniar ;
-abaterea medie patratic;
-dispersia;
-coeficientul de variaie.
38

Abaterea medie liniar se calculeaz ca o medie aritmetic simpl sau ponderat,

luate n valoare absolut:


Pentru o serie simpl
n

d =

| x x |
i =1

Abaterea medie liniar prezint dezavantajul c nu ine seama de faptul c abaterile


mai mari n valoare absolut influenteaz n mai mare masur gradul de variaie a unei
caracteristici, n comparaie cu abaterile mici. n plus, nu este indicat s se renune n mod
arbitrar la semnul valorilor din care se calculeaz o valoare medie. Din aceste considerente se
folosete ca principal indicator sintetic al variaiei abaterea medie patratic.
Abaterea medie patratic sau abaterea standard () se calculeaz ca o medie

patratic din abaterile tuturor elementelor seriei de la media lor aritmetic:


n

(x
i =1

x)2

Acest indicator este mai concludent dect abaterea medie liniar. Prin ridicarea la ptrat se d
o importan mai mare abaterilor mari n valoare absolut, acestea influennd ntr-o msura
mai mare gradul de variaie al variabilelor analizate.
n literatura de specialitate se apreciaz ca pentru o serie de distribuie normal
abaterea medie liniar este egal cu 4/5 din valoarea abaterii medii ptratice.
Abaterea medie ptratic este un indicator de baz, care se folosete la analiza
variaiei, la estimarea erorilor de selecie n calculul de corelaie.
La fel ca abaterea medie liniar, abaterea medie ptratic se exprim n unitatea de
masur a variabilei a crei variaie o caracterizeaz. Prin urmare cei doi indicatori nu se pot
folosi pentru compararea gradului de variaie i n aceasta situaie se recurge la un alt
indicator de variaie: coeficientul de variaie.

Coeficientul de variaie (v) se calculeaza ca un raport ntre abaterea medie ptratic


i media aritmetic. De obicei se exprim sub form de procente:
v=

100

Semnificaie. Cu ct valoarea lui v este mai aproape de zero cu att variaia este mai slab,
colectivitatea este mai omogen, media avnd un grad ridicat de reprezentativitate. Cu ct

39

valoarea lui v este mai mare cu att variaia este mai intens, colectivitatea este mai
eterogen, iar media are un nivel de semnificaie sczut.
Se apreciaz c la un coeficient de peste 35-40%, media nu mai este reprezentativ i
datele trebuie separate n serii de componente, pe grupe, n funcie de variaia unei alte
caracteristici de grupare.
Se poate afirma c acest indicator poate fi folosit ca un test n aplicarea metodei
gruprii. Dac media aritmetic este aproape de zero, coeficientul de variaie nu are
semnificaie.

Dispersia ( 2 ) este media ptratelor abaterilor de la media aritmetic:

2 =

2
1
xi x .

Msura dispersiei se refer la mprtierea valorilor dintr-un set de date. Media nu


are semnificaie dac se aplic pe un set de date foarte dispersate. De exemplu dac lum
valoarea medie a oraelor mari (peste 200.000 locuitori) va da o valoare de peste 400.000
datorit Bucuretiului care are 2.000.000. ns rezultatul nu are nici o semnificaie (nici un
ora nu avea aceast valoare).
Msurile dispersiei, exprimate sub forma unitilor de msur ale fenomenului
cercetat, nu sunt ntotdeauna utile atunci cnd se compar dispersiile a dou sau mai multe
serii. Compararea dispersiilor a dou sau mai multe serii d rezultate n urmtoarele 2 situaii:
a) irurile care se compar pot fi exprimate n aceleai uniti, iar mediile pot fi
aceleai sau au dimensiuni aproape egale.
b) irurile care se compar pot fi exprimate n aceleai uniti, ns mediile difer.
Dac seriile se exprim n uniti diferite, dispersiile nu pot fi comparate direct. De aceea de
multe ori se folosete abaterea medie ptratic n loc de dispersie.
n unele lucrri aceast mrime se numete varian (engleza :. variance). Variana este o
msur important n special cnd se studiaz variaia a dou sau mai multe eantioane. O
tehnic statistic foarte puternic este cunoscut sub numele de analiza de varian i
utilizeaz dispersia pentru a decide dac un numr de eantioane difer semnificativ unul de
altul.

40

2.3. Indicatori de asimetrie si aplatizare(Skewness i kurtosis)


Skewness
Abaterea medie ptratic i dispersia sunt indicatori care dau o msur a mprtierii
valorilor ntr-o distribuie de frecven. ntr-un anume sens ele ofer o msur a limii
distribuiei. Aceasta ns nu ofer nici o informaie privind caracteristicile formei distribuiei
de frecven. Figura de mai jos nfieaz 6 distribuii utiliznd histograma. Aceasta
reprezint un set de date care au acelai numr de valori. Pe orizontal avem o unitate de
msur exprimat n abateri medii patratice (), iar pe vertical avem media aritmetic. Dup
cum se observ, se poate face o comparaie direct.

Aparent cele ase distribuii de frecven sunt foarte diferite. Cele din partea dreapt
(b, d, i f) sunt similare dintr-un singur punct de vedere, anume ele sunt asimetrice, vrful
este plasat n stnga sau dreapta mediei. Spunem c avem o distribuie distorsionat sau
asimetric (skewed). Cele din stnga (a, c, e) au un grad mic de distorsiune (asimetrie). n
toate cazurile vrful este n apropierea mediei. Toate acestea sunt distribuite simetric.
Pe de alt parte cele dou distribuii de pe fiecare rnd pot fi considerate similare, n sensul c
au un anumit grad de ascuire sau kurtosis. Cele din primul rnd sunt foarte ascuite; ele au
aceleai grad de kurtosis. Cele din al doilea rnd au ascuimea mai moderat, iar cele din al
treilea rnd sunt relative plate.
41

Distorsiunea msoar, deci, volumul de valori din distribuia concentrat de o parte i


de alta a mediei. Dac acest volum de valori este mai mic dect media, spunem c distribuia
este pozitiv distorsionat (b). Dac exist mai multe valori mai mari dect media, spunem c
distribuia este negativ distorsionat (d).

Exemplu in Excel :

Introducei urmtoarele date de la adressa www.insse.ro :

Dup ce introducei coninutul unei celule, validai acest fapt cu [Enter] sau [Tab].

2.Pentru a edita coninutul unei celule folosii tasta [F2] sau dublu click.
Pentru formatarea celulelor selectai domeniul dorit. Alegei din meniu comanda
Format - Cells - Alignment i selectai opiunea Center din caseta derulant
pentru aliniere n centrul celulei, selectai opiunea Merge text pentru
reuniunea mai multor celule, selectai opiunea Wrap text pentru spargerea
textului pe mai multe rnduri.(de ex. Celula B1)
42

4. Pentru formatare selectai domeniul dorit. Alegei din meniu comanda Format
- Cells - Border i selectai tipul de linie dorit pentru ncadrarea celulei sau
domeniului selectat, apoi apsai butonul pentru tipul de ncadrare dorit.

3. Pentru a calcula numrul total de cauze n celula B17: se face clic pe B17 i se
introduce formula =SUM(B2:B16) sau se face clic pe butonul

43

4. Pentru calculul frecvenelor relative n celulele C2:C16: se nscrie n C2 formula pentru


anul 1990=B2/$B$17 , n care

B2 referin relativ=nr. cauze 1990 iar $B$17 referin

absolut=total general nr.cauze


Pentru calcularea formulei i n pentru ceilali ani fie prindem cursorul de umplere i tragem
n josul coloanei pn la C16 sau executm operaia Fill astfel: selectm domeniul de la
C3 la C16; din meniul Edit alegem opiunea Fill Down.

44

Tot domeniul selectat se va completa cu formula calculat n celula C2. Referina relativ
B2 va varia de la B2 la B16, iar referina absolut $B$17 va rmne neschimbat
4. Pentru ca frecvenele relative s fie exprimate n procente selectm domeniul dup
care din meniul FormatFormat cellsNumberPercentage

45

Pentru a micora numrul de zecimale apsai pe butonul


5.Pentru a obine evoluia temporal a numrului de cauze soluionate se urmeaz operaiile:

Se selecteaz domeniul C1:C16

Se alege din meniul InsertChart dup care se urmeaz paii din Chart Wizard

46

Pentru calcularea parametrilor statisticii descriptive Excel ofer mai multe moduri:
prin calcularea funciilor, un mod simplu i mai rapid: pachetul de calcule statistice

Data Analysis Tool oferit de Excel opiunea Descriptive Statistics, tabelul pivot
pentru calculul statisticilor descriptive pe subgrupuri de date. Se pot calcula urmtorii
parametrii: sum, medie aritmetic, modul, minim, maxim, deviaie standard, variaie,
eroare standard, kurtosis, skewness, interval de confiden, al k-lea element mai mic
sau mai mare, talia, i intervalul. Toi aceti parametrii se pot calcula pentru una sau
mai multe variabile.
Vom rezolva aceast problem cu ajutorul componentei Data Analysis Descriptive
Statistics:
1. Pentru a folosi pachetul Data Analysis el trebuie instalat. Pentru aceasta verificai
dac nu a fost instalat deja: deschidei meniul Tools. Dac opiunea Data Analysis
este prezent, atunci se trece la pasul urmtor. Dac opiunea Data Analysis nu este
prezent, atunci din meniul Tools se alege opiunea Add-Ins. Va aprea o fereastr
asemntoare celei de mai jos n care se va bifa prima opiune Analysis ToolPak.
Apsai butonul Ok.

47

2. Alegei opiunea Data Analysis din meniul Tools. Din fereastra de dialog care apare
selectm Descriptive Statistics. Clic pe OK.

3. Dup apsarea butonului OK pe ecran va aprea urmtoarea fereastr de dialog:


Urmeaz o descriere a cmpurilor ferestrei de dialog de mai sus:

48

4. Input Range: Introducei referinele domeniului unde se gsete variabila pentru care
dorim s calculm parametrii statisticii descriptive. n cazul nostru B1:B16. Pentru
introducere executai click n cmpul Input Range, apoi click n celula B1 i
executai o selecie pn n celula B16.
5. Grouped by: se va selecta Columns dac fiecare variabil este introdus ntr-o
coloan sau Rows dac fiecare variabil este introdus ntr-o linie. n cazul nostru
vom bifa Columns.
6. Labels in first row. Antetul de coloan sau linie poate s fie selectat sau poate lipsi.
Dac selectm i antetul de coloan, atunci n pagina de rezultate va aprea acel antet,
adic numele variabilei. In acest caz trebuie s bifm Labels in first row. Dac nu
bifm funcia va ntoarce eroarea: Input range contents non numeric data, deoarece
se consider i antetul de coloan ca fiind una dintre valorile variabilei. In cazul n
care nu selectm antetul de coloan, ar trebui s nu bifm nici Labels in first row.
Dac bifm Labels in first row atunci prima valoare a variabilei va fi luat drept
antet de coloan i rezultatele vor fi greite. In cazul nostru selectm labels in first

row.
7. Opiunile Output se refer la locul amplasrii tabelului de frecven. Dac vom
selecta opiunea New Worksheet Ply,tabelul de frecven va fi afiat la o pagin
nou al crei nume trebuie introdus n cmpul New Worksheet Ply. Output Range
este pentru cazul n care dorim ca rezultatul s fie afiat pe aceeai pagin cu tabelul
ncepnd cu o anumit celul care trebuie introdus n cmpul Output Range.( n

49

cazul nostru C1)New Woorkbook se bifeaz n cazul n care dorim ca rezultatul s


fie afiat ntr-un alt fiier.
Cel puin una dintre urmtoarele opiuni trebuie selectate.
8. Summary statistics se bifeaz pentru ca s se calculeze statisticile principale.
9. Confidence Level for Mean se bifeaz pentru a se calcula i semi- lungimea
intervalului de ncredere pentru media populaiei. Nivelul de confiden implicit este
95%, se poate schimba cu un alt numr de la 1 la 99,9.
10. Kth Largest ntoarce numrul al k-lea mai mic dect numrul cel mai mare. K este o
constant care se introduce n cmpul corespunztor. Clic pe Kth Largest.
Introducei numrul 2 n cmpul Kth Largest.
11. Kth Smallest ntoarce numrul al k-lea mai mare dect numrul cel mai mic. K este o
constant care se introduce n cmpul corespunztor. Poate fi diferit de K de la
punctul 10. Clic pe Kth Smallest. Introducei numrul 2 n cmpul Kth Smallest.
12. Click OK.

13. Interpretarea rezultatelor


50

Mean n medie s-au soluionat 458 de cauze. de ctre un judector

ES =
Standard Error Eroarea standard calculat dup formula:

S
n , unde S

este deviaia standard i n numrul de observaii.

Median Mediana este o valoare a seriei astfel nct jumtate dintre observaii
au valori mai mici (sau egale) i cealalt jumtate au valori mai mari (sau egale).
Dac n este impar, atunci mediana este dat prin formula:

Me =

X n +1
2

Dac n este par, atunci mediana este dat prin formula:

Xn + Xn
2

Me =

+1

Mode Modulul este valoarea care are cea mai mare frecven din serie. In
cazul modulului o situaie care apare este cea n care seria nu are modul, adic
toate valorile apar o singur dat. Atunci va fi afiat valoarea #N/A. O alt
situaie posibil este ca seria s fie bimodal sau trimodal. Atunci va fi afiat
numai prima valoare n ordinea apariiei lor n cadrul seriei. In acest caz pentru
determinarea tuturor valorilor modulului se poate face un tabel de frecven.

Standard Deviation Deviaia standard sau Abaterea standard S =

s 2 . Unde

s2 este variatia.
n

Sample Variance Variaia este calculat dup formula:


unde n este talia seriei,

s2 =

(X
i =1

X )2

X i , i = 1, n seria de date, n cazul nostru ,numrul de cauze

soluionate i X este media aritmetic a seriei.

Kurtosis Excesul sau Boltirea msoar nlimea aplatizrii sau boltirii unei
distribuii n comparaie cu o distribuie normal. Aceast msur este definit
prin:
51

1 n
(X i X )4
n i =1
3
S4
.
4=

Excesul

este zero pentru o serie de date avnd o distribuie normal, este

pozitiv pentru o serie de date avnd forma mai nalt dect cea a unei distribuii
normale (cu media X i variaia S2) i este negativ pentru o serie de date a crei
form este mai cobort dect cea a unei distribuii normale. In cazul nostru
valoarea -0,669 a boltirii indic o curb puin mai aplatizat dect curba normal.

Skewness Asimetria msoar abaterea de la aspectul simetric i direcia


asimetriei (pozitiv sau negativ) fa de curba normal. Este calculat cu
formula:
n

3 =

[( X
i =1

X ) / S ]3
n

Asimetria este 0 pentru o serie de date avnd o distribuie normal, este pozitiv
pentru o serie de date asimetric spre stnga (seria are mai multe valori mai mici),
este negativ pentru o serie de date asimetric spre dreapta (seria are mai multe
valori mai mari). In cazul nostru asimetria este 0,198, deci este puin deplasat la
dreapta fa de curba normal.

Range Intervalul este Maximul-Minimul. Maximul este 678, iar minmul este
390 Range=678-390=288

Minimum Minimul valoarea cea mai mic din serie.


Maximum Maximul valoarea cea mai mare din serie.
n

Sum Suma sau Totalul valorilor seriei:

X
i =1

, unde

X i , i = 1, n seria de date.

Count Numrul de observaii n=15.


Largest(2) - Numrul al k-lea mai mic dect numrul cel mai mare.
Smallest(2) - Numrul al k-lea mai mare dect numrul cel mai mic.
52

Confidence Level (95,0%) ntoarce o valoare cu ajutorul creia se poate


construi intervalul de confiden de 95% pentru media populaiei. Aceast valoare
este 42.23 intervalul este =[ X -42.23, X +42.23] = [], unde X este media
aritmetic a eantionului. Fie m media populaiei situat n acest interval. Media
oricrui eantion al acestei populaii este mai departe de m ca X cu o
probabilitate mai mare dect alpha. Alpha n cazul nostru este 5%. Presupunem c
utilizm X , deviaia standard standard i talia pentru a construi un test cu un prag
de semnificaie alpha n ipoteza c media populaiei este m. Nu vom respinge
ipoteza dac m este n intervalul de confiden i vom respinge ipoteza dac m nu
este n intervalul de confiden. Dac alpha este 0,95 trebuie s calculm aria de
sub curba normal. Aceast valoare este 1,96. Intervalul de confiden este:

[ X tcrit ES , X + tcrit ES ] , unde X este media aritmetic, iar E este eroarea


S
standard, iar t critic este 1,96. Valoarea ntoars de program este
calcula i cu funcia CONFIDENCE.

53

tcrit ES

. Se poate

V. LEGTURILE DINTRE FENOMENELE COLECTIVE


Statistica studiaz legturile cauzale dintre fenomenele

colective. Legile naturale

mbrac ntotdeauna forma enunrii unei legturi fie ntre manifestrile a dou sau mai
multor fenomene, fie ntre prezena i absena anumitor caractere Spunem, de exemplu, c
electricitile de sens contrar se atrag, iar cele de acelai sens se resping, c temperatura
descrete odat cu creterea altitudinii, c infracionalitatea crete dac scade nivelul de trai
Acestea sunt legi cunoscute. Prima este o lege rigid, se verific, prin urmare, aplicat
oricrui caz. Celelalte sunt legi stochastice..
Forma sub care am enunat legea stochastic de mai sus const numai n
existena legturii dintre fenomene i prin aceasta suntem privai de cunoaterea unui element
destul de interesant n aceast direcie: gradul de asociaie ntre cele dou fenomene sau
caractere.

Prezentul capitol este consacrat mijloacelor de care dispune statistica matematic


pentru a msura acestui nou element.
Este clar c o definiie perfect circumscris a gradului de legtur ntre dou variabile
nu poate fi atins. n procesul de cercetare a legturilor cauzale existente ntre fenomenele
naturale avem de-a face cu contopirea aciunilor unei multitudini de factori (cauze), dintre
care unii eseniali, alii neeseniali, unii pot fi determinai, alii nu. Tocmai de aceea, n
cercetarea legturii reciproce dintre dou fenomene apar dificulti mari deoarece pot s
existe cauze necunoscute. n astfel de situaii este util s determinm gradul de corelare i
apoi s analizm separat unele din aceste cauze. Cu alte cuvinte, trebuie s definim relaii
posibile ntre diferii factori, evenimente, atribute sau caracteristici care ar putea avea o
influen, cel puin parial asupra datelor experimentale. n acest mod este posibil stabilirea
unui tablou al condiiilor n care se desfoar un anumit fenomen natural, fapt care duce la
modelarea matematic a sa. Din aceast cauz, diferite puncte de vedere au putut sta alturi
pe aceast chestiune, fr ca s se decid care este cel mai adecvat. i natural, fiecare din ele
a condus la un mijloc diferit de msur a acestei legturi.
n multe procese naturale, pe lng complexa ntreptrundere cu alte fenomene
(procese), acestea mai sunt supuse unor evoluii care la prima vedere pot fi considerate
probabiliste (aleatoare). De aceea, pentru cunoaterea modului de evoluie probabil n viitor
- prognoza unui anumit fenomen - trebuie s ne bazm pe cunoaterea evoluiei trecute,
precum i pe situaia prezent. Experiena unui mare numr de observaii (probe) au dus la
concluzia c ntre diferitele mrimi variabile pot exista urmtoarele tipuri de relaii:
54

a) Relaia de dependen, Y depinde de X sau invers. O modificare a unei variabile


duce la o modificare a celei de-a doua. n cazul unei astfel de relaii s-ar putea aminti
existena relaiei cauzale n care o variabil este cauza, iar cealalt este efectul, cauza fiind un
fenomen sau un complex de fenomene care provoac, genereaz sau determin un alt
fenomen - efectul. Operaia logic prin care efectul este dedus din cauz se numete inferen

cauzal.
b) Relaia de interdependen, Y depinde de X i X depinde de Y. n acest caz
modificarea unei variabile provoac modificarea celei de-a doua variabile, iar modificarea
acesteia din urm are influen asupra primei variabile.
c) Relaia de tranziie, X se transform parial sau total n Y i invers.
d) Corelaia statistic sau covariana. Pentru X exist ntotdeauna Y i invers. Este o
relaie reciproc dintre dou variabile, dintre care una n mod logic apeleaz la alta i pe baza
analizei datelor experimentale se poate pune n eviden o asociere ntre ele.
e) Relaia stochastic; dac se realizeaz X atunci cu o anumit probabilitate se
realizeaz i Y, sau invers.
Datorit caracterului complex al fenomenelor i datorit multitudinii de factori
eseniali i ntmpltori care intervin, aceste legturi se manifest sub form de tendin; ele
pot fi identificate n condiiile aciunii legii numerelor mari, n colectivitile de volum
ridicat.
O problem important n cadrul analizei seriilor interdependente o reprezint

identificarea legturilor cu adevrat semnificative i stabile.


n cazul n care s-a stabilit c ntre dou variabile exist un raport de dependen, se
ridic o alt problem, mult mai dificil: gsirea unei msuri a acestei legturi, prin
intermediul unui indicator sintetic de corelaie.
Exist ns i situaii neltoare, n care variaiile (creterea sau scderea) celor dou
fenomene aparent interdependente sunt similare, dar nu exist nici o legtur logic ntre

ele. De exemplu, n ultimii ani n Romnia cresc simultan att rata srciei, ct i nzestrarea
populaiei cu telefoane mobile. Alteori explicaia tendinei de asociere a celor dou variabile
este dat de existena unei cauze comune. De exemplu, creterea simultan i semnificativ a
vnzrilor la pulovere de ln i la medicamente antigripale are aceeai cauz: venirea iernii.
Analiza calitativ a datelor statistice rezolv probleme de acest tip.

55

1. SERIILE INTERDEPENDENTE
1.1. Tipuri de legturi
Analiza seriilor interdependente urmrete
1. verificarea existenei i

2. msurarea intensitii legturilor dintre fenomene.


Cu ct fenomenele sunt mai complexe, cu att numrul factorilor care le influeneaz este mai
mare, ceea ce face legturile cauzale dificil de evideniat. Analiza dependenelor se complic
atunci cnd factorii de influen intercondiioneaz determinnd apariia de cauzaliti n lan.
Pentru a putea determina intensitatea relaiilor de corelaie, este necesar s se analizeze, n
primul rnd, coninutul i forma acestor relaii.
Vom nota cu:

y fenomenul a crui variaie este influenat (variabil dependent sau rezultativ)


i cu

x factorul de influen (variabila independent sau factorial).


Dup natura legturilor de interdependen deosebim dou categorii de relaii:

a) funcionale (deterministe) i
b) stochastice (statistice).
a) Funcionale: y = f (x).
Fenomenul cauz x determin n mod univoc fenomenul efect y, astfel nct
unei valori a variabilei x i corespunde o valoare unic a variabilei y..

b) Stochastice: y = f (x1 , x2 ,..., xn).


Fenomenul efect este influenat de o multitudine de factori,

eseniali i

ntmpltori. Unei valori a fenomenului cauz xi i pot corespunde mai multe


valori diferite ale fenomenului efect y, n funcie de aciunea combinat a
celorlali factori de influen. De exemplu, infracionalitatea unei persoane

depinde de: profilul psihologic,sex, gradul de educaie, gradul de srcie,


situaia familial, starea de sntate etc.
Fiecare caracteristic xi determin numai o parte a variaiei fenomenului y, restul variaiei
fiind explicat prin alte caracteristici, care din punct de vedere al legturii xi -y sunt
ntmpltoare.

56

Variaia fenomenului y poate fi analizat n funcie de unul sau mai muli factori de influen
(x1, x2,... , xn), dar ntotdeauna va rmne o variaie neexplicat, determinat de factorii
nenregistrai.
n cazul n care se identific i se analizeaz factorii de influen eseniali, componenta
aleatoare, care sintetizeaz aciunea factorilor ntmpltori, va avea o pondere redus i nu va
influena semnificativ veridicitatea rezultatelor.
Legturile stochastice sunt specifice fenomenelor din societate i economie.
Extrema diversitate a legturilor stochastice impune sistematizarea lor dup mai multe
criterii.
Dup numrul caracteristicilor analizate, legturile stochastice pot fi simple sau multiple.

a) Legturi simple - se alege o singur caracteristic determinant pentru variaia


fenomenului y, toate celelalte caracteristici care l influeneaz, fie c sunt

eseniale sau ntmpltoare, sunt considerate cu aciune constant.


De exemplu, analiza legturii dintre recolta total i suprafaa cultivat.

b) Legturi multiple - se analizeaz variaia fenomenului y n funcie de mai multe


caracteristici eseniale x1, x2,..., xn. Rmne i n acest caz o component

aleatoare, care sintetizeaz aciunea, presupus constant, a celorlali


factori de influen.
De exemplu, analiza variaiei salariului ntr-o colectivitate n funcie de
productivitate, vechime i calificare.
Dup natura caracteristicii pot exista legturi stochastice de asociere sau de corelaie.
a) Asocierea statistic se refer la raporturile de interdependen dintre caracteristicile
calitative, sau dintre o caracteristic numeric i una calitativ. De
exemplu, legtura dintre locul de munc i studii, calificare i
productivitate, , ntre zona geografic i clasa de fertilitate a terenurilor
agricole etc.
Analiza statistic a raporturilor de asociere este posibil doar dac se
gsete o modalitate de exprimare numeric a variantelor. De exemplu,
clasele de calitate ale produselor pot fi codificate i ierarhizate: 0 produs
inferior, 1 - produs mediu, 2 - produs superior.
b) Corelaia statistic exprim raporturile de cauzalitate dintre dou sau mai multe
caracteristici exprimate cantitativ. De exemplu, analiza cifrei de afaceri n
funcie de numrul salariailor i valoarea capitalului fix ,analiza gradului
de poluare n funcie de producia de substane chimice .
Dup sensul relaiei de cauzalitate, legturile stochastice pot fi directe sau inverse.
57

a) Legturi directe exist atunci cnd modificarea ntr-un anumit sens (cretere sau scdere) a
fenomenului cauz x determin modificarea n acelai sens a fenomenului
efect y.
De exemplu, legtura dintre numrul salariailor i volumul produciei,
dintre mrimea creditului i masa dobnzii, dintre costul unitar i costul
total etc.
b) Legturile inverse exist atunci cnd modificarea ntr-un anumit sens a lui x determin o
modificare n sens contrar a lui y. De exemplu, legtura dintre profitul
unitar i costul unitar de producie, dintre impozitul pe profit i profitul
net, dintre mrimea dividentelor i profitul reinvestit etc.
Dup forma matematic a legturilor, acestea pot fi liniare sau neliniare.
a) Liniare: legtura se realizeaz dup ecuaia dreptei.
b) Neliniare: exponeniale, hiperbolice, parabolice, logaritmice.

Forma legturii este, de regul, vizibil pe grafic. Atunci cnd legtura grafic nu este clar,
se poate continua analiza pe variantele sugerate de grafic folosind metode analitice i folosind
anumite criterii pentru a alege varianta cea mai bun.
Dup momentul producerii lor deosebim legturi sincrone i asincrone.
a) Sincrone - modificarea lui x determin modificarea imediat a lui y. De exemplu, creterea
veniturilor populaiei determin mrirea imediat a cererii de consum, creterea
produciei se obine concomitent cu creterea cheltuielilor etc.
b) Asincrone - fenomenul x determin variaia fenomenului efect y dup o perioad de timp.
De exemplu, legtura dintre investiii i creterea produciei sau legtura dintre
rata dobnzii i volumul masei monetare.

1.2. Metode elementare de verificare a existenei legturilor


Studierea legturilor dintre fenomenele economice presupune parcurgerea mai multor etape:
1.depistarea factorilor care influeneaz variaia fenomenului analizat i ierarhizarea
acestora;
2.alegerea factorului sau factorilor eseniali a cror influen asupra fenomenului
dependent urmeaz s fie analizat;
3.culegerea i sistematizarea datelor referitoare la variabilele studiate; verificarea gradului
de cuprindere a datelor nregistrate (dac datele provin dintr-un sondaj interpretarea
rezultatelor se va face n sens probabilistic);

58

4.verificarea existenei i formei legturii dintre caracteristicile corelate n vederea


alegerii corecte a procedeelor statistico -matematice de msurare a dependenei
statistice;
Verificarea existenei legturilor se poate face cu ajutorul unor metode simple:
metoda seriilor paralele interdependente;
metoda gruprilor;
metoda tabelului de corelaie;
metoda grafic;
analiza dispersional.
Metodele elementare evideniaz direcia legturii, iar unele dintre ele pot indica i

forma acesteia. Aplicarea acestor metode trebuie completat cu o analiz calitativ a


fenomenelor, bazat pe coninutul lor, pe legtura logic dintre ele
5.msurarea intensitii legturii cu ajutorul indicatorilor de corelaie selectai n funcie
de forma de legtur i de natura informaiilor de care dispunem;
6.testarea semnificaiei indicatorilor de corelaie calculai cnd datele au provenit dintrun sondaj.

2. Corelaia statistic
Eficiena aplicrii metodei corelaiei depinde de punerea (enunarea) corect a
problemei n studiu precum i de aplicarea corect a statisticii matematice.
Caracterul complex al dependenei statistice pune pe primul plan problema
identificrii existenei legturilor. Calculul indicatorilor de corelaie este admis cu condiia
stabilirii anticipate a unei legturi cauzale reale ntre fenomenele cercetate. Statistica nu poate
s rezolve o astfel de problem fr ajutorul tiinei din domeniul creia face parte fenomenul
studiat. Cu alte cuvinte, specialistul din domeniul respectiv trebuie s cunoasc temeinic
noiunile analizei statistice implicate pentru a da o interpretare corect a rezultatelor. Pentru a
asigura deducii suficient de ntemeiate, este necesar includerea n cercetare, dac este
posibil, a tuturor factorilor cu aciune esenial.
La fenomenele simple, unde cauzele acioneaz separat, relaia dintre fenomenul-efect
i fenomenul-cauz se reprezint sub forma:
y=f(x)

unde x reprezint cauza, iar y efectul.


La fenomenele complexe, dependena se exprim sub forma general:
y = f(x1 , x2 ,..., xn)

59

Fenomenul y este generat de aciunea comun a factorilor x1 ,x2 ,.., xn (cauze), din care
lum ns n calcul numai o parte.
S admitem c am luat n calcul factorul x1. ntrebarea care se pune este urmtoarea:
n ce condiii indicatorii corelaiei obinui exprim msura real a influenei variabilei x1
asupra variabilei y? Numai cu condiia ca factorul x1 s fie hotrtor n determinarea lui y,
ceilali fiind nesemnificativi. n cazul n care fenomenul este sub aciunea unui complex de
factori eseniali i aceasta este situaia obinuit, pentru a exprima influena i gradul de
intensitate a legturilor n raport cu un singur factor trebuie s eliminm influena celorlai.
S considerm o colectivitate statistic caracterizat prin mrimile X i Y. Efectund
o serie de determinri experimentale (sau observaii) asupra acestei colectiviti, putem
ntocmi tabela datelor respective:
X | x1, x2 , ..., xn
Y | y1 , y2 , ..., yn
Repartiia empiric a celor dou variabile se poate afia grafic, ntr-un sistem de axe XOY,
unde vom reprezenta punctele de coordonate xi i yi. Un ansamblu de astfel de puncte se
numete cmp de corelaie, tabel de corelaie sau nor statistic.
n Excel, acest lucru se poate face utiliznd diagrama XY prin puncte(XY-scatter)
Analiza vizual a organizrii i formei norului de puncte obinut poate oferi indicii
importante asupra relaiei dintre variabile.

Datele de sondaj vor susine ipoteza asocierii ntre variabile dac forma norului de puncte
se apropie de o curb funcional.
Cele dou caracteristici sunt independente. ntr-un caz particular, dependena
corelaionar se poate transforma ntr-o dependen funcional, dar cu un anumit grad de
certitudine. Apare problema de stabili cantitativ (numeric) n ce msur dependena
corelaional se apropie sau se deprteaz de dependena funcional.
n foarte multe cazuri, din observarea fenomenelor naturale sau a proceselor sociale, fr a
cunoate natura exact a acestora i nici cauzele prin care este pus n eviden o anumit
caracteristic, se pot trage concluzii foarte importante prin examinarea corelaiei dintre aceste
trsturi i alte evenimente. n acest mod se poate aprecia existena unei relaii statistice ntre
dou sau mai multe variabile, adic, n astfel de cazuri se vorbete despre corelaii dintre
mrimile care indic o dependen reciproc.
Corelaia este o metod statistic de determinare a relaiei dintre dou variabile existente.
Regresia este o metod statistic utilizat pentru a descrie natura relaiei dintre variabiledaca
este pozitiv ,liniar sau neliniar
60

Distribuie liniar

Distribuie neliniar

Dac punctele Mi(xi ,yi) nu arat o dependen funcional strict, dar exist o tendin ca
valorile lui Y s depind de cele ale lui X , dei nu n mod riguros, ntre mrimile X i Y
exist o corelaie Aceasta poate s fie liniar sau neliniar

Distribuie aleatoare

Distribuie grupat

Dac punctele Mi(xi ,yi) sunt distribuite de-a lungul unei fii, care n general, urmeaz o
curb determinat, spunem c ntre mrimile respective exist o dependen funcional. n
cazul cnd ntre X i Y nu exist nici un fel de dependen, cmpul de distribuie se va
prezenta asemntor cu acela artat n figurile de mai sus.
Fiind date dou variabile X i Y, se pune problema dac ntre cele dou variabile, respectiv
ntre fenomenele descrise de acestea, exist o anumit dependen numit i corelaie. O
prim concluzie se poate obine reprezentnd grafic ntr-un sistem de coordonate XY, cele
dou iruri de date observate pentru cele dou variabile. Dac punctele graficului se mprtie
pe toat suprafaa fr a urma o anumit regul, atunci vom spune c cele dou variabile nu
sunt corelate. Dac n schimb punctele descriu o anumit curb, numita i curb de regresie,
atunci vom spune c exist corelaie i ea este cu att mai intens, cu ct domeniul pe care se
ntind punctele este mai ngust. Mai mult, dac punctele se aeaz pe o curb care poate fi
aproximat de o curb clasic (dreapt, parabol, exponenial, etc.) atunci vom spune c
61

legtura dintre cele dou variabile este una liniar sau parabolic sau exponenial, etc. i
vom folosi ecuaia acelei curbe clasice pentru prognoz.

Exemplu:

Un exemplu de studiu a legturii specifice dintre :


X= producia total de substane chimice din Europa nregistrat ntre anii 1996 pn n
2007
X=(xi ,i=1..12) i
Y=gradul de poluare a aerului prin msurarea cantitii de gaze emise Y=(yi ,i=1..12)
n Excel :
x = (259, 274, 275, 248, 301, 284, 267, 270, 310, 314, 316 ,317) i
y = (769.75, 732.58, 702.34, 682.04 ,648.38, 614.57, 600.43, 583.63, 565.42, 552.28, 533.93, 521.32)
Datele au fost obinute de pe site-ul www.eurostat.eu
.

anii

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

productia
chimica

259

274

275

248

301

284

267

270

310

314

316

317

volumul
emisiilor de
gaze

769.75

732.58

702.34

682.04

648.38

614.57

600.43

583.63

565.42

552.28

533.93

521.32

emisiile de gaze

Poluarea in U.E.
900
800
700
600
500
400
300
200
100
0
240

norul de puncte--> poluarea in


U.E.

260

280

300

productia chimica

62

320

Metoda celor mai mici ptrate.


Dependena funcional a unei variabile y fa de alt variabil x poate fi studiat
empiric, pe cale experimental, efectundu-se o serie de msurtori asupra variabilei y pentru
diferite valori ale lui x. Rezultatele se pot prezenta sub form de tabel sau grafic.
Problema care se pune n acest caz este de a gsi reprezentarea analitic a dependenei
funcionale cutate, adic de a alege o formul care s descrie rezultatele experimentului.
Formula se alege dintr-o mulime de formule de tip determinat, de exemplu.
y = ax + b ,

y = ax2 + bx + c ,

y = aebx + c ,

y = a + h sin( t + )

Cu alte cuvinte, problema const n a determina parametrii a, b, c, ai formulei, n timp


ce tipul formulei este cunoscut dinainte ca urmare a unor considerente teoretice sau dup
forma prezentrii grafice a materialului empiric.
S notm, la modul general cnd avem n parametrii, dependena funcional prin:
y = f(x; a0 ,a1 ,...,an)

Parametrii a0, a1,..., an nu se pot determina exact pe baza valorilor empirice y1,
y2,...,yn ale funciei, deoarece acestea din urm conin erori aleatoare. Este vorba de obinerea

unei estimaii "suficient de bune".

Formularea problemei
Dac toate msurtorile valorilor funciei sunt y1, y2,...,yn

atunci estimaiile

parametrilor a0, a1,..., an se determin din condiia ca suma ptratelor abaterilor valorilor
msurate yk de la cele calculate f(xk; a0, a1,..., an), adic expresia
n

S = [ yk f ( xk ; a0 , a1 ,..., an )]2
k =1

s ia valoarea minim.
Aflarea valorilor parametrilor a0, a1,..., an, care conduc la cea mai mic valoare a
funciei
s = s (a0 , a1 ,..., an )
revine la rezolvarea sistemului de ecuaii
S
S
S
= 0,
= 0 ,,
=0
a0
a1
an
Dac formula empiric depinde liniar de parametrii necunoscui atunci sistemul de mai sus va
fi de asemenea liniar.

63

3. Dreapta de regresie.
n cazul cel mai simplu se studiaz numai dou variabile X, Y i se dorete gsirea
dependenei:
Y = aX + b
n ipoteza c X este cauza i Y este efectul.
n urma celor n probe se cunosc datele (xi ,yi), i=1,..., n i trebuie s determinm
coeficienii a i b astfel nct suma
n

S (a, b) = (axi + b yi ) 2
i =1

s fie minim. Se obine

a=

c xy

2
x

y c xy
y

=
rxy
x x y x

b = y ax

unde x2 este dispersia variabilei x, iar y2 este dispersia variabilei y.


Mrimea

cxy = x y x y
se numete corelaia variabilelor X i Y.
cov( x, y ) = M ( x y ) M (x ) M ( y )
N

M (x y ) =

x y
i =1

N
se numete covarian.

Pentru a analiza dac ntre variabilele X i Y exist o legtur liniar, se calculeaz


coeficientul de corelaie liniar, dat de formulele echivalente:

rxy = cxy /x y

Funcia Excel corespunztoare este CORREL.

Sintaxa funciei :
CORREL (X,Y)= coeficientul de corelaie
-parametrii de intrare reprezint doi vectori de aceeai dimensiune care conin
valorile celor dou variabile pentru care dorim s calculm coeficientul de corelaie.
64

Interpretare:
Valorile coeficientului de corelaie sunt n intervalul [ 1,1] .
Dac r = 0 ntre cele dou variabile nu exist corelaie.
Dac r = 1, corelaia ntre cele dou variabile este maxim i direct.
Dac r = -1, corelaia ntre cele dou variabile este maxim i invers.
Cu ct avem o valoare mai apropiat de 1 sau -1 cu att corelaia e mai puternic
(direct pentru valori pozitive i invers pentru valori negative), cu ct avem o valoare
apropiat de 0 corelaia este mai slab.
n ambele cazuri (r=-1, sau 1) , sintagma "tendina de a fi asociat" este un alt mod de
a spune c variabilitatea lui X tinde s fie asociat cu variabilitate n Y, i vice-versa, sau, pe
scurt, c X i Y au tendina de a varia mpreun.

4. Coeficient de determinare
r2

coeficient de determinare

Dac reprezentm variaia lui X ,respectiv Y prin suprafaa a dou cercuri (suprafaa
cercului reprezinta 100% din variaia fie a lui X sau Y). n caz de corelaie zero nu exist nici
o tendin pentru X i Y pentru a co-varia; i, prin urmare, dup cum este ilustrat ,avem dou
cercuri separate n partea de sus;

65

corelaia nu este zero,atunci cele dou cercuri se suprapun( o parte din variabilitatea lui X
este explicat de variabilitatea lui Y). i anume r 2 (care reprezint procentul din variaia lui
y determinat de variaia lui x )

n acest caz cele dou cercuri se suprapun (r = - 0.86 r

=0.74 ) Zona de suprapunere

reprezint 74% din variaia lui Y ( Yeste cuplat n variabilitate cuX, i invers), precum i
faptul c 26% din variaia lui Y este fr nici o legtur cu variabilitatea lui X, la fel ca din
variaia de X este fr nici o legtur cu variabilitate n Y.( zonele de ne-suprapunere
reprezint 26% ) Aceasta zon de ne-suprapunere sau poriune de dezacord, ntre X iY se
numete variaie rezidual = 1- r 2 .
Dar faptul c relaiile de cauzalitate ntre variabile pot produce corelaii nu implic faptul c o
relaie de cauzalitate se afl n spatele fiecrui exemplu de coresponden.

66

n final se va obine ecuaia de regresie:

Yy=

y
rxy ( X x )
x

Aceast dependen reprezint o dreapt numit dreapt de regresie a variabilei Y n raport cu


variabila X.

Dreapta de regresie

Observaie. Se poate vorbi i de dependena variabilei X n funcie de Y. Urmnd un calcul


asemntor se ajunge la dreapta de regresie a variabilei X n raport cu Y:

X x=

x
rxy (Y y )
y

Se observ c cele dou drepte de regresie coincid dac i numai dac rxy2 = 1 .

Observaii.
1. Trebuie s facem observaia c, indiferent de gradul de mprtiere al punctelor,
ntotdeauna se poate gsi o dreapt de regresie, dar n cazul unei dispersii mari aceasta devine
inutil. De aceea un studiu preliminar a distribuiei punctelor n plan sau spaiu se impune cu
necesitate.
2. Coeficientul de corelaie este o mrime foarte important n cadrul regresiei liniare.
El msoar gradul de dependen liniar ntre cauz i efect i are o valoare cuprins ntre 1
i 1. Apropierea de 1 implic o dependen liniar puternic ntre mrimi, iar apropierea de
zero indic o lips a corelatiei. Valorile negative semnific o corelaie invers.

67

EXEMPLU :

emisiile de gaze

Poluarea in U.E.
900
800
700
600
500
400
300
200
100
0
240

norul de puncte--> poluarea


in U.E.
Linear ( norul de puncte-->
poluarea in U.E.)

y = -2.3086x + 1289.4
R2 = 0.4801

260

280

300

productia chimica

68

320

MODEL DE TESTE DE VERIFICARE A CUNOTINELOR


1.Care sunt elementele definitorii ale unui studiu statistic (dai un exemplu)
2.Stabiliti tipul de variabila n urmatoarele cazuri:
a. foarte bine; a) cantitativa de raport b)calitativa ordinala c)calitativa nominala
b. admis;
a) cantitativa de raport b)calitativa ordinala c)calitativa nominala
a) cantitativa de raport b)calitativa ordinala c)calitativa nominala
c. 51%
d. maghiar
a) cantitativa de raport b)calitativa ordinala c)calitativa nominala
3. Descriei deosebirile dintre fenomenele colective i fenomenele tipice.(dai exemple din
cele dou categorii)
4.Un radar instalat intr-un pct.de control a inregistrat intr-o ora urmatoarele valori:
52, 56, 78, 25, 64, 81,44.
Aflai viteza medie, median, dispersia i deviaia standard ale vitezelor nregistrate
5.La Judectoria Iai s-au ales la ntmplare 8 procese i s-au numrat amnrile la fiecare
proces n parte , obinndu-se urmtoarele observaii:
2, 3, 0, 3, 4, 1, 3,
0.
a) Care este tendina central a numrului de amnri pentru un proces?
b) Care este probabilitatea ca alegnd la ntmplare un proces acesta s nu fie amnat ?
c) Construii histograma numrului de amnri pentru un proces ,pentru a studia forma
distribuiei .
6. a) Construii distribuia de frecvene pentru vrsta infractorilor din zona Iai;
b) Exist o corelaie ntre vrst i infracionalitate ,tiind c
V rsta
Nr.infractori
infractorilor
Sub 18 ani 15
18-25 ani
26-35 ani
36-50 ani
Peste 50 ani

25
20
30
10

7. Tendina central poate fi masurat prin:


a) Median
b) Amplitudine
c) Media aritmetic
8. Graficele statistice trasate prin linie se utilizeaz n mod curent pentru vizualizarea:
a) observaiilor oricrei serii de date statistice;
b) trendului (tendinei) evoluiei n timp a unui fenomen;
c) tendinei legturii dintre variabile i pentru alegerea modelelor de regresie.
9. mprtierea observaiilor fa de valoarea medie poate fi reprezentat prin:
a) Amplitudine
b) Mediana
c) Deviaie standard
10. .O serie de timp se reprezint grafic printr-o:
a) diagram de structur (de tip pie);
b) diagram linie
c) diagram XY prin puncte

69

Bibliografie
Virgil VOINEAGU, .Constantin MITRUT, Alexandru Isaic MANIU, Statistic, Editura
ASE,Bucuresti, 2008.
Emilia TITAN, Simona GHITA, Cristina TRANDAS, Statistic economic.
Elisabeta JABA, Statistica ediia a treia, Editura economic 2002;
Patrick BLATNER, Microsoft EXCEL 2002, Editura TEORA 2003.
www.ac.tuiasi.ro/ro/library/pdf/Introducere.pdf

http://www.ac.tuiasi.ro/ro/library/IS_Book/IS_cap11.pdf
http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=116&idb

70

71

72

S-ar putea să vă placă și