Sunteți pe pagina 1din 18

STATISTIC

Scurt istoric
ntr-o prim concepie, statistica echivala cu descrierea statului, expunerea situaiei geografice, economice i politice. Acest gen de statistic a fost cultivat mai nti de italieni. nc din sec. X X ! n "epu#lica !eneia se ela#orau diferite rapoarte care conineau informaii privitoare la partenerii si comerciali i au fost utili$ate n politica comercial oficial. %urentul &descrierea statului& a atins apogeul n sec. X! - X! cnd, n 'ermania, s-a constituit o adevrat coal cunoscut su# denumirea de coala descriptiv german. (escrierea statului a devenit disciplin de predare acadamic, ncadrat ntr-un sistem construit dup norme teoretice i practice, care s-au ela#orat i de$voltat n univeritile germane. )oua disciplin *+taats,unde-, a primit numele de statistic *+tatisti,-. .e vremea constituirii statisticii ca disciplin descriptiv a statului, se ntea n Anglia, n afara universitilor, o statistic cunoscut su# numele de aritmetica politic, a crui scop era/ anali$a datelor de o#servaie prin procedee matematice, desprinderea regularitilor n fenomenul social i chiar formularea de previ$iuni. +tudiile demografice lsau s se ntrevad c previ$iunea fenomenelor colective ar putea avea o nsemntate practic0 dealtfel ta#elele de mortalitate, ntocmite n sec. X! au constituit punctul de plecare al nfloritoarei industrii de asigurri. 1olosirea metodei statistice, recurgerea la instrumentul matematic i cutarea legitilor marcau un su#stanial progres, prefigurnd statistica modern. 2ste dificil s se dea o definiie satisfctoare statisticii. n lim#a3 u$ual termenul este folosit pentru a desemna o colecie de numere referitoare la un anumit domeniu *demografie, precipitaii, de#ite-. n sens tehnic *mai precis matematic- statistica este un instrument al matematicii utili$at pentru prelucrarea i interpretarea informaiilor numerice.

Scopul statisticii
+tatistica poate fi clasificat n dou mari categorii/ - statistica descriptiv - statistica analitic. +tatistica descriptiv se ocup de pre$entarea, clasificarea i sinteti$area datelor de o#servaie. Aceasta concentrea$ informaia existent n datele respective cu a3utorul anumitor indicatori statistici care, n fond, sunt nite numere ce exprim caracteristici sau tendine ale fenomenului studiat. +tatistica analitic folosete metode matematice *teoria pro#a#ilitilor- pentru extragerea i prelucrea informaiei statistice0 n multe ca$uri aceste metode pun n eviden legiti statistice. (epirea stadiului descriptiv, al simplei metode cantitative, a nsemnat, istoric vor#ind, deplasarea gndirii statistice spre interpretarea analitic a fenomenului i o#inerea de conclu$ii inductive, pe #a$a o#servaiilor empirice. Aceast schim#are de coninut a fcut ca statistica s se ntreptrund n mod constant cu matematica, n cutarea de metode corespun$toare o#iectivelor sale. 4ranspus ntr-un lim#a3 matematic statistica s-a construit ntr-o teorie numit teoria corelaiei statistice, ale crei aplicaii au permis identificarea unor noi legi de dependen, specific statistice i adaptate la formele complexe i variate pe care le ofer natura n diferitele sale manifestri.
5

n cercetrile moderne se pornete de la ipote$e statistice asupra fenomenului sau procesului o#servat, consecinele lor logic deduse se compar apoi cu datele disponi#ile i dac sunt n concordan, ipote$ele sunt 3ustificate, cel puin pn la noi o#servaii mai riguroase. 6nul din o#iectivele eseniale ale statisticii se consider tocmai msurarea incertitudinii conclu$iilor inductive. (e la un timp ns, gndirea statistic tinde s se preocupe mai puin de msurarea incertitudinii i mai mult de determinarea riscului de eroare i a pierderilor implicate de orice deci$ie ntemeiat pe o informaie care, prin natura sa, nu poate fi exhaustiv. Aplicarea calculelor statistice la datele empirice, oferite de o#servarea fenomenului, permite desprinderea de legiti statistice. 1enomenele sunt n interconexiune unele cu altele, n sensul c se generea$ i se influenea$ reciproc. Acest fapt conduce la noiunea de cau$alitate care exprim interaciunea dintre cau$ i efect astfel nct ntotdeauna cau$a s precead efectul. (esfurarea fenomenelor const astfel ntr-un ir nentrerupt de momente, ntr-o succesiune cau$-efect, efectul fiind la rndul lui cau$ pentru un alt efect .a.m.d. Astfel se formea$ un lan cau$al. 7rice ntrerupere a lanului cau$al nseamn de fapt existena unui efect care s nu ai# cau$. )ici un fenomen nu se a#ate de la acest principiu care poart numele de principiul cau$alitii. %unoaterea desfurrii evenimentelor este asigurat de cunoaterea legilor care guvernea$ fenomenul i a ansam#lului de condiii n care se desfoar acesta. (eci legea este un element primordial n cunoaterea fenomenelor deoarece exprim raporturile eseniale, necesare, generale, relativ sta#ile i repeta#ile ale fenomenelor i ale desfurrii lor. .utem deose#i dou mari categorii de legi/ - legi fizice, care se aplic fenomenelor i proceselor individuale luate n parte *ex. legea atraciei universale, legile , , ale dinamicii etc.- i - legi statistice, care se aplic numai fenomenelor de mas, ansam#lurilor de o#iecte *ex. legea ga$elor perfecte, legea de$integrrii radioactive, etc.- i care exprim anumite caracteristici ale ansam#lului considerat. 8egile fi$ice permit cunoaterea perfect a desfurrii viitoare a fenomenelor pe #a$a cunoaterii la momentul iniial a unor mrimi. Astfel, n mecanic, legea a -a a lui )e9ton permite cunoaterea perfect a micrii unui o#iect atunci cnd se cunosc la momentul iniial po$iia *trei coordonate- i vite$a sau impulsul *trei proiecii- o#iectului. 8egile statistice permit cunoaterea desfurrii viitoare a fenomenelor doar n termeni pro#a#ilistici *pro#a#iliti, valori medii, erori statistice etc.-. Acest lucru indic de la nceput c informaia pe care o d o lege statistic este mai srac dect cea dat de legea dinamic. %u toate acestea, legea statistic permite cunoaterea desfurrii viitoare a fenomenelor i poate fi tot att de determinist ca i cea dinamic. .articularitatea esenial a legilor statistice i$vort din faptul c ele acionea$ n fenomenele de mas, unde ntregul este determinat de unitatea prilor componente, o constituie exprimarea comportrii ansam#lului de uniti omogene i nu a fiecrei uniti n parte. n mod corespun$tor, legea statistic se reali$ea$ ca o tendin predominant, ca o necesitate care i croiete drum printr-un numr foarte mare de contingene i care se manifest n aceste contingene ca media unui numr mare de a#ateri ntmpltoare. (e aici i principiul verificat deseori n practic/ legea statistic poate fi evideniat dac i numai dac este considerat i supus o#servrii un numr mare sau suficient de mare de uniti elementare ale ansam#lului considerat.

Nooiuni elementare
nvestigarea statistic presupune, prin definiie, considerarea fenomenelor n multiplicitatea i varia#ilitatea lor. 6n ansam#lu de fenomene formea$ un fenomen de mas, sau, ceea ce numim populaie statistic, n msura n care elementele componente *indivi$i- sunt de aceai natur, adic au toate o proprietate comun i se deose#esc unele de altele n raport cu aspectele sau valorile caracteristice luate n studiu. .opulaia cu care lucrea$ statistica tre#uie s fie glo#al omogen - s includ doar elementele similare, aparinnd de aceeai &categorie& i intern structurat elementele ei s poat fi ordonate potrivit unui sistem de clasificare. Aa cum re$ult din cele de mai sus, o nsuire specific statisticii este aceea c statistica nu se ocup cu un element *individ- luat ca atare, ci cu colectiviti, cu grupuri de elemente ce posed o anumit trstur comun. Aceast trstur se numete caracteristic. (enumirea de &populaie& s-a pstrat din timpurile n care statistica se ocupa cu precdere de populaii n sensul propriu al cuvntului. 7 populaie poate fi mpit n su#populaii sau populaii pariale, care sunt / clase, grupe i eantioane. 7 clas este un su#ansam#lu de elemente ale unei populaii care conin o varia#li determinat de aceeai msur. 6n grup este un su#ansam#lu de elemente ale unei populaii care se distinge printr-o manier de tratare comun. 6n eantion este un su#ansam#lu de elemente ale unei populaii ales ntmplare. +e apelea$ la acest gen de populaie parial atunci cnd populaia n studiu este prea mare pentrua fi tratat n ansam#lul ei. +tudiul asupra eantionului va fi atri#uit ntregii populaii. ndivi$ii unei populaii statistice sunt cercetai pentru una sau mai multe caracteristici. %aracteristicile ntlnite se clasific n caracteristici cantitative i calitative. %aracteristicile cantitative sunt cele care se msoar numeric *nlime, greutate, lungimea unui ru etc.- i se mai numesc variabile statistice. %aracteristicile calitative nu se msoar numeric *culoare, sexul unei persoane etc.-. 2le nu repre$int o msur a unei entiti. (ac se convine s se repre$inte unele din ele prin numere ataate la categoriile ce le determin, nu este vor#a dect de o &codificare& procedeul ne3ustificnd operaiile aritmetice. Aceste caracteristici se mai numesc atri#ute. 8a rndul lor, caracteristicile cantitative pot fi discrete sau continue. !aria#ilele discrete sunt cele care pot lua un numr finit *sau cel mult numra#il- de valori distincte *ntregi, fracionare-, cum ar fi numrul mem#rilor unei familii, nr. de staii hidrologice etc. !aria#ilele continue sunt cele care pot lua orice valoare dintr-un anumit interval *nlimea unui individ, nivelul unui ru etc.-. 4otui, n practic nu se ntlnete o informaie privind adncimea unui ru de forma/ 5m, ; cm, 5< microni. Acest lucru nu se va ntmpla fie c preci$ia aparatelor cu care efectum msurtorile este limitat, fie c o preci$ie exagerat nu este ntotdeauna folositoare pentru ceea ce urmrim n investigaie. Astfel, msurtorile sau datele de o#servaie se grupea$ n cadrul unei anumite uniti i deci din punct de vedere practic se lucrea$ cu forma discret chiar dac varia#ilele sunt de tip continuu. (istincia ntre caracterul cantitativ i cel calitativ, precum i ntre varia#ilele discrete i varia#ilele continue este fundamental deoarece ele recurg la tehnici de anali$ foarte diferite. Aici tre#uie s lmurim un lucru care d deseori natere la confu$ii/ muli sunt nclinai s cread c varia#ilele discrete tre#uie s ia numai valori ntregi i c numerele fracionare sunt tipice pentru varia#ilele continue0 cu alte cuvinte diferena dintre continuu i discret se confund cu diferena dintre msurtorile cu numere ntregi i cele fracionare. + lum exemplul urmtor/ o varia#il ia valorile/ 5,=>50 5,=?@0 5,=<<. Aceasta este o varia#il discret deoarece trecerea de la o valoare la alta se face fr vreo alt valoare intermediar.

%ercetarea statistic a unei colectiviti poate fi/ - exhaustiv *total-, cnd fiecare individ este anali$at, de exemplu n ca$ul recensmintelor0 - parial *selectiv-, cnd sunt examinai numai anumii indivi$i, alei aleator. 2a este cea mai frecvent folosit, n ma3oritatea ca$urilor fiind i singura posi#il. .artea examinat din colectivitate se numete selecie sau eantion. )umrul indivi$ilor examinai se numete volumul seleciei.

Analiza seriilor statistice


2valuarea anumitor indicatori *parametri- statistici implic sta#ilirea caracteristicilor *proprietilor- principale ale seriilor statistice. Acestea sunt/ varia#ilitatea, omogenitatea, independena i concentrareaAmprtierea *dispersia- ctreAfaa de un una sau mai multe valori ale seriei. Variabilitatea termenilor unei serii statistice este determinat de faptul c fenomenul pe care l repre$int nu este univoc determinat, ci apare ca un re$ultat al aciunii com#inate a mai multor cau$e *permanente sau ntmpltoare-. %u ct aciunea cau$elor ntmpltoare este mai mare, cu att varia#ilitatea este mai mare i gradul de omogenitate mai mic. Omogenitatea presupune o variaie minim ntre termeni. (ac n urma anali$ei se constat c o serie nu pre$int omogenitate, nseamn c n acest ca$ colectivitatea este format din mai multe tipuri calitative i seria tre#uie descompus n su#serii componente. Independena termenilor unei serii provine din faptul c fiecare valoare individual repre$int un element distinct i o#iectiv al unei populaii statistice. 4ermenii ce aparin aceleiai colectiviti se supun acelorai legi care se manifest su# form de tendin. Concentrarea/mpr tierea !dispersia" ctreAfa de un una sau mai multe valori ale seriei apare ca re$ultat al intensitii unui efect produs de cau$e eseniale i ntmpltoare. Acest lucru determin fercvenele diferite de apariie a diferitelor valori din serie. (ac intensitatea factorilor este uniform, frecvenele de apariie sunt apropiate. n ca$ contrar, frecvenele de apariie se concentrea$ fie la un singur capt al seriei, fie ctre o valoare central.

#epartiii de $rec%ene
2xist diferene ntre anali$a seriilor dinamice i pro#lemele legate de gruparea i anali$area materialelor pentru care factorul timp nu are importan. 8a cercetarea seriilor dinamice pro#lema de #a$ o repre$int anali$a varia#ilei timp. Betodele de anali$ folosite n aceste dou ca$uri se deose#esc sensi#il. n cele ce urmea$ ne vom ocupa de pro#lemele gruprii i anali$ei preala#ile a datelor numerice pentru care ordinea de ae$are n timp nu contea$. (atele statistice n stare #rut repre$int o mas de$ordonat de materiale. .rima pro#lem este aceea de a face o asemenea grupare a datelor cu a3utorul creia s se poat aprecia valoarea lor n legtur cu pro#lema propus, s se poat nlesni comparaia cu alte date de acelai gen i s se poat o#ine posi#ilitatea unei anali$e ulterioare. nainte ca materialul statistic s fie supus anali$ei ulterioare i generali$rilor care vor permite s se fac anumite deducii, el tre#uie s capete o

>

anumit form i o structur clar. %u alte cuvinte n cadrul anali$ei datelor statistice tre#uie s se ia n considerare att valorile individuale ct i frecvenele de apariie ale acestora. n urma o#servrii caracteristicii cantitative X n n pro#e se o#in urmtoarele date primare/ x5, x:,..., xn *5-

n ca$ul n care volumul seleciei este mic aceste date sunt uor de manipulat i nu este nevoie de o grupare a lor. (ac ns avem o selecie de volum mare este greu de lucrat cu aceste date. n plus ta#elele de date primare nu sugerea$ nimic referitor la referitor la repartiia varia#ilei X. (e aceea este nevoie de o grupare *centrali$are- a datelor. 'ruparea datelor se face n funcie de tipul caracteristicii X. Astfel, dac X este o varia#il discret ce poate lua valorile distincte v5, v: ,..., vn , atunci n locul datelor iniiale se va reine repartiia empiric/

v5.v:. .vm n5.n:. .nm

*:-

6nde ni, *iC5, m- repre$int frecvena apariiei *numrul de apariii- valorii vi, iar n repre$int numrul valorilor din irul iniial *5- i se numete frecven absolut a valorii v. !aloare m repre$int numrul de clase. "aportul fj CnjAn dintre frecvena a#solut i numrul total de pro#e se numete frecven relativ. +e o#serv c f5 D f: DED fm C5 ntruct n5 Dn: D ... Dnm C n. 1recvenele relative, numite i impropriu pro#a#iliti de apariie, stau la #a$a calculrii densitii de repartiie a fercvenelor i a indicatorilor care exprim gradul de concentrare. (e asemenea permit compararea a dou repartiii construite pe aceeai varia#il, care difer numai prin numrul unitilor pe grupe. (ac X este o varia#il continu care poate lua valori ntr-un interval F a,bG atunci acest interval este mprit n m su#intervale Faj, ajD5G, jC5, m , cu a5 C a i amD5 C b. pentru fiecare din aceste su#intervale se determin numrul n al valorilor din irul *5- care se afl n acest interval numit frecven a#solut a su#intervalului. +u#intervalele Faj, ajD5G se pot lua ar#itrar. (e cele mai multe ori extremitile se iau echidistante, deci su#intervalele au lungimi egale. ns numrul m al su#intervalelor nu se alege la ntmplare. 2ste important ca prin gruparea datelor s nu se piard caracterul glo#al al repartiiei *dac m este prea mic se poate denatura repartiia real a varia#ilei X-. Astfel, dup unii autori numrul su#intervalelor, m, tre#uie alese n conformitate cu formula lui +turges / mCF5 D ;,;::lognG

Brimea intervalului va fi dat de formula/ i= xmax xmin m

) 55-;= ;5-5== 5=5-@== @=5-;=== ;==5-

m ;-> >-? ?-H H-5; 5;-:=

4a#elul 5. #eprezentarea gra$ic a repartiiilor statistice 2xist mai multe tipuri de repre$entri grafice a datelor statistice. (intre acestea pre$entm histograma, poligonul frecvenelor i graficul frecvenelor cumulate. Iistograma este o figur ntr-un sistem de coordonate rectangualre care repre$int distri#uia empiric prin dreptunghiuri. Ja$ele acestor dreptunghiuri, construite pe axa a#sciselor, repre$int su#intervalele folosite n centrali$area datelor. nlimea hj a dreptunghiului cu #a$a *aj, ajD5- este proporional cu raportul dintre frecvena relativ a intervalului i lungimea sa/
hj = C fj a j +5 a j

constanta % fiind un factor de scar. n ca$ul cnd su#intervalele gruprii au lungimi egale, nlimea h3 va fi proporional cu frecvena relativ, deci h3 CCKf3 . Poligonul frecvenelor este o diagram n care pe axa a#sciselor se iau mi3loacele vj ale intervalelor *aj, ajD5- folosite n grupare, iar pe axa ordonatelor valorile hj definite n construirea histogramei. 8inia frnt care unete punctele de coordonate * vj, hj- se numete poligonul frecvenelor. 2l se poate o#ine din histogram unind mi3loacele laturilor superioare ale drptunghiurilor. n fig 5 poligonul frecvenelor este trasat printr-o linie punctat. Brimile c5, c:, ..., cm definite prin/
c j = fi
i =5 j

se numesc frecvene cumulate. 8inia frnt o#inut prin unirea punctelor de coordonate *ajD5, cj G se numete graficul frecvenelor cumulate.

&odalit'i de clasi$icare a datelor

Bodul de sta#ilire a claselor L determinarea pragurilor minime i maxime ale fiecMrei clase determinM modul n care sunt atri#uite valorile fiecMrei clase i deci felul n care va arMta distri#uia. .rin schim#area claselor se crea$ diagrame cu aspect diferit. n general se urmrete ca valori similare s fie n aceeai clas. 2xist doi factori cheie n clasificarea datelor / schema de clasificare utilizat i numrul de clase ce se dorete a fi creat. (acM datele sunt #ine cunoscute se poate predetermina manual numMrul de clase. n ca$ contrar se utili$ea$ schemele clasice. %ele mai frecvente scheme de clasificare sunt/ natural breaks, quantile, intervale egale i deviaia standard. Acestea sunt descrise n cele ce urmea$. Sc(eme standard de clasi$icare Natural brea)s !*en)s" (atele se clasificM pe #a$a grupMrii naturale a valorilor. +e identificM punctele de rupturM cMutnd acele modele de grupare implicite ale datelor. !alorile sunt mpMrite n clase acolo unde graniele sunt marcate prin salturi mari de la o valoare la alta.

<

+uantile 1iecare clasM conine un numMr egal de valori. 7 astfel de clasificare este foarte potrivitM n ca$ul datelor liniare. (in cau$M cM datele sunt grupate dupM numMr n fiecare clasM, diagrama re$ultatM poate fi nelMtoare. (atele similare pot fi plasate n clase diferite, sau valori foarte diferite pot fi grupate mpreunM. AceastM distorsiune poate fi evitatM mMrind numMrul de clase.

Inter%ale egale AceastM schemM de clasificare divide irul de valori atri#ut n su#iruri egale. +pre exemplu n ca$ul unui ir de valori de la 5 la ;== i a trei clase, fiecare clasM repre$intM un ir de 5== * 5-5==, 5=5:==, :=5-;==-. AceastM metodM accentuea$M cantitatea de valori atri#ut relativ la celelalte valori, spre exemplu pentru arMta cM un maga$in este parte a unui lan de maga$ine care a reali$at o treime din vn$Mri. %el mai #ine se utili$ea$M pentru iruri de date dintr-un anumit domeniu cum ar fi tempertura i procentele.

Standard de%iation AceastM schemM de clasificare arat cu ct varia$ o valoare de la medie. +e calculea$M media i apoi se generea$M clasele adMugnd sau scM$nd din ea deviaia standard.

5=

Caracterizarea repartiiilor de $rec%en


(atele *care se refer la diferite domenii ale cunoaterii- odat aran3ate ntr-o repartiie de frecvene, scot n eviden trsturile commune ale tuturor cur#elor de repartiie i care se supun unor legi generale. Acest lucru ne permite ca experiena ctigat ntr-un anumit domeniu al cunoaterii s poat fi extins i n alt domeniu. 8a toate cur#ele ns tre#uie s o#servm varia#ilitatea mrimilor care se o#in ca re$ultat al unor msurtori. %u toate c exist varia#ilitate, se o#serv o tendin a datelor de a se grupa n centrul cur#ei *tendina central-. (ac se msoar mrimea a#aterii de la punctul de concentrare maxim a frecvenelor, se constat c sunt mai frecvente a#aterile mici dect cele mari, c a#aterile n am#ele pri fa de punctul de concentrare maxim se echili#rea$ aproape complet i c a#aterile foarte mari sunt foarte rare. (eoarece frecvena varia$, vom alege acea mrime care se ntlnete cel mai des. 2a va fi msura tendinei centrale a repartiiei. Aceast mrime, ca i altele asemntoare se numesc indicatori *sau parametrii- de po$iie, deoarece arat po$iia elementelor principale ale repartiiei pe axa a#sciselor. %aracterul repre$entativ al oricrui indicator de po$iie depinde de ct de strns i se altur celelalte valori, sau cu alte cuvinte, de gradul de concentrare a datelor n 3urul tendinei centrale.

Indicatorii tendinei centrale


Atenuarea datelor, care accidental sunt prea mari sau prea mici dintr-o populaie statistic se face prin calcularea unor medii, n felul acesta fcndu-se o compensare a valorilor individuale. Acest calcul ne arat o anumit tendin a fenomenului studiat, media statistic fiind o valoare ce sinteti$ea$ ntr-o singur expresie numeric toate valorile din seria msurtori sau o#servaii. 4ermenii seriei difer de medie deoarece au fost influenai de diferii factori. &edia aritmetic Bedia aritmetic simpl exprim un nivel mediu, anihilnd a#aterile individuale, netipice. 2a este cuprins ntre valoraea cea mai mare i cea mai mic. ,e$iniia -. (ac n urma unei selecii apar valorile distincte x5, x:,..., xn, atunci media aritmetic este dat de formula/ x= x5 + x: + ... + xn 5 n = xi n n i =5

n ca$ul datelor centrali$ate *n care avem repartiia de frecven *:--/ x= n5v5 + n: v: + ... + nn vn 5 n = ni vi n n i =5

care se mai numete medie aritmetic ponderat. )umrul care arat de cte ori se repet fiecare valoare *nj- este &ponderea& valorii respective. Obser%aia -. Bedia aritmetic are de$avanta3ul c este sensi#il la valori extreme, iar dac termenii sunt prea &mprtiai&, tinde s devin o valoare nerepre$entativ. Bedia aritmetic este o valoare lipsit de coninut dac elementele sunt deose#ite din punct de vedere calitativ, ca$ n care este mai util s se fac medii pariale pentru fiecare tip de colectivitate.

55

Obser%aia .. (ac avem mai multe medii, fiecare referindu-se la o anumit categorie, fiecare medie va fi ponderat n funcie de importana categoriei sale. &edia geometric Bedia geometric este mai puin sensi#il la valorile extreme dect celelalte medii, deci se ntre#uinea$ cnd dorim s atenum divergenele mari dintr-o serie de determinri cu frecvene egale, fiind dup o expresie &cea mai exact medie&. +e utili$ea$ cnd valorile au o evoluie *de cretere sau scdere- permanent, nentrerupt, sau o raie din ce n ce mai mare, termenii fiind legai ntre ei printr-o relaie de produs. (e asemenea se mai ntre#uinea$ cnd vrem s dm o importan mai mare termenilor mai mici, n valoare a#solut, sau cnd diferenele ntre termeni sunt foarte mari. Are de$avanta3ul c nu se poate ntre#uina cnd avem valori nule sau negative. ,e$iniia .. (ac x5, x:,..., xn sunt n valori, media geometric se definete prin
M g = n x5 x: ...xn

%alculul se face mai uor cu a3utorul logaritmilor/ lg M g = 5 n lg xi n i =5

(atorit faptului c se calculea$ mai uor cu a3utorul logarimilor, se mai numete &medie logaritmic&. 2a se utili$ea$ i la calcularea ritmului *de cretere sau descretere- numindu-se astfel i &medie de ritm&. n re$umat, se ntre#uinea$ cnd/ - seria are o mare dinamicitate0 - termenii au variaii mari0 - distri#uia are un caracter pronunat de asimetrie. Obser%aia /. Bedia geometric se folosete atunci cnd pre$int importan variaiile relative. (e asemenea media geometric poate fi folositoare pentru calculul unor rapoarte. &edia ptratica se ntre#uinea$ cnd valorile pre$int creteri din ce n ce mai mari. 2a constituie modelul matematic pentru a#aterea medie ptratic. Bedia este sensi#il la valori extreme, din care cau$ este ntotdeauna mai mare dect celelalte medii. Are avanta3ul c se poate aplica i n ca$ul valorilor nule sau negative *care prin ridicare la ptrat devin po$itive-. +e ntre#uin$ea$ cnd dm importan valorilor mari. ,e$iniia /. Bedia ptratic este definit prin formula/ x patr , s = 5 n : xi n i =5

sau n ca$ul datelor centrali$ate *media ponerat-/ x patr , p = 5 n ni vi: n i =5


5:

,e$iniia 0. Bedia armonic este valoarea invers a mediei aritmetice ale valorilor inverse datelor de o#servaie/
Mh = n

x
i =5

5
i

2xprim caracterul sintetic al unor valori ce se afl n raport invers. +e utili$ea$ cnd frecvenele sunt egale. .entru o repartiie de frecven, media armonic se folosete rar. +e utili$ea$ cu predilecie n economie. &edia glisant numit i &medie mo#il&, se utili$ea$ n ca$ul n care irul valorilor pre$int fluctuaii mari, #rute i e greu de apreciat tendina *trendul-. +e presupune c media glisant corespunde mi3locului intervalului sintetic. %alculul se face mediind ; sau @ valori alturate. ,e$iniia 1. Bedia glisant pentru ;, respectiv @ valori alturate sunt date de formulele xglis ,; = xi 5 + xi + xi +5 ; xi : + xi 5 + xi + xi +5 + xi + : @

xglis ,@ =

,e$iniia 23 &ediana este elementul dintr-un ir de date statistice care ar mpri intervalul n dou grupe egale ca numr, dup ce acestea au fost ordonate dup mrimea lor. (ac seria are :nD5 elemente, atunci mediana este elementul nD5, iar dac are :n elemente mediana este media aritmetic a celor doi termini din mi3loc.

IN,ICATO#II VA#IATI4I
7 medie este repre$entativ numai atunci cnd se calculea$ din valori omogene ntre ele. %u ct fenomenele sunt mai complexe *dependente de mai multi factori-, cu att variaia este mai mare i utili$area mrimilor medii devine insuficient. (e aceea este important de cunoscut ct de OdeparteP sunt valorile sumei statistice fa de medie. %omparaia se face cu media seriei, considerat ca fiind valoarea cea mai repre$entativ pentru populaia statistic. Anali$a statistic a unei repartiii poate fi aprofundat prin calculul indicatorilor de variaie. Acesti indicatori tre#uie s serveasc la / - verificarea repre$entativitii mediei ca valoare tipic a unei populaii statisatice0 - verificarea gradului de omogenitate a seriei0 - caracteri$area statistic a formei i gradului de variaie a unui indicator0 - cunoasterea gradului de influen a factorilor dup care s-a facut gruparea unitilor o#servate.

5;

Indicatorii simpli ai %ariaiei3


ndicatorii simpli ai variaiei servesc la caracteri$area gradului de mpratiere a mrimilor seriei statistice. +e pot exprima att n mrimi a#solute ct i n mrimi relative. (in aceasta grupa fac parte / - amplitudinea variaiei *a#solut i relativ-0 - a#aterile individuale *a#solute i relative-. Amplitudinea absolut se calculea$a ca diferena dintre valoarea maxim i valoarea minim al caracteristicii / Aa C xmax L xmin Amplitudinea relati%a se exprima de regul n procente i se calculea$ ca un raport ntre amplitudinea a#solut i media aritmetic / A ArC a 5== x Abaterile indi%iduale absolute *di- se calculea$ ca diferena ntre fiecare valoare i media aritmetic / di C xi - x , i C 5,...,n Abaterile indi%iduale relati%e *dr- se calculea$ ca raportul dintre a#aterile individuale a#solute i media aritmetic *se exprima n procente- / dr C
di x 5==

, i C 5,...,n

'radul de variaie al unei caracteristici depinde de toate a#aterile variantelor nregistrate i de frecventa lor de apariie i prin urmare indicatorii simpli ai variaiei nu pot exprima ntreaga variaie a unei populaii statistice. (e aceea a fost necesar introducerea indicatorilor sintetici ai variaiei.

Indicatorii sintetici ai %ariaiei3


ndicatorii sintetici ai variaiei, la fel ca i indicatorii tendintei centrale tre#uie s se #a$e$e pe toate o#servaiile, sa fie usor de calculat, uor de nteles i s fie ct mai puin afectai de fluctuaiile de selecie. ndicatorii sintetici ai variaiei sunt / - a#aterea medie liniar 0 - a#aterea medie patratic0 - dispersia0 - coeficientul de variaie. Abaterea medie liniar se calculea$ ca o medie aritmetic simpl sau ponderat, luate n valoare a#solut / .entru o serie simpl

5>

d=

Q x x Q
i =5 i

A#aterea medie liniar pre$int de$avanta3ul c nu ine seama de faptul c a#aterile mai mari n valoare a#solut influentea$ n mai mare masur gradul de variaie a unei caracteristici, n comparaie cu a#aterile mici. n plus, nu este indicat s se renune n mod ar#itrar la semnul valorilor din care se calculea$ o valoare medie. (in aceste considerente se folosete ca principal indicator sintetic al variaiei abaterea medie patratic. Abaterea medie patratic sau a#aterea standard *R- se calculea$ ca o medie patratic din a#aterile tuturor elementelor seriei de la media lor aritmetic/ RC

( x

Acest indicator este mai concludent dect a#aterea medie liniar. .rin ridicarea la ptrat se d o importan mai mare a#aterilor mari n valoare a#solut, acestea influennd ntr-o msura mai mare gradul de variatie al varia#ilelor anali$ate. n literatura de specialitate se aprecia$ ca pentru o serie de distri#uie normal a#aterea medie liniar este egal cu >A@ din valoarea a#aterii medii ptratice. A#aterea medie ptratic este un indicator de #a$, care se folosete la anali$a variaiei, la estimarea erorilor de selecie n calculul de corelaie. 8a fel ca a#aterea medie liniar, a#aterea medie ptratic se exprim n unitatea de masur a varia#ilei a carei variaie o caracteri$ea$. .rin urmare cei doi indicatori nu se pot folosi pentru compararea gradului de variaie i n aceasta situaie se recurge la un alt indicator de variaie / c eficientul de variaie. Coe$icientul de %ariatie *v- se calculea$a ca un raport ntre a#aterea medie ptratic i media aritmetic. (e o#icei se exprim su# form de procente / vC

x 5==

+emnificaie. %u ct valoarea lui v este mai aproape de $ero cu att variaia este mai sla#, colectivitatea este mai omogen, media avnd un grad ridicat de repre$entativitate. %u ct valoarea lui v este mai mare cu att variaia este mai intens, colectivitatea este mai eterogen, iar media are un nivel de semnificaie sc$ut. +e aprecia$ c la un coeficient de peste ;@->=S, media nu mai este repre$entativ i datele tre#uie separate n serii de componente, pe grupe, n funcie de variaia unei alte caracteristici de grupare. +e poate afirma c acest indicator poate fi folosit ca un test n aplicarea metodei gruprii. (ac media aritmetic este aproape de $ero, coeficientul de variaie nu are semnificaie. ,ispersia * : - este media ptratelor a#aterilor de la media aritmetic /
: =
: 5 xi x . n

5@

Bsura dispersiei se refer la T mprtierea U valorilor dintr-un set de date. Bedia nu are semnificaie dac se aplic pe un set de date foarte dispersate. (e exemplu dac lum valoarea medie a oraelor mari *peste :==.=== locuitori- va da o valoare de peste >==.=== datorit Jucuretiului care are :.===.===. ns re$ultatul nu are nici o semnificaie *nici un ora nu area aceast valoare-. Bsurile dispersiei, exprimate su# forma unitilor de msur ale fenomenului cercetat, nu sunt ntotdeauna utile atunci cnd se compar dispersiile a dou sau mai multe serii. %ompararea dispersiilor a dou sau mai multe serii d re$ultate n urmtoarele : situaii/ a- irurile care se compar pot fi exprimate n aceleai uniti, iar mediile pot fi aceleai sau au dimensiuni aproape egale. #- irurile care se compar pot fi exprimate n aceleai uniti, ns mediile difer. (ac seriile se exprim n uniti diferite, dispersiile nu pot fi comparate direct. (e aceea de multe ori se folosete a#aterea medie ptratic n loc de dispersie. n unele lucrri aceast mrime se numete varian *din l. engl. variance-. !ariana este o msur important n special cnd se studia$ variaia a dou sau mai multe eantioane. 7 tehnic statistic foarte puternic este cunoscut su# numele de analiza de varian i utili$ea$ dispersia pentru a decide dac un numr de eantioane difer semnificativ unul de altul.

S)e5ness i )urtosis
S)e5ness A#aterea medie ptratic i dispersia sunt indicatori care dau o msur a mprtierii valorilor ntr-o distri#uie de frecven. ntr-un anume sens ele ofer o msur a T limii U distri#uiei. Aceasta ns nu ofer nici o informaie privind caracteristicile formei distri#uiei de frecven. 1igura de mai 3os nfiea$ ? distri#uii utili$nd histograma. Aceasta repre$int un set de date care au acelai numr de valori. .e ori$ontal avem o unitate de msur exprimat n a#ateri medii patratice *-, iar pe vertical avem media aritmetic. (up cum se o#serv, se poate face o comparaie direct. Aparent cele ase distri#uii de frecven sunt foarte diferite. %ele din partea dreapt *#,d, i f- sunt similare dintr-un singur punct de vedere, anume ele sunt asimetrice, VvrfulW este plasat n stnga sau dreapta mediei. +punem c avem o distri#uie distorsionat sau asimetric *s,e9ed-. %ele din stnga *a,c,e- au un grad mic de distorsiune *asimetrie-. n toate ca$urile vrful este n apropierea mediei. 4oate acestea sunt distri#uite simetric. .e de alt parte cele dou distri#uii de pe fiecare rnd pot fi considerate similare, n sensul c au un anumit grad de VascuireW sau kurtosis. %ele din primul rnd sunt foarte ascuite0 ele au aceleai grad de ,urtosis. %ele din al doilea rnd au VascuimeaW mai moderat, iar cele din al treilea rnd sunt relative plate. (istorsiunea msoar, deci, volumul de valori din distri#uia concentrat de o parte i de alta a mediei. (ac acest volum de valori este mai mic dect media, spunem c distri#uia este po$itiv distorsionat *#-. (aca exist mai multe valori mai mari dect media, spunem c distri#uia este negativ distorsionat *d-.

5?

7 distri#uie perfect simetric nu are distorsiune *s,e9nessC=-. 2xist mai multe metode de msurare a distorsiunii. %ea mai u$itat este formula/
*x x!= n ;
;

unde la numrtor avem deviaia cu#ic a valorilor fa de medie, iar este a#aterea medie ptratic. Avem urmtoarele situaii/ -dac + X= avem distorsiune negativ0 -dac + Y= avem distorsiune po$itiv. +,e9ness este un concept cu aplicaii importante n geografie deoarece foarte multe varia#ile n geografie au o distri#uie accentuat distorsionat. %u alte cuvinte distri#uia de frecven seamn foarte mult cu cele nfiate n #,d sau f. n al doilea rnd ali indicatori cum ar fi media sau dispersia pot conduce la interpretri greite dac se folosesc i$olat.

5<

6urtosis Zurtosis d o msura a extinderii nspre valorile care sunt concentrate ntr-o parte a distri#uiei de frecven. (ac o clas ntr-o distri#uie de frecven conine o foarte mare parte din valorile din distri#uie, atunci distri#uia pre$int un mare grad de ,urtosis, iar forma este mai ascuit. ntr-o distri#uie cu un grad mic de ,urtosis *distri#uie plat- fiecare clas conine o proporie similar din toate valorile. 1ormula folosit pentru , este /
*x x"= n >
>

.entru distri#uia normal avem ZC;, pentru o distri#uie ascuita ZY;, iar pentru o distri#uie plat ZX;. (in pcate acest indicator nu este folosit n studii geografice asa cum ar fi de dorit. %a i distorsiunea Z ofer informaii preioase asupra distri#uiei unui set de date suplimentare celor date de medie i dispersie. 4re#uie remarcat faptul ca multe varia#ile statistice ntlnite n geografie au o distorsiune mare dar i un Z mare *Y;-. %nd se aplic acestor varia#ile media aritmetica i dispersia, acestea pot conduce la informaii eronate. Bai mult n aceste condiii datele nu pre$int o distri#uie normal astfel c nu pot fi aplicate testele parametrice.

5N

S-ar putea să vă placă și