Sunteți pe pagina 1din 45

CAPITOLUL I STATISTICA I CUNOATEREA REALITII SOCIAL ECONOMICE

I.1. Scurt istoric al dezvoltrii statisticii Statistica s-a dezvoltat ntr-un proces istoric ndelungat, parcurgnd traseul de la practic la teorie i a cunoscut mai multe etape, dintre care cele mai importante sunt: 1). Statistica practic 2). Statistica descriptiv 3). Aritmetica politic 4).Statistica probabilistic sau calculul probabilitilor 5). Statistica modern. 1). Statistica practic dateaz de peste 6000 ani i cuprinde primele forme de eviden, care au servit nevoilor practice ale cunoaterii i conducerii vieii social-economice. Statistica n antichitate a fost utilizat pentru descrierea statelor din punct de vedere geografic, economic, politic, cum ar fi: - inventarierea aurului, pmntului i animalelor n China ,Egipt, Grecia; - nregistrri primitive ale populaiei n statele sclavagiste: Egipt, Babilon, Asiria, Sumer; - nregistrri periodice cunoscute sub denumirea de census ale numrului populaiei ntr-o form mai avansat, evidena impozitelor i ntocmirea registrelor fiscale, cadastrale n Imperiul Roman (600 550 .e.n); - evidena pmntului prin serviciul numit tabularium n Dacia ocupat de romani. n Evul Mediu dezvoltarea cunoaterii statistice a vieii sociale, economice i politice ia un avnt deosebit, mai ales ca urmare a creterii schimburilor econoimice dintre state, care necesit informaii ct mai complete despre partenerii comerciali efectivi i poteniali. Evidenele din aceast perioad au avut un caracter demografic (inute de preoi despre cstorii, nateri, decese), contabil (inventarierea de bunuri ale feudelor, mnstirilor) i statistic (din iniiativa statului privind descrierea patrimoniilor, veniturilor, pmntului). 2). Statistica descriptiv reprezint cea mai veche rdcin teoretic a statisticii care apare odat cu practica statistic n cadrul universitilor, n secolele XVI XVIII, cnd descrierea cantitativ, numeric, a statelor privind populaia, armata, bogiile solului, activitatea productiv i comercial desfurat s-a amplificat, atingnd perfeciunea. Reprezentani ai acestei perioade sunt Francesco Sansovino (1521 1583) i Giovani Botero (15331517) care n lucrrile lor au luat n considerare la descrierea statelor: bogiile, populaia, comerul, finanele. O contribuia remarcabil la dezvoltarea statisticii descriptive aduce Dimitrie Cantemir (1673- 1723) prin lucrarea Descrierea Moldovei, care poate fi considerat o monografie cu caracter geografic, economic, politic, social i cultural. Statistica descriptiv s-a numit i statistic universitar, ntruct teoreticienii si de baz erau profesori universitari dintre care amintim: - olandezul Hermann Conring (1606-1681), fondatorul colii descriptive germane, de la Universitatea Helmstedt, care inea cursuri universitare despre tiina descriptiv a statului -germanul Gottfried Achenwall (1719-1772) de la Universitatea din Gottingen, care definete statistica1 drept tiina derscriptiv folosit pentru prezentarea particularitilor unui stat i este cel care d numele acestei discipline de statistic pornind de la cuvintul de origine latin status care nseamn stare i de la cuvntul italienesc stato care nseamn stat. Cu toate c cola german a ridicat statistica la rang de tiin, ea nc nu avea drept scop esenial descoperirea, cunoaterea legitilor statistice, a legturilor cauzale dintre fenomene.
1

G. Anchenwall a promovat denumirea acestei discipline de statistic, pe care a preluat-o de la profesorul su Martin Schmeitzel (1679-1747) de la universitatea din Halle. 5

3). Aritmetica politic s-a dezvoltat n Anglia n parale cu coala descriptiv german. Statistica aprut n Anglia este deosebit i reprezint un nou mod de cercetare, specific tiinelor naturii, fizicii, chimiei orientat spre descoperirea legilor care guverneaz fenomenele economico-sociale i a legitilor ce se manifest n cadrul lor, care permit formularea de concluzii i chiar previziuni, depind faza de descriere prin folosirea datelor i procedeelor bazate pe experimente. Denumirea acestui curent vine de la lucrarea lui William Petty (1623-1687), Aritmetica politic, sugernd semnificaia statisticii de analiz a datelor de observaie prin metode matematice. Alturi de William Petty, ali reprezentani de seam au fost John Graunt (1620-1674), Edmund Halley (1656-1742). Ei au pus accentul pe studiul fenomenelor demografice i i fundamenteaz concluziile pe un numr mare de cazuri individuale cu care, prin generalizare, se pot interpreta tendinele de producere a fenomenelor. 4). Statistica probabilist sau a calculului probabilitilor corespunde secolului al XVIII-lea, odat cu creterea rolului metodelor metematico-statistice n cunoaterea fenomenelor i cu apariia calculului probabilitilor. Jacob Bernoulli (1654-1705) a formulat faimoasa lege a numerelor mari i atrage atenia asupra posibilitii utilizrii calculului probabilitilor n economie. Dintre reprezentanii importani ai acestei etape fac parte: Pierre-Simon Laplace (1749-1829), Karl Friedrich Gauss (1777-1855) care definesc legea normal de repartiie, Simeon Denis Poisson (1781-1840) care a stabilit ecuaia cu derivate pariale, Adolf Quetelet 1 (1796-1874) a folosit n lucrrile sale din domeniul demografiei i criminalitii, calculul probabilitii i legea numerelor mari. 5). Statistica modern corespunde apariiei n secolul al XIX-lea a birourilor sau oficiilor de statistic pe plan naional i internaional, odat cu organizarea congreselor internaionale de statistic i cu apariia revistelor de specialitate. S-au formulat principiile teoriei seleciei i a extinderii rezultatelor acestora asupra ntregului, s-a fundamentat teoria corelaiei statistice i a analizei factoriale. La sfritul secolului al XIX-lea i nceputul secolului XX, prin contribuiile teoretice i metodologice ale lui Karl Pearson (1857-1936), Ronald Fisher (1890-1962), Francis Galton (1822-1911), statistica face progrese remarcabile i i cucerete statutul actual de disciplin tiinific i metod de cercetare utilizat n multe discipline. I.1.1.Organizarea statisticii n Romnia Att n plan teoretic ct i instituional, statistica romneasc s-a ncadrat n ansamblul curentelor statistice ale timpului. n 1859 au luat fiin primele organisme de statistic din Principatele Unite; - la Bucureti, Biroul de Statistic al rii Romneti, sub conducerea lui Dionisie Pop Marian (18291865); - la Iai, Direcia de Statistic din Moldova, sub conducerea lui Ion Ionescu de la Brad (1818 1891). Sub conducerea lui D.P.Marian apare n 1860 prima publicaie romneasc de statistic: revista Anale statistice. n anul 1862 cele dou organe de statistic se unesc i formeaz Oficiul Statistic al Principatelor Unite. Statistica a figurat i ca disciplin universitar la Facultatea Juridic de la Academia Mihilean din Iai susinut de Alexandru Papiu Ilarian. Ali reprezentani marcani ai statisticii romneti au fost Octav Onicescu (1892 1983), ntemeietorul colii romneti de teoria probabilitilor i academicianul Gheorghe Mihoc (1906 1981). n prezent, organul central al statisticii este Institutul Naional de Statistic i Studii Economice (INSSE), organizaie public, independent, guvernamental, care are drept scop producerea i difuzarea datelor statistice oficiale. Statistica oficial n Romnia are drept baz juridic Ordonana Guvernamental 9/1992 i Legea nr.11/1994. INSSE este organizat pe domenii de activitate i n teritoriu, n direcii judeene de statistic. Rezultatele activitii INSSE se regsesc n Anuarul Statistic al Romniei, Anuarul Demografic, Buletin de Informare, Revista de Statistic. n vederea aderrii la Uniunea European, rile candidate trebuie s adopte modelul i standardele statistice ale acesteia, astfel nct s se foloseasc de ctre toate rile membre i asociate, msurtori comparabile i compatibile. I.2. Obiectul de studiu i metoda statisticii
1

Adolf Quetelet- statistician, matematician i astronom belgian, fondator al statisticii moderne, a organizat mpreun cu demograful englez William Farr, primul Congres Internaional de statistic la Bruxelles, n anul 1853. 6

Semnificaiile actuale ale termenului statistic sunt: 1). Date numerice cu privire la unul sau mai multe fenomene din natur sau societate, culese, sistematizate i uneori publicate n anuare, culegeri, reviste; 2). Activitatea de culegere, prelucrare i valorificare a informaiilor statistice, organizat de stat sau de ctre cercettori; 3). Totalitatea metodelor, procedeelor, tehnicilor statistice; 4). tiin de sine stttoare. Statistica este tiina care studiaz fenomene i procese din natur i societate, relaiile dintre fenomenele economice i sociale, laturile cantitative ale fenomenelor n dependen de cele calitative. Statistica se ocup de acele fenomene i procese care se produc ntr-un numr mare de cazuri individuale i care pot fi denumite fenomene de mas, de tip colectiv. n societate, fenomenele pot fi: simple i de mas. Fenomenele simple apar ca rezultat al unei singure cauze i sunt considerate fenomene tipice, deterministe, adic are loc cauza se produce i efectul, dac rmn neschimbate condiiile. Fenomenele de mas apar ca rezultat al mai multor cauze cu grade diferite de influen i ele sunt considerate atipice deoarece forma lor de manifestare individual este foarte diferit. Fenomenele de mas sunt nedeterministe, stohastice, adic se produc ntmpltor, sunt legate de hazard, putnd fi studiate prin teoria probabilitilor i sub incidena legii numerelor mari. Potrivit legii numerelor mari, variaiile ntmpltoare de la tendina general se compenseaz reciproc dac exist un numr suficient de mare de cazuri individuale luate n studiu. Obiectul de cercetare al statisticii l reprezint studiul cantitativ al fenomenelor economico-sociale de mas n scopul cunoaterii i exprimrii legitilor manifestate la nivelul ntregului ansamblu. Statistica utilizeaz metode i modele matematice, dar elaboreaz i o serie de metode specifice. Totalitatea operaiilor, tehnicilor i procedeelor de investigare a fenomenelor de mas cu care opereaz statistica, formeaz metodologia ei. Statistica se preocup de elaborarea i perfecionarea unei metodologii tiinifice corespunztoare schimbrilor continue ce au loc n societate, a proceselor informaticii i a tehnicii de calcul. I.3. Concepte de baz utilizate n statistic Noiunile de baz cu care opereaz statistica sunt: 1). Colectivitatea (populaia) statistic; 2). Unitatea statistic; 3). Caracteristica (variabila) statistic; 4). Date statistice; 5). Indicatorul statistic. 1). Colectivitatea statistic, denumit i populaie, reprezint totalitatea elementelor individuale de aceeai natur, cu trsturi eseniale comune, generate de aceleai cauze i care sunt supuse cercetrii statistice. Colectivitatea statistic are un caracter obiectiv, existnd independent de voina cercettorului i finit, fiind un ansamblu msurabil cu un numr determinat de elemente. Colectivitile statistice pot fi: statice i dinamice. Colectivitile statice (de stoc) exprim o stare i au o anumit ntindere n spaiu, formnd un existent la un moment dat. Aceste colectiviti se caracterizeaz prin esena lor material, concret i prin faptul c volumul lor poate fi determinat prin msurare sau numrare la un moment dat. Colectivitile dinamice (de flux) exprim un proces, o devenire n timp, evoluia lor desfurnduse pe o scar a timpului, ntr-un anumit interval de timp. Ele reprezint manifestri ale colectivitilor de fiine sau de lucruri i se caracterizeaz prin esena lor nematerial, faptic i prin aceea c, volumul lor nu poate fi determinat prin msurare sau numrare la un moment dat, ci prin nregistrarea curent, continu a evenimentelor ce se produc ntr-un interval de timp i ntr-un spaiu determinat. n cazul colectivitilor statice timpul este constant, iar n cazul celor dinamice spaiul i forma de manifestare sunt constante. 2). Unitile statistice reprezint elementele individuale ale colectivitii. Unitile statistice au trsturi variabile n timp i spaiu, ele sunt uniti independente i obiective ce pot fi studiate separat, pe subcolectiviti sau pe ntreaga colectivitate. Totalitatea unitilor statistice care alctuiesc o colectivitate determin volumul colectivitii respective. n funcie de scopil cercetrii statistice, unitile unei colectiviti pot fi:

- simple: sunt elemente constitutive ale colectivitii i reflect nsi modul de existen al colectivitii, fiind elemente indivizibile. - complexe: care in de forma de organizare economic i social a colectivitii i pot fi mprite n mai multe uniti statistice simple. 3). Caracteristica statistic ( variabila): reprezint criteriile pe baza crora se caracterizeaz unitile colectivitii. Caracteristica reprezint nsuirea, trstura comun tuturor unitilor statistice ce compun o colectivitate i care are proprietatea de a nregistra variante sau valori diferite de la o unitate statistic la alta. I. Dup coninutul lor, pot fi: - caracteristici de timp: arat momentul sau perioada n care au existat unitile statistice; - caracteristici de spaiu: desemneaz un teritoriu, un loc, un spaiu unde exist unitile statistice; - atributive cantitative (numerice), exprimate cu ajutorul cifrelor, a numerelor; - atributive calitative, exprimate cu ajutorul cuvintelor, literal, altele dect cele de spaiu sau de timp. II. Dup natura variaiei, caracteristicile atributive cantitative pot fi: - cu variaie continu dac valorile posibile sunt n numr infinit sau sunt cunoscute ca fcnd parte dinainte dintr-un ir de valori posibile; - discrete, cu variaie discontinu, dac valorile sau variantele ei posibile sunt valori izolate pe un anumit interval. III. Dup numrul formelor de manifestare exist urmtoarele tipuri de caracteristici: - caracteristici alternative, ce pot avea doar dou forme de manifestare; - caracteristici nealternative, ce au o form sau mai mult de dou forme de manifestare. Formele concrete de manifestare ale caracteristicilor corespunztoare fiecrei uniti statistice se numesc variante sau valori. Numrul de uniti la care se nregistreaz aceeai valoare sau variant poart denumirea de frecven sau pondere. 4). Datele statistice sunt caracterizri numerice ale unitilor, grupelor i colectivitilor obinute prin observare i prelucrare. Mesajul datelor statistice l reprezint informaia numeric. 5). Indicatorul statistic: reprezint expresia numeric cu un coninut real, concret i cu o form specific de exprimare. Un indicator statistic este alctuit din trei pri: - expresia numeric; - partea noional care explic coninutul expresiei numerice; - partea care precizeaz timpul i spaiul pentru care ste valabil expresia numeric. Datele i indicatorii nu se deosebesc ntotdeauna. Indicatorii de regul se constituie din anumite date primare, pe baza unor calcule. I.4. Cercetarea statistic Activitatea statistic, depus n cadrul unor organisme de specialitate create n acest scop, se desfoar prin realizarea unui numr mare de operaii strict corelate, temeinic organizate, riguros programate. Cercetarea statistic cuprinde totalitatea operaiilor de culegere i nregistratre sistematizare i prelucrare, analiz i interpretare a informaiilor necesare pentru cunoaterea i conducerea proceselor economico-sociale de mas. Cercetarea statistic trebuie privit ca un proces de cunoatere ce presupune parcurgerea n succesiune logic a trei etape principale: 1). Observarea statistic; 2). Prelucrarea statistic; 3). Analiza i interpretarea statistic. Aceste etape pot fi separate n timp i, de regul, se efectueaz n locuri diferite i cu personal de diferite specialiti. Deosebit de important este asigurarea autenticitii datelor statistice n toate etapele cercetrii. Realizarea fiecrei etape impune o bun cunoatere a fenomenelor i proceselor investigate, a modului de organizare a colectivitii supuse cercetrii, a posibilitilor concrete de folosire a surselor de informaii. Schematic cele trei etape ale cercetrii statistice i operaiile specifice fiecreia dintre ele pot fi prezentate ca n figura nr.1.1:

OBSERVAREA STATISTIC

-culegerea i nregistrarea datelor individuale -verificarea datelor primare - sistematizarea datelor individuale prin centralizare i grupare -calcularea sistemului de indicatori statistici

PRELUCRAREA STATISTIC

-prezentarea rezultatelor
prelucrrii sub form de tabele, grafice , serii

ANALIZA I INTERPRETAREA STATISTIC

-confruntarea i compararea rezultatelor prelucrrii -verificarea ipotezelor concluziilor finale -fundamentarea calculelor de prognoz

-formularea

Fig. nr.1.1. Etapele i operaiile cercetrii statistice

I.5. Observarea statistic. Controlul datelor statistice Observarea statistic este prima etap a cercetrii statistice i const n culegerea i nregistrarea, pe baza unor criterii unitare, a datelor individuale privind mrimea, valoarea, formele de manifestare ale caracteristicilor pentru toate unitile statistice ce alctuiesc colectivitatea supus cercetrii. Observarea statistic trebuie s se realizeze pe baza unui plan, riguros fundamentat din punct de vedere tiinific, plan ce vizeaz dou categorii de probleme: - organizatorice; - metodologice. Problemele organizatorice se refer la: - elaborarea i tipizarea documentelor de nregistrare (centralizatoare, chestionare, formulare) i a instruciunilor; - sectorizarea teritoriului; - recrutarea i instruirea personalului care va executa observarea; - popularizarea observrii (dac este cazul), prin mass-media, despre scopul i natura observrii, n vederea obinerii unor date autentice. Problemele metodologice se refer la: a) stabilirea obiectului de investigaie, prin delimitarea colectivitii supuse cercetrii; b) alegerea unitii de observare, a elementului individual al colectivitii supuse cercetrii, de la care se culeg datele statistice individuale. n funcie de scopul observrii se va stabili tipul unitii statistice: simple sau complexe; c) precizarea caracteristicilor utile cercetrii, identificndu-le denumirea i variantele formelor de manifestare. Ele se formuleaz sub form de ntrebri clare, explicite. d) timpul observrii ce trebuie privit din dou puncte de vedere: timpul la care se refer datele nregistrate i timpul n care se nregistreaz datele. Timpul la care se refer datele poate fi un interval sau un moment. n cazul anumitor fenomene, datele se pot referi la o perioad de timp: lun, trimestru, an, iar n alte cazuri se refer la un moment dat, numit moment de referin sau moment critic.De exemplu, la recensmntul populaiei Romniei, organizat n luna martie 2002, ora 0 din data de 18 spre 19 martie, reprezint momentul critic la care se refer toate datele nregistrate. Timpul n care se efectueaz nregistrarea este ntotdeauna o perioad mai mare de timp i logic este ulterior producerii fenomenului studiat. e) locul observrii coincide, de regul, cu locul producerii fenomenelor, ns difer atunci cnd observarea se realizeaz prin prelucrarea datelor din diferite surse de informaii deja existente (anuare, reviste, publicaii, etc.) f) purttorii de informaii, respectiv documentele de nregistrare pot fi formulare statistice, benzi magnetice, dischete, CD-uri. Formele tradiionale de documente sunt fiele i listele.
9

Fiele sunt formulare individuale, completate pentru o singur unitate statistic i se utilizeaz atunci cnd unitile supuse cercetrii sunt dispersate n spaiu. Listele sunt formulare colective, completate pentru mai multe uniti statistice i se utilizeaz atunci cnd unitile statistice sunt concentrate n spaiu. Formularele de observare sunt nsoite de norme metodologice i tehnice privind completarea lor. Clasificarea observrii statistice se poate realiza n funcie de urmtoarele criterii: - dup numrul de uniti statistice; - dup perioada de timp la care se organizeaz; - dup modul de organizare. I. Din punct de vedere al gradului de cuprindere a colectivitii studiate, observrile statistice se clasific n: - observri statistice totale sau exhaustive: nseamn consemnarea ntr-o form unitar a tuturor unitilor statistice ale colectivitii studiate - observri statistice pariale: se efectueaz asupra unei pri a colectivitii. II. Din punct de vedere al timpului de nregistrare, se disting urmtoarele tipuri de observri statistice: - observri statistice curente: ce se efectueaz cu caracter continuu, sistematic i operativ asupra faptelor i fenomenelor, n timpul, la locul i pe msura apariiei lor (Raportrile statistice). - observri statistice periodice: se fac la anumite intervale de timp, dinainte stabilite, egale sau neegale. (recensmnt, ancheta, sondaj) - observri statistice unice (ocazionale): se utilizeaz n cadrul unor colectiviti de fapte i evenimente discontinue, neobinuite. III. n funcie de modul de organizare, se identific urmtoarele categorii de observri statistice: 1).Raportrile statistice; 2).Recensmntul; 3).Sondajul; 4).Ancheta; 5).Monografia. 1).Raportrile statistice sunt documente tipizate oficiale, prin care fiecare unitate economic sau instituie public este obligat s raporteze periodic forurilor n drept, rezultatele obinute n urma desfurrii unei activiti. Raportul statistic se caracterizeaz prin obligativitatea ntocmirii, prin metodologia unitar de calcul a indicatorilor raportai i prin elemente comune, cuprinse n fiecare formular tipizat, i anume: elemente de form (de identificare) i elemente de fond (de coninut). Sistemul raportrilor statistice reprezint o observare total, cu o periodicitate bine precizat i cu responsabilitile stipulate prin lege n privina autenticitii informaiilor furnizate. Fiecare agent economic sau instituie completeaz mai multe tipuri de rapoarte statistice, ce privesc anumite laturi ale activitii sale. 2) Recensmntul este o observare total, de mare amploare, periodic, ce reprezint situaia la un moment dat a colectivitii supuse cercetrii. Recensmntul populaiei este o observare statistic iniiat de stat, pe baza unui act normativ. Principiile metodologice privind organizarea recensmntului sunt: - principiul simultaneitii, potrivit cruia nregistrrile se refer la acelai moment, numit moment critic pentru toate unitile statistice; - principiul periodicitii, care presupune organizarea recensmntului la intervale egale de timp, pentru a putea asigura comparabilitatea datelor ; - principiul stabilitii, ce se refer la faptul c recensmntul trebuie organizat atunci cnd colectivitatea nregistreaz cel mai ridicat grad de stabilitate. Perioada de pregtire i organizare a recensmntului este foarte mare i vizeaz urmtoarele lucrri: - elaborarea calendarului recensmntului; - ntocmirea listelor pe localiti, cldiri; - sectorizarea teritoriului; - elaborarea i furnizarea formularelor i instruciunilor; - recrutarea i pregtirea personalului; - popularizarea recensmntului n rndul populaiei. Principala form de recensmnt o constituie recensmntul populaiei. Acesta se mai organizeaz pentru caracterizarea eptelului, pentru inventarierea produselor finite, pentru evaluarea mijloacelor fixe.

10

3) Sondajul (observarea selectiv) este observare statistic periodic, parial, prin care se culeg date i informaii numai pentru o parte a colectivitii studiate, numit eantion (mostr), urmnd ca rezultatele obinute s fie generalizate la nivelul ntregii colectiviti. Eantionul trebuie s fie reprezentativ, s cuprind aceleai structuri, uiti cu trsturi eseniale i valori tipice, ca i colectivitatea din care s-a extras. Sondajul se utilizeaz pentru cercetarea bugetelor de familie, recepia mrfurilor, nregistrarea preurilor, controlul calitii diferitelor produse, cercetri sociologice. Acesta se folosete ori de cte ori nu se poate efectua o observare total sau cnd e justificat din punctul de vedere al operativitii, economicitii i al condiiilor de realizare. De asemenea, se folosete frecvent la verificarea autenticitii datelor obinute prin observare total. 4) Ancheta este o observare parial, periodic, ce se bazeaz pe completarea benevol a unor chestionare. Prin anchete se urmrete obinerea unor informaii referitoare la tendinele ce se manifest n colectivitatea care intereseaz. Rezultatele anchetelor sunt orientative, deoarece nu se pune condiia reprezentativitii unitilor de la care se culeg date. Cele mai des ntlnite sunt anchetele privind cercetarea pieei i a opiniei publice, referitor la preferinele consumatorilor, iar mai recent, anchetele se utilizeaz n demografie, privind: mortalitatea pe grupe socio-profesionale, pe vrste, fertilitatea populaiei. 5) Monografia presupune studierea exhaustiv a unei singure uniti statistice complexe, cum ar fi o unitate economico-social, unitate administrativ-teritorial. Se efectueaz monografii pentru studierea fenomenelor demografice, ce din punct de vedere al sferei de cuprindere pot fi: - monografii ce studiaz un singur fenomen demografic (natalitate, mortalitate) n cadrul ntregii populaii sau a unei pri a acesteia, n corelaie cu toi factorii sociali-economici care l determin; - monografii ce studiaz un ansamblu de fenomene demografice interdependente, n cadrul unei uniti teritoriale sau zone geografice, la nivelul crora fenomenele demografice se difereniaz cel mai mult, n plus sau n minus fa de media lor pe ar. Monografia necesit colaborarea i conlucrarea unor cercettori din mai multe domenii. I.5.1.Controlul datelor Fiecare procedeu de observare prezint i posibilitatea de a nregistra erori, practic neexistnd observri perfecte. Erorile de observare reprezint neconcordane ntre nivelul nregistrat n formularele de observare i cel real. Ele pot fi ntmpltoare i sistematice. Erorile de observare ntmpltoare sunt abateri de la realitate care intr sub incidena numerelor mari i nu influeneaz n mod esenial rezultatele medii, deoarece aciunile lor ntr-un sens sunt egal probabile cu aciunile n sens contrar i se compenseaz reciproc la nivelul colectivitii. Acestea se datoreaz neateniei, nelegerii greite a sensului ntrebrilor, a nerespectrii instruciunilor i executrii defectuoase a nregistrrilor. Erorile sistematice sunt abateri voite ce denatureaz realitatea ntr-un singur sens, influennd rezultatele ntregii cercetri.Acestea se concretizeaz n exagerri ale dimensiunilor, proporiilor unui anumit fenomen, fie de ctre persoanele nregistrate, fie de cele care efectueaz nregistrarea. n vederea depistrii erorilor de observare , datele nregistrate sunt supuse controlului autenticitii . Controlul datelor statistice este o aciune ulterioar nregistrrii i se efectueaz cu scopul de a asigura volumul complet i calitatea datelor nregistrate. Datele statistice obinute prin nregistrare sunt supuse unui control cantitativ pentru a constata dac au fost cuprinse toate unitile colectivitii cercetatei dac la fiecare unitate au fost nscrise date pentru toate caracteristicile cuprinse n formulare. Prin controlul cantitativ se verific dac este complet volumul informaiilor statistice. Pe lng controlul cantitativ se efectueaz i un control calitativ (logic) ce const n verificarea valorilor pentru diferite caracteristici ntre care exist anumite relaii de interdependen. Prin control logic pot fi depistate eventuale erori sistematice, dac se compar n timp sau n spaiu, uniti statistice ce au condiii asemntoare dar la care apar variaii foarte mari n privina indicatorilor nregistrai.

11

CAPITOLUL II SISTEMATIZAREA I PREZENTAREA DATELOR STATISTICE


II.1. Sistematizarea datelor prin centralizare i grupare Datele primare obinute n urma observrii statistice , indiferent de tipul lor , prezint o mare varietate , necesitnd sistematizarea acestora pentru a putea oferi claritatea necesar i adaptabilitatea pentru calcule . Prin sistematizarea datelor se nelege organizarea colectivitii studiate din punct de vedere al unitilor componente i al caracteristicilor nregistrate. Sistematizarea are rolul de a facilita compararea , corelarea logic a dou sau mai multe caracteristici. Realizat manual sau cu ajutorul calculatorului electronic, n general, sistematizarea primar a datelor este matricial. De exemplu : dac se alege o colectivitate , notat cu U , alctuit din n uniti statistice, notate cu u1,u2,..,ui, , un i se aleg m caracteristici , notate xj, aceste elemente pot fi descrise astfel: ____ U= {u1, u2,,ui ,,un} i=1,n ___ X= {x1 ,x2 , ,xj, ,xm } j=1,m Dup nregistrarea valorilor i variantelor caracteristicilor pentru toate unitile statistice se obine o matrice de ordinul n*m, adic Xnm=[xij] , unde xij reprezint valoarea caracteristicii j pentru unitatea statistic i. Forma general a matricii este prezentat n tabelul nr.2.1.:

Unitile colectivitii uI

Tabel 2.1. Caracteristicile observate (xj) x1 x2 . . . xj . . . xm

12

u1 u2
.

. . ui . . . un

x11 x12 . . . x1j . . . x1m x21 x22 . . . x2j x 2m . . . . . . . . xi1 xi2 . . . xij . . . xim . . . . . . . . . . . . xn1 xn2 . . . xnj . . . xnm

Mrimea matricii depinde de numrul caracteristicilor alese i de numrul unitilor supuse observrii.Elementele matricei pot fi nule, pozitive sau negative. Pe baza maticei, pentu necesitile diferitelor analize, se pot alctui: - vectorul linie i, format din totalitatea caracteristicilor nregistrate la nivelul unei uniti statistice a colectivitii; -vectorul coloan j, format din totalitatea valorilor unei caracteristici la toate unitile statistice. Pe baza datelor primare, din caracteristicile numerice se pot calcula caracteristici derivate prin: a) operaii de adunare-scdere, pentru datele exprimate n aceeai unitate de msur; b) operaii de multiplicare (de nmulire) i de raport (mprire) pentru datele exprimate n uniti de msur diferite. scale de msurare prin atribuirea de valori fiecrei caracteristici. Se pot folosi patru scale de msurare: 1) scala nominal; 2) scala ordinal; 3) scala de interval; 4) scala de raport. 1) Scala nominal const n atribuirea de variante caracteristicilor nenumerice, astfel nct toi indivizii aparinnd aceleiai clase s aib aceeai valoare atribuit. De exemplu, pentru caracteristica domiciliu, studenii vor forma dou grupe. Prima grup cuprinde studenii din mediul urban, care se poate codifica drept clasa 1 i o grup care cuprinde studenii din mediul rural, notat drept clasa 2. Volumul de informaii obinut prin sistematizarea datelor cu ajutorul scalei nominale este direct proporional cu numrul claselor construite; aadar cu ct numrul claselor crete, cu att analiza este mai amnunit. 2) Scala ordinal se aplic tot n cazul caracteristicilor nenumerice calitative, unitile statistice putnd fi ordonate cresctor sau descresctor i li se pot atribui ranguri sau numere de ordin. De exemplu: ordonarea gimnatilor dup numrul de medalii obinute: 1. nici o medalie; 2. o medalie; 3. dou medalii; 4. trei sau mai multe medalii. 3) Scala de interval se utilizeaz pentru caracteristicile atributive cantitative i presupine introducerea ntre valorile caracteristicii a distanei dintre ele. Aplicarea acestei scale const n atribuirea de valori caracteristicii msurate n funcie de intervalul dintre valori. n acest caz, punctul zero al scalei i unitatea de msur se pot alege arbitrar sau convenional. Scala de interval se aplic la cuantificarea curgerii timpului calendaristic sau la msurarea temperaturii. 4) Scala de raport (metric) este cea mai nalt treapt de msurare, cu ajutorul acesteia se exprim cele mai multe caracteristici numerice economice. n cazul acestei scale, punctul zero este dat n mod natural, semnificnd efectiv absena fenomenului. Valorile msurate pe scala de raport pot fi: cantitile executate, vndute, venituri realizate, preuri unitare, vrsta, vechimea mic. Sistematizarea datelor se efectueaz prin centralizare i grupare.

13

Centralizarea datelor const n strngerea datelor la locul prelucrrii a tuturor informaiilor i determinarea totalurilor pentru caracteristicile direct nsumabile sau care devin nsumabile, prin aplicarea unor coeficieni de echivalen. Centralizarea datelor poate fi: - simpl; - pe grupe. Centralizarea simpl nseamn agregarea valorilor individuale ale caracteristicilor pentru toate unitile de colectiviti care permit nsumarea din punct de vedere al coninutului, n scopul obinerii indicatorilor totalizatori. n urma centralizrii simple se obin informaii privind volumul colectivitii i valoarea totalizat a caracteristicilor cuprinse n planul observrii i care sunt exprimate n uniti de msur nsumabile. Centralizarea pe grupe are drept scop cunoaterea mai detaliat a fenomenului, permind analiza structurii colectivitii. Aceasta const n gruparea datelor i n calcularea indicatorilor totalizatori pe fiecare grup, iar pe baza lor a indicatorilor totalizatori pe ntreaga colectivitate. Centralizarea pe grupe include mai multe centralizri simple. n urma centralizrii se obin indicatori statistici totalizatori ce au un coninut concret i o form specific de exprimare, motiv pentru care sunt denumii indicatori absolui. Ei constituie baza informaional a cunoaterii statistice i sunt urmrii statistic la toate structurile organizatorice ale economiei naionale. Gruparea statistic (clasificare, stratificare) const n mprirea colectivitilor statistice n grupe omogene de uniti statistice, dup variaia uneia sau mai multor caracteristici de grupare. La aplicarea gruprilor se opereaz cu noiunile urmtoare: - caracteristica de grupare; - variaia; - amplitudinea; - grupa omogen. Caracteristica de grupare este acea nsuire n funcie de care unitile statistice se separ pe clase sau pe grupe omogene. Variaia este proprietatea caracteristicilor de grupare, de a nregistra mai multe valori sau mai multe forme de manifestare. Amplitudinea,notat cu A, reprezint cmpul de variaie a tuturor valorilor individuale ale unei caracteristici i se determin ca diferen ntre valoarea maxim i minim. Grupa omogen reprezint clasa de uniti statistice la care variaia caracteristicii de grupare este minim. Gruprile statistice se pot clasifica dup mai multe criterii. 1.n funcie de numrul caracteristicilor de grupare, gruprile statistice pot fi: - a. simple; - b. combinate. a. Gruprile simple se efectueaz dup o singur caracteristic de grupare i sunt utile pentru determinarea tendinei de concentrare a fenomenelor. Forma general a unei grupri simple este prezentat n n tabelul simplu nr.2.2: Forma general a unei grupri simple Tabel 2.2.
Caracteristica xi x1 x2
. .

xi . . xn
.

Numr de uniti statistice fi f1 f2 . . fi . . fn fi

TOTAL

b. Gruprile combinate se obin dup dou sau mai multe caracteristici. n acest caz, colectivitatea se mparte n grupe omogene dup o anumit caracteristic, apoi aceste grupe se mpart, la rndul lor, n alte subgrupe mai mici, dup o alt caracteristic. Gruparea combinat dup mai mult de dou caracteristici este relativ rar, deoarece odat cu creterea numrului de caracteristici, scade claritatea, exigibilitatea unui astfel de tabel.
14

Tabelele obinute dup o grupare combinat se numesc tabele cu dubl intrare (vezi tabelul nr.2.3.). Tabel 2.3.
Caracteristica Caracteyj -ristica xi x1 x2 . . xi . . xn Total dup caracteristica y y1 f11 f21 . . fi1 . . fn1 fy1 y2 f12 f22 . . fi2 . . fn2 fy2
.

...

yj . . .

ym f1m f2m . . fim . . fnm fym

Total dup caracteristica x fx1 fx2 . . fxi . . fxn

. . . f1j . . . . . . f2j . . . . . . . . fij . . . . . . . . fnj . . . . . . fyj . . .

fij

ntre frecvenele totalizate pe rnduri i coloane exist urmtoarele relaii:

f ij = f xi = f yj
i =1 j =1 i =1 j =1

2.n funcie de coninutul caracteristicilor de grupare, exist urmtoarele categorii de grupri: a) grupri teritoriale: n cazul n care mprirea n grupe omogene se face dup apartenena teritorial a unitii. b) grupri cronologice: cnd timpul este considerat elementul definitoriu n sistematizarea datelor. c) grupri tipologice: n funcie de o caracteristic atributiv calitativ. d) grupri cantitative (numerice): dup o caracteristic atributiv cantitativ. n funcie de gradul de variaie, gruprile cantitative pot fi: - pe variante, n cazul n care numrul variantelor valorilor numerice nregistrate este redus, iar fiecrei valori i corespunde o grup. - pe intervale, n cazul n care variaia caracteristicii este mare. Intervalele de grupare pot fi egale sau neegale. Gruparea numeric pe intervale egale se realizeaz parcurgnd mai multe etape: 1. Se calculeaz amplitudinea (A), ca diferen ntre valarea maxim (xmax) i valoarea minim (xmin) a caracteristicii de grupare: A=xmax-xmin 2. Se determin numrul de grupe n care se va mpri colectivitatea dup relaia lui H. D. Sturges: ng=1+3.322lgn unde : ng- numrul de grupe n numrul de uniti statistice din care este alctuit colectivitatea. 3. se determin mrimea intervalelor de grupare (h), dup formula :
h= A 1 + 3.322 lg n

4. se construiesc intervalele de grupare prin adunarea succesiv a mrimii intervalelor de grupare pornind de la valoarea minim a caracteristicii de grupare (xinf), care devine limit inferioar a primului interval de grupare. n vederea obinerii unei grupri corecte trebuie respectate cteva reguli , cum ar fi: - limita inferioar a primului interval se poate stabili mai mic dect xinf; - mrimea intervalului de grupare (k) trebuie s fie un numr ntreg, dac este numr zecimal ntotdeauna se rotunjete n sus; - limita superioar a unui interval poate fi egal sau neegal cu limita inferioar a intervalului imediat urmtor. Forma unui tabel care prezint o grupare pe intervale este urmtoarea: Tabel 2.4.
Intervale de grupare dup caracteristica xi x1inf-x1sup x2inf-x2sup Numr de uniti statistice fi f1 f2

15

xIinf-xIsup ... xminf-xmsup Total

... fi ... fm

fi II.2. Serii statistice

Seriile statistice sunt rezultatul gruprii datelor dup una sau mai multe caracteristici. Seria statistic reprezint corespondena dintre valorile (variantele) unei caracteristici i frecvena corespunztoare sau variaia unei alte caracteristici, cu care se coreleaz. Aadar, seria statistic cuprinde dou iruri de date corespondente: - primul ir se refer la criteriul de enumerare (valorile sau variantele caracteristicii, momentele sau intervalele de timp, unitile teritoriale); -al doilea ir cuprinde date numerice ce arat frecvena sau mrimea primului ir. Seriile statistice pot fi clasificate dup mai multe criterii, prezentate n continuare. I. n funcie de numrul caracteristicilor studiate, exist urmtoarele tipuri de serii statistice: -serii unidimensionale (univariabile) obinute n urma gruprii dup o singur caracteristic; -serii multidimensionale, obinute n urma gruprii dup dou sau mai multe caracteristici. II. n funcie de coninutul caracteristicii studiate, seriile statistice pot fi: a) serii de repartiie (de distribuie); b) serii descriptive; c) serii cronologice (de timp sau dinamice); d) serii teritoriale (de spaiu). a) Seriile de distribuie se elaboreaz cnd caracteristicile de grupare studiate sunt atributive, exprimate numeric sau nenumeric i se realizeaz prin specificarea frecvenelor, respectiv a numrului de uniti statistice la care s-a nregistrat aceeai valoare sau variant a caracteristicii. Forma seriei de distribuie: x1 x2 X: f1 f2 fi. fn unde:xi -reprezint valorile individuale ale caracteristicii; fi-reprezin frecvenele de apariie ale valorilor caracteristicii. Un exemplu de serie de distribuie pe variante este prezentat n tabelul nr.2.2,iar tipul seriei de distribuie pe intervale este exemplificat n tabelul nr.2.4. b) Seriile descriptive prezint o colectivitate prin enumerarea unitilor componente i a valorilor principalelor caracteristici nregistrate. c) Seriile cronologice se elaboreaz pentru a descrie evoluia n timp a unui fenomen sau proces. n funcie de timpul la care se refer datele, seriile cronologice pot fi: - serii cronologice de momente, n cazul n care valorile caracteristicii au fost nregistrate la anumite momente determinate de timp. Termenii unei serii de momente nu se pot nsuma direct, pentru c ar duce la nregistrri repetate. - serii cronologice de intervale, care prezint valorile unei caracteristici nregistrate pentru intervale sau perioade de timp (luni, trimestre, semestre, ani). Termenii unei serii de intervale sunt nsumabili, obinndu-se valoarea centralizat pentru ntreaga perioad. Forma general a unei serii dinamice este prezentat n tabelul nr.2.5. : Tabel 2.5.
Timpul (ti) t0 t1 ... .
.

...

xi. xn

Valorile caracteristicii xi x0 x1 ... .


.

ti .. . tn

xi ... .
.

xn

16

d) Seriile teritoriale rezult din centralizarea frecvenelor sau ale variantelor caracteristicii studiate,
dup variaia unei caracteristici de spaiu. De exemplu: altitudinea medie a principalelor localiti din judeul Mure. Modelul unei serii teritoriale este cel prezentat n tabelul nr.2..6: Tabel 2.6.
Unitatea teritorial A B . . Z Valorile caracteristicii xA xB
. .

xZ

II.3. Vizualizarea datelor cu ajutorul tabelelor i reprezentrilor grafice Tabelul statistic se folosete n toate fazele cercetrii statistice, de la culegerea datelor, prelucrarea i analiza lor, pn la prezentarea rezultatelor finale. Tabelul statistic poate fi format dintr-o singur serie sau din mai multe serii. Forma de prezentare a unui tabel statistic este o reea de linii verticale i orizontale care prin ntretiere formeaz rndurile, coloanele i rubricile tabelului. Din punct de vedere al fondului, tabelul statistic exprim coninutul unei colectiviti printr-un numr redus de cuvinte i un numr mare de cifre. Elementele de baz ale tabelului statistic sunt: - subiectul tabelului, ce este dat de fenomenul sau procesul cercetat i presupune precizarea colectivitii studiate i a unitilor statistice. Acesta se descrie la capetele rndurilor. - predicatul tabelului, ce precizeaz denumirea indicatorilor i caracteristicilor pentru care s-au nregistrat date i cu ajutorul crora se studiaz colectivitatea i care se descriu la capetele coloanelor; - datele numerice reprezint valorile sau variantele caracteristicilor i se trec n rubricile tabelului; - nota explicativ reprezint un element facultativ i are drept scop precizarea sursei datelor sau a metodologiei distincte de calcul pentru anumite valori din tabel. Principalele tipuri de tabele statistice sunt: 1) Tabele statistice simple sunt folosite pentru nregistrarea i prezentarea datelor primare. Prezentarea colectivitii n acest caz se face prin simpla enumerare a unitilor statistice, nscriind n dreptul fiecrei uniti valorile caracteristicilor observate. Tabelele statistice simple pot fi: - enumerative; - teritoriale, dac datele numerice se repartizeaz n funcie de uniti de spaiu; - cronologice, dac valorile caracteristicilor se nregistreaz n funcie de timp. 2) Tabelele statistice pe grupe cuprind datele numerice referitoare la o colectivitate desprit pe grupe omogene dup o singur caracteristic. 3) Tabelele statistice combinate (cu dubl intrare) sunt rezultatul mpririi colectivitii n grupe omogene, dup cel puin dou caracteristici. Reprezentrile grafice, denumite i diagrame sau grafice, redau ntr-o form expresiv evolia unor fenomene, constituind nu numai o form de prezentare a rezultatelor cercetrii, dar i un suport logic inductiv sau deductiv de analiz i interpretare a fenomenelor studiate. Elementele constructive ale unui grafic sunt: - titlul graficului, care trebuie s corespund coninutului datelor prezentate; - scara de reprezentare este locul geometric al punctelor cotate. Aceasta se alege n funcie de mrimea datelor de reprezemtat, de gradul de variaie dintre ele, de spaiul disponibil astfel nct s asigure proporionalitatea dimensiunii lor graficului. - reeaua graficului poate fi reprezentat de sistemul axelor de coordonate rectangulare Ox, Oy, primul cadran sau poate fi format din linii paralele verticale, orizontale, oblice pentru a distinge diferitele pri ale graficului. - legenda are rolul de a explica semnificaia simbolurilor utilizate, semnelor convenionale utilizate, haurri, culori, reele. n funcie de natura datelor de reprezentat exist mai multe tipuri de grafice:

17

a) diagrame prin areale se utilizeaz pentru reprezentarea grafic a indicatorilor de volum


unidimensionali, nregistrai pentru un numr redus de uniti statistice (3-5) sau pentru uniti de timp. Aria figurii geometrice alese trebuie s fie proporional cu mrimea indicatorilor de reprezentat. Exist dou tipuri de diagrame prin areale: a1) diagrama prin ptrate; a2) diagrama prin cercuri. b) diagrame structurale evideniaz raportul care exist ntre prile componente ale colectivitii. Fiecare figur geometric aleas se va diviza n attea pri cte grupe omogene are colectivitatea cercetat. Se disting trei categorii de diagrame structurale: b1) dreptunghiul de structur; b2) cercul de structur; b3) ptratul de structur. c) Reprezentri grafice ale seriilor de distribuie cu frecvene se utilizeaz n cazul n care valorile caracteristicii sunt prezentate sub form de intervale egale sau neegale, i pot fi de dou tipuri: c1) histograma; c2) poligonul frecvenelor. d) Cronograma: se folosete pentru a reprezenta grafic valorile uneia sau mai multor serii cronologice. e) Diagrame prin benzi i coloane: se construiesc n cazul n care se reprezint valori ale unor serii teritoriale sau serii cronologice de intervale egale. Acestea permit reprezentarea n acelai sistem de axe a doi sau mai muli indicatori ntre care exist anumite interdependene. f) Graficul norilor de puncte: se utilizeaz n cazul gruprilor combinate pentru a evidenia forma i intensitatea legturii dintre caracteristici. Reprezentrile grafice se pot realiza, n cea mai mare parte, cu ajutorul programului EXCEL sau n anumite situaii, se pot construi manual. Regula de baz n construcia unei reprezentri grafice este de a asigura proporionalitatea ntre dimensiunea figurilor geometrice utilizate i mrimea valorilor de reprezentat.

II.4. Indicatorii statistici rezultai din prelucrarea primar a datelor Indicatorii statistici, ca expresie sintetic sau analitic a fenomenelor i proceselor de mas, sunt elaborai pe baza unor metodologii i tehnici specifice prin care li se stabilete coninutul, puterea cognitiv i legturile cu ceilali indicatori. Aceatia sunt purttori de informaii, au coninut real, obiectiv determinat i pot fi utilizai fie unilateral, pentru a caracteriza anumite aspecte ale unor fenomene i procese sub raportul volumului i structurii, fie sub form de sistem de indicatori pentru a studia interdependenele dintre anumite fenomene. Indicatorii folosii n cercetarea statistic pot fi: - primari; - derivai. Indicatorii primari se obin n urma prelucrrii datelor individuale, fie prin nregistrare direct, rezultai din observare, fie prin nsumare parial, pe grupe sau total, pe ntreaga colectivitate a datelor individuale de acelai fel. Acetia sunt exprimai n uniti de msur specifice caracteristicii observate sau n cazul n care sunt caracteristici ale cror valori nu pot fi nsumate direct, se folosec uniti natural-convenionale sau valorice. De aceea indicatorii primari se mai numesc indicatori absolui, cu un coninut real i o form de exprimare concret, care reflect volumul colectivitii (pe total sau pe grupe) i nivelul cumulat al diferitelor caracteristici observate (pe total colectivitate sau pe grupe de uniti). n activitatea social-economic, indicatorii primari absolui, rezultai n urma sistematizrii datelor, pot fi folosii ca atare, fr nici o prelucrare suplimentar sau pot fi supui diferitelor prelucrri i procedee de calcul, obinndu-se indicatori derivai.
18

Indicatorii derivai se obin prin prelucrarea indicatorilor absolui prin diferite procedee de calcul i au drept scop evidenierea aspectelor calitative ale fenomenelor i proceselor cercetate, aspecte ce nu pot fi surprinse de indicatorii absolui, cum ar fi: componena structural, intensitate, dinamic, nivel mediu, etc. Indicatorii derivai se obin, n general, ntr-un proces de comparaie realizat pe baz de diferen sau de raport. Compararea datelor se poate face: - la nivelul unitii statistice pentru una sau mai multe caracteristici - la nivelul unei grupe omogene, din punct de vedere al uneia sau mai multor caracteristici sau n ce privete numrul unitilor statistice ce compun grupa respectiv - la nivelul ntregii colectiviti cercetate, de asemenea pentru una sau mai multe caracteristici sau a numrului de uniti statistice componente. Compararea pe baz de diferen se poate efectua, mumai atunci cnd datele sunt comparabile din punct de vedere al coninutului i al unitilor de msur. Compararea pe baz de raport se poate face att n cazul datelor cu acelai coninut, ct i n cazul datelor cu coninut diferit dar interdependente ntre ele. Indicatorii derivai ce se pot determina din prelucrarea primar a datelor sunt: a) modificarea absolut; b) mrimile relative. a) Modificarea absolut ( ) se calculeaz ca diferen ntre date de acelai tip i se mai numete spor sau reducere absolut. Diferena se efectueaz ntre mrimea comparat i mrimea baz de comparaie cu ajutorul urmtoarelor formule: x=xc xbc= , unde xc- este mrimea comparat xbc- este mrimea baz de comparaie sau x=xc - xbc= sau f=fc -fbc= unde f-numrul de uniti statistice comparate. b) Mrimile relative sunt indicatori derivai, rezultai din compararea sub form de raport a doi indicatori statistici i exprim printr-un singur numr proporiile indicatorului raportat fa de indicatorul baz de

xc 10 k xbc
raportare.Formula general de calcul: unde k=0,1,2,3, Rezultatul raportrii poate fi un numr ntreg sau zecimal i se poate exprima sub form de ct, coeficient, procent, promile, procentimile sau n uniti de msur combinate. Mrimile relative sunt instrumente necesare i utile n analiza ntregii activiti economice, dar construcia lor simpl, permite posibilitatea obinerii unor indicatori ce estompeaz, uneori denatureaz aspectele reale. De aceea, calcularea lor trebuie precedat de alegerea atent a bazei de comparaie i verificarea comparabilitii datelor raportate. Drept baz de comparaie se aleg acei indicatori fa de care indicatorii comparai permit obinerea unor mrimi relative cu grad mare de sintetizare i care au sens economic. Principalele tipuri de mrimi relative sunt: 1) Mrimi relative de structur; 2) Mrimi relative de coordonare; 3) Mrimi relative de dinamic; 4) Mrimi relative ale planului; 5) Mrimi relative de intensitate. 1) Mrimile relative de structur se determin atunci cnd o colectivitate este separat n grupe sau clase, dup variaia uneia sau mai multor caracteristici i exprim raportul n care se afl un element sau un grup de elemente ale colectivitii, fa de volumul ntregii colectiviti. Principalele mrimi relative de structur sunt: - greutatea specific; - frecvena relativ.
19

a) Greutatea specific, notat gi, se calculeaz prin raportarea mrimilor agregate la nivelul grupelor omogene ale valorilor individuale ale caracteristicii, la mrimile agregate pe ntreaga colectivitate a valorilor caracteristicii, dup formula: Rezultatul arat ponderea valorii caracteristicii (a unui indicator) unei grupe omogene n totalul valorii

gi =

x
i =1 j =1

j =1 n m

ij

100

ij

caracteristicii, la nivelul ntregii colectiviti. b) Frecvena relativ, notat fi*, se determin raportnd frecvena corespunztoare unei grupe omogene (f i), la numrul total de uniti statistice din care este alctuit colectivitatea (fi). Formula de calcul:

fi =

fi

f
i =1

100
i

Rezultatul, arat ponderea numrului de uniti statistice dintr-o grup n numrul total de uniti statistice ce alctuiesc colectivitatea. Suma mrimilor relative de structur, calculat fa de aceeai baz, este ntotdeauna egal cu 100%. Msura relativ de structur se reprezint cu ajutorul diagramelor structurale. 2) Mrimile relative de coordonare sau de teritoriu se calculeaz ca raport ntre doi indicatori absolui de acelai fel, din aceeai perioad de timp, nregistrai pentru grupe diferite ale aceleiai colectiviti sau pentru colectiviti statistice de acelai fel, dar situate n spaii diferite. Formulele de calcul sunt:

kB / A =

xA (100) xB
sau

kA/ B =

xA (100) xB

Unde xA-valoarea caracteristicii pentru unitatea teritorial A; XB-valoarea caracteristicii pentru unitatea teritorial B. Mrimile relative de coordonare admit reversibilitatea, direcia de comparare nefiind mic; oricare dintre termenii comparai n funcie de scopul urmrit poate fi considerat ca termen comparat sau ca termen baz de comparaie. Rezultatul arat cu cte procente este mai mare sau mai mic termenul comparat fa de termenul baz de comparaie sau ct reprezint termenul comparat din termenul baz de comparaie. Dac rezultatul rmne sub form de coeficient, arat de cte ori este mai mare sau mai mic termenul comparat fa de termenul baz de comparaie. 3) Mrimile relative de dinamic se folosesc pentru a caracteriza evoluia n timp a fenomenelor i sunt specifice seriilor cronologice. Acestea se determin ca raport ntre nivelul fenomenului dintr-o perioad, considerat perioad curent, notat cu 1 i nivelul aceluiai fenomen nregistrat ntr-o perioad anterioar, considerat perioad de baz, notat cu 0. Formula de calcul este:

20

k1 / 0 =

x1 (100) x0

Dac se compar ntre ei toi termenii unei serii cronologice, se obin mrimi relative de dinamic cu baza fix, n cazul n care se raporteaz fiecare termen la termenul iniial i respectiv mrimi relative cu baza mobil, n cazul n care se raporteaz fiecare termen la termenul din perioada precedent. Formulele de calcul sunt:

ki / 0 =

xi (100) x0

k i / i 1 =

xi (100) xi 1

Rezultatul sub form de coeficient, arat de cte ori a crescut sau a sczut nivelul fenomenului n perioada curent fa de perioada de baz. Dac rezultatul se exprim sub form de procent, arat cu ct la sut a crescut sau a sczut, nivelul din perioada curent fa de nivelul din perioada de baz. Mrimile relative de dinamic, nu admit proprietatea de reversibilitate, exprimndu-se ntr-un singur sens. 4)Mrimile relative ale planului se folosesc ori de cte ori un fenomen se desfoar n mod organizat, programat sau planificat. Agenii economici utilizeaz aceti indicatori pentru caracterizarea produciei, aprovizionrii, desfacerilor, costurilor, fondurilor de salarii, n funcie de programele elaborate i urmrite. Se pot determina: - mrimile relative ale sarcinii de plan; - mrimile relative ale ndeplinirii planului. Mrimea relativ a sarcinii de plan se determin raportnd nivelul planificat pentru perioada curent, la nivelul efectiv realizat ntr-o perioad anterioar, luat drept baz de comparaie, dup formula:

k pl / 0 =

x pl x0

(100)

Rezultatul arat cu ct la sut este mai mic sau mai mare nivelul planificat fa de nivelul realizat n perioada de baz. Mrimea relativ a ndeplinirii planului se obine prin raportarea nivelului efectiv realizat n perioada curent, la nivelul planificat pentru perioada curent. Formula de calcul este:

k1 / pl =

x1 100 x pl

Rezultatul poate fi interpretat astfel: dac este: - mai mare de 100%, s-a nregistrat o depire de plan; -egal cu 100%, planul a fost realizat integral; - mai mic de 100%, planul nu a fost ndeplinit. 5)Mrimile relative de intensitate se calculeaz ca raport ntre doi indicatori absolui, de natur diferit, dar ntre care exist o relaie de interdependen. Cei doi termeni ai raportului au uniti de msur diferite, iar mrimea rezultat prin raportare va avea o unitate de msur compus. Acestea se pot determina la nivelul unitilor statistice, a grupelor omogene sau la nivelul colectivitii.

xi 10 k yi Formula de calcul pentru o unitate statistic este: iar pentru o grup omogen sau pentru ntreaga colectivitate este: kx/ y =

y i / xi

n cazul n care valorile caracteristicilor xi, yi pentru ntreaga colectivitate.

x y

i i

10k
sunt agregate la nivelul unei grupe omogene sau

21

Rezultatul sub form de coeficient arat cte uniti din valoarea caracteristicii de la numrtor, se cuprind ntr-o singur unitate a valorii caracteristicii de la numitor. Mrimile relative de intensitate admit, n anumite situaii i reversibilitatea:

ky/x =

yi 10 k xi
sau

yi /

xi

Dac rezultatul se nmulete cu 100 va arta cte uniti din indicatorul raportar revin la 100 uniti ale indicatorului baz de raportare. Dac rezultatul se nmulete cu 1000 se obin promile i se utilizeaz n cazul n care indicatorul comparat este mult mai mic dect cel baz de comparaie , iar exprimarea sub form de coeficieni sau procente ar conduce la obinerea unor mrimi relative greu de reinut i interpretat. n cazul n care rezultatul raportului dintre cele dou mrimi comparate are o valoare foarte mic se utilizeaz procentimile , exprimnd indicatorul comparat la 10000 sau la 100000 uniti din indicatorul baz de comparaie.

y x

10k

CAPITOLUL III ANALIZA STATISTIC A SERIILOR DE DISTRIBUIE CU FRECVENE

III.1. Necesitatea analizei Fenomenele de mas studiate de statistic se caracterizeaz prin variabilitatea formelor individuale de manifestare determinat de aciunea, uneori n sensuri diferite, a unui complex de factori eseniali sau neeseniali, sistematici sau aleatorii, obiectivi sau subiectivi. Intensitatea cu care acioneaz factorii de influen, modul de asociere a factorilor determin un anumit grad de mprtiere sau de concentrare a valorilor individuale ctre valori tipice i n acelai timp determin o anumit form de repartiie a frecvenelor. Legile statistice se manifest la nivelul ntregii colectiviti i nu la nivelul fiecrei uniti statistice. Prin sistematizarea datelor statistice individuale prin centralizare i grupare, se obin seriile de distribuie cu frecvene, ce prezint drept trsturi specifice: - variabilitatea; - omogenitatea; - independena; - concentrarea sau aglomerarea termenilor. Variabilitatea se manifest atunci cnd influena factorilor ntmpltori este puternic i mprtierea valorilor nregistrate este mare. n acest caz, colectivitatea prezint o omogenitate sczut. Omogenitatea presupune existena unor abateri sau variaii minime ntre termenii seriei i este, de regul, rezultatul aciunii factorilor eseniali determinai, cu caracter sistematic. Independena termenilor provine din faptul c unitile statistice exist independent unele fa de altele i fiecare valoare a caracteristicii se nregistreaz pentru o unitate statistic distinct. Pentru caracterizarea structurii seriei se calculeaz indicatorii de frecven, cu scopul de a cunoate ceea ce este esenial i comun n formele individuale de manifestare i care leag ntre ele valorile individuale ale caracteristicii. Concentrarea sau aglomerarea fa de unele valori tipice ale seriei apare atunci cnd aciunea factorilor eseniali sau aleatori este difereniat, cu intensiti diferite i seria prezint o repartiie neuniform a frecvenelor. Modul de asociere a factorilor de influen determin o tendin de concentrare a valorilor individuale spre anumite valori tipice.
22

n acest caz, frecvenele se pot concentra: a) ctre una din extremitile seriei (seria are forma J sau I); b) ctre valoarea central (de mijloc), obinndu-se pe grafic o repartiie simetric sau normal, numit curb normal Gauss-Laplace; c) ctre ambele extremiti, obinndu-se o repartiie n form de U. n cazul n care intensitatea factorilor de influen este uniform, frecvenele de apariie ale valorilor individuale sunt apropiate ntre ele i seria prezint o repartiie uniform a frecvenelor. Exist i cazuri cnd nu se poate observa o regularitate sau cnd repartiia frecvenelor indic o colectivitate structurat pe mai multe tipuri calitative, situaie n care este necesar ca seria respectiv s fie descompus n mai multe serii distincte. Se impune aadar, ca prin metode statistice corespunztoare, s se analizeze seriile de distribuie cu frecvene, s se studieze forma de repartiie i tendinele de concentrare a frecvenelor. Pentru aceasta se utilizeaz un sistem de indicatori absolui, relativi i medii, ce vor fi prezentai n continuare. Un rol important n analiza seriilor de repartiie cu frecvene, revine reprezentrilor grafice, ca prim mijloc de exprimare a formei de repartiie.

III.2. Indicatorii de frecvene Noiunea de frecven se refer la numrul unitilor statistice, ce corespund unei grupe omogene. Se disting trei tipuri de frecvene: absolute, relative, cumulate. 1.Frecvena absolut (fi; i 1,.n) se obine n cazul colectivitii analizate dup o singur caracteristic i arat numrul de uniti statistice, la care se nregistreaz aceeai valoare variant a caracteristicii sau care au valorile caracteristicii ncadrate n acelai interval de variaie. 2.Frecvena relativ (fi*; i 1n) reprezint ponderea numrului de uniti dintr-o grup n ansamblul colectivitii, fiind o mrime relativ de structur, ce se exprim n procente i permite astfel compararea mai multor serii din punct de vedere al frecvenelor. 3. Frecvenele cumulate se pot calcula fie pe baza frecvenelor absolute fie pe baza celor relative. Cumularea frecvenelor se face succesiv, pornind fie din captul de sus al seriei, fie din cel de jos, obinnduse astfel pentru fiecare valoare a caracteristicii, frecvenele cumulate ascendent sau descendent. Acestea arat numrul (ponderea) unitilor statistice ce au valori mai mici sau egale i mai mari, dup caz, dect o anumit valoare a caracteristicii. Indicatorii de frecvene ai caracteristicii numerice pot fi reprezentai ca n tabelul 3.1.: Tabelul 3.1.
Valorile caracteris ticii xi
X1 X2

. . xI . . xn TOTAL

Frecvene le absolute fi f1 f2 . . fI . . fn
.

Frecvene le relative fI* f1* f2* . . fi* . . fn* fi*

Frecvene cumulate absolute Ascendent Descendent Fa1=f1 Fa2=f1+f2 . . Fai=f1+..+fi . . . Fan= fi Fa1= fi Fa2= fi-f1 . . . . . . Fan=fn -

Frecvenele cumulate relative Ascendent Descendent Fr1=f1* Fr2=f1*+f2* . . . . . . Frn= fi* Fr1= fi* Fr2= fi*-f1* . . . . . . Frn=fn* -

fi

III.3. Indicatorii tendinei centrale Indicatorii tendinei centrale cu ajutorul crora se poate caracteriza o serie de repartiie sunt mediile i indicatorii de poziie. III.3.1. Mediile
23

Mediile sintetizeaz printr-o expresie numeric ceea ce este tipic i esenial, ceea ce se manifest drept tendin, legitate n masa de valori individuale ale caracteristicii pentru care se determin. Media este o valoare reprezentativ, numit i sperana matematic, spre care tind toate valorile, variaia dintre ele fiind determinat numai de influena factorilor aleatori. n vederea obinerii unei medii reprezentative, trebuie s se respecte urmtoarele cerine: - s existe un numr suficient de mare de cazuri individuale pentru caracteristica studiat din care se determin media; - media s se determine din valori omogene; n caz contrar se vor calcula medii pariale pe subcolectiviti omogene; - s se aleag tipul de medie care s corespund cel mai bine formei de manifestare a caracteristicii studiate. n practica statistic, dat fiind diversitatea fenomenelor, se utilizeaz mai multe tipuri de medii: 1. media aritmetic; 2. media armonic; 3. media ptratic; 4. media geometric; 5. media cronologic. Toate aceste medii se pot calcula ca medii simple sau ca medii ponderate. Mediile simple se determin n cazul n care numrul variantelor valorilor caracteristicii, este egal cu numrul de uniti statistice. Mediile ponderate se calculeaz cnd pentru fiecare variant a valorilor caracteristicii exist frecven. 1. Media aritmetic se folosete, n general, atunci cnd fenomenul studiat prezint modificri aproximativ constante, apropiate de forma unei progresii aritmetice. Media aritmetic reprezint acea valoare la care ar fi ajuns fiecare unitate statistic, dac toi factorii de influen ar fi acionat n mod constant. Dac media aritmetic este o valoare reprezentativ pentru ansamblul datelor individuale, nseamn c este acea mrime, cu care dac s-ar nlocui valorile individuale ale caracteristicii, suma acestora ar rmne constant. Fie o colectivitate statistic alctuit din n uniti statistice, pentru care s-au nregistrat valorile unei caracteristici discrete notate cu xi, x2,,xi,,xn. Media aritmetic simpl se determin ca raport ntre suma termenilor xi i numrul de termeni (n) dup formula:

x=

x
i =1

Dac fiecare valoare individual xi, ar fi nlocuit cu media aritmetic, valoarea totalizat a caracteristicii la nivelul colectivitii nu se modific:

x
i =1

= x1 + x 2 +... + xi + ... + x n = x + x + ... + x + ... + x = n x x =

x
n

n cazul n care pentru valorile individuale se nregistreaz frecvene absolute, notate f 1, f2, ,fi,,fn se obine seria: x1 x2 xi xn X: f1 f2 fi fn unde i=1,2,,n
24

iar media se determin cu ajutorul mediei aritmetice ponderate pe baza frecvenelor absolute sau a frecvenelor relative, dup caz:

x=

x
i =1 n i =1

fi
x=
i

f i*

100

unde fi* se determin dup formula:

f i* =

fi

100
i

O variant a mediei aritmetice ponderate se utilizeaz pentru a determina nivelul mediu a unei caracteristici alternative. n acest caz, pentru a exprima numeric aceast caracteristic, n mod convenional, se acord variantelor formei directe, valoarea 1, iar variantelor formei opuse, valoarea 0. Schematic, metoda de calcul se prezint n urmtorul tabel:
Variantele posibile de rspunsuri Da forma direct Nu forma opus TOTAL Valorile caracteristicii xi 1 0 Frecvene absolute N numrul de uniti ce au nregistrat valoarea 1 M numrul de uniti ce au nregistrat valoarea 0 fi=N+M Frecvene relative fI* p q fi*=p+q=1

Frecvenele relative pentru forma direct i pentru forma opus se obin dup urmtoarele formule:

p=

N N +M

q=

Aadar, media caracteristicii alternative se calculeaz astfel:

M N+M

x=

x f f
i i

1 N + 0 M N = =p N +M N+M

Media caracteristicii alternative se poate exprima i n procente. Media aritmetic prezint o serie de proprieti, dintre care n practica statistic se utilizeaz urmtoarele: 1) ntr-un ir de valori egale, media aritmetic este egal cu fiecare dintre ele. Deci, x1 = x2 = = xi = = xn = xc=x, deoarece

x=

x
n

x
n

xc n = xc n

2) Mrimea mediei aritmetice este ntotdeauna cuprins n intervalul de variaie al caracteristicii studiate: xmin x xmax Pentru o serie de distribuie cu frecvene, media se ncadreaz ntre valorile extreme ale caracteristicii, oscilnd n jurul valorii cu frecvena cea mai mare.
25

3) ntr-o serie statistic, suma abaterilor individuale ale termenilor seriei de la valoarea mediei lor aritmetice este egal cu zero, att pentru o serie simpl ct i pentru o serie cu frecvene. n cazul unei serii simple:

(x
i =1 n n i =1 i =1

x) = 0

xi x = xi x n = xi
n cazul unei serii cu frecvene:

x
n

n = 0

(x
i =1

x) f i = 0

f i x f i = xi f i x f i = xi f i

x f f f
i i i

=0

4) ntr-o serie statistic, dac toi termenii se mresc sau se micoreaz cu o constant a, atunci media noilor termeni este mai mic sau mai mare dect media seriei iniale, cu mrimea constantei a.

x=

5) Dac toi termenii unei serii se micoreaz sau se mresc de h ori, atunci media se mrete sau se micoreaz de h ori. Fie xi, i=1,n, termenii seriei pentru care s-a calculat media aritmetic i x =xi/h , I=1,2,,n termenii modificai ai seriei. Atunci:

h x x= =
n n

xi

1 1 x = x = h h h

h x 1 1 x x= = = x =
i

xi

h h

Aceeai proprietate se verific i n cazul n care se nmulesc termenii seriei cu o constant h:

x = x' h
Proprietile 4 i 5 se folosesc combinat, obinndu-se relaia de calcul simplificat a mediei aritmetice , att pentru o serie simpl ct i pentru o serie cu frecvene, pe baza urmtoarelor formule: - pentru o serie simpl:

x=

i =1

xi a h h + a n

a este egal cu centrul de interval cu frecvena maxim;


26

h lungimea unui interval. - pentru o serie cu frecvene absolute:

x=

i =1

- pentru o serie cu frecvene relative:

xi a fi h h+ a fi xi a * ) fi h h+ a 100

x=

6) Dac ntr-o serie de distribuie cu frecvene, se reduc proporional toate frecvenele, atunci media calculat pe baza noilor frecvene va fi egal cu media seriei iniiale. Fie media seriei iniiale:

x=

x f f
i i

Iar fi frecvenele micorate:

fi =

fi c

x' =

fi 1 xi f i c = c =x fi 1 fi c c

7) Pentru o serie de repartiie cu frecvenele egale ntre ele, media aritmetic ponderat se transform n medie aritmetic simpl. Dac f1=f2==fI==fn=fc, Atunci:

x=

x f f
i i

x f f
i c

f c xi

x
n

=x

8). ntr-o colectivitate structurat pe grupe, media acesteia este dependent de media grupelor i de frecvenele grupelor respective.

Fie seria x1 x2 xixn X: f1 f2 fifn respectiv XA: f1 f2 i XB: xk*1 xk*2xn


27

mprit n dou grupe:

x1 x2

xk fk

avnd media xA i numrul de uniti fA

fk*1 fk*2fn

avnd media xB i numrul de uniti fB

Atunci, media la nivelul ntregii colectiviti va fi:


k n n

f x + f B xB x= A A = fA + fB

x
i =1 k i =1

fi +
i

f +f
i = k +1

i = k +1 n

fi

x
i =1 n i =1

fi
i

Unde mediile celor dou grupe se calculeaz astfel:

xA =

x
i =1 n

fi

fA
i = k +1

f A x A = xi f i
i =1

xB =

x
fB

fi

f B xB =

i = k +1

fi

9) Media aritmetic a sumei sau diferenei dintre dou caracteristici aleatoare independente este egal cu suma sau diferena mediilor celor dou caracteristici. Fie xi, yi valorile generale a dou caracteristici, ce formeaz dou serii cu numr egal de termeni, cu mediile celor dou caracteristici cunoscute, atunci:

x y =

( xi y i )
i =1

xi
i =1

y
i =1

= x y

10). Media produsului a dou caracteristici independente x i y este egal cu produsul mediilor celor dou caracteristici.

x y = x y
Aceast proprietate se utilizeaz atunci cnd o caracteristic complex se poate exprima ca produs de dou sau mai multe caracteristici independente. 2.Media armonic, xh, se calculeaz din valorile inverse ale termenilor unei serii. n cazul unei serii simple, media armonic se determin astfel:
n 1 1 1 1 1 + + ... + + ... + = x1 x 2 xi x n i =1 xi

Dac nlocuim termenii cu media lor se obine:


n 1 1 1 1 1 + + ... + + ... + = xh xh xh xh i =1 xi

1 1 = xh = xi xn

x
i =1

1
i

Pentru o serie cu frecvene absolute, media armonic are urmtoarea formul:


28

xh =

f 1 x f
i i

Pentru o serie cu frecvene relative, xh are formula general:

xh =

f
i =1

* i

x
i =1

1
i

= fi
*

100 1 x fi* i =1 i
n

Media armonic se determin n cazul n care se studiaz o serie bidimensional, care cuprinde valorile a duo caracteristici xi, yi ntre care exist un raport de invers proporionalitate xi=1/yi. Pentru a pstra acest raport i n ce privete mediile pentru una dintre caracteristici, media se va determina cu ajutorul mediei aritmetice, iar pentru cealalt cu ajutorul mediei armonice. Dac este calculat din aceleai valori pozitive, media armonic este ntotdeauna mai mic dect media aritmetic. 3. Media ptratic (xp) se calculeaz din ptratul valorilor termenilor seriei:

x1 + x 2 + ... + xi + ...x n = xi2


2 2 2 2 i =1

nlocuind termenii cu media lor ptratic se obine:

x p + x p + ... + x p + ... + x p = xi
2 2 2 2 i =1

n x p = xi x p =
2 2 i =1

x
i =1

2 i

Pentru seriile de repartiie cu frecvene, media ptratic ponderat se calculeaz cu urmtoarele formule: -din frecvene absolute: -din frecvene relative:

xp =

x f f
2 i i

xp =

2 i

fi

100

Media ptratic se folosete n cazul n care predomin termenii cu valori mari ai seriei, seria fiind asimetric ctre valori mari. n practica statistic, media ptratic se utilizeaz pentru calcularea abaterii standard. Determinat din aceleai valori ca i media aritmetic, media ptratic este ntotdeauna mai mare. 4.Media geometric (xg), se calculeaz n cazul n care ntre termenii unei serii exist relaie de produs sau cnd fenomenul studiat are o evoluie exponenial, apropiat de forma unei progresii geometrice. n acest caz, media geometric reprezint acea valoare cu care, dac se nlocuiesc termenii seriei, produsul acestora nu se modific. Produsul termenilor unei serii se exprim matematic:

x1 x 2 ... xi ... x n = xi
i =1

29

x g x g ... x g = xi
i =1

Formula mediei geometrice simpl este:

x g = xi x g = n
n i =1

x
i =1

Pentru o serie de repartiie cu frecvene, se utilizeaz media geometric ponderat, fie pe baza frecvenelor absolute, fie a celor relative:

x g = f i xi
i =1

fi

x g = 100 xi
i =1

fi*

Expresiile mediei geometrice se pot logaritma i se obin urmtoarele formule:

log( x g ) = log(n
f

x ) log x
i fi

log x
n
i

log( x g ) = log i xi

log x g =

f log x f
i

Prin logaritmare, media geometric se transform n logaritmul mediei aritmetice. Media geometric se utilizeaz atunci cnd seria prezint variaii foarte mari ntre termeni, variaie ce se reduce prin logaritmare, astfel nct valorile mai mici vor fi mai bine reprezentate n valoarea mediei. Media geometric nu se poate determina n cazul n care unul dintre termeni este egal cu zero sau ia valori negative. Determinat din aceleai valori, media geometric este ntotdeauna mai mic dect media aritmetic. 5.Media cronologic (xc) este o form transformat a mediei aritmetice i este specific seriilor dinamice. ntre mediile prezentate exist urmtoarea relaie de inegalitate:
xh x g x x p xc

III.3.2. Indicatorii medii de poziie Indicatorii medii de poziie au drept scop completarea informaiilor obinute n urma calculrii nivelului mediu i studiaz variaia caracteristicii, a formei de repartiie a frecvenelor i evideniaz tendina de aglomerare, de concentrare a frecvenelor. Acetia se utilizeaz pentru aprecierea gradului de semnificaie a mediei i pentru determinarea gradului de asimetrie. Principalii indicatori medii de poziie sunt: 1). Modul sau valoarea modal; 2). Mediana; 3). Cuartile; 4). Decile; 5). Centile. 1). Modul, numit i valoare modal sau valoare dominant, notata Mo, reprezint acea valoare a caracteristicii, ce corespunde celei mai mari frecvene de apariie. Pentru o serie de repartiie cu frecvene pe variante, modul se determin printr-o simpl analiz a seriei, stabilind cea mai mare frecven a seriei i identificnd valoarea modal, drept valoarea caracteristicii corespunztoare celei mai mari frecvene. Pentru o serie de repartiie cu frecvene pe intervale, se identificntr-o prim etap intervalul modal, adic intervalul cu fre Valoarea modal se poate determina dup una din urmtoarele formule:
inf

30

Mo =

xM o

+ xM o 2

sup

M o = xM o

inf

+ hM o

1 1 + 2

n cazul n care frecvenele sunt aproximativ simetric distribuite n intervalul modal se utilizeaz prima formul, iar dac frecvenele au o distribuie neuniform se folosete cea de-a doua formul. xinfMo limita inferioar a intervalului modal xsupMo limita superioar a intervalului modal hMo lungimea intervalului modal hMo=xsupMo - xinfMo 1 diferena dintre frecvena intervalului modal i frecvena intervalului precedent 2 diferena dintre frecvena intervalului modal i frecvena intervalului urmtor. 2. Cuantilele sunt indicatori cu ajutorul crora se realizeaz divizarea seriei ntr-un numr de pri egale. Cuantilele de ordin r sunt valori ale caracteristicii studiate, ce mpart seria statistic ordonat n r pri egale. Astfel, dac: r=2; se obine cuantila de ordinul 2, numit median; r=4; se obin cuantile de ordin 4, numite cuartile; r=10; se obin cuantile de ordin 10, numite decile; r=100; se obin cuantile de ordin 100, numite centile. 2.1. Mediana (Me) este valoarea situat n mijlocul unei serii ordonate cresctor sau descresctor i care mparte seria n dou pri egale. Determinarea medianei presupune ordonarea termenilor seriei cresctor sau descresctor, stabilirea locului medianei i calcularea valorii medianei. ntr-o serie simpl, format dintr-un numr impar de termeni, mediana va fi egal cu valoarea termenului central, de rang (n+1)/2, unde n este numrul total de termeni. ntr-o serie simpl cu un numr par de termeni, mediana va fi media aritmetic simpl a celor doi termeni centrali, de rang n/2 i de rang (n+2)/2. n cazul seriilor de repartiie cu frecvene, pe variante, mediana este considerat valoarea caracteristicii corespunztoare primei frecvene cumulate ascendent, ce depete ( fi+1)/2, unde fi este numrul total de uniti statistice. n anumite situaii, semnificaia medianei sufer uneori din cauza modului de determinare i se recomand renunarea la median i alegerea altei valori tipice pentru caracterizarea tendinei centrale. Pentru o serie de repartiie cu frecvene pe intervale, mediana se determin astfel: - se identific intervalul median, adic intervalul de grupare ce corespunde primei frecvene cumulate ascendent ce depete ( fI+1)/2; - se determin valoarea medianei folosind relaia de calcul: unde:

f
M e = xM e
inf Me

+1

inf

+ hM e

Fa ( M e 1) f Me

x limita inferioar a intervalului median hMe lungimea intervalului median fMe frecvena absolut a intervalului median fi suma total a frecvenelor absolute Fa(Me- 1) frecvenele cumulate ascendent pn la intervalul median. 2.2.Cuartilele (n numr de trei Q1, Q2 = Me, Q3) sunt acele valori ale caracteristicii, ce mpart seria ordonat cresctor sau descresctor n patru pri egale, coninnd fiecare 25% din numrul observaiilor. Pentru o serie simpl, cuartilele se determin astfel: - se stabilete locul cuartilelor cu ajutorul urmtoarelor expresii: (n + 1)/4 pentru Q1; 2(n + 1)/4 pentru Q2; 3(n +1)/4 pentru Q3 n cazul unei serii simple cu un numr impar de termeni, cuartilele sunt egale cu variantele caracteristicii ce au numr de ordine egal cu expresiile determinate anterior. Pentru seriile simple cu numr par de termeni, cuartilele se calculeaz ca o medie aritmetic a termenilor vecini poziiilor aflate pe baza expresiilor determinate anterior. ntr-o serie de repartiie pe intervale, cuartilele se calculeaz astfel: - se identific intervalele n care se situeaz Q1, Q2, i Q3; acestea vor fi intervalele corespunztoare primelor frecvene cumulate ascendent, ce depesc expresiile precizate la seriile pe variante. Locul pentru cuartila Q1 se determin pe baza relaiei:

31

1 ( f i + 1) 4
iar valoarea cuartilei Q1 este acea valoare a caracteristicii corespunztoare primei frecvene cumulate ascendent mai mare sau egal cu expresia : 1/4( fi + 1). Cuartila Q2 este egal cu Me, locul acesteia se obine pe baza relatiei: 1 ( f i +1) 2 Cuartila Q3 este considerat valoarea caracteristicii corespunztoare primei frecvene cumulate ascendent ( fi+1). Valorile cuartilelor se determin dup urmtoarele relaii:

Q1 = xQ1

inf

+ hQ1

1 ( f i + 1) Fa ( Q1 1) 4 f Q1 2 ( f i + 1) Fa ( Q2 1) 4 = Me f Q2 3 ( f i + 1) Fa ( Q3 1) 4 f Q3

Q2 = xQ2

inf

+ hQ2

Q3 = xQ3

inf

+ hQ3

unde: xQ1inf, xQ2inf, xQ3inf limita inferioar a intervalului n care se gsete Q1, Q2, Q3; hQ1, hQ2, hQ3 lungimea intervalului n care se gsete Q1, Q2, Q3; fQ1, fQ2, fQ3 frecvena absolut a intervalului n care se gsete Q1, Q2, Q3; Fa(Q1- 1); Fa(Q2-1); Fa(Q3-1) frecvenele cumulate pn la intervalul precedent cuartilelor respective. 2.3.Decilele (n numr de nou: D1, D2, D3, D4, D5=Me, D6, D7, D8, D9) sunt acele valori ale caracteristicii ce mpart seria n zece pri egale, coninnd fiecare 10% din numrul observaiilor. n cazul unei serii simple, ordonate cresctor sau descresctor, decilele se determin conform definiiei. Pentru seriile de repartiie cu frecvene pe variante, cele dou decile DK, K=1,2,3,9, vor fi, pe rnd, acele valori ale caracteristicii corespunztoare primei frecvene cumulate ascendent, ce depete expresia: K/10( fi+1); K=1,2,3,9. Pentru seriile de repartiii cu frecvene pe intervale, decilele se determin dup formulele urmtoare:

D1 = xD 2inf 2 D 1

inf

2 1 1 ( ffii + 1) Faa ( D12 1)) +1 + hD 2 10 hD 10 + 1 ffD12 D

D5 = x D5

inf

5 ( f i + 1) Fa ( D5 1) + hD5 10 = Me f D5 9 ( f i + 1) Fa ( D9 1) 10 + hD9 f D9

D9 = x D9

inf

Notaiile sunt asemntoare cu cele de la cuartile.


32

2.4. Centilele se determin asemntor cuartilelor i decilelor, calculul lor justificndu-se n cazul fenomenelor ce prezint variaii mari i foarte mari ale valorilor individuale, cum ar fi: fenomene demografice, clasamente n economia mondial. Ele sunt n numr de 99, mpart variantele unei caracteristici n 100 pri egale cu K/100; K= 1,2,3...99. III.4. Indicatorii variaiei Indicatorii variaiei au drept scop verificarea omogenitii, variabilitii i a gradului de mprtiere a valorilor individuale ale caracteristicii, precum i a reprezentativitii mediei pentru ntreaga colectivitate. Tot cu ajutorul lor se caracterizeaz asimetria repartiiilor i interdependena dintre factorii de influen, dup care se structureaz unitile unei colectiviti n grupe omogene. n funcie de modul de calcul, indicatorii variaiei pot fi simpli i sintetici, exprimai n mrimi absolute, relative i medii. Indicatorii simpli ai variaiei sunt: a) Amplitudinea absolut, A; b) Amplitudinea relativ, A%; c) Abaterea individual absolut, di; d) Abaterea individual relativ, di%. a) Amplitudinea absolut, A, se determin dup formula: A= xmax - xmin, iar pentru seriile de repartiie cu frecvene pe intervale, aceasta se calculeaz ca diferen ntre limita superioar a ultimului interval (xnsup) i limita inferioar a primului interval de grupare (x1inf): A= xnsup x1inf Amplitudinea se exprim n unitatea de msur a caracteristicii i de aceea, ea nu poate fi utilizat n comparaii, ca msur a variaiei, dect pentru seriile unde caracteristicile sunt exprimate n aceeai unitate de msur. Pentru a elimina acest inconvenient, se calculeaz amplitudinea relativ a variaiei. b) Amplitudinea relativ a variaiei (A%), se calculeaz ca raport ntre amplitudinea absolut (A) i nivelul mediu al caracteristicii: A%= (A / x ) 100 Rezultatul arat ponderea amplitudinii n valoarea mediei. c) Abaterile individuale absolute, di, se calculeaz ca diferen ntre fiecare valoare individual a caracteristicii xi i nivelul mediu: di= xi-x = Rezultatul arat abaterile valorilor individuale de la media lor. d) Abaterile individuale relative, di%, se determin raportnd abaterile individuale absolute, la nivelul mediu: di%=(di / x )100 n analiza variaiei se pot determina abaterile individuale minime i maxime, att n mrime absolut ct i relativ: di min= xmin-x; di max= xmax-x; di min%=(di min / x )100 di max%=(di max / x )100

n cazul n care repartiia este simetric: dmax = dmin . Indicatorii sintetici ai variaiei evideniaz abaterile tuturor nivelurilor individuale ale caracteristicii de la media lor i a frecvenelor de apariie a acestora. Indicatorii sintetici ai variaiei sunt a) Abaterea medie liniar, d; b) Dispersia, 2; c) Abaterea medie ptratic, ;
33

d) Coeficientul de variaie, v. a) Abaterea medie liniar (d ) se calculeaz ca medie aritmetic simpl sau ponderat a abaterilor individuale de la media lor sau de la mediana lor, astfel: - pentru o serie simpl dx = xi - x /n ; dMe = xI Me /n

- pentru o serie de repartiie cu frecvene absolute: dx = xi -x fi / fi ; dMe = xi -Me fi / fi

- pentru o serie de repartiie cu frecvene relative: dx =( xi -x fi* )/ fi* ; dMe =( | xi Me | fi*)/ fi* Aceasta se exprim n unitatea de msur a caracteristicii i arat cu cte uniti se abat n medie, unitile statistice de la nivelul mediu. Calculul abaterii medii, este justificat numai n msura n care prezint importan mrimea abaterii i nu semnul acesteia. b) Dispersia ( 2) caracterizeaz gradul de concentrare a valorilor individuale. Aceasta se mai numete varian i se calculeaz ca medie aritmetic simpl sau ponderat a ptratelor abaterilor individuale de la media lor. Astfel: - pentru o serie simpl: 2 = (xi -x)2 /n - pentru o serie de repartiie cu frecvene absolute: 2 = (xi -x)2 fi / fi - pentru o serie de repartiie cu frecvene relative: 2 = (xi - x)2 fi* /100 c). Abaterea medie ptratic ( ), denumit abatere standard sau abatere tip, se calculeaz ca medie ptratic simpl sau ponderat, a abaterilor tuturor valorilor individuale de la media lor. Astfel: - pentru o serie simpl, formula de calcul este:

( x

- pentru o serie de repartiie cu frecvene absolute:

( x x) f
i i

fi

- pentru o serie de repartiie cu frecvene relative:

( x x)
i

fi

100

Abaterea medie ptratic se exprim n unitatea de msur a caracteristicii i este cu att mai mare cu ct este mai intens variaia valorilor individuale ale caracteristicii i invers. Rezultatul arat cu cte uniti se abat n medie valorile caracteristicii de la nivelul mediu, innd cont de influena abaterilor individuale mari ale caracteristicii Pentru aceeai serie, abaterea medie liniar (d ) este mai mic sau cel mult egal cu abaterea medie ptratic ( ): d .
34

Pentru o serie cu tendin de normalitate, abaterea medie liniar reprezint 4/5 din valoarea abaterii mediei ptratice: d (4/5) Abaterea medie ptratic se utilizeaz att pentru verificarea omogenitii valorilor individuale a reprezentativitii mediei, ct i pentru caracterizarea asimetriei unei serii de repartiie, la estimarea erorilor de selecie. Aceasta se calculeaz n analizele economice i financiare, n studii de marketing, de prognoz. d). Coeficientul de variaie (v), cunoscut i sub denumirea de coeficient de omogenitate, este indicatorul ce permite compararea gradului de variaie a dou sau mai multe caracteristici de natur diferit, urmrite pentru aceeai colectivitate. Coeficientul de variaie se calculeaz n dou moduri: - ca raport ntre abaterea medie liniar (d ) i media colectivitii (x ):

v=

d 100 x

- ca raport ntre abaterea medie ptratic ( ) i nivelul mediu (x ):

v=

100 x

Coeficientul de variaie ia valori de la 0-100%: 0 v 100%. Coeficientul de variaie poate fi folosit drept test de semnificaie a reprezentativitii mediei, considerndu-se urmtoarele praguri de semnificaie: - 0<v 17% media este strict reprezentativ; - 17%<v 35% media este moderat semnificativ; - 35<v 50% media este relativ reprezentativ; - v>50% media nu este reprezentativ. Din punct de vedere al gradului de omogenitate a colectivitii: - 0<v 35% - variaie mic, colectivitate omogen, alctuit din uniti statistice aparinnd aceluiai tip calitativ; -35%<v 50% -variaie relativ mare; -v>50% - variaie foarte mare , eterogenitatea colectivitii, unitile statistice aparin unor tipuri calitative diferite. III.4.1. Proprietile dispersiei 1. Pentru un ir de valori egale ntre ele, dispersia este nul, deoarece media lor aritmetic este egal cu fiecare dintre variantele nregistrate. Dac x1=x2==xn=xc=x 2=0 2. n cazul n care se calculeaz dispersia pe baza proprietilor 4 i 5 ale mediei aritmetice, se obine formula de calcul simplificat al dispersiei: - pentru o serie simpl:

( n ) = x a h ( x a ) n h f h ( x a) = f
2 2 2 2 2 i 2 2 i i

xi a

- pentru o serie de repartiie cu frecvene absolute: - pentru o serie de repartiie cu frecvene relative:

2 =

xi a 2 * ) fi h h 2 ( x a) 2 100

unde a i h sunt valori arbitrare, convenabil stabilite, astfel nct s permit simplificarea.
35

3). Dispersie ntr-o colectivitate mprit pe grupe ntr-o colectivitate mprit pe grupe, dispersia colectivitii totale ( 20) este egal cu media dispersiilor de grupe ( 2) plus dispersia dintre grupe ( 2), dup formula: 02= 2 + 2 Aceast relaie este cunoscut sub denumirea de regula de adunare a dispersiilor sau ecuaia fundamental a analizei dispersionale. Media dispersiilor de grupe ( 2) se calculeaz ca o medie aritmetic a dispersiilor de grup j2 ponderate cu volumul grupelor fj. j=1,2,,p - numrul grupei

j =1 p

2 j

f.j

j2 =

(x
n i =1

xj
n ij

f.j
j =1

f ij

xj =

x
i =1 n i =1

f ij

f
i =1

fj

Dispersia de grup, j2, se calculeaz ca o medie a ptratelor abaterilor variantelor variabilei din cadrul unei grupe fa de media lor, dup formula: -dispersia de grup: - media unei grupe j: unde: i=1,2,k; j=1,2,p. Dispersia de grup, msoar influena factorilor ntmpltori, care au acionat asupra valorilor caracteristicii pentru unitile statistice dintr-o anumit grup a colectivitii. Dispersia dintre grupe ( 2), se calculeaz ca o medie aritmetic a ptratelor abaterilor mediilor de grup xj fa de media general a colectivitii x, dup formula:

2 =

(x
p j =1

x f.j
p j

f.
j =1

Dispersia dintre grupe msoar influena factorului de grupare ce a determinat separarea grupelor n cadrul colectivitii. Dispersia colectivitii totale ( o2), sintetizeaz variaia tuturor valorilor individuale din colectivitatea total, cauzat att de influena factorilor aleatori, ce acioneaz n interiorul grupelor, ct i de influena factorului sistematic, n funcie de care s-a structurat colectivitatea general, dup formula:

0 =
2

(x
n i =1

x fi
n i

f
i =1

Pe baza celor trei dispersii se pot construi ali indicatori: gradul de determinaie (R 2) i gradul de nedeterminaie (K2), care se calculeaz cu ajutorul urmtoarelor relaii de calcul:

R2 =

2 100 02

K2 =

2 100 2 0

36

Gradul de determinaie (R 2) exprim msura n care variaia caracteristicii urmrite, depinde de factorul principal sistematic dup care s-a structurat colectivitatea n grupe omogene. Gradul de nedeterminaie (K 2) exprim msura n care variaia caracteristicii depinde de variaia factorilor aleatori, ce acioneaz n interiorul grupelor. ntre cei doi indicatori exist urmtoarea relaie:

R 2 + K 2 = 100
Dac R2>K2, nseamn c factorul principal de grupare acioneaz n mod hotrtor asupra variaiei caracteristicii xi. Dac R2<K2, variaia caracteristicii se datoreaz influenei exercitate de alte cauze, de factori ntmpltori. III.5. Analiza asimetriei repartiiilor empirice O analiz statistic complet a seriilor de repartiie cuprinde, pe lng caracterizarea tendinei centrale n cadrul seriilor, a mprtierii valorilor individuale fa de tendina central, i o analiz a formei n care se repartizeaz frecvenele n funcie de valorile individuale nregistrate. Forma repartiiilor se analizeaz n primul rnd cu ajutorul metodei grafice: histogramei, poligonul frecvenei i a curbei cumulative a frecvenelor. ntr-o serie de repartiie perfect simetric, frecvenele valorilor individuale sunt egal repartizate de o parte i de alta a valorilor centrale, iar cele trei valori ale tendinei centrale, respectiv valoarea medie, mediana i modala sunt egale. n funcie de poziia i valorile pe care le au cei trei indicatori ai tendinei centrale, se pot ntlni: - serii simetrice; - serii uor asimetrice; - serii cu tendin pronunat de asimetrie. a). Caracterizarea i msurarea asimetriei se poate face cu ajutorul coeficientului de asimetrie, propus de K.Pearson, calculat cu formula: Acest coeficient ia valori n intervalul: Cas [-1;1] .

C as =

ntr-o serie perfect simetric Cas =0, deoarece x =Me=M0. Dac x >M0; atunci Cas (0;1] asimetrie pozitiv. Dac x <M0; atunci Cas[-1;0) asimetrie negativ.

x M0

fi fmax

fi

fi

xi x =Me=Mo a.serie perfect simetric

Mo Me x

xi

x Me x< Mo c.asimetrie negativ


37

x>Mo b. asimetrie pozitiv

Fig. 3.1. Formele repartiiilor empirice ale unei serii de distribuie b). Un alt procedeu de calcul al coeficientului de asimetrie, propus de K.Pearson, are n vedere mediana i se calculeaz raportnd abaterea mediei de la mediana luat de trei ori, la abaterea medie ptratic, dup formula:

C , as =

unde: Cas [-3;3] Aceast formul se folosete pentru seriile uor asimetrice, n care pentru un numr mare de cazuri individuale se verific relaia : M0=x - 3(x - Me). n serie asimetric x Me M0, iar forma unor astefl de serii este j, i sau u. Ali coeficieni de asimetrie se pot determina cu ajutorul cuartilelor i decilelor, astfel: c). coeficientul intercuartilic Yule (casy) urmrete evidenierea poziiei cuartilelor fa de median, calculndu-se pe baza formulei:

3 x Me

C asy =

( Q3 M e ) ( M e Q1 ) ( Q3 M e ) + ( M e Q1 )

unde: Casy [-1; 1] Dac Casy =0 serie simetric. Dac Q3 - Me>Me Q1 Casy(0;1] serie cu asimetrie pozitiv. Dac Q3 - Me<Me Q1 Casy[-1;0) serie cu asimetrie negativ. d). Coeficientul de asimetrie interdecilic a lui Bowley (CasB) se bazeaz pe relaia dintre decile i median, determinndu-se dup formula:

CasB =

( D9 M e ) ( M e D1 ) ( D9 M e ) + ( M e D1 )

unde: CasB [-1;1]. Cu ct valoarea coeficientului este mai apropiat de zero, cu att repartiia este mai simetric, iar cu ct coeficientul este mai apropiat de 1, cu att seria este mai asimetric. Gradul i tendina de asimetrie se pot caracteriza cu ajutorul indicatorului denumit densitatea de repartiie a frecvenelor, util n special n cazul seriilor de repartiie pe intervale mari sau neegale. Acest indicator se calculeaz raportnd fiecare frecven absolut sau relativ, la lungimea intervalului respectiv. Dac se utilizeaz frecvenele absolute, obinem densitatea absolut a frecvenelor (da), iar dac se utilizeaz frecvenele relative, atunci rezult densitatea relativ a frecvenelor (dr), astfel:

da =

fi hi

f dr = i hi

Unde: fi - frecvena absolut a intervalului i; hi mrimea intervalului i; fi* - frecvena relativ a intervalului i. Dac valorile acestor indicatori au tendin de cretere ctre valoarea central a caracteristicii, nseamn c seria de distribuie are tendin de normalitate.

38

CAPITOLUL IV INDICATORI I METODE STATISTICE DE ANALIZ A LEGTURILOR DINTRE FENOMENELE ECONOMICO-SOCIALE

IV.1. Prezentarea i clasificarea legturilor dintre caracteristicile social-economice Fenomenele economico-sociale sunt fenomene complexe, influenate de aciunea simultan a unui numr mare de factori eseniali sau neeseniali, sistematici sau aleatori, obiectivi sau subiectivi. n scopul fundamentrii corecte a deciziilor privind aceste fenomene, trebuie analizate legturile cauzale existente ntre ele, respectiv care este fenomenul ce determin i care este fenomenul determinat. Statistica, cu ajutorul unor metode specifice, poate releva existena legturii, determina forma matematic n care se vor reda cel mai bine legturile i poate msura intensitatea lor. ntruct legile statisticii se manifest la nivelul ntregii colectiviti, ca tendin, rezult c dependenele social-economice se vor evidenia tot ca tendin, manifestat la nivelul unui numr mare de cazuri individuale. n vederea reliefrii legturilor i a tendinelor existente n desfurarea lor, unitile statistice se supun gruprii, se organizeaz n serii statistice, sub forma unor iruri paralele de valori ale caracteristicii rezultative (dependente sau efect), notate cu yi, respectiv ale caracteristicii factoriale (independente sau cauz) notate cu xi. n funcie de natura relaiei de cauzalitate existente ntre dou caracteristici, exist: - legturi funcionale; - legturi stohastice. Legturile funcionale sunt legturi univoce, realizate direct ntre dou fenomene, n care unei valori a fenomenului independent x, i corespunde o singur valoare a fenomenului dependent y, n cazul n care condiiile rmn neschimbate. Legturile stohastice, de natur probabilistic, numite legturi statistice, presupun ca unei valori a caracteristicii factoriale x s i corespund o distribuie de valori a caracteristicii rezultative y, i aceasta pentru c y este influenat nu doar de x ci i de ali factori. Fenomenelor economico-sociale le sunt specifice legturile statistice generate de factori multipli, cu influene n sensuri i de intensiti diferite. Ca urmare, legtura nu se manifest n fiecare caz n parte, ci numai n general i n medie, pe baza unui numr mare de cazuri individuale.
39

Legturile statistice se pot clasifica dup mai multe criterii. I.Dup numrul caracteristicilor luate n studiu: a. legturi simple, cnd caracteristica rezultativ y este studiat doar prin variaia unei singure caracteristici factoriale x, ceilali factori sunt cu aciune constant, considerai factori reziduali; de exemplu, capacitatea de producie (x) i cifra de afaceri(y); b. legturi multiple, cnd caracteristica rezultativ y, este analizat prin prisma variaiei a dou sau mai multe caracteristici factoriale x; de exemplu, capacitatea de producie (x1) i numrul de salariai (x2) determin variaia cifrei de afaceri. II.Dup forma de exprimare a caracteristicilor: a. legturi ntre caracteristici numerice, numite corelaii, cnd att caracteristica rezultativ y, ct i cea factorial x, sunt exprimate numeric; de exemplu, legturile ntre cheltuielile de producie (x) i profit (y); b. legturi ntre caracteristici calitative, numite asocieri statistice, cnd att caracteristica rezultativ y, ct i cea factorial x, sunt exprimate prin cuvinte; de exemplu, legtura dintre profesie (x) i sectorul de activitate (y). III.Dup sensul legturilor dintre caracteristici: a. legturi directe, cnd modificarea caracteristicii factoriale x, are ca efect modificarea n aceeai direcie a caracteristicii rezultative y; de exemplu, legtura ntre venitul populaiei (x) i volumul vnzrilor unui produs (y); b. legturi indirecte, cnd modificarea caracteristicii factoriale x, are ca efect modificarea n sens opus a caracteristicii rezultative y; de exemplu, legtura dintre preul unui produs (x) i volumul vnzrilor (y). IV.Dup forma modelului matematic prin care se exprim legtura: a. legturi liniare, cnd se exprim prin ecuaia liniei drepte; de exemplu, legtura ntre veniturile lunare (x) i cheltuielile lunare (y); b. legturi neliniare, cnd se exprim prin ecuaia unei curbe: parabol, hiperbol, ecuaie exponenial; de exemplu, o legtur prin parabol poate fi ntre cantitatea de ngrminte administrate (x) i producia la hectar (y). V.Dup modul de producere n timp, legturile statistice pot fi: a. legturi sincrone sau concomitente, atunci cnd n acelai timp cu modificarea caracteristicii factoriale x, se modific i caracteristica rezultativ y; de exemplu, legturile dintre cheltuielile de reclam (x) i volumul vnzrilor (y); b. legturi asincrone sau cu decalaj, n cazul n care modificarea caracteristicii rezultative y, are loc dup un decalaj de timp de la modificarea caracteristicii factoriale x; de exemplu, legtura ntre volumul investiiilor n modernizarea capacitilor de producie (x) i cifra de afaceri (y). Ca urmare a varietii legturilor de interdependen ntre fenomenele economico-sociale, precum i situaiile des ntlnite n practic, cnd factorii de influen nu pot fi identificai sau cuantificai direct, orice analiz statistic trebuie nceput cu studiul calitativ, multilateral al acestor fenomene. Cu ct fenomenele sunt mai complexe, cu ct numrul factorilor este mai mare i relaiile de cauzalitate mai dificil de identificat i msurat.

IV.2. Identificarea legturilor. Exprimarea formei legturilor.

Metoda regresiei

n funcie de modul de prezentare i sistematizare a datelor statistice ce urmeaz a fi analizate, se pot utiliza, ntr-o prim etap, metode simple de verificare a existenei legturii dintre caracteristicile studiate. Cu ajutorul acestor metode, se poate stabili existena raporturilor de interdependen, precum i o prim interpretare a legturii, caracterizarea tendinei manifestate n ceea ce privete sensul i intensitatea legturii. La cercetarea legturii se pot utiliza metode analitice, care permit, prin calcularea unor indicatori, msurarea corelaiei, att n ce privete existena i direcia legturii, ct i din punct de vedere al formei i intensitii n care se realizeaz. Metodele simple folosite pentru evidenierea existenei legturilor, pentru stabilirea direciei i aprecierea formei acestora, sunt: a) metoda seriilor de date interdependente;
40

b) metoda gruprilor; c) metoda tabelului de corelaie; d) metoda grafic. a) Metoda seriilor de date interdependente se utilizeaz atunci cnd se dispune de un numr mic de uniti observate. Valorile caracteristicilor studiate se prezint paralel, sub forma unor serii statistice, ordonnd valorile caracteristicii factoriale x, cresctor sau descresctor. Prin compararea acestor iruri paralele de date, se poate observa dac n variaia lor exist vreo legtur sau nu i se poate constata direcia manifestat. b) Metoda gruprilor, prezentat n cadrul subcapitolului de sistematizare a datelor, se utilizeaz pentru evidenierea legturilor, n cazul unui numr mare de uniti observate, cu o amplitudine mare a variaiei pentru caracteristica factorial (x). Analiza legturilor dintre dou caracteristici se realizeaz cu ajutorul gruprilor simple, efectuate tiinific, dup o caracteristic de grupare (x) cu rol determinant n variaia caracteristicii rezultative (y). Rezultatele acestei grupri se trec ntr-un tabel astfel: pe prima coloan se prezint grupele dup caracteristica factorial (x), iar n urmtoarele, datele calculate pentru caracteristica rezultativ (y) n ce privete valorile centralizate pe fiecare grup, indicatorii medii i relativi. Pentru caracterizarea legturii, ca tendin general, se pot folosi mediile de grup. Acestea exprim ceea ce este esenial i tipic n formarea fenomenului studiat. Cu ct numrul de grupe este mai mare, cu att este mai fidel redat tendina manifestat n variaia caracteristicilor, iar pentru a reda ct mai obiectiv densitatea de repartiie a frecvenelor pe grupe, este necesar ca gruparea s se fac pe intervale egale. Prin prezentarea n paralel i compararea variaiei caracteristicii rezultative (y), condiionat de variaia caracteristicii factoriale, se asigur verificarea legturii i aprecierii direciei acesteia. c) Metoda tabelului de corelaie constituie o metod ce are la baz o grupare combinat dup dou caracteristici: una factorial (x) i una rezultativ (y), numrul de grupe dup cele dou caracteristici fiind egal. Se centralizeaz frecvenele dup ambele caracteristici i se obine un tabel cu dubl intrare, numit tabel de corelaie. Grupele dup x se trec pe orizontal n ordine cresctoare, iar grupele dup y pe vertical, n ordinea descresctoare a caracteristicii rezultative. Legtura dintre cele dou variabile x i y, se poate caracteriza dup modul de distribuire a frecvenelor n interiorul tabelului, astfel: - dac frecvenele se distribuie fr nici o regularitate pe toat suprafaa tabelului, atunci se apreciaz c ntre x i y exist o legtur slab sau nu exist deloc legtur, cele dou caracteristici fiind independente; - poziia frecvenelor n jurul diagonalei, ne informeaz despre intensitatea legturii: concentrarea frecvenelor n jurul diagonalei indic o legtur strns, n caz contrar exist o legtur slab; - poziia diagonalei indic, de regul, sensul legturii i anume diagonala din stnga jos-dreapta sus, indic o legtur direct, iar diagonala stnga sus-dreapta jos, arat o legtur invers. d) Metoda grafic const n reprezentarea n sistemul de axe rectangulare, a celor n cupluri de valori (xi yi) ale indicatorilor corelai, obinndu-se graficul de corelaie sau corelograma. Pe axa absciselor (0x) se reprezint valorile caracteristicii factoriale x, pe axa ordonatelor (0y) valorile caracteristicii rezultative y, iar intersecia cuplurilor de valori se marcheaz cu cte un punct. Cu ct dispunem de un numr mai mare de valori nregistrate, cu att imaginea este mai sugestiv, obinndu-se pe grafic un numr mai mare de puncte de intersecie, fapt pentru care acest grafic mai este denumit i graficul norilor de puncte. Prin imaginea oferit, graficul de corelaie permite verificarea existenei legturii i sugereaz nu numai sensul legturii, dar i forma de legtur. Astfel: - dac punctele sunt dispersate la ntmplare, fr nici o regularitate, iar linia trasat n mijlocul norului de puncte este paralel cu axa absciselor, rezult c legtura ntre cele dou caracteristici nu este semnificativ sau nici nu exist; - dac punctele se disperseaz n direcia unei anumite linii, ce nu este paralel cu axa Ox, rezult c cele dou caracteristici sunt corelate; - dac tendina de concentrare a punctelor este n jurul diagonalei ce leag colul stng jos cu colul drept sus a graficului, rezult o legtur liniar direct, iar dac aceast diagonal leag colul stng sus cu colul drept jos, rezult o legtur liniar invers. n cazul legturilor de tip liniar (direct sau invers), variaia celor dou caracteristici este uniform. Formele legturilor n cazurile prezentate anterior sunt reprezentate: yi yi yi

41

xi a.Lipsa legturii

xi b. Legtur liniar

xi c. Legtur liniar direct invers Fig. 4.1. Forme ale legturilor liniare

n practic, exist situaii cnd ntre x i y exist o legtur neliniar, de forma unei hiperbole, parabole, funcii exponeniale sau de alt tip i variaia caracteristicii rezultative (y), sub influena modificrii caracteristicii factoriale (x) este neuniform. Exemple de legturi neliniare: yi yi yi

xi a.Legtur hiperbolic

xi b. Legtur parabolic

xi c.legtur exponenial Fig.4.2. Forme de legturi neliniare

Metoda grafic permite i o apreciere global a intensitii legturii, dintre cele dou caracteristici studiate. Dac linia prin mijlocul norului de puncte se poate trasa uor i exist puine puncte dispersate fa de aceast linie, atunci se apreciaz o legtur mai strns, n caz contrar, o legtur mai slab. Metoda grafic reprezint punctul de plecare al metodelor analitice de cercetare a dependenelor dintre fenomene. Metodele analitice permit msurarea legturii prin exprimarea matematic a acesteia i prin calculul unor indicatori ai corelaiei, asigurnd astfel o imagine mai precis a dependenelor dintre fenomene. Principalele metode analitice sunt: - metoda regresiei; - metoda corelaiei. Metoda regresiei const n cercetarea legturilor existente ntre fenomene cu ajutorul unor funcii matematice, denumite funcii de regresie. n folosirea acestei metode este important s se identifice funcia ce exprim cel mai bine dependena dintre caracteristicile studiate. Funcia de regresie poate avea forme variate, fie de funcie liniar sau neliniar, de producie sau logistic. A. Modelul regresiei simple (unifactoriale), exprim dependena caracteristicii rezultative y, numai n raport cu caracteristica factorial (x), fcnd abstracie de toi ceilali factori de influen,

y = f ( x) +
considerndu-I constani i este de forma: unde este variabila aleatoare cu dispersia constant i media nul, numit eroare, ce nsumeaz influena factorilor nenregistrai. Modelul este o reflectare schematic, simplificat a realitii, construit dup identificarea dependenelor i specificarea formei legturii dintre cele dou fenomene. a.1. Modelul liniar sau regresia simpl liniar are la baz ecuaia liniei drepte i este cel mai cunoscut model, specific tipului de legtur dintre dou caracteristici ce variaz n progresie aritmetic, adic:

y = a + bx +
unde a,b sunt parametrii necunoscui ai modelului, ce trebuie estimai n vederea estimrii parametrilor a i b se utilizeaz, de regul, metoda celor mai mici ptrate. Dac dispunem de n observaii pereche (xi, yi), atunci modelul se poate scrie sub forma:

y xi = a + bxi
42

yxi valorile ecuaiei de regresie, calculate pentru toate unitile observate, pe baza valorilor individuale xi i sunt numite valori teoretice ale lui y n funcie de x; acestea se noteaz ca o medie, ntruct evideniaz tendina de realizare a corelaiei, respectiv tendina de variaie a lui y, dac ar fi depins numai de variaia lui x; xi valorile individuale ale caracteristicii factoriale, obinute din observare; a parametru cu sens geometric de ordonata de origine a dreptei, fiind valoarea lui y cnd x = 0; nu are semnificaie independent, putnd avea sens pozitiv sau negativ; b- parametru numit coeficient de regresie, ce arat cu ct se modific y, dac x se modific cu o unitate; n graficul de corelaie, b indic panta liniei drepte. Semnul coeficientului de regresie b, indic sensul legturii, astfel dac: b>0 legtur direct; b=0 lipsa legturii; b<0 legtur invers. Operaia de nlocuire a termenilor nregistrai, obinui din observare (y i), cu termenii teoretici, obinui din calcul (yxi), ce elimin variaiile ntmpltoare i evideniaz tendina esenial, se numete ajustare. Funcia de ajustare, reprezentat printr-o dreapt de regresie este:

y xi = a + bxi y i = a + bxi + i
Ajustarea se exprim astfel:

i = 1, n i = 1, n

Iar valorile nregistrate sunt de forma:

y i y xi = a + bxi + i a bxi = i
Se poate spune c estimarea parametrilor se bazeaz pe determinarea funciei care minimizeaz erorile de ajustare. n cazul n care factorul x este determinant pentru y, iar legtura este liniar, atunci valorile ecuaiei de regresie (yxi) trebuie s prezinte abateri minime fa de valorile nregistrate yi. ntruct aceste abateri se pot produce ntr-un sens sau altul, ele sunt ridicate la ptrat, iar metoda se numete metoda celor mai mici ptrate. Determinarea parametrilor a i b se face prin minimizarea funciei de dou variabile, ce are forma: sau

F ( a, b ) = y i y xi
i =1

= min

Minimul funciei, se obine prin derivarea funciei:

F ( a, b ) = ( y i a bxi ) = min F ( a, b ) =0 a 2 ( y i a bxi ) 1 = 0


a + bxi - yi = 0 axi + bxi2 - xiyi = 0 Din care se obine sistemul de ecuaii: na + b xi = yi a xi + b xi2 = xiyi Prin rezolvarea acestui sistem se obin parametrii a i b, iar pe baza lor se calculeaz valoarea ecuaiei de regresie pentru fiecare valoare a caracteristicii x, respectiv:
i =1

F ( a, b ) =0 b 2 ( y i a bxi ) xi = 0

Rezult sistemul:

x=

x
n

y=

y
n

43

yxi = a + bxi , iar apoi se trece la ajustare Dac funcia de ajustare (yxi ) este corect aleas i datele utilizate satisfac condiia de omogenitate i volum, atunci seria ajustat exprim clar tendina manifestat n dependena fenomenului. Avnd calculate xi , yi i cunoscnd valoarea lui n, se pot determina: nlocuind aceste valori n ecuaia dreptei de regresie se obine:

b=

x =a + bx i rezult a = y - bx , ceea ce dovedete c dreapta de regresie trece prin punctul mediu (x ,y ). a.2. Regresia simpl neliniar: parabol, exponenial, hiperbolic a.2.1. Modelul parabolei de gradul II este de forma: y = a +bx +cx2 + Funcia de ajustare este reprezentat prin ecuaia de regresie: yxi = a +bxi +cxi2 ; i = 1,2,,n unde a,b,c parametrii necunoscui ce trebuie estimai. Similar modelului liniar, se utilizeaz metoda celor mai mici ptrate pentru estimarea lui a,b,c, prin minimizarea funciei: obinnd sistemul de ecuaii normale:

( x x )( y y ) ( x x)
i i 2 i

F( a ,b ,c ) = y i y xi
i =1
2 i

na + b xi + c x = y a xi +b xi2 +c xi3 = xiyi a xi2 +b xi3 + c xi4 = xi2yI Valorile obinute pentru parametrii a,b,c se introduc n ecuaia de regresie i se determin valoarea ecuaiei pentru fiecare valoare a caracteristicii xI , dup care se trece la ajustare. a.2.2. Modelul exponenial are forma: y = abx + iar funcia de ajustare este funcia exponenial: yxi = abxi; i =1,2,n; a,bR+ Funcia se logaritmeaz transformnd-o n model liniar: lgyxi = y ; lga = a i lgb = b atunci se obine: y = a +b xi Se aplic n continuare metoda celor mai mici ptrate, ca i n cazul regresiei liniare simple i se obine sistemul de ecuaii normale: na +b xi = yi a xi + b xi2 = xiyi Parametrii a i b se obin prin antilogaritmare, se nlocuiesc n ecuaia de regresie, se obin valorile lui yxi i se trece la ajustare. a.2.3. Modelul hiperbolic exprim dependena invers dintre dou caracteristici i are forma:

b' y = a+ + x
Ajustarea se realizeaz prin ecuaia de regresie:

y xi = a +

b xi

Pentru estimarea parametrilor a, b, se utilizeaz metoda celor mai mici ptrate, parametrii obinndu-se prin rezolvarea sistemului de ecuaii normale: n continuare ajustarea se realizeaz prin parcurgerea acelorai pai ca la modelele anterioare.

1 na + b = y i xi 44

y 1 1 + b 2 = i xi xi xi

B. Modelul regresiei multiple (multifactoriale), exprim dependena caracteristicii rezultative (y), n raport cu un numr mare de factori, respectiv de caracteristici factoriale i are forma: Y = f(x1, x2,xk,xm) + ; xk caracteristici factoriale independente b.1. Regresia multipl liniar este cel mai cunoscut model multifactorial, utilizat atunci cnd caracteristica rezultativ (y) este liniar dependent fa de caracteristicile factoriale (x k) i se exprim cu relaia: yi = a + b1x1i + b2x2i ++ bkxki ++ bmxmi + i i = 1,2,, n numr de observaii k= 1,2,, m numrul caracteristicilor factoriale bk, k = 1,2,, m coeficienii de regresie multipl care arat cu ct se modific y, dac xk se modific cu o unitate. Parametrii se obin utiliznd metoda celor mai mici ptrate, minimiznd funcia: Similar modelului regresiei simple liniare, prin derivarea funciei n raport cu toi parametrii a, b k, se

(y
n i =1

y xi

) = [ y
2

( a + b1 x1i + b2 x 2i + ... + bm x mi ) ]

obine sistemul de ecuaii normale cu k = 1, 2,,m caracteristici factoriale i m + 1 ecuaii: na + b1 x1i + b2 x2i + + bm xmi = yi a x1i + b1 x1i2 +b2 x1ix2i ++ bm x1ixmi = x1iyi a x2i + b1 x1ix2i + b2 x2i2 ++ bm x2ixmi = x2iyi . . a xmi + b1 x1Ixmi ++ bm xmi2 = xmiyi b.2. Regresia multipl curbilinie se utilizeaz n cazul cnd caracteristicile factoriale acioneaz prin multiplicarea lor, iar influenele sunt proporionale cu valoarea acestora. Modelul are forma:

y i = ax1i x 2i x3i ... x mi

b1

b2

b3

bm

Liniarizarea modelului se face prin logaritmare, dup care se estimeaz parametrii funciei liniare, prin metoda celor mai mici ptrate. Procedeul este similar regresiei simple, dar calculele sunt mai laborioase. n practic, atunci cnd legtura ntre fenomene este slab, metoda regresiei trebuie mbinat cu metoda corelaiei, ce prin calculul indicatorilor, msoar intensitatea legturii. IV.3. Msurarea intensitii legturilor. Metoda corelaiei Metoda corelaiei, permite o ierarhizare a factorilor de influen. Aceasta const n calcularea unor indicatori ai corelaiei, ce msoar intensitatea legturii ntre dou sau mai multe caracteristici, exprimnd, ct de strns este legtura dintre ele. a) Covariaia este un indicator ce se utilizeaz pentru msurarea legturii liniare ntre o caracteristic rezultativ (y) i una factorial. Cu ajutorul graficului de corelaie se reprezint variabilitatea caracteristicilor x i y, n jurul mediilor lor. Mediile x iy definesc patru cadrane, abaterile valorilor individuale fa de media lor avnd semne diferite n cele patru cadrane, dup cum se observ n graficul alturat: yi II(-,+) I(+,+)

III(-,-)

IV(+,-)

Fig.4.3. Graficul de corelaie Formula de calcul a covariaiei este:

COV( x , y ) =

(x

x yi y n

)(

)
45

n cadranele I i III COV(x,y) >0 evideniaz o legtur direct. n cadranele II i IV COV(x,y) <0 evideniaz o legtur invers. Dac COV(x,y) = 0 x, y sunt independente, ntre ele nu exist legtur. Cu ct valoarea covariaiei este mai mare, cu att legtura este mai intens i invers. b) Coeficientul de corelaie liniar simpl msoar intensitatea n cazul legturilor liniare, fiind independent de unitile de msur ale caracteristicilor din care se determin. Formula de calcul este:

rx , y =

xi x y i y x y n

(x

x yi y

)(

n x y

) = cov( x, y )
x y

Dac nlocuim mediile i abaterile medii ptratice cu formulele lor de calcul, se obine formula de calcul a coeficientului de corelaie liniar simpl:

rx , y =

[n x

n x i y i xi y i
2 i 2

( xi ) n y i ( y i )

][

In practica statistic se utilizeaz frecvent aceast formul, deoarece conine elemente deja calculate la ecuaiile de regresie. Coeficientul de corelaie ia valori n intervalul [-1, 1]. Dac: r(0, 1] legtur direct; r[-1, 0) legtur invers; r=0 x i y sunt caracteristici independente sau necorelate liniar. Cu ct rezultatul coeficientului r se apropie de 1 sau de 1, cu att legtura este mai intens. c) Coeficientul de corelaie liniar multipl msoar intensitatea ntre o caracteristic rezultativ (y) i dou sau mai multe caracteristici factoriale (x). Cel mai des utilizat coeficient, este cazul corelaiei dintre o caracteristic rezultativ (y) i dou caracteristici factoriale (x1, x2), cu formula de calcul:

ry / x1 , x2 =
unde:

r 2 y / x1 + r 2 y / x2 2ry / x1 ry / x2 rx1 / x2 1 r 2 x1 / x2

ry / x1 =

[n x
2 2

n x1 y x1 y
2 2

( x1 ) n y 2 ( y )

][

ry / x 2 =

[n x [n x

n x2 y x 2 y ( x2 )
2

] [n y
2

( y)

] ]

rx1 / x2 =

n x1 x 2 x1 x 2
2 2

( x1 ) n x 2 ( x 2 )

][

Rezultatul se interpreteaz n acelai mod ca i cel al coeficientului de corelaie simpl. d) Raportul de corelaie este indicatorul utilizat pentru msurarea intensitii n cazul legturilor neliniare. Calculul se bazeaz pe descompunerea dispersiei totale a caracteristicii rezultative y
46

( y2), n dispersia valorilor observate fa de valorile estimate, printr-o ecuaie de regresie ( valorilor estimate fa de medie ( 2r/y), utiliznd formula:
2 y

y/r

) i dispersia

y/r

r/y

( y y)
i

(y =

sau
i

y xi n

) + (y
2

xi

unde yxi este ecuaia de regresie sub forma unei parabole, hiperbole, exponeniale sau de orice alt tip. Raportnd dispersiile pariale la dispersia total, se obin: coeficientul de determinaie (R 2x,y) i coeficientul de nedeterminaie (K2x,y).

R 2 x, y =

2r / y 2y

K2 =

x, y

2r / y = 2 = y

(y (

xi

n yi y n

(y = ) (y
2

2 y/r 2y

xi i

y y

Prin nlocuirea elementelor de calcul ale dispersiilor, cei doi indicatori se mai pot calcula i cu ajutorul urmtoarelor relaii:

x, y

2y/r = 2 = y

(y

(y y ) n = ( y y) ( y y)
i i xi 2 i i

y xi

2 2

ntre R2 i K2 se stabilesc urmtoarele relaii: R2x,y + K2x,y = 1 R2xy = 1 K2x,y 2 2 Dac R x,y > K x,y caracteristica factorial (K) este factor determinant pentru variaia caracteristicii rezultative. Raportul de corelaie (Rx,y) se obine ca rdcin ptrat a coeficientului de determinaie:

R xy = R 2 xy Rx, y =

Rx, y = 1 K 2 x, y

(y (y

xi i

) y)
y

Rx, y =

( y y ) ( y y)
i xi i

Unde: Rx,y [0, 1]. Cu ct valoarea lui Rxy este mai apropiat de 1, cu att legtura este mai strns. e) Coeficientul de asociere se utilizeaz pentru msurarea intensitii legturii dintre dou caracteristici nenumerice, alternative. Datele rezultate din observare se sistematizeaz i se prezint ntr-un tabel de asociere, dup cum rezult din tabelul nr.4.1.
Elementele de calcul necesare pentru determinarea unui coeficient de asociere
Tabel nr.4.1. Variantele factoriale x caracteristicii Variantele rezultative y y1 f11 f21 f11 + f21 caracteristicii y2 f12 f22 f12 +f22 TOTAL f11 + f12 f21 + f22 fij

x1 x2 TOTAL

47

Gradul de asociere dintre cele dou caracteristici x i y se msoar cu ajutorul coeficientului de asociere Yule, notat Cay obinut pe baza urmtoarei formule:

C ay =

f11 f 22 f 21 f12 f11 f 22 + f 21 f12

Unde: Cay [-1; 1] Dac Cay (0, 1] , rezult c ntre x i y exist o asociere direct. Dac Cay [-1, 0), atunci ntre x i y asocierea este invers. Dac Cay = 0, nu exist legtur ntre cele dou caracteristici. f) Coeficientul de contingen are aceeai semnificaie ca i coeficientul de asociere i se calculeaz cu formula:

Cc =

( f11 +

f12 )( f 21 + f 22 )( f 11 + f 21 )( f 12 + f 22 )

f 11 f 22 f 21 f 12

ntre cei doi coeficieni , prezentai anterior, se verific relaia: Cc > Cay. g) Coeficienii de corelaie a rangurilor se utilizeaz pentru msurarea intensitii legturii dintre cele dou caracteristici, n cazul n care una sau ambele caracteristic sunt exprimate numeric, respectiv sunt cuantificate cu ajutorul scalei ordinale prin atribuirea de ranguri sau n cazul caracteristicilor exprimate ca mrimi relative de intensitate. n cazul acestor caracteristici, pentru determinarea coeficienilor de corelaie a rangurilor, se parcurg urmtoarele etape: 1) se ordoneaz valorile ambelor caracteristici cresctor sau descresctor; 2) se acord ranguri att pentru caracteristica x, ct i pentru caracteristica y, ranguri ce se noteaz R x , respectiv Ry , astfel: - rangul pentru x va fi Rx = 1, 2, , n unde n reprezint numrul de observaii; - rangul pentru y va fi Ry = 1, 2, , n; 3) se determin diferenele de rang pentru fiecare cuplu de valori (xi, yi): Di = Ryi - Rxi ; 4) se stabilete pentru fiecare valoare a caracteristicii rezultative (y i) asociat caracteristicii factoriale (xi): - numrul de ranguri superioare, notat P; - numrul de ranguri inferioare, notat Q; 5) se calculeaz scorul S, dup formula:S = P - Q Legtura dintre x i y se caracterizeaz cu ajutorul urmtorilor coeficieni de corelaie a rangurilor: - Coeficientul lui Spearman care are formula:

CS = 1

6 Di
i =1 3

n n

- Coeficientul Kendall are forma:

CK =

S 0,5 n 2 n

Unde: S scorul determinat; n numrul de cupluri. Cei doi indicatori iau valori n intervalul :[-1; 1]. Dac CS i CK (0; 1] , ntre x i y exist o legtur direct. Dac CS i CK [-1; 0) , nter x i y este o legtur invers. Cu ct se apropie de 1 i de 1, cu att legtura este mai intens.

48

49

S-ar putea să vă placă și