Documente Academic
Documente Profesional
Documente Cultură
Regresia i corelaia
CURS 1. DOMENIUL ECONOMETRIEI ............................................................................ 2 1.1 Temenul de econometrie. Scurt istoric al dezvolt rii .............................................. 2 1.2 Modelul econometric ................................................................................................ 3
CURS 2. METODA REGRESIEI ............................................................................................ 5 2.1 Tipuri de leg turi ntre fenomenele economice.......................................................... 6 2.2 Metode de analiz a interdependenei dintre fenomene ............................................ 9 2.2.1 Metode parametrice simple ................................................................................ 10 2.2.2 Metode analitice de msurare i interpretare a legturilor................................... 16
C = a + aV +aC t-1 + u 1 - ecuaia consumului (1.1) It = b + b RD + b It-1 + u2 - ecua ia investiiilor (1.2) RD = c +c V + c B + u3 - ecuaia pieii banilor (1.3) V = Ch +I +G - ecua ia veniturilor tuturor agenilor economici (1.4) Evident, modelul prezentat mai sus constituie o redare extrem de schematic a relaiilor din economie i rolul su este doar de a facilita exemplificarea noiunilor i conceptelor specifice econometriei. Astfel, n modelul prezentat deosebim variabile, parametrii si relaii, formnd mpreun o reprezentare structural. n ce privete modelul deosebim a) variabile predeterminate: exogene (independente, de intrare): RD , B ,G retardate ( cu efect ntrziat): Ch , I b) variabile endogene (efect, dependente, de ieire): Ch , I , RD , V c) variabile aleatoare (stochastice, perturbatoare): u1 , u2 , u3 n ce privete relaiile acestea pot fi: a) relaii funcionale (de regresie) de tip comportamental (1.1) ,(1.2); tehnologic; istituional; b) relaii de identitate (de balan, de echilibru) (1.4). Parametrii, la randul lor, pot fi particularizai astfel: - parametrii de regresie a,a ,a ,b ,b ... - estimatori ai parametrilor de regresie (rezultai din calcule asupra datelor provenite dintr-un sondaj statistic): , , ,b^ ...; - parametrul "liber":a ,b ,c ntr-o form concentrat modelul (1.1-1.4) poate aprea astfel: (y, x, a, u)= 0 Unde: - un set de ecuaii suficiente pentru a obine variabilele endogene (y) dac celelalte elemente (x - variabilele predeterminate, a- parametrii, u - variabilele perturbatoare) sunt date. Se pune problema de a determina pe "a" (de a gsi setul parametrilor "a" n mulimea "A" a deciziilor) care maximizeaz o valoare ateptat n condiii date. n afara modelelor de tipul celui prezentat, domeniul econometriei se extinde i asupra altor aspecte din economie pentru care cuantificarea poate aduce mai mult rigoare i n general, un plus de cunoatere. Dar miezul tare al demersului econometric rmne totu i modelul bazat pe zeci sau sute de ecuaii, n mare majoritate de regresie, prin care se caut reproducerea elementelor eseniale din mecanismele de funcionare ale economiei, ncepnd cu economia casnic, trecnd prin economia de firm, economia naional (aflat n centrul ateniei econometricienilor) i sfrind cu mondoeconomia. Perspectivele pe care le deschide modelarea econometric pot fi redate succint astfel: reprezint o modalitate de a prentmpina surprizele economiei de pia printr-o evaluare aprioric a comportamentului diverilor ageni economici; permite anticiparea efectului unor decizii n vederea alegerii celei mai bune politici economice (cu efecte benefice maxime i cu implicaii nedorite minime); faciliteaz dezvoltarea teoriei economice, ntruct este greu de acceptat c se poate face o teorie economic realist fr a apela la m surri (cuantificri, evalu ri) iar evalu rile (procedeele de msurare) fr o teorie adecvat nu pot demonstra nimic. Acest din urm aspect sugereaz existena, n orice caz necesitatea, unei relaii de complementaritate ntre econometrie i economie. Pentru o reciproc avantajare este necesar ca 4
economia s-i fundamenteze mai riguros conceptele i categoriile, ceea ce ar avea efecte salutare asupra preciziei datelor, iar econometria la rndul ei, trebuie s-i perfecioneze metodele innd seama de specificul n care evolueaz variabilele n economie ca i de imposibilitatea experimentelor (controlate statistic) n acest domeniu. Numai sprijinindu-se reciproc teoria economic i econometria pot face ca economia s ating nivelul de rigurozitate al tiinelor naturale. Legat de relaia teorie economic - econometrie i, n ultima instan, de caracterizarea econometriei ca o economie de inten ie tiinific, merit toat atenia p rerea econometricianului R.Frisch, conform creia "experiena a artat c fiecare din urmtoarele 3 puncte de vedere, al statisticii2, al teoriei economice i al matematicii, este de o condiie necesar, dar nu suficient pentru o n elegere efectiv a relaiilor cantitative din economia modern; unificarea lor este aceea care asigur eficiena. Econometria este tocmai aceast unificare". Dou dintre scopurile principale ale econometriei sunt: furnizarea de msurri empirice pentru teoria economic i verificarea teoriei cu ajutorul testelor. Spre exemplu, teoria economc prezice ca funcia cererii se ndreapt de sus in jos. Estimrile econometrice pot verifica sau demostra falsul acestei preziceri, i msura care este magnitutinea acestui fenomen. Cel mai important model economic este regresia. Regresiile sunt importante pentru economiti pentru c acetia nu pot folosi simulri n economie. Ei pot observa datele, iar modelele trebuie s fie interpretate pentru a nltura problemele de observare sau de analiz.
n domeniul fenomenelor i proceselor social-economice, iau natere o serie de legturi, de interdependene, determinate de aciunea unor cauze i condiii diferite, care influeneaz mai mult sau mai puin fenomenele existente. Complexitatea fenomenelor economice i sociale, caracterizarea lor cantitativ i calitativ determin folosirea combinat a diferitelor tiine n investigarea relaiilor de cauzalitate, care stau la baza apariiei i dezvoltrii lor. Printre metodele i modelele care s-au impus n studiul interdependenei cele care se folosesc cel mai frecvent sunt corelaia i regresia statistic Utilizarea acestor metode este justificat de necesitatea crescnd a reflectrii ntr-o form numeric adecvat a interdependenei obiective dintre fenomenele social-economice n ceea ce privete natura, direcia i gradul de intensitate a legturilor, care se manifest ntr-o anumit perioad de timp sau n dinamic. Teoretic i practic se demonstreaz n mod tiinific c fenomenele sociale apar i se dezvolt ca urmare a unor cauze variate, care pot aciona m acelai sens sau n sens opus i cu grad diferit de intensitate. Complexitatea interaciunii dintre fenomene este cu att mai mare, cu ct ele aparin unor colectiviti mai numeroase Reiese c fenomenele sociale nu sunt, de regul, fenomene univoc determinate, fiind rezultatul conjugrii influenei mai multor fenomene-cauz, iar n sistemul acesta de legturi nu toate raporturile de dependen au aceeai importan, aciunea unora dintre factori compensndu-se reciproc. De aceea, n analiza a raporturilor de dependen dintre fenomene, problema care se pune este aceea a msurrii relaiei care exist ntre dou sau mai multe caracteristici cuprinse n programul unei cercetri concrete a fenomenelor social-economice de mas. Aceasta presupune, n primul rnd, s se constate dac ntre caracteristica x - denumit caracteristica factorial sau
2
Analiza statistica urmareste: a. descoperirea a tot ceea ce este permanent, esential si logic in variatia proceselor statistice; b. masurarea influentei factorilor care determina variatii in timp si spatiu; c. masurarea influentei factorilor care determina variatii din punct de vedere calitativ.
independent i caracteristica y caracteristic rezultativ sau dependent - exist sau nu un raport de dependen i, n al doilea rnd, dac aceast relaie exist s se exprime printr-un indicator simplu sau sintetic de corelaie, msura n care caracteristica factorial x contribuie la formarea caracteristicii rezultative y sub aspectul naturii, direciei i formei de legtur ntre ele. n acest stadiu de cercetare statistic analiza calitativ ce trebuie s precead aplicarea uneia sau a alteia dintre metodele statistice este deosebit de important i are un vdit caracter interdisciplinar. Aceasta permite ca, din ansamblul de legturi existente n mod obiectiv ntre fenomenele aceleiai colectiviti statistice, s se desprind acelea care au caracter permanent i sunt determinante n formarea nivelurilor concrete de dezvoltare a caracteristicii rezultative. Acest lucru apare cu att mai necesar, cu ct legitatea de apariie i dezvoltare a fenomenelor social-economice fiind valabil pentru ntregul ansamblu, nu este sesizabil, de obicei, n cadrul cercetrii empirice, dect dac datele se refer la un numr mare de cazuri individuale concrete, diferite ca forme de manifestare, aparinnd aceleiai colectiviti. Avnd n vedere toate aceste aspecte, trebuie precizat c metoda corelaiei nu poate da rezultate bune dect dac se lucreaz cu un num r suficient de mare de cazuri individuale n care distribuia abaterilor este aproximativ normal . Dac aceast condiie nu este satisfcut, cmpul de aciune a legii numerelor mari este limitat, iar concluziile desprinse n urma obinerii anumitor indicatori de corelaie pot ,da natere unei interpretri eronate, ca urmare a reflectrii neveridice a fenomenelor supuse cercetrii statistice. i cu aceast ocazie este necesar ca procesul de analiz s porneasc de la simplu la complex, de la fenomene la esen, de la o esen de un anumit grad la o esen de grad superior. Aceasta presupune ca, n analiza legturilor dintre fenomene, s se foloseasc metoda abstractiz rii succesive a factorilor, prin care s se poat studia att legturile simple, imediate dintre dou fenomene legate printr-o relaie de cauzalitate direct, ct i interaciunea dintre factori. Studiul econometric al interdependenei dintre fenomene necesit identificarea legturilor studiate de la cauz la efect, precum i legturile realizate prin intermediul unui ir de cauzaliti. n acest sens, este necesar ca relaiile de cauzalitate din interiorul fenomenelor complexe s fie studiate i prezentate tot sub o form de tendin valabil la nivelul ntregului ansamblu i nu la nivelul unor valori individuale izolate. Aceasta conduce n mod obligatoriu la folosirea unor metode statistice m care s se in seama de formele de distribu ie de frecven ale fenomenelor pentru care se studiaz interdependenele dintre ele i care nu pot fi interpretate dect pe baza indicatorilor medii i a celor de variaie. nainte de aplicarea modelelor econometrice de analiza interdependena, este necesar s facem distincia ntre corelaie i covariaie. Covariaia presupune existena unor forme de repartiie n timp, spaiu sau organizare, pentru 2 sau mai multe variabile, dar care sunt independente ntre ele. Corelaia se poate defini ca interdependena existent ntre diferitele fenomene sau caracteristici exprimate prin numere (cantitativ) sau prin cuvinte (calitativ) manifestat n cadrul fenomenelor social-economice de mas. Corelaia presupune gsirea funciei analitice cu care s descriem statistic legtura dintre variabilele studiate. Trebuie precizat c metoda corelaiei nu poate da rezultate bune dect dac se lucreaz cu un num r suficient de mare de cazuri individuale n care distribu ia abaterilor este aproximativ normal .
1. Leg turile funcionale sunt univoce, realizate direct ntre un fenomen-cauz i un fenomen-efect. Deci, fenomenul-efect depinde de o singur cauz, care poate fi identificat de cte ori se produce, ceea ce nseamn c, dac condiiile rmn constante, atunci unei valori a caracteristicii factoriale i corespunde o singur valoare a caracteristicii rezultative. Ele se mai numesc i legturi de tip determinist. Relaia matematic dintre fenomenul-efect i fenomenul-cauz, pentru legturile de tip funcional (determinist) este: yi=f(xi). Ex Un exemplu de astfel de leg tur funcional este aceea dintre nivelul productivitii muncii i consumul specific de timp de munc pentru produsul respectiv n cadrul unei perioade de timp. Se poate, cu uurin, demonstra c, pe msur ce scade timpul de producere a unei m rfi, cu att crete productivitatea muncii pentru produsul respectiv. 2. legturi statistice, denumite i leg turi stohastice, de tip nedeterminist descrise prin funcia matematic : yi = f ( x1i , x2i ,..., xki ) i se refer la fenomene complexe, influenate de mai multe cauze, care se manifest n condiii diferite. n aceast relaie de multicauzalitate unii factori au caracter esenial, alii ntmpltor. Cu ct relaiile de cauzalitate sunt mai numeroase, cu att gradul de variabilitate a fenomenului-efect este mai mare. n astfel de cazuri, la fiecare valoare a caracteristicii factoriale i poate corespunde o distribuie de valori a caracteristicii rezultative. Specific leg turilor statistice este faptul c n variaia unei caracteristici rezultative exista ntotdeauna i o component aleatoare, care apare ca rezultat al interac iunii dintre factorii eseniali i cei ntmpltori i care poate fi inclus ntre cei n factori sau poate fi explicitat n afara lor. Dac se expliciteaz componenta aleatoare factorial (e) relaia va fi: Dac fenomenele sunt de tip stohastic, variaia factorilor aleatori urmeaz o lege de distribuie normal normat pentru care media este egal cu zero i dispersia cu unu, ceea ce nseamn c pentru un numr mai mare de cazuri observate abaterile ntr-un sens i altul se compenseaz reciproc i pentru ecuaia medie de tendin se folosete func ia liniar cu care se pot determina numeric parametrii ecuaiilor funciei de regresie care se utilizeaz. Legturile de tip stohastic sunt cele mai frecvente n domeniul fenomenelor sociale i economice. n cazul legturii statistice, identificnd un factor de influen, se poate constata c, pe msura variaiei acestuia, variaz ntr-o msur mai mare sau mai mic i caracteristica apreciat i dependent de factorul ales. De exemplu, legtura dintre nzestrarea tehnic a muncii i productivitatea muncii este o legtur de tip statistic. La o cretere a nzestrrii tehnice a muncii se obine o cretere diferit a productivitii muncii, deoarece productivitatea muncii depinde i de ali factori. Pentru a studia gradul de dependen a productivitii muncii de gradul de nzestrare tehnic este necesar ca aici s se foloseasc metoda abstractizrii, n care s se considere c numai acest factor ar fi esenial i variabil, iar ceilali factori ar avea aciune comun cu caracter constant, chiar dac n realitate, ei au o influen hotrtoare i variabil asupra productivitii muncii. Trebuie remarcat c legturile de tip statistic pot fi reciproce, adic efectul se transform, la rndul lui, n cauz imediat sau mediat prin intermediul unor relaii de cauzalitate n lan. Pentru a studia legturile de tip statistic este necesar s se identifice i s se ierarhizeze factorii eseniali, precum i formele sub care se manifest relaiile de cauzalitate. Acest lucru este posibil numai dac se nregistreaz toate unitile care formeaz colectivitatea de fenomene ce depinde de aceleai cauze esen iale. Cnd analiza relaiilor de cauzalitate se studiaz pe baza unor observri pariale este necesar s se verifice, n prealabil, gradul de reprezentativitate al colectivitii de selecie i s se verifice apoi gradul de semnificaie al indicatorilor de corelaie care s-au calculat, prin aplicarea unor teste de semnificaie. i aici, interpretarea relaiilor de cauzalitate, folosind datele de selec ie, se face n sens probabilist. 7
Varietatea formelor de manifestare a legturilor statistice necesit m continuare o clasificare a lor dup mai multe criterii. Un prim criteriu este acela al numrului factorilor nregistrai. A. Dup numrul caracteristicilor-factori luate n studiu, legturile statistice pot fi: legturi simple i legturi multiple. Leg turile simple (unifactoriale) sunt acelea n care caracteristica rezultativ se studiaz numai n funcie de o singur caracteristic factorial considerat principal i variabil, iar celelalte caracteristici factoriale, chiar dac au fost identificate i nregistrate, se consider cu aciune constant n toate cazurile individuale nregistrate. Leg turile multiple (bifactoriale i multifactoriale) presupun s se studieze dependena unei caracteristici rezultative n funcie de mai muli factori nregistrai. Interpretarea statistic a legturilor multiple implic i analiza legturilor simple dintre toate caracteristicile nregistrate pentru calculul corelaiei multiple. B. Dup coninutul caracteristicilor incluse n analiza de corela ie, legturile pot fi: de asociaie i de corelaie. Asociaia statistic (asocieri statistice cnd legtura se stabilete ntre variabile calitative) exprim relaia de interdependen dintre dou sau mai multe caracteristici exprimate calitativ sau ntre o caracteristic numeric i una calitativ. De exemplu, ntre aptitudini i profesia aleas exist o legtur de tip stocastic sau ntre gradul de ndemnare i productivitatea muncii. La folosirea caracteristicilor calitative este necesar s se gseasc o posibilitate de cuantificare, pentru a putea trece apoi la calculul indicatorilorde corelaie. Corelaia statistic (corelaii statistice cnd legtura se stabilete ntre variabile cantitative ) exprim relaia de interdependen dintre dou sau mai multe caracteristici exprimate numeric i se poate msura prin indicatori statistici de corelaie. De exemplu, ntre nivelul de productivitate a muncii, vechimea n producie i nivelul salariilor exist legturi de corelaie, care pot fi analizate att ca legturi simple, ct i ca o legtur multipl. C. Dup direcia n care se produc, legturile pot fi: directe i inverse. Leg turile directe (pe m sur ce crete variabila factorial crete i cea rezultativ) sau n acelai sens se produc atunci cnd, pe msur ce se modific nivelul de dezvoltare a caracteristicii factoriale, se modific n acelai sens i nivelul caracteristicii rezultative. n exemplul precedent, att productivitatea muncii, ct i vechimea n producie influeneaz m acelai sens varia ia salariailor. Leg turile inverse (pe msur ce crete variabila factorial descrete cea rezultativ) sunt acelea n care, pe msur ce se modifice nivelul de dezvoltare a caracteristicii factoriale, se modific m sens contrai nivelul caracteristicii rezultative. De exemplu, ntre nivelul productiviti muncii i nivelul costului unitar exist o legtur statistic invers. D. Dup forma legturii, ele pot fi: rectiliniare - a c rei linie de tendin se m soar cu ecua ia funciei liniare), i curbiliniare, exprimate prin ecuaia unei funcii exponeniale, parabolice, hiperbolice etc. Identificarea formei de realizare a legturii este determinant pentru msurarea corect a corelaiei dintre fenomenele social-economice.
E. Dup timpul n care se realizeaz, legturile statistice pot fi: concomitente (sincrone) i cu decalaj (asincrone). Leg turile sincrone (concomitente) sunt cele care pot fi urmrite n dinamic pentru aceeai perioad de timp. De exemplu, dac se analizeaz corelaia dintre dinamica productivit ii muncii i a salariilor, se poate observa c pe msur ce crete productivitatea muncii, crete i mrimea salariilor ncasate de muncitorii aceleiai colectiviti statistice. Leg turi asincrone (cu decalaj) apar atunci cnd caracteristicile factoriale ncep s acioneze asupra variaiei caracteristicii rezultative, dup scurgerea unei perioade timp. n cadrul analizei n timp, a legturilor, trebuie verificat dac, exist decalaj pn la nceperea corelaiei i necesitatea stabilirii perioadei de corelare a seriilor dup eliminarea decalajului. De exemplu, ntre mrimea investiiilor n maini i instalaii i creterea productivitii muncii exist un decalaj necesar asimilrii n mas a noilor tehnologii, sau ntre dezvoltarea unei ramuri noi de producie i mrimea exportului exist un decalaj corespunztor asigurrii competitivitii produselor pe plan interna ional. Problemele care trebuie rezolvate n aplicarea metodelor de analiz a corelaiilor pot fi sintetizate astfel: identificarea i ierarhizarea factorilor care determin n mod obiectiv varia ia caracteristicii rezultative; verificarea gradului de cuprindere a unitilor nregistrate. Dac unitile observate provin dintr-o cercetare parial de tip selectiv trebuie ca la interpretarea rezultatelor s se in seama de principiile teoriei probabilitilor; sistematizarea datelor observate, astfel nct s nu se modifice gradul i forma de variaie a caracteristicile la care se aplic metoda corelaiei; verificarea existenei i formei de legtur dintre caracteristicile corelate, n vederea alegerii corecte a modelului utilizat la msurarea dependenei statistice; calcularea adecvat a indicatorilor de corelaie m funcie de forma de legtur i de natura informaiei de care se dispune; aplicarea testelor de semnificaie a indicatorilor de corelaie pentru cazul n care ei provin dintr-un sondaj statistic. Interpretarea rezultatelor, verificarea ipotezelor, aplicarea testelor de semnificaie a funciilor i parametrilor lor se face potrivit particularitilor fenomenelor studiate n funcie de timp, loc i form de organizare. Dac datele provin dintr-un sondaj statistic trebuie s se verifice reprezentativitatea ansamblului i s se interpreteze probabilistic indicatorii calculai.
de interdependen i de posibilitatea de msurare a acestora, respectiv de natura informaiei de care se dispune i se poate folosi n msurarea i interpretarea acestor legturi. innd seama de aceste dou aspecte, la cercetarea legturilor dintre fenomene se pot folosi att metode simple de interpretare a legturii, ct i metode analitice, bazate pe interpretarea formei de dependen. Pentru interpretarea legturilor dintre fenomene se pot folosi metode de sistematizare i verificare a legturilor: A. Metode parametrice simple i analitice, B. Metode neparametrice
caracteristicile factoriale sunt independente ntre ele i atunci ordinea de fixare a lor n analiza raporturilor de interdependen este m funcie de importana fiecreia dintre ele pentru procesul de formare a caracteristicii rezultative; caracteristicile factoriale sunt corelate ntre ele i, n acest caz, este necesar ca ordinea de stabilire a factorilor s se fac n raport cu natura obiectiv a existenei legturii dintre factori. Procednd n acest fel, se pot analiza nu numai legturi directe, imediate, ci i interdependena dintre factori. Cnd n analiza de corelaie se folosesc serii cronologice sau teritoriale, timpul i, respectiv, spaiul nu sunt utilizate dect pentru ordonarea seriilor, respectiv pentru ob inerea unor serii condiionate n funcie de timp sau de unitatea teritorial, fr ca acestea s fie cuprinse n calculele de corelaie. Folosind acest procedeu se compar vizual dac exist o anumit tendin de corelare a valorilor nscrise pe acelai rnd. Deci, pe baza acestui procedeu se poate face numai verificarea existenei corelaiei i a direciei n care ea se manifest. Pe baza aplicrii sale nu se poate verifica nici forma i nici gardul de dependen a variabilei rezultative de factorii care o determin. Pentru a msura intensitatea dependenei, pornind de la seriile interdependente, este necesar s se aplice n continuare metodele analitice de calcul statistic. b) Metoda grup rilor reprezint un model de analiz prin excelen calitativ, capabil s surprind aspecte eseniale ale legaturilor dinte variabile. Studiul legaturilor se realizeaz dup ce unitile colectivitii se grupeaz n funcie de caracteristica factorial, iar pentru caracteristica rezultativ se calculeaz indicatorii derivai (mrimile relative sau medii) specifici fiecrei grupe. Aceast metod de studiere a legturilor dintre fenomene necesit calcularea mediilor condiionate ale variabilei rezultative y xi pentru grupele obinute dup variabila factorial. Pe baza tabelului de corelaie se pot calcula urmtoarele medii de grup:
y j nij yi =
j =1
nij
j =1
Cu ajutorul acestei metode se pot analiza corelaii simple i multiple. n cazul corelaiei simple, gruparea se face dup variaia caracteristicii factoriale n funcie de gradul de amplitudine a variaiei. Caracteristica rezultativ poate s apar cu valori centralizate pe grupele caracteristicii factoriale sau sub form de distribuii condiionate. De exemplu, dac se analizeaz, pe baza gruprii, legtura dintre nivelul productivitii muncii (x) i salariul obinut (y), atunci se vor grupa unitile colectivitii m funcie de amplitudinea variaiei caracteristicii factoriale - productivitatea muncii. Dup modelul m care se distribuie mediile condiionate ale variabilei rezultative fa de varia ia caracteristicii factoriale se poate aprecia dac fenomenele cercetate sunt sau nu corelate i care este direcia n care se manifest legtura. n cazul grup rii combinate, folosit la analiza corelaiei simple, se obine un tabel de corelaie, care, dat fiind importana folosirii lui n calcule de corelaie, se trateaz ca un procedeu separat. n cazul corela iei multiple nseamn c se analizeaz o singur caracteristic rezultativ variabil de mai muli factori. Aici se pot folosi fie grup ri simple obinute dup variaia unei singure caracteristici factoriale, fie grup ri combinate dup varia ia mai multor caracteristici factoriale. In prima variant - gruparea simpl - valorile celorlalte caracteristici apar ca medii 11
condiionate de primul factor de grupare; n cea de a doua variant -gruparea combinat - se coreleaz caracteristicile factoriale n ordinea lor de interdependen i pentru caracteristica rezultativ se calculeaz numai valorile mediilor condiionate de variaia factorilor respectivi de la o grup la alta. De exemplu, pentru a studia corelaia dintre vechimea n producie i salariul obinut, s-a organizat o observare selectiv pentru un eantion de 200 de muncitori. n acest caz se consider vechimea n producie ca fiind prima caracteristic factorial (xi) care este legat m mod obiectiv de cea de-a doua caracteristic factorial - producia obinut {xi), iar salariile obinute (y) pot fi considerate ca dependente de ambii factori. Metoda grup rii are ns i ea un grad limitat de analiz a corelaiei. Aceast metod d posibilitatea sistematizrii materialului ob inut din observare, n vederea aplicrii calculelor de corelaie. Ca metod independent, ea nu permite dect s se constate dac ntre caracteristicile studiate exist sau nu o corelaie statistic i, dac exist, s se aprecieze direcia n care se produce, eventual s se sesizeze forma n care se manifest. Identificarea formei de legtur nu se poate face fr a se ntocmi graficul de corelaie, iar verificarea ei, fr efectuarea analizei dispersionale. Pentru ca metoda gruprii s permit aplicarea corect a calculelor de corelaie este necesar s se in seama de anumite principii, care asigur o grupare tiinific a datelor. n primul rnd, trebuie s se aleag pentru efectuarea grup rii numai acele caracteristici care corespund unui raport obiectiv de interdependen i pentru care se pot stabili grupele i intervalele de grupare corespunztoare scopului analizei. Odat precizate caracteristica factorial i cea rezultativ este necesar s se stabileasc, n continuare, numrul de grupe i mrimea intervalelor n funcie de amplitudinea variaiei i tendina manifestat n distribuirea frecvenelor. Pentru a reda ct mai fidel forma de variaie a caracteristicilor este indicat s se foloseasc un numr mai mare de grupe dect n cazul folosirii gruprii ca metod de analiz a structurii colectivitii. n al doilea rnd, se recomand ca, pe ct posibil, s se evite groparea pe intervale neegale pentru ca densitatea de repartiie a frecvenelor pe grupe s nu influeneze n mod subiectiv asupra formei n care se manifest legtura dintre caracteristicile studiate. In cazul n care sistematizarea datelor se face dup dou caracteristici de grupare i se analizeaz o corelaie simpl este indicat ca i pentru caracteristica rezultativ s se foloseasc tot intervale egale de grupare i acelai numr de grupe, deoarece n calculele de corelaie apar totdeauna valori perechi, nregistrate la nivelul fiecrei uniti sau al aceleiai grupe. n al treilea rnd, metoda grup rii trebuie s fie combinat cu calcularea mediilor i a indicatorilor relativi pe grupe. Folosind mediile de grup se pot nltur influenele factorilor neeseniali, pstrndu-se ceea ce este esenial i tipic n formarea fenomenului studiat, legtura dintre fenomene realizndu-se, dup cum se tie, numai ca o tendin-general, valabil n medie pentru ntregul ansamblu de uniti statistice. De reinut c metoda grup rii nu trebuie folosit dect n cazul unui numr mare de observaii, cnd aplicarea metodelor analitice de calcul nu se poate face fr gruparea prealabil a datelor individuale. c. Metoda grafic Cu ajutorul acestei metode se verific dac ntre fenomenele supuse corelaiei exist legturi statistice i dac ele exist s se poat aprecia forma i sensul n care ele se realizeaz. n plus, metoda grafic se poate folosi i ca instrument de prezentare a rezultatelor analizei de corelaie, dup ce au fost calculai indicatorii care exprim numeric gradul de legtur dintre fenomenele cercetate, servind astfel pentru compararea datelor distribuiilor empirice cu valorile teoretice determinate prin aplicarea metodelor analitice de calcul. Cel mai frecvent, metoda grafic se folosete pentru interpretarea legturilor dintre dou fenomene ce se pot exprima sub forma a dou variabile statistice. Pentru aceasta se folosete sistemul axelor rectangulare, respectiv cadranul I, m care valorile lui x i y sunt pozitive. Pentru 12
analiza datelor de corelaie se reprezint grafic pe axa OX (axa absciselor) - valorile caracteristicii factoriale, iar pe axa OY (axa ordonatelor), valorile caracteristicii rezultative. Pentru a uura interpretarea datelor, cele dou scri de reprezentare nu ncep cu punctul de origine (unde x i y au valoarea zero), ci n mod convenional cu valorile cele mai apropiate de limitele inferioare nregistrate pentru cele dou caracteristici, deci se face o ntrerupere de canal pe ambele axe. La stabilirea scrilor de reprezentare pe cele dou axe se recomand s se asigure o anumit proporionalitate ntre ele n raport cu gradul de variaie a ambelor caracteristici. Dac se asigur o proporie just ntre cele dou scri de reprezentare, atunci graficul este ntocmit corect i, ntr-adevr, cu ajutorul lui se va putea prezenta forma obiectiv n care se produce legtura. Stabilind astfel cele dou scri de reprezentare, se va asigura un cmp de corelaie corespunztor tipului de dependen dintre cele dou variabile. Dac se dispune de un numr mare de observaii statistice, atunci se va ob ine pe grafic un numr mare de puncte de intersecie ale valorilor caracteristicii factoriale x cu cele ale caracteristicii rezultative y. Din aceast cauz, n literatura de specialitate, acest grafic este denumit graficul norilor de puncte". Graficul de corelaie denumit i corelogram sau graficul norului de puncte, permite s identifice cu ajutorul ajustrii care este funcia analitic corespunztoare valorilor noastre. Prin ajustare nelegim nlocuirea valorilor empirice obinute pentru o observaie statistic cu valori teoretice calculate dup un model statistic. n cazul n care am ntocmit un grafic de corelaie putem face o ajustare vizual i dup aceea aplicm modelul de calcul i o ajustare numeric. Ajustarea vizual const n trasarea unei linii drepte sau a unei curbe care s treac ct mai aproape de valorile empirice nscrise n grafic. Cu ajutorul graficului norilor de puncte" se pot rezolva, n principal, dou aspecte ale analizei corelaiei dintre fenomene: a) existena i direcia legturii; b) forma de legtur dintre cele dou variabile. Interpretnd modul de mprtiere a punctelor pe grafic se poate aprecia care este tendina de asociere a celor dou caracteristici pentru flecare unitate n parte. Fenomenele de mas, dup cum s-a mai artat, sunt influenate i de existena unor factori ntmpltori, care fac ca regularitile de producere a legturilor s se abat uneori de la forma teoretic de manifestare a legturii. Astfel, analiznd tendina pe care o prezint pe grafic poziia punctelor corespunztoare frecvenei de apariie a valorilor individuale ale celor dou caracteristici, se poate aprecia dac n medie exist legtur, sau fenomenele sunt independente ntre ele, iar n cazul n care exist legtur - care este sensul producerii ei. Cel mai des, n legturile existente ntre dou variabile din domeniul economic, distribuia punctelor pe grafic apare sub cele trei variante prezentate n figurile de mai jos: Interpretnd foram de legtur putem avea corelaii :
10 9 8 7 6 5 4 3 2 1 0 0 5 10 15 20
10 8 6 4 2 0 0 5 10 15 20
13
10 9 8 7 6 5 4 3 2 1 0 0 5 10 15 20
Lips de legtur Metoda grafica este utilizat cu bune rezultate pentru alegerea funciei analitice care se studiaz (n cazul regresiei i corelaiei). Fa de celelalte metode prezentate anterior, metoda grafic prezint avantajul c, cu ajutorul ei, se poate constata nu numai existena legturii i sensul ei, dar mai ales forma ctre care tinde s se realizeze. Metoda grafic se poate folosi, deci, att ca metod independent de prezentare a corelaiei, ct i ca instrument de stabilire a formei de legtur, fiind considerat calea cea mai sigur de a alege corect funcia analitic avut spre studiu. d. Metoda tabelului de corelaie care are la baza tabelul de corelaie, tabel cu dubl intrare reprezentnd o form special a unei grup ri combinate, n care separarea pe grupe a unitilor se face dup variaia ambelor caracteristici factorial i rezultativ. Cu ajutorul tabelului de corelaie n funcie de modul de distribuie a frecvenelor, n tabel se obin informaii cu privire la existena i direcia legturii dintre cele dou variabile n unele cazuri direcia legturii este dat de poziia diagonalei n jurul creia se grupeaz frecvenele: cnd diagonala leag unghiul stng de sus al tabelului cu unghiul drept de jos legtura este directa, iar cnd unete unghiul stng de jos cu unghiul drept de sus, se apreciaz c ntre cele dou caracteristici exist o legtur n sens invers. Procedeul tabelului de corelaie este, de fapt, o combinare a metodei gruprii cu principiile de construire i interpretare a unei reprezentri grafice. Tabelul de corelaie este o form special de prezentare a rezultatelor unei grup ri combinate obinute dup variaia celor dou caracteristici. n cazul tabelului de corelaie, gruparea unit ilor se face dup ambele caracteristici, att dup variaia caracteristicii factoriale, ct i dup variaia caracteristicii rezultative. La ntocmirea tabelului de corelaie trebuie s se respecte anumite reguli stabilite prin analogie cu construcia graficului de corelaie, innd seama i de condiiile impuse de metoda grup rii. n primul rnd, se recomand ca pentru ambele caracteristici dup care se face gruparea s se stabileasc intervale egale de grupare, n raport cu amplitudinea variaiei fiecrei caracteristici. n al doilea rnd, se recomand s se foloseasc, pe ct posibil, un numr egal de grupe att pentru caracteristica factorial, ct i pentru caracteristica rezultativ. Pentru a desprinde ct mai bine modul de corelare a celor dou caracteristici este indicat s se foloseasc un numr suficient de mare de grupe n scopul asigurrii unui cmp ct mai mare de corelaie i al red rii corecte a formei obiective a relaiei de interdependen. 14
n al treilea rnd, se recomand ca modul de nscriere a celor dou caracteristici n tabelul de corelaie s fie analog modului de prezentare a lor n graficul de corelaie. Potrivit acestui principiu, grupele dup variaia caracteristicii factoriale se trec pe orizontal, n ordine cresctoare, n capetele coloanelor, iar grupele formate dup variaia caracteristicii rezultative se trec pe vertical, n ordine descresctoare, n capetele rndurilor. Numrul unitilor colectivitii cercetate, purttoare a celor dou caracteristici (frecvenele), se trec n rubricile formate din ntretierea coloanelor cu rndurile tabelului. Dup modul de distribuie, n tabel se pot aprecia existena, intensitatea i direcia legturii dintre cele dou caracteristici studiate. Interpretarea tabelului de corelaie se face ca i n cazul graficului de corelaie, adic, dac frecvenele se concentreaz ctre prima bisectoare, atunci legtura este direct; dac tind s se concentreze ctre cea de-a doua bisectoare legtura este invers i dac se mprtie fr nici o regularitate pe toat suprafaa tabelului, variaia celor dou caracteristici este independent una de alta. Tabelul de corelaie, alctuit n mod analog cu graficul de corelaie, are urmtoarea schem: Valorile caracteristicii de grupare X x1 x2 ... xi ... xr Total Variantele sau valorile caracteristicii dependente Y y1 y2 yj ym n11 n12 ... n1j n1m n21 n22 n2j n2m ... ... ... ... ni1 ni2 nij nim ... ... ... ... nr1 nr2 nrj nrm n.1 n.2 n.j nm Volumul grupei n1. n2. ... ni. ... nr.
i =1
ni. = n. j
j =1
Acest tabel de corelaie se prezint astfel n cele patru unghiuri ale sale: a) unghiul din stnga jos: x i y au valori minime; b) unghiul din stnga sus: x are valoare minim, iar y are valoare maxim; c) unghiul din dreapta sus: x i y au valori maxime; d) unghiul din dreapta jos: x are valoare maxim, iar y are valoare minim. Dup modul de asociere a nivelurilor celor dou caracteristici se distribuie frecvenele m cadrul tabelului i se poate interpreta care este tendina de formare a raportului de corelaie ntre cele dou variabile, x i y. Dac tabelul prezint n titlurile rndurilor variabila x;" i n titlurile coloanelor variabila y,", atunci direcia legturii se interpreteaz invers dect m graficul de corelaie. Modul de aezare a frecventelor n jurul diagonalei ne d posibilitatea s apreciem intensitatea legturii: concentrarea intens a frecventelor n jurul diagonalelor indic existena unei legaturi strnse ntre caracteristici. n alte cazuri, frecventele se grupeaz pe diverse curbe. Dac frecvenele se repartizeaz pe ntregul tabel fr nici o regularitate, atunci ori nu exist legtura, ori aceasta este foarte slab . e) Metoda balanelor. Aceast metod servete pentru analiza relaiilor care exist n cadru unui proces stocastic n care se pot analiza relaiile de interdependen dintre diferitele elemente ale procesului, dintre diferitele laturi ale lui sau dintre diferitele etape sau momente n care el se desfoar. Spre deosebire de metodele prezentate anterior, care se refer la analiza interdependenei dintre variabile statistice, metoda balanelor servete pentru analiza relaiilor care exist n cadrul unui proces stocastic. In cazul unui proces stocastic, se pot analiza relaiile de interdependen 15
dintre diferitele elemente ale procesului, dintre diferitele laturi ale lui sau dintre diferitele etape sau momente n care el se desfoar. Ca metod , balanele sunt, de fapt, o dezvoltare a metodei grup rilor aplicate, nu a unor date individuale, ci a unor mrimi sintetice, caracteristice procesului social-economic analizat. i n acest caz, metoda grup rii pe elemente sau laturi ale procesului se folosete mpreun cu mrimile medii i mrimile relative, care permit reliefarea legturilor obiective existente ce se formeaz la nivelul ntregului ansamblu, prin compensarea abaterilor individuale din interiorul procesului analizat. n forma sa cea mai general, metoda balanei este folosit pentru analiza procesului reproduciei sociale i economice a ntregii economii. Cu ajutorul ei se interpreteaz corelaiile care se formeaz n mod obiectiv ntre elementele procesului de reproducie, pe ramuri i forme de proprietate; corelaiile dintre producie, consum i acumulare; ntre reproducia avuiei naionale i a produsului intern brut i net. Un loc din ce n ce mai important, n sistemul de balane al economiei naionale, l ocup balana legturilor dintre ramuri - ntocmit sub form de balan ah, denumit i balana inputoutput. n cadrul balanei ah, aceleai grupe se trec att n subiectul, ct i n predicatul tabelului, iar n rubricile ei se nregistreaz schimbarea unui fenomen care are ca puncte de plecare grupele din predicatul tabelului. Aceasta nseamn c n subiectul tabelului se vor ntlni ramurile, n calitatea lor de productori, iar n predicatul tabelului, aceleai ramuri, m calitate de consumatori sau de elemente de acumulare. Pe baza datelor din balan se pot caracteriza multiplele legturi reciproce ce se formeaz n mod obiectiv pe linie de producie-consumacumulare-investiii, care iau natere ntre grupele colectivitii m cadrul procesului reproduciei sociale. Balana ah permite deci caracterizarea n expresie numeric a legturilor de corelaie multipl dintre agregatele ce msoar ntr-un mod unitar ntregul mecanism al ramurilor i subramurilor, pe uniti administrative i economice ale economiei unei ri. Caracterizarea acestor interdependene, deosebit de complexe, bazate pe un bogat material informativ, se face cu ajutorul calculului matriceal, folosind echipamentele modeme de calcul. Metoda balanelor este deci caracteristic analizei proceselor sociale i economice ce se produc pe baza unor legturi de tip stocastic, a cror interpretare nu este posibil dect prin folosirea unui sistem de indicatori totalizatori sau medii. Prin interpretarea datelor din balan se pot stabili legturile, precum i gradul de intensitate a acestora, prin utilizarea unor indicatori de corelaie care s exprime numeric relaiile ce se manifest n interiorul procesului socialeconomic analizat. 2.2.2 Metode analitice de msurare i interpretare a leg turilor n paragraful precedent au fost prezentate metodele de verificare a legturilor dintre fenomenele i procesele economice de mas, ca momente iniiale ale cercetrii statistice a corelaiile dintre fenomene; cu ajutorul lor se face o sistematizare a informaiilor necesare aplicrii metodelor analitice de calcul i interpretare statistic. Aplicarea metodelor analitice trebuie s aib n vedere, n primul rnd, aspectele scoase n eviden n urma efectu rii analizei calitative care trebuie s precead orice fel de cercetare statistic, deci cunoaterea coninutului social-economic al relaiilor de cauzalitate dintre fenomene i, n al doilea rnd, s foloseasc cu discernmnt concluziile formulate prin aplicarea metodelor simple de corelaie, prin care s-au verificat existena, direcia i forma n care se realizeaz legtura dintre fenomene. n cazul n care nu se ine cont de aceste principii, calculul statistic devine un simplu exerciiu formal pentru determinarea unor indicatori de corelaie nesemnificativi. 16
Pentru a evidenia legea care se manifest n fiecare legtur n parte, pentru a msura statistic tendina sa de manifestare se folosesc ecuaiile de estimare corespunztoare unei funcii analitice care exprim forma de legtur dintre caracteristica factorial i cea rezultativ. Aceast funcie este cunoscut sub denumirea de funcie de regresie, iar reprezentarea ei grafic se face prin linia (curba) de regresie. Alegerea corect a funciei de regresie, care s exprime cel mai bine legtura dintre cele dou caracteristici, este deosebit de important pentru determinarea valorii statistice a indicatorilor de corelaie. Forma legturii dintre cele dou caracteristici se calculeaz n funcie de modul de corelare a valorilor caracteristicii rezultative cu valorile caracteristicii factoriale alese. Dac funcia de regresie nu a fost aleas n mod corespunztor, atunci rezultatele analizei, respectiv valorile indicatorilor de corelaie, vor fi denaturate. Pentru alegerea corect a funciei de regresie este necesar s se reprezinte legtura dintre cele dou serii de distribu ie printr-un grafic de corelaie, care s permit interpretarea vizual a tendinei de asociere a celor dou caracteristici perechi. Pe baza reprezentrii grafice se poate aprecia apoi dac legtura este de form rectilinie sau curbilinie. Tot ca instrument de verificare a veridicitii funciei de estimare, pentru msurarea legturi dintre cele dou variabile n cadrul colectivitii nregistrate, se pot folosi i metodele de analiz dispersional, cu interpretarea corespunztoare rezultatelor n urma aplicrii ei. Funcia de regresie exprim statistic modul n care caracteristica rezultativ (y) s-ar modifica dac ar varia numai valorile caracteristicii factoriale (x), iar ceilali factori ar fi considerai cu aciune constant n toate cazurile observate. Celelalte caracteristici, fiind considerate ca neeseniale i cu aciune constant asupra tuturor unitilor la care se msoar raportul de interdependen, nseamn c influen a lor este sintetizat ntr-o singur valoare cu caracter de medie. Legtura dintre cele dou variabile se realizeaz tot sub form de tendin, ceea ce nseamn c pentru estimare se va folosi tot o ecuaie medie de tendin corespunztoare formei identificate pe grafic. Metoda analizei regresiei i corelaiei s-a nscut n legtur cu cercetrile din biologie, sa dezvoltat pe baza experimentelor n genetic i agrobiologie, extinzndu-se apoi la alte domenii tiinifice, tehnice i economice, cunoscnd astzi aplicaii m mai toate domeniile. Apariia i dezvoltarea acestei metode sunt legate n Anglia de numele lui Francis Galton (1822-1911), biolog i matematician, i al lui Karl Pearson (1857-1936) matematician, biolog i filosof. Primul coeficient de corelaie se pare c a fost formulat de matematicianul i statisticianul francez Auguste Bravaia (1811-1863). Un promotor al dezvoltrii metodelor statistice aplicate a fost revista Biometrika", nfiinat n 1901, unde s-au expus cele mai importante contribuii la teoria i tehnica regresiei i corelaiei. Un rol important n dezvoltarea metodelor statistice 1-a avut celebra staiune Rothamsted, unde au lucrat i R.A. Fisher, M.G. Kendall i alii. Problema de la care au plecat Galton i Pearson, n anii 1890, n analiza regresiei a fost din domeniul ereditii. Galton a studiat corelaia dintre mrimea medie a prinilor i mrimea medie a copiilor, constatnd o strns legtur care poate fi studiat cu ajutorul unei funcii analitice. Constatnd c, n timp, se manifest o tendin de scdere a nl imii descendenilor, ecuaiile funciei analitice cu care a msurat aceast tendin a numit-o ecuaie de regresie, iar metoda de calcul i analiz a corelaiei cu ajutorul funciilor analitice de estimare, metoda regresiei. Aceast metod a corelaiei din domeniul biologiei s-a extins i n domeniul agrobiologiei i, mai trziu, i n domeniul economic. Iniial, regresia i corela ia erau legate numai de repartiia normal. Mai trziu s-au cercetat i fenomene care nu aveau o repartiie normal, dar erau corelate ntre ele. De asemenea, trebuie menionat faptul c metoda corelaiei s-a aplicat avndu-se n vedere dou posibiliti n funcie de volumul datelor de care se dispune: aplicarea n cazul unei colectiviti generale i 17
aplicarea n cazul unui eantion ob inut cu ajutorul unor metode de sondaj, pentru corelaii simple i multiple, liniare i neliniare. n cel de-al doilea caz, dup cum s-a mai artat, interpretarea se face cu ajutorul probabilitilor.
18
Coeficientul de regresie arat nu numai gradul de influen a factorului x asupra variabilei y, ci i sensul n care se realizeaz legtura. Valoarea coeficientului de regresie b poate fi mai mare dect zero, mai mic dect zero i egal cu zero. n cazul n care b > 0, atunci legtura de corelaie este direct, deoarece pe msur ce cresc valorile lui x, cresc i valorile ecuaiei de regresie calculate. n cazul n care b < 0, legtura este de sens invers, adic pe msur ce crete valoarea aracteristicii-factor, scade valoarea caracteristicii rezultative. Cnd b = 0, cele dou variabile sunt independente ntre ele i atunci y x = a, deci valoarea medie a ecuaiei de regresie este egal cu valoarea medie a caracteristicii rezultative ( y x = y ). Aceasta nseamn c variabila y nu este n funcie de variabila x, care s-a considerat ca factor de influen, ci variaia ei depinde de ceilal i factori, care s-au considerat ca fiind cu aciune constant pentru toate unitile colectivitii. Pentru a determina ecuaia medie de regresie, i, cu ajutorul ei, valorile ecuaiei de regresie corespunztoare tuturor valorilor variabilei x, este necesar s se calculeze valorile celor doi parametri a i b. Dac factorul x este determinant pentru variabila y, atunci valorile estimate prin funcia de regresie trebuie s dea abateri minime fa de cele nregistrate pentru variabila rezultativ. Cum aceste abateri se pot produce ntr-un sens sau altul, ele sunt ridicate la p trat i, din aceast cauz, metoda de verificare a acestei condiii se mai numete i metoda celor mai mici p trate. Cu alte cuvinte, dac y depinde de x, atunci trebuie s se ndeplineasc condiia ca suma p tratelor abaterilor valorilor empirice de la valorile ecuaiilor lor de regresie s fie minim. Parametrii a i b se determin din sistemul de ecuaii normale ob inut prin metoda celor mai mici p trate ( ( y i Yxi ) 2 = minim ). Dac modelul ales este corela ia liniar simpl corespunde datelor empirice, atunci ecuaia de regresie consider c valorile teoretice obinute prin celor mai mici p trate s prezinte 2 abateri minime. (Pentru tendina liniar aceast ecuaie este : [ y i (a + bxi )] = minim ).
Parametri ecuaiei n acest caz se determin prin rezolvarea urmtorului sistem de ecuaii: na + b xi = yi 2 a x i + b x i = xi y i Dac se folosete metoda determinanilor se obine: yi xi xi yi xi2 yi xi2 xi yi xi a= = n xi2 ( xi ) 2 n xi
x x n y x x y b= n x x x
i 2 i
n xi yi xi yi n xi2 ( xi )2
i 2 i
Acest procedeu mai simplu permite obinerea cu uurin a sistemului de ecuaii normale i pentru corelaia liniar multipl, unde se lucreaz cu un numr mai mare de parametri corespunztor numrului caracteristicilor factoriale .
19
Rezolvnd sistemul de ecuaii, se obin valorile lui a i b i se calculeaz care este ecuaia de regresie pentru fiecare valoare a caracteristicii factoriale. Aceste valori ale ecuaiilor de regresie se mai numesc i valorile teoretice ale caracteristicii y n funcie de x, iar operaia de nlocuire a termenilor reali y cu valorile ecuaiilor de regresie (valori teoretice) se numete ajustare. Deci, prin ajustarea unei serii statistice de distribuie se nelege nlocuirea termenilor empirici (termeni reali obinui prin observare) cu termeni teoretici, calculai pe baza unui model matematic, care arat tendina de variaie a caracteristicii rezultative, dac ar fi depins numai de variaia lui x considerat. n analiza corelaiei dintre fenomene, valorile ecuaiilor de regresie au un rol important. Ele pot fi considerate ca valori teoretice, care exprim tendina de manifestare a interdependenei dintre fenomene. Dac n procesul de interaciune dintre ele nu ar interveni i ali factori eseniali sau ntmpltori care s modifice gradul de legtur pentru fiecare unitate n parte.
Coeficientul de corelaie Coeficientul de corelaie liniar simpl poate s ia valori ntre -1 i +1. ntre -1 i 0, legtura dintre cele dou variabile este de sens invers i este cu att mai intens, cu ct se apropie de 1. ntre 0 i +1, legtura dintre cele dou variabile este direct i este cu att mai intens, cu ct se apropie de 1. Formul de calcul simplificat pentru seria bidimensional simpl n xi y i ( xi )( y i ) ry / x = n xi2 ( xi ) 2 n y i2 ( yi ) 2
][
Pentru verificarea semnificaiei coeficientului de corelaie liniar simpl, se aplic, cel mai frecvent, testul t: ry / x t= n2 1 ry2/ x
unde, n reprezint numrul de perechi de valori. Valoarea calculat se compar cu cea tabelar stabilit probabilistic pentru un nivel de semnificaie P = 1 / 2 i cu n-2 grade de libertate. Dac tcalculat > ttabelar , se verific ipoteza semnificaiei coeficientului de corelaie iar dac
tcalculat < ttabelar , legtura este nesemnificativ i trebuie cutat un alt factor esenial cu care s se studieze corelaia.
Raportul de corelaie n cazul n care dispunem de un num r mic de perechi de valori (xi, yi), negrupate: pornind de la deviana factorial :
Ry/x =
(Y (y
xi i
y)2 y)2
sau
Ry / x = 1
( yi Y x ) 2 ( yi y ) 2
i
Raportul de corelaie poate lua valori de la zero la +1; interpretarea sensului legturii se face dup funcia de regresie. Dac R y / x = ry / x se confirm ipoteza legturii liniare i aceast rela ie este considerat un test de verificare a legturii. n cazul unei serii bidimensionale avem abaterile: - abaterea dintre yi i ecuaia de regresie; - abaterea dintre ecuaia de regresie i medie; - abaterea dintre yi i media lor ntre cele 3 abateri exist relaia y i y = ( y i Y xi ) + (Yxi y ) Astfel putem determina: Dispersia total
(y
2 y =
y) 2
n Dispersia de grup:
(y
2 y /r =
YX I ) 2
(Y
2 y /x =
y) 2
K
2 y/x
Coeficientul de nedeterminaie:
=
2 y /r
2 Interpretnd cele dou dispersii putem avea dou variante: 2 2 Dac: R y / x > K y / x rezult legtur ntre x i y
2 2 Dac: R y / x < K y / x tendin spre independen
100
Trebuie subliniat, nc o dat, c toate aceste metode i procedee de calcul i interpretare a corelaiei nu se pot aplica dect dac, prin cunotinele de care se dispune, s-a stabilit c n mod logic ntre fenomenele cercetate pot exista raporturi obiective de interdependen. Aceasta este cu att mai necesar cu ct fenomenele social-economice pot prezenta, n general, o anumit simetrie n covariaia lor, n jurul valorilor medii fie sub aspectul gradului de mprtiere a abaterilor, fie sub aspectul direciei producerii legturii. Desigur c aceast relaie de covariaie numeric nu este suficient pentru a afirma c ntre caracteristicile respective exist i o legtur 21
de corelaie. Pentru ca o anumit covariaie numeric ntre dou sau mai multe variabile statistice, care, n general, au o dispersie asemntoare, s fie considerat n acelai timp i legtur de corelaie, este indispensabil analiza raporturilor calitative dintre fenomenele cercetate. Numai n urma unei astfel de analize, cunoscndu-se raporturile obiective dintre fenomene, dependena ntre dou sau mai multe caracteristici statistice se poate aprecia c exist o legtur de corelaie, i, n consecin, se poate trece la msurarea ei. Pentru a putea reflecta ntr-o form ct mai veridic raporturile de cauzalitate existente, influenele factorilor eseniali asupra variaiei caracteristicii rezultative este necesar ca metodele i procedeele de calcul i interpretare statistic s se aplice n mod difereniat m raport cu posibilit ile de identificare a factorilor-cauz, de cuantificare a fenomenelor, de cuprindere a unit ilor care formeaz colectivitatea supus cercetrii.
22
Ex. Corelaia liniar simpl (date negrupate) Se prezint urmtoarele date cu privire la numrul de otre lucrate i salariu net lunar Salariul net lunar Ore lucrate Nr. crt (lei) (xi) (yi) 1. 140 2200 2. 146 2555 3. 151 2642 4. 163 2852 5. 169 2957 6. 173 3027 7. 176 3080 8. 187 3272 9. 190 3325 10. 190 3325 Dintre metodele simple de cercetare a legaturilor statistice recurgem la : A) Metoda seriilor paralele interdependente Concluzie: Valorile xi fiind ordonate cresctor se poate observa c i valorile yi cresc n cea mai mare parte, ceea ce sugereaz o legtur direct. B) Metoda grafic este o alt cale de a stabili legtura dintre fenomene. Graficul de asemenea confirm o legtur direct de form liniar.
3000
2500
mii lei
2000
1500
1000
500
ore
Datele necesare calculrii celor doi parametri sunt prezentate n tabelul de mai jos.
23
xi
yi
x2
xiyi
Yxi=-425,62+19,87xi 2357 2476 2576 2814 2933 3013 3073 3291 3351 3351 29235
140 2200 146 2555 151 2642 163 2852 169 2957 173 3027 176 3080 187 3272 190 3325 190 3325 1685 29235
i
2 i 2 i
19600 308000 21316 373030 22801 398942 26569 464876 28561 499733 29929 523671 30976 542080 34969 611864 36100 631750 36100 631750 286921 4985696
i
y x x y x a= n x ( x )
i i i
2
b=
Valorile funcie de regresie se obin nlocuind xI cu valorile empirice. Parametrul b=19,87 se interpreteaz astfel: pentru fiecare ora lucrata salariului net crete , n medie cu 19,87 lei. a) Raportul de corelaie liniar simpl se ca calcula cu formula: Ry / x = Nr. crt 1. 2. 3. 4. 5. 9. 7. 8. 9. 10. ( yi Y x ) 2 1 ( yi y ) 2
i
xi 140 146 151 163 169 173 176 187 190 190
yi 2200 2555 2642 2852 2957 3027 3080 3272 3325 3325
Yxi 2357 2476 2576 2814 2933 3013 3073 3291 3351 3351
(yi - Yxi)2 24659.9 6195.1 4399.4 1430.0 555.0 197.5 55.1 369.1 667.7 667.7
(yi - y )2 523452.3 135792.3 79242.3 5112.3 1122.3 10712.3 24492.3 121452.3 161202.3 161202.3
yi2 4840000 6528025 6980164 8133904 8743849 9162729 9486400 10705984 11055625 11055625
24
1685
29235
29235
39196.5
1223782.5
86692305
2 Ry /x
29235 = 2923,5 mii lei /vz 10 39196 ,5 Ry/ x = 1 = 0,9838 1223782 ,5 Se poate spune c legtur este strns (r/x=0,9838) i gradul de determina ie = 0,98382 este de 0,968 sau de 96,8%.
Unde: y =
b) Metoda coeficientului de corelaie Intensitatea legturii se msoar prin coeficientul de corelaie (ry/x).
ry / x = = n x i y i x i y i = = 0,9838
[n x
2 i
( xi ) 2 n y i2 ( y i ) 2
][
Rezult c legtura dintre aceste dou variabile este direct (rz/x>0) i puternic. Exist legtur liniar intens deoarece ry/x=Ry/x.
25