Sunteți pe pagina 1din 98

Conf. Univ. Dr.

Nicolae Mihailescu

STATISTICA
2

Cuprins
Statistica – stiinta si metodologie de cercetare a fenomenelor social-economice
- Obiectul si metoda statisticii
- Concepte de baza folosite de statistica
- Cercetarea statistica
- Tipuri de erori care pot apare într-o cercetare statistica
Gruparea datelor statistice
Seriile statistice
Marimile relative
Marimile medii
- Marimi medii de pozitie (mediana si modulul)
- Media în cazul caracteristicii alternative
Indicatorii gradului de variabilitate
- Dispersia în cazul caracteristicii alternative
- Felurile dispersiilor
Indicatorii asimetriei si boltirii (aplatizarii) seriilor de repartitie
Indicatorii gradului de concentrare / diversificare
Prezentarea datelor statistice sub forma reprezentarilor grafice
Studiul statistic al corelatiilor dintre fenomene
- Metode statistico- matematice de analiza a corelatiilor
dintre fenomene
- Metode de analiza a corelatiei rangurilor
Indicii statistici
- Indicii de grup medii armonici
- Indicii de grup medii aritmetici
- Indicii de grup calculati ca raport între marimi medii
- Indicii teritoriali
Analiza statistica a seriilor dinamice
- Sistemul de indicatori ai seriilor dinamice
- Ajustarea seriilor dinamice
Cercetarea statistica prin sondaj
- Erorile în cercetarea statistica prin sondaj
- Procedee de sondaj
- Felurile esantioanelor
3

Statistica – stiinta si metodologie de cercetare a fenomenelor social-


economice

Obiectul si metoda statisticii

Statistica studiaza, pe baza expresiei cantitative a fenomenelor social-economice de


masa, legitatile dezvoltarii sociale, în conditii concrete de loc si timp, în strânsa
interdependenta cu continutul lor calitativ.
Teoria probabilitatilor este fundamentata pe aceasta stabilitate statistica a
fenomenelor de masa care este cunoscuta sub denumirea de legitate statistica.
Se precizeaza ca o legitate statistica este un adevar constatat experimental si în
aceste conditii nu se poate demonstra.

Concepte de baza folosite de statistica

Populatia statistica reprezinta ansamblul elementelor care au una sau mai multe
caracteristici comune, cu o existenta obiectiva si localizata clar în timp si spatiu
Unitatea de observare statistica este elementul component al populatiei statistice la
care se particularizeaza nivelul individual al caracteristicilor statistice.
Unitatile statistice au o forma de existenta care poate fi simpla sau complexa.
Unitatile simple sunt reprezentate printr- un singur element structural obiectiv, cum ar fi de
exemplu persoana, produsul, piesa etc., în timp ce unitatile complexe sunt formate din mai
multe unitati simple, ca de exemplu: familia, întreprinderea etc..
Caracteristica statistica este acea însusire comuna tuturor unitatilor populatiei
statistice supusa cercetarii ale carei valori difera de la o unitate statistica la alta sau de la un
grup de unitati la altul. Caracteristicile statistice pot fi clasificate în functie de mai
multe criterii, astfel:
- dupa continutul caracteristicilor,
- numerice sau cantitative
- exprimate prin cuvinte (legate de natura unitatilor statistice)
- de spatiu (exprima particularitatea unitatilor statistice de a exista într- un
anumit punct al spatiului)
- de timp (exprima particularitatea unitatilor statistice de a fi aparut la un
anumit moment sau de a fi existat un anumit interval de timp)
- dupa modul de prezentare al caracteristicilor numerice,
- pe variante (discreta sau prezentare în numere întregi)
- pe intervale (continua)
- dupa modul în care se manifesta,
- forma alternativa (caracteristica cu doua variante de manifestare)
- forma nealternativa (caracteristica cu mai mult de doua variante de
manifestare)

Varianta este nivelul individual al caracteristicii statisticii asociat unei unitati


statistice sau unui grup de unitati.
4

Frecventa este numarul de unitati statistice la care se înregistreaza o varianta a


caracteristicii.
Indicatorul statistic este expresia numerica a unei determinari calitative obiective
rezultata în urma unei cercetari statistice.
Forma indicatorilor statistice depinde de gradul de prelucrare la care au fost supuse
datele initiale, astfel:
- indicatori absoluti
- indicatori relativi
- indicatori medii
Legea numerelor mari are:
- o forma generala de manifestare prin caracterul real al legitatilor statistice si
respectiv,
- o forma specifica care este exprimata printr-un grup de teoreme ale teoriei
probabilitatilor:
- Inegalitatea lui Cebâsev
- Teorema lui Cebâsev
- Teorema lui Bernoulli
- Teorema lui Poisson

Cercetarea statistica

Cercetarea statistica este un proces de cunoastere a fenomenelor de masa, realizat cu


ajutorul metodelor statistice. Efectuarea unei cercetari statistice implica parcurgerea
urmatoarelor etape:
- Observarea statistica
- Prelucrarea datelor obtinute prin observare
- Interpretarea rezultatelor
Observarea statistica este etapa în care are loc înregistrarea datelor primare.
Observarea se desfasoara conform unei metodologii care se aplica în mod identic la toate
unitatile statistice de la care se culeg date.
Procedeele operationale prin care se realizeaza observarea statistica sunt:
- observarea pe baza de documente care au fost elaborate de sistemul informational
contabil, de evidenta tehnic-operativa sau de alte sisteme de evidenta,
- observarea directa a unitatilor care compun colectivitatea statistica, prin:
- masurare, cântarire etc.,
- interviu,
- aplicarea unui chestionar.
Observarea statistica poate fi desfasurata în mai multe variante de lucru în functie de
criteriul la care ne referim, astfel:
- dupa modul de cuprindere în cercetare a unitatilor statistice,
- observari totale: recensamintele, sistemul raportarilor statistice obligatorii
- obsevari partiale: cercetarea statistica prin sondaj, ancheta statistica,
monografia
- dupa periodicitatea organizarii observarii
- observari curente
5

- observari periodice
- observari unice
Prelucrarea datelor obtinute prin observare este etapa în care se desfasoara operatiuni
de grupare, de centralizare (totalizare), de calcul a indicatorilor derivati (sintetici si analitici)
precum si de afisare a rezultatelor sub forma tabelelor si reprezentarilor grafice. Prelucrarea
datelor se efectueaza cu ajutorul unor procedee metodologice compatibile cu scopul
cercetarii si cu particularitatile colectivitatii cercetate.
Interpretarea rezultatelor este etapa în care se formuleaza concluzii cu privire la
starea colectivitatii statistice cercetate. Rezultatele obtinute în urma prelucrarilor efectuate
sunt supuse unui proces calitativ de extragere a acelor informatii cu caracter esential care
prezinta utilitate practica, confirma sau infirma ipoteze, fundamenteaza eventuale actiuni
care vor fi întreprinse în viitor, orienteaza decizia economica pe un teren al cunoasterii
stiintifice etc.

Tipuri de erori care pot apare într-o cercetare statistica

Rezultatele cercetarilor statistice pot fi deformate, într-o masura mai mare sau mai
mica, de unele erori a caror aparitie este cauzata atât de factori obiectivi cât si de factori
subiectivi.
Dupa locul aparitiei, erorile care pot afecta rezultatele cercetarilor statistice, sunt:
- erori de înregistrare sau de observare
- erori de reprezentativitate
- erori de prelucrare sau de calcul
- erori de interpretare
- erori de metoda sau de metodologie a cercetarii
Erorile de înregistrare pot apare la orice tip de observare statistica si sunt la rândul
lor de doua feluri:
- erori întâmplatoare
- erori sistematice
Erorile de reprezentativitate sunt specifice cercetarilor statistice prin sondaj si pot
îmbraca, de asemenea, doua forme:
- erori întâmplatoare
- erori sistematice

Gruparea datelor statistice

Gruparea datelor statistice este o operatiune de sistematizare a prezentarii


materialului statistic obtinut prin observare care consta în separarea colectivitatii cercetate în
grupe omogene de unitati dupa variatia uneia sau mai multor caracteristici din programul
observarii.
Realizarea unei grupari utile pentru îndeplinirea scopului cercetarii statistice impune
cu necesitate sa fie respectate urmatoarele conditii:
- alegerea caracteristicii sau caracteristicilor care vor sta la baza efectuarii operatiunii
de grupare în strânsa legatura cu obiectivele de cunoastere si respectiv cu particularitatile
sau specificul colectivitatii supuse cercetarii. Cea mai potrivita caracteristica de grupare este
6

aceea care este în strânsa interdependenta cu esenta fenomenului studiat si, în consecinta,
permite identificarea tipurilor calitative care exista în cadrul colectivitatii;
- în cazul caracteristicilor de grupare numerice se stabileste sau se calculeaza
marimea intervalului de grupare si respectiv numarul de grupe care vor fi constituite, astfel
încât sa se obtina cea mai buna forma de distribuire a unitatilor statistice pe grupe;
- toate operatiunile de natura metodologica, implicate cu efectuarea unei grupari a
datelor statistice, trebuie sa fie subordonate atingerii obiectivelor gruparii, si anume:
a - cunoasterea structurii colectivitatii statistice si respectiv a tipurilor
calitative existente în colectivitate la un anumit moment sau într-o
anumita perioada de timp,
b - cunoasterea modificarilor de natura structurala, care s-au produs de la
un segment de timp la altul,
c - identificarea unor posibile corelatii care se formeaza între
caracteristicile utilizate la grupare, forma si directia acestor corelatii si,
într-o anumita masura, obtinerea unei informatii orientative privind
intensitatea corelatiei.
Efectuarea unei grupari a datelor statistice, dupa o caracteristica exprimata numeric,
implica parcurgerea unor etape de lucru, dupa cum urmeaza:
1 - se calculeaza amplitudinea variatiei, respectiv se cuantifica diferenta dintre
valoarea (varianta) cea mai mare a caracteristicii si valoarea (varianta) cea mai mica,
(A = x max − x min ) ;
2 - în functie de marimea amplitudinii variatiei, se stabileste numarul de grupe în
care va fi împartita colectivitatea. În aceasta etapa de lucru se opteaza, de regula, pentru
constituirea unui numar mai mare de grupe comparativ cu numarul care se presupune ca este
necesar pentru a cunoaste structura si respectiv tipurile calitative existente în colectivitate.
Aceasta operatiune este legata în mod strict de logica persoanei care realizeaza gruparea;
3 - se calculeaza marimea (lungimea) intervalului de grupare prin raportarea
amplitudinii variatiei la numarul de grupe convenit a fi constituite. Daca se considera
necesar, pentru a calcula marimea intervalului, se poate folosi formula propusa de Sturges,
x − x min x max − x min
i = max =
1 + log 2 n 1 + 3,322 ⋅ log 10n
4 - se scriu intervalele de grupare astfel încât sa se foloseasca ca limite inferioare si
superioare, “numere rotunde”;
5 - se repartizeaza unitatile statistice pe intervalele de grupare stabilite. Aceasta este
o etapa intermediara de lucru care ofera o prima forma de sistematizare a materialului
statistic pe grupe si în continuare, sa permita, daca se considera necesar, efectuarea unei
regrupari prin asocierea a doua sau mai multor intervale de grupare;
6 - se procedeaza la efectuarea unor regrupari, eventual în mai multe variante, pentru
a avea posibilitatea formularii celei mai bune decizii de alegere a gruparii care ofera solutia
considerata optima, în vederea caracterizarii colectivitatii statistice cercetate sau pentru
efectuarea unor prelucrari ulterioare. Regruparea poate fi efectuata fie pe intervale de
marimi egale fie pe intervale de marimi neegale dupa cum se considera ca acestea raspund
mai bine scopului propus.
7

Felurile gruparilor

Gruparile pot fi prezentate în mai multe variante constructive în functie de un anumit


criteriu, astfel:
a) dupa numarul caracteristicilor folosite la grupare,
- grupari simple, când gruparile sunt efectuate dupa o singura caracteristica,
- grupari combinate când se folosesc doua sau mai multe caracteristici pentru
sistematizarea pe grupe a materialului statistic. Este necesar sa se precizeze
ca se opteaza, de regula, pentru un numar de maximum 4 caracteristici de
grupare. În cazul folosirii unui numar mai mare de 4 caracteristici se ajunge
la o pulverizare a informatiilor statistice si în consecinta la îngreunarea
înterpretarii din punct de vedere structural a colectivitatii statistice;
b) dupa tipul caracteristicii de grupare,
- grupari efectuate dupa o caracteristica de spatiu
- grupari efectuate dupa o caracteristica de timp
- grupari efectuate dupa o caracteristica numerica
- grupari efectuate dupa o caracteristica exprimata prin cuvinte
c) dupa variatia caracteristicii de grupare numerica,
- grupari efectuate pe variante ale caracteristicii (atunci când caracteristica de
grupare este de forma discreta - se exprima în numere întregi - si are o
variatie redusa, sau prezinta un numar relativ mic de variante)
- grupari efectuate pe intervale de grupare (de marimi egale sau neegale).
Aceste grupari pot fi formate atât în cazul caracteristicilor discrete cât al celor
de forma continua.

Seriile statistice

Seria statistica este un sir de valori ale unei caracteristici ordonate în functie de sirul
valorilor unei alte caracteristici sau dupa un anumit principiu, cum ar fi ordinea alfabetica,
ordinea de marime sau rangul unitatii statistice etc..
Seriile statistice pot fi de mai multe feluri în functie de tipul caracteristicii de grupare
sau de forma practica de prezentare a datelor, astfel:
1 - serii simple enumerative - sunt seriile care prezinta o simpla însiruire a datelor.
De exemplu, însiruirea notelor obtinute la examenele sustinute de un student la finele unui
an de studii universitare.
2 - serii de spatiu sau teritoriale - prezinta volumului colectivitatii statistice sau
nivelul unei caracteristici statistice în raport cu tipologia teritoriala în care exista unitatile
statistice. De exemplu, repartizarea numarului locuitorilor pe judete care a existat, în tara
noastra, la o anumita data calendaristica.
3 - serii dinamice, cronologice sau de timp - sunt siruri de date statistice care prezinta
schimbarea marimii unor indicatori statistici în raport cu timpul. Seriile dinamice pot fi de
doua feluri:
- de intervale de timp, cînd indicatorii prezentati în serie dinamica au ca
perioada de formare întreg segmentul de timp le care se refera. De exemlu, dinamica
cifrei de afaceri obtinuta anual de un agent economic într-o perioada de cinci ani;
8

- de momente, cînd indicatorii prezentati în serie dinamica se refera la


numarul unitatilor sau marimea caracteristicii statistice înregistrata la o anumita data
calendaristica. De exemplu, dinamica stocurilor de marfuri existente într-un magazin
la data de întâi a fiecarei luni, pe durata unei anumite perioade de timp (trimestru,
semestru, an).
4 - serii de repartitie, de variatie sau de distributie – se prezinta sub forma unor date
paralele cu referire la o caracteristica statistica de grupare numerica sau cantitativa si
numarul unitatilor colectivitatii statistic care revin pe variante ale caracteristicii sau pe
intervale de grupare. De exemplu, seria numarului salariatilor care îsi desfasoara activitatea
în cadrul unei firme comerciale, grupati dupa marimea salariului mediu lunar.

Marimile relative

Marimile relative sunt indicatori derivati calculati ca raport între doua marimi
absolute, doua marimi medii sau alte doua marimi relative. Rezultatul obtinut este o expresie
numerica care arata câte unitati din indicatorul raportat revin la o unitate a indicatorului baza
de raportare.
Formele de exprimare a marimilor relative depind de natura fenomenelor studiate si
de raportul de marime existent între indicatorii care se compara, si anume:
- forma de coeficient – este un rezultat exprimat de un numar zecimal sau de un
numar întreg care arata câte unitati zecimale sau întregi din indicatorul raportat revin la o
unitate din indicatorul baza de raportare;
- forma de fractie – arata cîte parti reprezinta marimea indicatorului raportat la o
parte a indicatorului baza de raportare; - forma de procent – când rezultatul prezentat
în forma de coeficient este amplificat cu 100 si arata câte unitati din indicatorul raportat
revin la 100 de unitati ale indicatorului baza de raportare;
- forma de promila – când rezultatul prezentat în forma de coeficient este amplificat
cu 1000 si arata câte unitati din indicatorul raportat revin la 1000 de unitati ale indicatorului
baza de raportare;
- forma de prodecimila – când rezultatul prezentat în forma de coeficient este
amplificat cu 10.000 si arata câte unitati din indicatorul raportat revin la 10.000 de unitati ale
indicatorului baza de raportare;
- forma de procentimila – când rezultatul prezentat în forma de coeficient este
amplificat cu 100.000 si arata câte unitati din indicatorul raportat revin la 100.000 de unitati
ale indicatorului baza de raportare;

Cu ajutorul marimilor relative pot fi caracterizate urmatoarele aspecte:


- structura fenomenelor sau a colectivitatilor, prin raportarea indicatorilor exprimati
în marimi absolute privind volumul fiecarei grupe la indicatorul care dimensioneaza
volumul total al colectivitatii (marimi relative de structura), astfel:

Volumul grupei
M.r.s. =
Volumul total al colectivit atii statistice
9

- intensitatea fenomenelor, prin raportarea nivelului a doua fenomene diferite între


care exista o anumita legatura, rezultatul are în acest caz o semnificatie distincta si un
continut de nivel mediu. De exemplu, valoarea medie a productiei sau a cifrei de afaceri
realizata de un salariat într-o zi, pe parcursul unei luni, sau într-un an, valoarea mijloacelor
fixe care revine în medie la un salariat, cheltuielile efectuate pentru 1000 lei productie etc.
(marimi relative de intensitate). Se mentioneaza, în acest sens, ca toti indicatorii care
exprima aspecte ale performantei financiare si respectiv ale eficientei economice atinse de
un agent economic fac parte din categoria marimilor relative de intensitate si prezinta o larga
utilizare în analizele economico- financiare efectuate de factorii de decizie.
Marimile relative de intensitate (M.r.i.) se calculeaza astfel:

Nivelul fenomenulu i raportat


M.r.i. =
Nivelul fenomenulu i baza de raportare

- dinamica fenomenelor, în care caz, marimea relativa calculata exprima modificarea


unui indicator statistic, de la un segment de timp la altul (marimi relative de dinamica).
Marimile relative de dinamica (M.r.d.) se calculeaza dupa formula:

Nivelul unui indicator realizat în perioada de calcul


M.r.d. =
Nivelul realizat în perioada de baza

- îndeplinirea indicatorilor programati, prin raportarea indicatorului realizat la nivelul


programat al aceluiasi tip de indicator, aferenti unei perioade de timp date (marimi relative
de îndeplinire a indicatorilor programati). Pentru calculul acestor marimi relative se
foloseste ur matoarea relatie:

Indicatoru l realizat
M.r.î.p. =
Indicatoru l programat sau planificat

- marimea relativa a sarcinii programate de modificare a indicatorului analizat


(marimi relative ale sarcinii programate de crestere sau de scadere a indicatorilor
analizati). Formula de calcul este urmatoarea:

Indicatoru l programat pentru o perioad a de timp


M.r.s.p. =
Indicatoru l realizat în perioada de timp precedent a

- raportul de marime dintre doua grupe ale aceleiasi colectivitati (marimi relative de
coordonare ).
- raportul de marime dintre doi indicatori de acelasi fel, coexistenti în timp dar situati
în spatii diferite (marimi relative de coordonare teritoriala).
Tipurile de marimi relative prezentate ofera o informatie analitica asupra
fenomenului studiat sau a agentului economic în ansamblul sau, pe baza careia este posibil
sa se formuleze aprecieri suficient de consistente cu privire la starea economico-financiara a
acestuia.
10

Marimile medii

Mediile sunt, de asemenea, indicatori derivati dar care exprima ceea ce este tipic,
comun si general în configuratia fenomenelor, exprima într-o maniera abstracta tendinta
centrala de grupare a nivelurilor individuale catre un nivel de sinteza denumit marime
medie. Media poate substitui nivelurile individuale pe care le sintetizeaza deoarece este o
valoare mai mult sau mai putin reprezentativa în functie de gradul de omogenitate al
colectivitatii supuse cercetarii.

Modul de organizare al sistemului de date statistice pentru care dorim sa calculam


media determina optiunea de aplicare a unei anumite forme de medie. Se cunosc si se aplica
mai multe tipuri de medii, dintre care cele mai utilizate sunt: media aritmetica, media
armonica, media patratica, media cronologica si media geometrica.

Media aritmetica se utilizeaza la calculul nivelului mediu al unor indicatori


prezentati în serie dinamica de intervale de timp, la calculul nivelului mediu al seriilor
statistice de variatie, al seriilor simple enumerative, precum si în cazul seriilor teritoriale
comparabile. De exemplu, se recurge la forma mediei aritmetice atunci când dorim sa
calculam categoria medie de încadrare tarifara a unor salariati, productia medie sau cifra de
afaceri realizata în medie pe un segment de timp dintr-o anumita perioada etc.

Daca frecventele variantelor din seria statistica studiata sunt egale între ele, se
foloseste formula mediei aritmetice simple,
Σx
M (x ) = x = i , iar daca frecventele variantelor nu sunt egale între ele, se aplica
n
media aritmetica ponderata,
Σx i n i
M(x) = x = , în care notatiile utilizate au urmatoarele semnificatii:
Σn i
M(x) sau x - valoarea medie a caracteristicii studiate “x”,
xi- varianta “i” a caracteristicii statistice pentru care se calculeaza media, i = 1, 2, 3,
... , n ,
ni- frecventa variantei “i” a caracteristicii statistice studiate,
n - numarul variantelor caracteristicii statistice atunci când se foloseste media
aritmetica simpla.

Proprietatile mediei aritmetice:


Media aritmetica are mai multe proprietati operationale care prin cunoasterea si
aplicarea lor se poate verifica atât exactitatea calculelor cât si posibilitatea obtinerii valorii
medii printr-un calcul simplificat. Aceste proprietati sunt:
1. Media aritmetica se pozitioneaza ca marime între valoarea minima si maxima a
caracteristicii studiate,
x min < x < x max
11

2. Suma algebrica a abaterilor va riantelor caracteristicii de la valoarea medie este


egala cu zero,
S (x i − x ) = 0 , pentru seriile statistice cu frecvente egale,
S (x i − x ) ⋅ n i = 0 , pentru seriile statistice cu frecvente neegale

3. Daca fiecare varianta a caracteristicii studiate (xi) se mareste sau se micsoreaza cu


o constanta (a), valoarea medie a caracteristicii se modifica cu constanta respectiva,
S (x i ± a )
x± a = , pentru seriile statistice cu frecvente egale,
n
S (x i ± a ) ⋅ n i
x± a = , pentru seriile statistice cu frecvente neegale
Sn i

4. Daca fiecare varianta a caracteristicii studiate (xi) se mareste sau se micsoreaza de


un anumit numar de ori (k) valoarea medie a caracteristicii se modifica cu numarul de ori
exprimat de constanta respectiva. În cazul seriile statistice cu frecvente neegale pot fi scrise
urmatoarele relatii:
S (x i ⋅ k ) ⋅ n i
x⋅ k =
Sn i
x 
S i  ⋅ n i
x  k
=
k Sn i

5. Daca valoarea medie se calculeaza pe baza frecventelor relative (nri ), valoarea


medie nu se modifica,
n
x = Sx i ⋅ nr i , în care nri = i
Sn i
În acest sens se mentioneaza, de asemenea ca, daca frecventele (ponderile)
variantelor caracteristicii studiate se modifica în aceeasi proportie, respectiv se majoreaza
sau se micsoreaza de “c” ori, (“c” fiind o constanta oarecare), media caracteristicii nu se
modifica.

Pornind de la proprietatile prezentate, în anumite conditii, prin îmbinarea acestora se


ajunge la o relatie de calcul simplificat a valorii medii si anume,
x −a
S i ⋅
x= k ⋅ k + a , pentru seriile statistice cu frecvente egale,
n
x −a
S i ⋅ ni
x= k ⋅ k + a , pentru seriile statistice cu frecvente neegale
Sn i
Aceste relatii ofera în mod efectiv avantajul simplificarii calculelor numai daca sunt
îndeplinite urmatoarele conditii:
12

- seria de variatie este constituita pe intervale egale de grupare,


- constantei “a” i se acorda ca valoare mijlocul intervalului care detine frecventa cea
mai mare,
- constantei “k” i se acorda ca valoare marimea intervalului de grupare.

Exemplul 1. Cele 30 de apartamente ale unui bloc de locuinte se repartizeaza dupa


valoarea consumului de energie electrica înregistrat în luna aprilie, astfel:
Tabelul 1
Consumul de energie electrica din luna aprilie
Grupe de Numaru Mijlocu Consum x i − a xi− a Frecvente
apartamen l aparta- l ul ⋅ n i relative
k k
te dupa men- interva- total de a = 7,25 (nri)
consumul telor lului energie n
de energie (ni ) (xi ) electrica k = 0,5 nr i = i
Sn i
electrica (xi ni )
($)
pâna la 5 6,25 31,25 -2 -10 0,17
6,5
6,5-7,0 7 6,75 47,25 -1 -7 0,23
7,0-7,5 10 7,25 72,50 0 0 0,33
7,5-8,0 6 7,75 46,50 +1 6 0,20
peste 8,0 2 8,25 16,50 +2 4 0,07
Total 30 - 214,00 - -7 1,00
Nota: - Limita inferioara a intervalului de grupare este inclusa în interval.
- Mijlocul intervalului de grupare se obtine prin raportarea la 2 a sumei celor doua
limite înscrise la fiecare interva l (semisuma limitelor intervalului).
- În cazul intervalelor deschise (lipseste una din limite), pentru a putea calcula
mijlocul intervalului, acestora li se completeaza limita care nu este definita, astfel:
- în cazul primului interval: se calculeaza marimea intervalului urmator si se
extinde marimea acestuia si la primul interval. Prin urmare primul interval va avea ca
limite, 6,0 si 6,5,
- în cazul ultimului interval: se calculeaza marimea intervalului precedent si
se extinde marimea acestuia si la intervalul urmator. În urma acestui calcul ultimul
interval va fi dimensionat astfel: 8,0-8,5.

Consumul mediu de energie electrica care revine la un apartament este,


Σx i n i 214
x= = = 7,13 $ sau,
Σn i 30
x −a
S i ⋅ ni
k −7
x= ⋅ k+ a = ⋅ 0,5 + 7,25 = 7,13 $ ,
Sn i 30
sau, daca se folosesc frecventele relative se poate scrie urmatoarea relatie de calcul a valorii
medii,
x = Sx i fr i = 6,25 ⋅ 0,17 + 6,75 ⋅ 0,23 + 7, 25 ⋅ 0,33 + 7,75 ⋅ 0,20 + 8,25 ⋅ 0,07 = 7,13 $
13

Media armonica este o forma transformata a mediei aritmetice (simple sau


ponderate) si se utilizeaza atunci când ne propunem sa calculam o valoare medie din marimi
relative, cunoscând marimile relative individuale si numaratorii rapoartelor pe baza carora
au fost calculate. Utilizari adecvate ale acestei forme de medie sunt: la calculul indicelui
mediu al preturilor de consum; pentru determinarea nivelului mediu al mai multor marimi
relative de intensitate de acelasi tip, dar numai în conditiile în care se cunosc nivelurile
individuale ale marimilor relative si numaratorii rapoartelor pe baza carora au fost calculate.

Formula de calcul a mediei armonice simple se aplica atunci când numaratorii


rapoartelor pe baza carora au fost calculate marimile relative individuale sunt egali ca
marime între ei,
Ma (x ) = x =
n
,
1
∑x
i

unde “n” este numarul marimilor relative, iar “ xi” reprezinta marimile relative
individuale.

În timp ce media armonica ponderata se utilizeaza atunci când numaratorii


rapoartelor pe baza carora au fost calculate marimile relative individuale nu sunt egali ca
marime între ei,

Ma (x ) = x =
∑ x i ni
1
∑ x xi ni
i

În cazul mediei armonice ponderate, se foloseste o pondere compusa, “ x i n i ”


echivalenta cu numaratorii rapoartelor pe baza carora au fost calculate marimile relative
individuale.

Exemplul 2. În patru puncte comerciale dintr-o piata agro-alimentara s-au înregistrat


în ziua de 1 octombrie urmatoarele date statistice privind vânzarile de cartofi:
Tabelul 2
Vânzarile de cartofi înregistrate la data de 1 octombrie
Punctul Sumele încasate Pretul de vânzare x i ni
comercial din vânzarea cu amanuntul xi
cartofilor (lei) (lei/kg.)
-xini- -xi-
A 675.000 2.500 270
B 420.000 2.400 175
C 655.500 2.300 285
D 500.000 2.000 250
Total 2.250.500 980
Sa se determine pretul mediu de vânzare, al unui kilogram de cartofi, înregistrat la
cei patru comercianti, în data de 1 octombrie.
14

x=
∑x n i i 675.000 + 420.000 + 655.500 + 500.000
= = 2.296,4 lei/kg
1 675.000 420.000 655.500 500.000
∑x x ni i
2.500
+
2.400
+
2.300
+
2.000
i
Se mentioneaza ca între media aritmetica si media armonica nu este nici-o deosebire
de continut, ambele reflectând nivelul mediu al caracteristicii studiate, dar calculul acesteia
din urma se adopta în functie de modul în care sunt prezentate datele statistice initiale.

Media patratica se utilizeaza la calculul indicatorilor care exprima în mod sintetic


gradul de variabilitate al caracteristicilor statistice.
Daca frecventele variantelor caracteristicii din seria statistica studiata sunt egale între
ele, se foloseste formula mediei patratice simple,
Sx 2i
Mp (x ) = x = ,
n
iar daca frecventele variantelor nu sunt egale între ele, se aplica media patratica ponderata,
Sx 2i n i
Mp (x ) = x =
Sn i

Media cronologica are semnificatia unei medii aritmetice din medii partiale si se
utilizeaza la calculul nivelului mediu al indicatorilor prezentati sub forma seriilor dinamice
de momente. Aceasta medie se foloseste la calculul valorii medii a activelor circulante, a
stocurilor de orice natura dar în special pentru materii prime, materiale si marfuri, a
imobilizarilor corporale si respectiv a mijloacelor fixe, precum si la calculul efectivelor
medii de animale.
Daca intervalele de timp, dintre oricare doua momente succesive ale seriei dinamice,
sunt egale între ele se foloseste formula mediei cronologice simple, adica,

x1 x
+ x 2 + x 3 + x 4 + ... + x n-1 + n
Mc = x = 2 2
n -1
si respectiv, daca nu sunt egale între ele, se recurge la formula mediei cronologice
ponderate,

x1 + x2 x + x3 x + x4 x + xn
t1 + 2 t2 + 3 t 3 + ... + n-1 tm
Mc = x = 2 2 2 2
t 1 + t 2 + t 3 + ... + t m
în care,
Mc - nivelul mediu al indicatorilor prezentati în serie dinamica, calculat cu media
cronologica,
xi - indicatorii de nivel ai seriei dinamice, i = 1, 2, 3, ... , n,
n - numarul indicatorilor de nivel sau numarul momentelor de timp la care sunt
înregistrati indicatorii,
15

tj - durata intervalului de timp “j”, dintre doua momente succesive la care sunt
înregistrati indicatorii de nivel, exprimata în zile, luni sau ani,
j = 1, 2, 3, ... , m ; m = n-1. Suma duratelor succesive tj va fi egala cu durata întregii
perioade exprimata de seria dinamica analizata.

Media geometrica are aplicabilitate în domeniul economic, în special când se


calculeaza indicele mediu anual de crestere (scadere) - ” Im ” - a unui indicator, într-o
anumita perioada de timp. Aceasta forma de medie conduce la un rezultat real numai atunci
când seria dinamica, pentru care dorim sa determinam nivelul mediu al modificarii relative,
prezinta o anumita constanta a cresterii sau scaderii indicatorului formalizat în serie
dinamica.
Relatia de calcul a mediei geometrice simple este urmatoarea:

x2 x3 x4 x x
Im = Mg = n −1 ⋅ ⋅ ⋅ ... ⋅ n = n−1 n , în care:
x1 x 2 x3 x n−1 x1

- Mg este notatia pentru valoarea medie obtinuta cu ajutorul mediei geometrice,


- n - numarul indicatorilor de nivel înscrisi în serie dinamica,
- x i - varianta “i” a indicatorului de nivel,
- x 1 si x n - primul si respectiv ultimul indicator de nivel al seriei dinamice.

Daca fenomenul studiat este marcat de oscilatii pronuntate cu caracter conjunctural,


de la un segment de timp la altul, utilizarea procedeului clasic al mediei geometrice, simpla
sau ponderata, dupa caz, poate conduce la un rezultat neconform cu realitatea, deoarece se
bazeaza numai pe indicatorul initial si final din seria dinamica respectiva. În aceste situatii
se recomanda calculul indicelui mediu anual de crestere (scadere) prin folosirea procedeului
mediei geometrice corectate sau a procedeului autoregresiei care iau în calcul toti
indicatorii de nivel cuprinsi în seria dinamica analizata.

Media geometrica corectata ( Mg c ) este o forma a mediei geometrice ponderate


calculata din medii geometrice secventiale sau partiale ( Mg i ), determinate astfel:
- prima medie geometrica ( Mg 1 ) este o medie geometrica simpla , care se
refera la întreaga serie dinamica supusa prelucrarii,
- a doua medie geometrica ( Mg 2 ) este tot o medie geometrica simpla dar care
se bazeaza pe n-2 indicatori de nivel, fiind eliminati din calcul primul si ultimul indicator
din serie, notatia “n” este acordata numarului total de indicatori de nivel înscrisi în serie
dinamica,
- a treia medie geometrica ( Mg 3 ) se determina prin luarea în consideratie a
unui numar de n-4 indicatori de nivel, se elimina astfel din calcul primii doi si ultimii doi
indicatori de nivel din serie,
- se continua modalitatea de calcul a mediilor geometrice secventiale
(partiale) pâna se epuizeaza toate posibilitatile.
16

Daca seria dinamica respectiva este formata dintr-un numar impar de indicatori,
indicatorul din mijlocul seriei nu va fi luat în calcul la nici-o varianta a mediei geometrice
secventiale.
Ponderea fiecarei medii geometrice secventiale este reprezentata prin numarul
unitatilor (segmentelor) de timp la care se refera media, adica f1 = n-1 pentru prima medie,
f2 = n-3 pentru media a doua, f3 = n-5 pentru media a treia, s.a.m.d.

Relatia de calcul a mediei geometrice corectate este urmatoarea:

Im = Mg c = ∑ i Mg 1f1 ⋅ Mg f22 ⋅ Mg f33 ⋅ Mg f44 ⋅ ... ⋅ Mg fmm


f

în care, ∑ f i = f 1 + f 2 + f 3 + f 4 + ... + f m
m - numarul mediilor geometrice secventiale
Procedeul autoregresiei se bazeaza pe calculul indicelui mediu anual de crestere
(scadere) din ecuatia care se obtine prin minimizarea urmatoarei expresii:

2
S = ∑ (x i−1 ⋅ Im − x i ) = minim
n

i= 2

Egalând cu zero derivata acestei sume calculata în raport cu Im rezulta ecuatia,


∑ ( x i-1 ) ⋅ Im = ∑ x i ⋅ x i-1 , din care se extrage Im ,
2

Im = ∑x ⋅ xi i -1

∑ (x ) 2
i -1

Daca indicele mediu este exprimat procentual si apoi se micsoreaza cu 100 se obtine
ritmul mediu anual de crestere sau de scadere (Rm ) , ca o expresie derivata a marimii medii
care caracterizeaza modificarea medie în timp a unui fenomen,

Rm = Im ⋅ 100 - 100

Marimi medii de pozitie (mediana si modulul)

Daca se considera necesar, pentru aprecierea nivelului mediu al unei caracteristici


statistice se poate folosi, mediana sau modulul, ca valori tipice de pozitie, deoarece acestea
ocupa un anumit loc cu semnificatie medie în cadrul unei serii de valori.
Mediana (XMe) este varianta caracteristicii care ocupa locul central în seria de date
statistice care au fost ordonate crescator sau descrescator.
Pozitia ocupata de mediana în cadrul unei serii de repartitie prezentata ca o însiruire
de variante se calculeaza asfel:
n+ 1
Me =
2
Daca seria are un numar impar de valori, XMe, va fi varianta centrala localizata prin
calculul locului medianei (Me).
17

Daca seria are un numar par de valori, XMe, va fi rezultatul mediei aritmetice simple
efectuata din cele doua variante centrale.
În cazul seriilor de repartitie în care datele statistice sunt prezentate sub forma unor
grupari pe intervale de grupare, calculul valorii mediane se realizeaza pe baza formulei:
Sn i + 1
− fcp
X Me = x 0 + d⋅ 2 , în care,
fm
x 0 este limita inferioara a intervalului median,
d este marimea intervalului median, obtinuta ca diferenta între limita superioara si
limita inferioara a intervalului median,
Sn i + 1
este locul sau, numarul de ordine pe care îl ocupa valoarea mediana si pe
2
baza caruia se stabileste intervalul median,
fcp este suma frecventelor tuturor intervalelor precedente, constituite pâna la
intervalul în care se gaseste valoarea mediana,
fm este frecventa intervalului în care se pozitioneaza valoarea mediana.

Quartilele sunt acele valori ale caracteristicii statistice care împart o serie de
repartitie în patru zone egale, din punct de vedere al numarului unitatilor care formeaza o
colectivitate. Aceasta procedura este folosita atunci când numarul unitatilor statistice este
suficient de mare si se considera necesar sa se constituie patru grupe egale care sa se
caracterizeze printr- un anumit grad de omogenitate. Calculul quartilelor se bazeaza pe
aceeasi logica metodologica folosita la calculul medianei, dar tinând seama de locul ocupat
de quartila respectiva. Quartila 2 (Q 2 ) este identica cu valoarea mediana iar quartila 1 (Q 1 ) si
respectiv quartila 3 (Q 3 ) se calculeaza astfel:

Sn i + 1
− fcp (Q1 )
Q1 = x 0( Q1 ) + d⋅ 4
f Q1

⋅ (Sn i + 1) − fcp (Q3 )


3
Q 3 = x 0 (Q3 ) + d⋅ 4
f Q3

Decilele. În unele cazuri, în procesul de prelucrare al datelor statistice, se opteaza


pentru calculul decilelor care sunt valori ale caracteristicii ce împart seria statistica în zece
parti egale. Decila a cincea este egala cu valoarea mediana, iar calculul celorlalte decile tine
seama de pozitia acesteia în cadrul seriei de valori ale caracteristicii. Decilele se calculeaza,
de regula când amplitudinea variatiei este mai mare, astfel:
Sn i + 1
⋅ (Sn i + 1) − fcp (D 9 )
9
− fcp (D1 )
D1 = x 0 (D1 ) + d⋅ 10 ..... D 9 = x 0( D9 ) + d⋅ 10
f D1 f D9
18

Modulul (XMo ) reprezinta acea varianta a caracteristicii care are cea mai mare
frecventa, sau, cu alte cuvinte, varianta care este înregistrata de cele mai multe unitati ale
colectivitatii statistice.
Daca dispune m de o serie de repartitie în care datele statistice sunt prezentate sub
forma unei grupari pe intervale de grupare, calculul valorii modale se realizeaza pe baza
formulei:

∆1
X Mo = x 0 + d⋅ , în care,
∆1 + ∆ 2
x 0 este limita inferioara a intervalului modal. Intervalul modal este intervalul care
are frecventa cea mai mare,
d este marimea intervalului modal, obtinuta ca diferenta între limita superioara si
limita inferioara a intervalului modal,
∆ 1 este diferenta dintre frecventa intervalului modal si frecventa intervalului
precedent,
∆ 2 este diferenta dintre frecventa intervalului modal si frecventa intervalului
urmator.

Sunt si cazuri în care frecvente maxime identice se înregistreaza la doua sau mai
multe intervale de grupare sau la mai multe variante ale caracteristicii, în aceste situatii
seriile de repartitie sunt denumite bimodale sau multimodale.

Exemplul 3.
Daca folosim datele statistice utilizate la exemplul 1, valoarea madiana si respectiv
valoarea modala se calculeaza astfel:
Grupe de Numarul Marimea Frecventel
apartamente apartamen intervalulu e cumulate
dupa - i ascendent
consumul de telor (lim. sup.
energie (ni ) -- lim.
electrica ($) inf.)
6,0-6,5 5 0,5 5
6,5-7,0 7 0,5 12
7,0-7,5 10 0,5 22
7,5-8,0 6 0,5 28
8,0-8,5 2 0,5 30
Total 30 -
Locul valorii mediane:
Sn + 1 30 + 1
Me = i = = 15,5 , prin urmare mediana este valoarea medie a variantelor cu
2 2
numarul de ordine 15 si 16 care se pozitioneaza în intervalul, 7,0 - 7,5 (intervalul median).
19

Sn i + 1 30 + 1
− fcp − 12
X Me = x 0 + d⋅ 2 = 7 ,0 + 0 ,5 ⋅ 2 = 7,175 $
fm 10
Intervalul modal este intervalul, 7,0 – 7,5 la care se înregistreaza frecventa maxima
(10).
∆1 10 − 7
X Mo = x 0 + d⋅ = 7,0 + 0,5 ⋅ = 7,214 $
∆1 + ∆ 2 (10 − 7 ) + (10 − 6)

Indicatorii gradului de variabilitate

Datele retinute în urma observarii difera de la o unitate statistica la alta, prin urmare
prezinta un anumit grad de variabilitate determinat de conditiile de dezvoltare specifice
fenomenului studiat, de factorii care actioneaza asupra aparitiei si existentei fiecarei unitati.
Pentru caracterizarea unei colectivitati statistice din punct de vedere al împrastierii
nivelurilor individuale se folosesc indicatori specifici cunoscuti sub denumirea de indicatorii
variatiei.
Daca tinem seama de numarul variantelor caracteristicii care se compara pentru a
obtine un indicator care masoara gradul de variabilitate se disting doua feluri de indicatori:
- indicatori simpli si
- indicatori sintetici.
1. Indicatorii simpli ai variatiei caracterizeaza abaterea unei singure variante fata de
alta varianta sau fata de valoarea medie a caracteristicii. Acesti indicatori dimensioneaza,
prin urmare, aspecte izolate ale gradului de variabilitate si pot fi calculati atât în expresie
absoluta cât si în expresie relativa.
a) - Amplitudinea variatiei (A) masoara câmpul de împrastiere a valorilor
caracteristicii si se obtine prin compararea variantei cu marimea cea mai mare sub care s-a
înregistrat caracteristica cu varianta de valoare minima, astfel:
- amplitudinea absoluta: A = x max − x min

x max − x min
- amplitudinea relativa: A(% ) = ⋅ 100
x

b) - Abaterea fiecarei variante a caracteristicii de la valoarea medie


( ? i ),
- abaterea absoluta: ? i = x i − x ; i = 1,2,..., n

xi− x
- abaterea relativa: ? i (% ) = ⋅ 100
x
Acesti indicatori exprima masura în care fiecare varianta a caracteristicii se
distanteaza de la valoare medie a tuturor variantelor. Pentru analiza prezinta interes, în mod
deosebit, abaterea maxima negativa si respectiv abaterea maxima pozitiva care ofera si o
informatie generala asupra împrastierii nivelurilor individuale în raport cu valoarea medie.
20

2. Indicatorii sintetici ai variatiei caracterizeaza abaterea medie a tuturor variantelor


caracteristicii de la media lor.
a) - Abaterea medie liniara sau abaterea medie absoluta (d),
S xi − x
d= , în cazul seriilor de repartitie cu frecvente egale
n

S xi − x ⋅ ni
d= , în cazul seriilor de repartitie cu frecvente neegale
Sn i

Abaterea medie liniara, prin modul ei de calcul, acorda aceeasi importanta tuturor
abaterilor variantelor de la valoarea medie, indiferent de marimea abaterii, fapt ce poate
influenta în mod negativ o corecta apreciere a gradului de reprezentativitate a valorii medii.
Din acest motiv, pentru aprofundarea analizei seriilor statistice se recomanda sa se utilizeze
si alti indicatori sintetici cu rol de medie a nivelului de variabilitate.

b) - Dispersia s 2x ( )
Dispersia caracteristicii ofera o marime cifrica cu caracter abstract a gradului de
variabilitate existent într-o colectivitate statistica deoarece nu poate fi interpretata în mod
direct datorita caracterului ireal al unitatii de masura în care se exprima
S (x i − x ) 2 Sx 2i  Sx i 
2

s 2x = = −  , în cazul seriilor de repartitie cu frecvente egale


n n  n 

S (x i − x ) ⋅ n i Sx 2i n i  Sx i n i 
2 2

s =
2
x = −  , în cazul seriilor de repartitie cu frecvente neegale
Sn i Sn i  Sn i 
Uneori, pentru determinarea dispersiei se poate folosi si o formula de calcul
simplificat, care are un suport metodologic similar cu cel ut ilizat la calculul simplificat al
mediei aritmetice,
x −a 
2

S i 
 k 
sx = ⋅ k 2 − (x − a ) , în cazul seriilor de repartitie cu frecvente egale
2 2

x −a 
2

S i  ⋅ ni
 k 
sx = ⋅ k 2 − ( x − a ) , în cazul seriilor de repartitie cu frecvente neegale
2 2

Sn i
Se precizaza, de asemenea, ca aceste relatii ofera în mod efectiv avantajul
simplificarii calculelor numai daca sunt îndeplinite urmatoarele conditii:
- seria de variatie este constituita pe intervale egale de grupare,
- constantei “a” i se acorda ca valoare mijlocul intervalului care detine frecventa cea
mai mare,
21

- constantei “k” i se acorda ca valoare marimea intervalului de grupare.

c) - Abaterea medie patratica sau abaterea standard (s x ) se calculeaza prin


extragerea radacinii patrate din dispersie, astfel,
S (x i − x )
2

sx = , în cazul seriilor de repartitie cu frecvente egale


n

S (x i − x ) ⋅ n i
2

sx = , în cazul seriilor de repartitie cu frecvente neegale


Sn i
Abaterea medie patratica caracterizeaza gradul de variabilitate a variantelor
individuale ale caracteristicii de la va loarea medie. Cu cât abaterea medie patratica are o
marime mai mica cu atât valorile caracteristicii sunt mai concentrate în jurul mediei si în
consecinta colectivitatea statistica este mai omogena si invers, cu cât abaterea medie
patratica are o marime mai mare cu atât valorile individuale ale caracteristicii sunt mai
dispersate si deci colectivitatea este mai putin omogena.
Abaterea medie patratica are o aplicabilitate extinsa pentru dimensionarea sintetica a
variatiei caracteristicii studiate deoarece se exprima în aceleasi unitati de masura în care sunt
exprimate si variantele caracteristicii. Acest indicator prezinta totusi si o limita de aplicare
atunci când se doreste sa se faca, pe baza marimii sale, o comparatie a gradului de
variabilitate existent în doua colectivitati statistice ale caror caracteristici sunt exprimate în
unitati de masura diferite sau sunt marimi cifrice de ordin diferit (ordinul zecilor si respectiv
ordinul sutelor) chiar daca unitatea de masura este identica.
d) - Coeficientul de variatie (V)

sx
V= ⋅100
x

Coeficientul de variatie permita, datorita formei sale de exprimare procentuala, cea


mai generala apreciere a gradului de variabilitate medie a caracteristicii statistice studiate,
fara limite de interpretare.
Cu cât coeficientul de variatie are o valoare mai mica, cu atât media caracteristicii
este mai reprezentativa pentru colectivitatea statistica studiata si în consecinta colectivitatea
este mai omogena. Se apreciaza ca o valoare mai mica de 30% a coeficientului de variatie
atesta un grad bun de omogenitate a colectivitatii si respectiv de reprezentativitate a valorii
medii.
Dispersia în cazul caracteristicii alternative

Dupa cum se cunoaste, în cazul caracteristicii alternative valoarea medie este egala
cu proportia numarului unitatilor care detin caracteristica urmarita în totalul unitatilor care
formeaza colectivitatea statistica (p). Pentru caracteristica alternativa dispersia si abaterea
medie patratica se calculeaza astfel:
22

s 2x =
(1 − p )2 ⋅ p+ (0 − p )2 ⋅ q = q 2 ⋅ p + p 2 ⋅ q = q⋅ p⋅ (q + p ) = q⋅ p s x = q⋅ p
p+ q p+ q p+ q

Notatia “q” este acordata proportiei numarului unitatilor care nu detin caracteristica
urmarita în totalul unitatilor care formeaza colectivitatea statistica si în consecinta, p + q = 1 .
De asemenea, se mentioneaza ca “p” este ponderea (frecventa) relativa pentru varianta 1, iar
“q” este ponderea relativa pentru varianta 0.

Felurile dispersiilor

Pentru a mari paleta concluziilor care privesc aspectele structurale ale colectivitatilor
statistice se procedeaza la împartirea acestora în grupe omogene dupa doua sau mai multe
caracteristici. Grupele constituite difera între ele atât prin valoarea lor medie, cât si prin
nivelul intern al gradului de variabilitate. Indicatorii variatiei calculati pentru întreaga
colectivitate sintetizeaza doua categorii de influente:
- influenta factorilor cu actiune întâmplatoare localizati la nivelul grupelor care
determina variatia interna a grupelor;
- influenta factorilor obiectivi reprezentati prin continutul si tipologia caracteristicilor
de grupare care au puterea de a determina departajarea colectivitatii în grupe care
evidentiaza tipuri calitative distincte si care determina variatia dintre grupe.
Analiza colectivitatilor statistice împartite pe grupe, prin calcularea unor indicatori
specifici ai variatiei, are în vedere urmatoarele tipuri de indicatori:
- dispersia caracteristicii statistice la nivelul colectivitatii (dispersia generala),
- dispersia caracteristicii statistice la nivelul fiecarei grupe (dispersia de grupa),
- media dispersiilor calculate pe grupe,
- dispersia dintre grupe.

a) Dispersia generala ( s 20 ) oglindeste variatia caracteristicii statistice existenta în


colectivitatea totala si produsa ca urmare a influentei tuturor factorilor obiectivi si
întâmplatori care actioneaza asupra unitatilor statistice,

∑ ∑ (x − x 0 ) ⋅ n ij
k nj
2
ij
j =1 i =1
s 20 = k
în care,
∑n j
j=1

x ij sunt cele “i” variante ale caracteristicii din grupa “j”,


x 0 este media caracteristicii la nivelul colectivitatii totale,
k reprezinta numarul de grupe în care s-a împartit colectivitatea,
nj
n j este frecventa grupei “j”, ∑n ij = nj,
i =1

n ij este frecventa variantei “i” din grupa “j”.


23

b) Dispersia de grupa ( s 2j ) caracterizeaza variatia caracteristicii la nivelul unei grupe


de unitati,
fj

∑ (x − x j ) ⋅ n ij
2
ij
i =1
sj =
2
fj
în care,
∑n ij
i =1

x j este valoarea medie a caracteristicii în grupa “j”.

c) Media dispersiilor calculate pe grupe ( s 2j ) reflecta acea parte din variatia


caracteristicii, existenta în colectivitatea totala, care este produsa de factorii cu actiune
întâmplatoare,
k

∑s 2
j ⋅ nj
j =1
s =
2
j k

∑n j
j =1

d) Dispersia dintre grupe ( d 2 ) este masura gradului de împrastiere a mediilor


calculate pe grupe de la media generala. Aceasta dispersie reflecta variatia caracteristicii din
colectivitatea totala provocata de influenta factorului obiectiv reprezentat prin caracteristica
folosita pentru a realiza gruparea,

∑ (x − x )
k
⋅n j
2
j 0
j=1
d =
2
k

∑n j
j =1

Rezulta, din cele expuse, ca dispersia generala cumuleaza atât influenta factorilor
întâmplatori cât si influenta factorului obiectiv, respectiv a factorului de grupare, exprimând,
astfel, masura nivelului total al varibilitatii caracteristicii studiate, fapt confirmat si prin
relatia care atesta “regula de adunare a dispersiilor”,
s 20 = s 2j + d 2

Indicatorii asimetriei si boltirii (aplatizarii) seriilor de repartitie

Indicatorii asimetriei si boltirii seriilor de repartitie ofera informatii suplimentare


care completeaza si le dezvolta pe acelea sintetizate de indicatorii medii sau de cei ai
variatiei.

a) Coeficientul de asimetrie
Coeficientul de asimetrie (Sx ) este o masura a asimetriei distributiei seriei în jurul
mediei, acesta ne edifica asupra modului de dispunere a nivelurilor individuale ale
caracteristicii în raport cu o repartitie uniforma sau normala. Cu cât coeficientul de asimetrie
24

este mai mic, respectiv se apropie ca marime de zero, cu atât seria statistica are un grad de
asimetrie mai redus, iar daca Sx este egal cu zero, seria este perfect simetrica.
Semnul pozitiv al coeficientului de asimetrie indica o asimetrie spre dreapta iar,
semnul negativ semnalizeaza existenta unei asimetrii a seriei statistice spre stânga respectiv
catre nivelurile mai mici ale seriei.
Formula de calcul a coeficientului de asimetrie este:
3
1  x− x 
Sx = S  
n  sx 
2
Sx 2  Sx  S(x − x ) 2
în care, s = − =
 n 
x
n n

b) Coeficientul de boltire (aplatizare) (Kx ) se cuantifica cu ajutorul relatiei:


4
1  x− x 
Kx = S  
n  sx 
Marimea coeficientului de boltire se compara cu nivelul standard de 3.
- daca, Kx = 3, boltirea seriei statistice corespunde legii de repartitie normale,
- daca, Kx < 3, seria are o dispunere plata relativ la repartitia normala,
- daca, Kx > 3, seria are o forma ascutita comparativ cu repartitia normala,
Atunci când Sx = 0 si K x = 3 , seria statistica este normal distribuita.

Verificarea convergentei seriei de repartitie studiate câtre legea de repartitie normala


pe baza indicatorilor de asimetrie si boltire se poate realiza cu ajutorul testului Jarque-Bera.
Dimensiunea statistica a acestui test este:
n
JB = S2x +
n
(K x − 3) 2
6 24
JB se distribuie conform legii de repartitie ? 2 cu 2 grade de libertate)
Daca, JB > ? 2P=1−q ; f = 2 , se respinge ipoteza nula a repartizarii normale a variabilei. Cu
cât valoarea lui JB este mai mica, mai apropiata de zero, cu atât seria statistica se apropie ca
forma de repartitia normala. Este evident ca atunci când, JB = 0, seria se distribuie conform
legii de repartitie normala.

Indicatorii asimetriei si boltirii seriilor de repartitie prezinta, de asemenea, utilitate


practica pentru alegerea unei anumite scheme de sondaj. Se mentioneaza ca în cazul
colectivitatilor statistice relativ simetrice, sau cu un grad redus de asimetrie si o dispunere
compatibila cu repartitia teoretica normala, se adopta, de regula, un tip de sondaj simplu,
nestratificat.

Indicatorii gradului de concentrare / diversificare


25

Studiul seriilor statistice poate fi aprofundat prin conturarea unor concluzii specifice
cu privire la masura în care volumul caracteristicii sau unitatile statis tice se dispun între
starile, grupele sau segmentele de timp la care se refera.
Indicatorii cu ajutorul carora se apreciaza gradul de concentrare / diversificare sunt:

- indicatorul “Energia informationala” ( Ei = Sr 2 )


Indicatorul "Ei" poate înregistra o marime cuprinsa între 1 si 1/n (în care “n” este
numarul starilor, grupelor sau diviziunilor de timp, iar “r” sunt marimile relative de
1
structura). Daca Ei = , se constata o dispunere uniforma a unitatilor sau a caracteristicii pe
n
starile respective (maxima diversificare), iar daca Ei = 1 , se identifica o concentrare totala,
într-o singura stare.

- indicatorului “Entropia informationala” (En).


En = − log 2 10⋅ ( Σr ⋅ log r) = -3,321928 ⋅ (Σr ⋅ log r)
Entropia informationala poate lua o valoare în intervalul 0 si log 2 n , în care “n”
reprezinta numarul starilor sau al segmentelor de timp. Daca En = 0 , exista o singura stare
care concentreaza toata activitatea, iar daca En = log 2 n = 3,321928 ⋅ log 10n , se confirma o
dispunere uniforma a tuturor starilor prin prisma numarului unitatilor statistice sau a
volumului caracteristicii studiate.

- ”Coeficientul Gini” (Kg)

Kg =
( )
n ⋅ Σr 2 − 1
n −1
Coeficientul Gini se situiaza ca marime în intervalul 0 si 1. Marimea 0 atesta o
dispunere uniforma pe stari sau pe segmente de timp, iar valoarea 1 se obtine atunci când se
constata existenta unei singure stari care concentreaza întreaga activitate sau toate unitatile
colectivitatii statistice.

Prezentarea datelor statistice sub forma reprezentarilor grafice

În vederea realizarii operatiunilor de prelucrare, interpretare, previziune si prezentare


a datelor statistice initiale sau a indicatorilor obtinuti în urma prelucrarii, se procedeaza, de
regula, la vizualizarea indicatorilor economico-financiari folosind reprezentari grafice, care
se construiesc cu ajutorul sistemului de axe rectangulare, prin figuri geometrice, harti, figuri
simbolice etc.
Pentru obtinerea unui mesaj corect prin grafic este necesar sa se apeleze la tipul de
reprezentare care se potriveste specificului datelor ce vor fi vizualizate în forma grafica.
Astfel, în practica se utilizeaza urmatoarele tipuri de reprezentari grafice:
- diagrama prin benzi - este recomandata a fi utilizata în cazul datelor care
exprima: lungimea (râurilor, fluviilor, soselelor, cailor ferate); vârsta populatiei (piramida
vârstelor); productia unor bunuri industriale sau agricole realizate într-un an. De asemenea,
26

aceasta modalitate de reprezentare este folosita si în cazul seriilor dinamice formate dintr- un
numar redus de indicatori distantati inegal în timp.
- diagrama prin coloane - are o utilizare mai frecventa atunci când dorim sa
reprezentam grafic un numar redus de indicatori sistematizati în serie dinamica;
- diagrama de structura - este utilizata pentru reprezentarea tipurilor calitative de
fenomene existente într-o colectivitate. Diagrama de structura se poate realiza pe cerc,
semicerc, patrat sau dreptunghi prin reprezentarea grafica a marimilor relative de structura
referitoare la grupele unei colectivitati;
- diagrama polara - este aplicata cu predilectie pentru reprezentarea grafica a unor
indicatori de volum înregistrati pe segmente de timp componente ale unei perioade;
- histograma - este folosita la reprezentarea seriilor de variatie pe intervale;
- curba cumulativa de frecvente (ascendenta sau descendenta);
- cronograma - este o modalitate clasica de reprezentare a seriilor dinamice formate
dintr- un numar suficient de mare de indicatori;
- cartograma - se realizeaza pe harta prin hasurari de intensitati diferite în functie de
marimea indicatorilor reprezentati;
- cartodiagrama - se construieste pe harta folosind diagrame înscrise în fiecare zona
teritoriala;
- figuri geometrice (patrat, cerc, paralelipiped, dreptunghi) - sunt folosite în special
pentru reprezentarea grafica a unor indicatori de volum;
- figuri simbolice - acestea reproduc la dimensiuni proportionale marimea
indicatorilor de volum pe care dorim sa- i reprezentam.

Studiul reprezentarilor grafice ne permite sa formulam aprecieri privind evolutia si


tendinta indicatorilor economico- financiari, sa concluzionam asupra unor aspecte ale
corelatiilor dintre fenomene, sa caracterizam din punct de vedere spatial dezvoltarea unor
fenomene, sa vizualizam structura fenomenelor etc. Este de relevat faptul ca aceasta metoda
de analiza prin grafice este utilizata si ca etapa intermediara de lucru în cadrul folosirii altor
metode mai complexe, cum ar fi metodele statistico- matematice de analiza a corelatiilor
dintre fenomene sau cele de modelare a seriilor dinamice.

Studiul statistic al corelatiilor dintre fenomene

Fenomenele si procesele economice se gasesc în relatii de interdependenta, astfel


încât unele se comporta ca fenomene cauza, determinante, independente sau factoriale, iar
altele sunt fenomene efect, determinate, dependente sau rezultative.
Concluzii utile privind interdependenta dintre indicatorii statistici pot fi formulate
numai în conditiile folosirii unui volum suficient de mare de date. Daca se studiaza corelatii
între serii dinamice de indicatori numarul minim de segmente de timp trebuie sa fie de 15,
iar în cazul seriilor de indicatori obtinuti în urma unor experimentari, numarul minim de
indicatori este apreciat la 40. În unele situatii concrete se remarca faptul ca o semnificatie
crescuta a indicatorilor care exprima diverse aspecte ale corelatiilor dintre fenomene este
mult îmbunatatita atunci când numarul determinarilor statistice depaseste 100.
Pentru a studia legaturile statistice care se formeaza între fenomene pot fi utilizate
mai multe modalitati de observatie si de calcul, grupate astfel:
27

- metode simple sau de observatie


- metoda compararii seriilor paralele de date statistice interdependente
- metoda tabelului de corelatie
- metoda grafica
- metode analitice
- metode parametrice (metode statistico- matematice de analiza a corelatiilor)
- metode neparametrice (metode de analiza a corelatiei rangurilor)

Metoda compararii seriilor paralele de date statistice interdependente consta în


stabilirea legaturilor de interdependenta dintre fenomenele social-economice prin
compararea a doua sau mai multe serii de indicatori.
În cazul seriilor de repartitie indicatorii care se refera la variabila determinanta sau
independenta se aseaza în ordine crescatoare sau descrescatoare si în mod paralel se înscriu
apoi valorile corespunzatoare variabilei (caracteristicii) dependente. Daca se compara serii
cronologice de indicatori acestia se pozitioneaza în mod paralel pe segmente de timp
identice. Metoda compararii seriilor paralele de date statistice interdependente se poate
utiliza, de asemenea, si atunci când seriile respective de indicatori sunt înscrise în raport cu o
caracteristica de spatiu (teritoriala).
Cu ajutorul acestei metode poate fi identificata, astfel, o anumita corespondenta a
modificarilor înregistrate de indicatorii seriilor comparate, directia si intens itatea orientativa
a modificarilor.

Metoda tabelului de corelatie. Tabelul de corelatie este un tabel statistic cu dubla


intrare si cuprinde doua serii statistice de repartitie, o serie reprezinta seria de variante, sau
intervalele de grupare, ale caracteristicii determinante, iar cealalta serie se refera la
caracteristica dependenta (determinata). Tabelul de corelatie este o forma de grupare
combinata efectuata dupa doua caracteristici considerate în sistem interdependent.
În functie de modul în care se distribuie frecventele aferente celor doua caracteristici
se poate contura o apreciere cu privire la existenta sau inexistenta unei legaturi statistice,
forma si directia legaturii. Concentrarea frecventelor în jurul uneia dintre diagonalele
tabelului indica existenta unei anumite legaturi statistice, iar daca se remarca o împrastiere a
frecventelor în tot spatiul tabelului se apreciaza ca cele doua caracteristici nu manifesta o
stare de interdependenta.
Prin metoda tabelului de corelatie se identifica daca exista o legatura statistica între
fenomenele studiate, în profil static, la un anumit moment la care se refera datele, legatura
care poate sa nu se mai manifeste la alte momente de existenta a unitatilor statistice.

Metoda grafica este una din cele mai utilizate metode pentru evidentierea legaturilor
care se formeaza între caracteristicile statistice. Aceasta metoda poate avea atât o utilizare
independenta cât si în contextul aplicarii altor metode cu o structura de lucru mai complexa
cum ar fi metodele statistico- matematice de analiza a corelatiilor.
Metoda graficului de corelatie (corelograma) consta în analiza unui grafic construit
pe baza axelor rectangulare, valorile caracteristicii independente se înscriu pe abscisa, iar
cele ale caracteristicii rezultative se înscriu pe axa ordonatelor. Reprezentarea punctelor de
intersectie a valorilor celor doua caracteristici (“norul de puncte”) ofera o dispunere care
28

permite, prin observatie, sa se concluzioneze asupra existentei corelatiei, precum si asupra


directiei si formei analitice de manifestare a corelatiei.

Metodele statistico-matematice de analiza a corelatiilor dintre fenomene fac parte


din categoria metodelor de analiza factoriala, sunt metode cu caracter analitic si permit
dimensionarea intensitatii interdependentei dintre doua sau mai multe fenomene, viteza de
modificare a fenomenelor efect prin modificarea fenomenelor cauza, precum si forma
analitica a relatiei de interdependenta exprimata printr-o ecuatie de regresie. Aceste metode
prezinta o larga aplicabilitate practica datorita consistentei informatiilor pe care le ofera.

Corelatiile care se manifesta între fenomene sunt expresii ale asocierii unor
dimensiuni cifrice date de indicatorii statistici cu continut economic sau de alta natura, si pot
fi clasificate în functie de urmatoarele criterii:
1) Dupa numarul caracteristicilor care intervin într-un sistem de interdependenta
statistica, se disting:
-corelatii simple, când sistemul considerat cuprinde o caracteristica
(fenomen) cauza si o caracteristica (fenomen) efect;
- corelatii multiple, când se studiaza un sistem format din doua sau mai multe
caracteristici determinante si o caracteristica rezultativa.
2) Dupa sensul sau directia corelatiei, pot exista:
- corelatii directe, când modificarea într-un anumit sens a fenomenului cauza
determina modificarea în acelasi sens a fenomenului efect;
- corelatii inverse, când modificarea într- un anumit sens a fenomenului cauza
determina modificarea în sens invers a fenomenului efect.

3) Dupa forma analitica, legaturile de interdependenta pot fi:


- corelatii liniare,
- simple, exprimate cu ajutorul ecuatiei:
y = a + bx
- multiple, sintetizate prin ecuatia:
y = a + bx 1 + cx 2 + dx 3 , daca variabilele independente (x) sunt în
numar de trei
- corelatii de tip parabolic,
- simple: y = a + bx + cx 2
- multiple: y = a + bx 1 + cx 12 + dx 2 + ex 22 , daca variabilele independente
(x) sunt în numar de doua
- corelatii de tip hiperbolic,
b
- simple: y = a +
x
b c
- multiple: y = a + +
x1 x 2
- corelatii de tip exponential ,
- simple: y = a ⋅ b x
29

- multiple: y = a ⋅ b x1 ⋅ c x2

4) Dupa tipul sincronizarii corelatiei în timp (în cazul corelatiilor dintre


indicatori prezentati în serii dinamice):
- corelatii concomitente;
- corelatii cu decalaj.

În cadrul ecuatiilor de regresie fenomenul efect (rezultativ, determinat sau


dependent) este notat cu y, fenomenul sau fenomenele cauza (determinante sau
independente) cu x, iar parametrii a, b, c, d, ... asociati fenomenelor determinante sau
independente se numesc coeficienti de regresie.

În cazul abordarii unei probleme de analiza a corelatiei dintre fenomene cu ajutorul


metodelor statistico- matematice, se are în vedere parcurgerea urmatoarelor etape:

* constituirea sistemului de indicatori statistici sau de masurare propusi a fi studiati


în sistem interdependent.
Se mentioneaza ca în aceasta etapa de lucru trebuie sa se tina seama de conditiile
restrictive ce privesc volumul datelor. În cazul studierii corelatiei între indicatori statistici
prezentati sub forma seriilor dinamice, numarul minim acceptat este de 15 indicatori, iar în
cazul datelor obtinute prin experimentari sau masurari ale unor unitati retinute prin sondaj,
numarul minim de indicatori este apreciat la 40;

* analiza sistemului propus prin prisma cunostintelor de economie generala, precum


si a experientei practice din domeniul concret al masuratorilor efectuate, în vederea stabilirii
caracterului real sau absurd de existenta a interdependentei între fenomenele sistemului.
Aceasta decizie este necesara deoarece prelucrarea indicatorilor initiali se realizeaza
folosind o metodologie matematica care nu poate preciza caracterul real sau absurd al
corelatiei.

* se apreciaza, tot pe baza de analiza, care este tipologia fenomenelor constituite în


sistem interdependent, respectiv care este fenomenul dependent-efect (y) si care este
fenomenul independent-cauza (x);

* se reprezinta grafic sisteme de corelatie constituite dintr- un fenomen efect si unul


cauza, folosind axele rectangulare. Pe grafic va rezulta un "nor de puncte" care va sugera
forma ecuatiei de regresie în functie de modul de dispunere a punctelor în plan;

* pe baza reprezentarii grafice, prin apreciere vizuala, se alege forma ecuatiei de


regresie, considerata ca sintetizând în mod corespunzator modul de asezare a norului de
puncte;

* se estimeaza valorile parametrilor din ecuatia de regresie aleasa, folosind metoda


celor mai mici patrate, care consta în minimizarea sumei patratelor abaterilor nivelurilor
30

reale ale fenomenului dependent-efect (y) de la nivelurile calculate pe baza ecuatiei de


regresie ale aceluiasi fenomen (yc),
S = S(y− y c ) = minim
2

Minimum acestei sume se obtine prin egalarea cu zero a derivatelor partiale ale
sumei în raport cu parametrii ecuatiei.
În cazul particular al unei ecuatii de regresie de forma: y = a + b⋅ x , sistemul de
ecuatii obtinut prin metoda celor mai mici patrate care permite estimarea parametrilor
ecuatiei de regresie, “a” si “b”, este dedus astfel:
S = S(y− a− b⋅ x)2 = minim
 dS = 2 S( y− a − b⋅ x ) ⋅ (− 1) = 0
 da
 dS
 = 2 S( y− a − b⋅ x ) ⋅ (− x ) = 0
 db
De unde rezulta:
 na + bS x = Sy

aS x + bS x = Sxy
2

Rezolvarea matriciala a sistemului se bazeaza pe relatia:


A −1⋅ B = C

în care:
A reprezinta matricea sistemului de ecuatii
A-1 este matricea inversa a matricei A
B reprezinta vectorul termenilor liberi (Sy; Sxy )
C reprezinta vectorul coeficientilor (parametrilor) ecuatiei de regresie, “a” si “b”.
* se calculeaza estimatia erorii standard pentru fiecare parametru al ecuatiei de
regresie si se verifica semnificatia parametrilor cu ajutorul Criteriului "t" .
Confirmarea semnificatiei parametrilor ecuatiei de regresie este atestata cu ajutorul
Criteriului "t" care consta în a compara variabila t-statistic cu variabila t-tabelara
corespunzatoare unui anumit prag de semnificatie (de obicei se opteaza pentru o
probabilitate P = 95%, respectiv un prag de semnificatie q = 5%, q = 1-P ) si f = n - k grade
de libertate, distribuita dupa func tia de repartitie Student). Se precizeaza ca "n" reprezinta
numarul variantelor, iar "k" reprezinta numarul parametrilor ecuatiei de regresie.

Variabila t- statistic se obtine raportând estimatia parametrului la estimatia erorii


standard asociata fiecaruia dintre parametrii ecuatiei, astfel:
Daca ecuatia de regresie este de forma: y = a + b⋅ x 1 + c⋅ x 2 + d⋅ x 3
a
- pentru parametrul a, t − statistic = , în care sa este estimatia erorii standard a
sa
parametrului a,
31

b
- pentru parametrul b, t − statistic = , în care s b este estimatia erorii standard a
sb
parametrului b,
c
- pentru parametrul c, t − statistic = , în care sc este estimatia erorii standard a
sc
parametrului c,
d
- pentru parametrul d, t − statistic = , în care s d este estimatia erorii standard a
sd
parametrului d,

Nota: Estimatiile erorilor standard ale parametrilor ecuatiei de regresie (sa, sb, sc si sd ) sunt
determinate prin extragerea radacinii patrate din elementele situate pe diagonala
principala a matricei rezultate din produsul estimatiei dispersiei erorii standard a ecuatiei
de regresie sau patratului erorii standard a ecuatiei de regresie ( s 2y.yc ) cu matricea inversa
a produsului matricei transpuse a variabilelor independente ( X' ) cu matricea initiala a
acestor variabile ( X ) :

s 2y.y c ⋅ (X'⋅X) −1 = s 2y.y c ⋅ (A) −1


S (y − y c )
2

în care, s 2y.y c =
n−k

Testarea si interpretarea semnificatiei parametrilor ecuatiei de regresie conduce la


urmatoarele concluzii:
-daca marimea cifrica a parametrul "a" este suficient de mare, se obtine informatia ca
sistemul de corelatie studiat este format dintr-un numar redus de variante dar, în anumite
conditii date ale analizei abordate aceasta concluzie poate fi ignorata. Importanta acestui
parametru pentru analiza economica este relativ redusa iar procedura verificarii semnificatiei
statistice a acestuia este aplicata, de regula, în scop demonstrativ.
-testarea semnificatiei parametrului “b”, “c”, si“ d” este efectuata, de asemenea, prin
compararea indicatorului t- statistic cu t-tabelar ( q = 0,05; f = n - k). Daca se constata o
inegalitate în favoarea marimii tabelare a lui “t” se accepta ipoteza nula si deci putem afirma
cu suficienta încredere ca parametrul respectiv are o marime care nu difera semnificativ de
zero. În aceste conditii caracteristica asociata acestui coeficient devine neinteresanta în
sistemul de corelatie studiat si poate fi eliminata din sistem. În cazul existentei unei
inegalitati în favoarea marimii statistice, calculate, se respinge ipoteza nula si prin urmare
parametrul respectiv are o marime care difera semnificativ de zero iar variabile independenta
asociata este semnificativa în cadrul sistemului interdependent studiat.
Decizia de a elimina o variabila independenta dintr-un sistem interdependent
multiplu se poate lua si atunci când marimea coeficientului de regresie asociat variabilei este
foarte mica, situatie în care variabila dependenta este deci influentata într-o masura
considerata nesemnificativa;
32

* se calculeaza nivelurile estimate (teoretice) ale fenomenului efect prin aplicarea


ecuatiei de regresie, urmarindu-se realizarea urmatoarei egalitati:

Σ y = Σy c

Prin aceasta egalitate se confirma exactitatea calculelor efectuate pâna la aceasta


etapa de lucru.

* se procedeaza la testarea ipotezei privind existenta autocorelatiei între valorile


variabilei reziduale cu ajutorul criteriului statistic DURBIN-WATSON care se bazeaza pe
calculul si interpretarea urmatorului indicator ( coeficientul de autocorelatie - DW):

∑ (u t − u t −1 )
n
2

t =2
DW = n
; ut = (y − yc)t
∑u 2
t
t =1

Criteriului statistic DURBIN-WATSON atesta o buna eficacitate a parametrilor


ecuatiei de regresie si respectiv a ecuatiei de regresie de a fi utilizata în calcule care vizeaza
extrapolarea corelatiei studiate, daca marimea coeficientul de autocorelatie - DW este
cuprinsa în intervalul 1,8 si 2,2.

Se precizeaza ca indicatorul statistic DW poate avea o marime situata în intervalul, 0


si 4:
- daca: 0,0 ≤ DW < 1,8, se confirma o corelatie pozitiva între termenii de eroare sau
reziduali (autocorelatie pozitiva);

- daca: 2,2 < DW ≤ 4,0, se confirma o corelatie negativa între termenii de eroare sau
reziduali (autocorelatie negativa);

- daca: 1,8 ≤ DW ≤ 2,2, se infirma existenta autocorelatiei între termenii reziduali;

- valoarea ideala a indicatorului statistic DW, pentru a constata absenta


autocorelatiei între termenii reziduali, este 2.

În cazul ecuatiilor de regresie care nu au parametrul “a“, testarea existentei


autocorelatiei între variantele variabilei reziduale cu ajutorul indicatorului statistic DW nu
este relevanta.

* se calculeaza intensitatea corelatiei, folosind:


a)- Raportul de corelatie este forma generala de calcul a intensitatii corelatiei dar se
utilizeaza, în special, în cazul corelatiilor simple neliniare si multiple,
33

Σ(y- yc )2
Ry⋅ x sau Ry⋅ xi = 1− , unde
Σ(y- y)2

Σy
y = M (y ) = este valoarea medie a variabilei dependente.
n
Uneori se practica si un calcul corectat (ajustat) al raportului de corelatie în functie
de numarul gradelor de libertate aferente celor doua sume de patrate. Se mentioneaza ca
acest calcul este aplicat, de regula, atunci când baza de date este reprezentata de un esantion
si în consecinta raportul de corelatie corectat este masura estimatiei intensitatii corelatiei
dintre fenomenele sistemului studiat. Relatia de calcul a raportului de corelatie corectat are
urmatoarea forma:

 Σ( y − y c )2 Σ( y − y) 2 
R y .x (corectat ) sau R y . xi (corectat ) = 1 −  : 
 n − k n − 1 

n −1
( )
sau, R y . z (corectat ) sau R y . x i (corectat ) = 1 − 1− R y . x ⋅
2

n−k

în care : k = numarul parametrilor din ecuatia de regresie.

Rezultatul raportului de corelatie se considera, practic, ca nu are semn algebric si se


încadreaza ca marime în intervalul 0 si 1. Cu cât raportul de corelatie are o valoare mai
apropiata de 1, cu atât legatura dintre fenomenele sistemului studiat este mai puternica si,
dimpotriva, cu cât valoarea sa se apropie de 0 se apreciaza ca interdependenta este slaba sau
inexistenta. Se considera o corelatie foarte puternica atunci când Ry.x are o valoare cuprinsa
între 0,8 si 1. Daca marimea raportului de corelatie este cuprinsa între 0,6 si 0,8, se
considera existenta unei corelatii suficient de puternica; daca rezultatul se situeaza între 0,4
si 0,6, corelatia este de intensitate medie; iar daca valoarea sa este mai mica de 0,4, corelatia
este slaba sau inexistenta.

b)- Coeficientul simplu de corelatie liniara - ca forma particulara a raportului de


corelatie - se aplica numai în cazul corelatiei sintetizata prin ecuatia de regresie, y = a + bx ,

n ⋅ Σxy − Σx ⋅ Σy
ry . x =
[n ⋅ Σx ][
− (Σx )2 ⋅ n ⋅ Σy 2 − (Σy) 2
2
]
în care: n = numarul variantelor

Marimea acestui coeficient se poate situa între -1 si +1, semnul coeficientului aratând
sensul legaturii (inversa, când are semnul minus sau directa când este pozitiv). Cu cât
coeficientul simplu de corelatie are o valoare mai apropiata de +1 sau de -1, cu atât legatura
dintre fenomenele sistemului studiat este mai puternica si, dimpotriva, cu cât valoarea sa se
34

apropie de 0 se apreciaza ca interdependenta este mai slaba sau inexistenta. Interpretarea


acestui coeficient pe intervale de marimi, indiferent de semnul rezultatului, este similara cu
aceea prezentata în cazul raportului de corelatie.

* se verifica semnificatia indicatorului care exprima intensitatea corelatiei cu ajutorul


Criteriului "F" .
Criteriul "F" folosit pentru verificarea semnificatiei raportului de corelatie se aplica
prin compararea variabilei F-statistic cu variabila F-tabelar care corespunde probabilitatii P
= 0,95 si numarului gradelor de libertate, f1 = k - 1 si f2 = n - k ,
S (y c − y) S ( y − y c )
2 2

F − statistic = :
k −1 n−k

Daca F-statistic > F-tabelar ipoteza nula este respinsa si deci, raportul de corelatie
este semnificativ diferit de zero.
În acelasi timp, raportul de corelatie si expresia relativa a estimatiei erorii standard a
ecuatiei de regresie ( V y.y c < 10% ) confirma prin marimea lor ca, ecuatia de regresie
formalizeaza corect, din punct de vedere analitic, legitatea statistica a corelatiei dintre
variabilele sistemului considerat si poate fi utilizata cu suficienta încredere pentru a estima
niveluri viitoare ale variabilei dependente în conditiile adoptarii unor variante posibile ale
marimii variabilelor independente.

* se calculeaza coeficientul de determinare în forma procentuala, astfel:


În cazul corelatiilor simple se calculeaza coeficientul simplu de determinare , pe
baza relatiei:
d y . x = ry2. x ⋅ 100 sau, d y . x = R 2y . x ⋅ 100 ;
iar în cazul corelatiilor multiple, se calculeaza coeficientul multiplu de determinare :
D y . x i = R 2y . x i ⋅ 100.
Coeficientul de determinare exprima cât la suta din modificarea (variatia)
indicatorului rezultativ (y) este determinata de modificarea (variatia) indicatorului
(indicatorilor) factorial sau independent din sistemul interdependent considerat. Diferenta
pâna la 100% este reprezentata de influenta altor factori care nu au fost cooptati în sistemul
studiat.
* se calculeaza estimatia erorii medii a ecuatiei de regresie (estimatia erorii standard
a regresiei) în expresie absoluta:

Σ(y - y c ) 2
s y ⋅ yc = ,
n-k

si în expresie relativa:

s y ⋅ yc
Vy ⋅ yc = ⋅ 100
y
35

Acest indicator exprima "puterea" ecuatiei de regresie, atunci când este folosita în
calcule de extrapolare sau de prognoza. Se considera o eroare medie relativa de o marime
foarte buna, când aceasta se situeaza sub 5% si de o marime buna, când are o valoare
cuprinsa între 5% si 10% . Interpretarea acestui indicator de eroare este complementara
concluziei oferita de criteriul statistic DURBIN-WATSON

O semnificatie statistica similara aceleia pe care o ofera eroarea medie relativa a


ecuatiei de regresie este obtinuta prin calculul si interpretarea “Coeficientului de
neregularitate al lui Theil” care se determina astfel:

σ y ⋅ yc Σ (y − y c )
2

Th = ; în care σ y ⋅ yc =
Σ y 2c Σy 2 n
+
n n

Coeficientul de neregularitate al lui Theil poate lua o valoare cuprinsa între zero si
unu. Daca, Th = 0 , valorile estimate ale variabilei dependente ( y c ) exprima perfect
prognoza fenomenului. Se considera ca fiind o marime foarte buna a coeficientului de
neregularitate al lui Theil atunci când nu depaseste limita de 5%.

Exemplul 4
Exemplificarea metodologiei statistice pentru analiza corelatiei dintre fenomene
(metode statistico-matematice sau parametrice de analiza a corelatiei) va fi efectuata pe baza
seriilor dinamice a doi indicatori statistici, prezentati într-o forma conventionala, “dinamica
cheltuielilor pentru servicii” (SERIA 01) - variabila dependenta (y) si “dinamica veniturilor”
(SERIA 02) - variabila independent a (x).

Tabelul 3
Anul Dinamica cheltuielilor Dinamica veniturilor
pentru servicii
SERIA 01 (y) SERIA 02 (x)
1 1,00 2,00
2 2,00 4,00
3 4,00 6,00
4 5,00 8,00
5 8,00 10,00
Total 20,00 30,00

Reprezentarea grafica a corelatiei dintre seria 01 si seria 02 este expusa în figura 1.


36

Corelograma dinamicii cheltuielilor pentru


servicii în functie de dinamica veniturilor

pentru servicii (%) 10


8
cheltuielilor
Dinamica

6
y
4
2
0
0 5 10 15
Dinamica veniturilor (%)

Fig. 1

Pe baza reprezentarii grafice din figura 1 se conchide ca ecuatia de regresie, y = a +


bx, sintetizeaza în mod corespunzator interdependenta dintre cele doua variabile deoarece
distributia norului de puncte se grupeaza în jurul unei linii drepte.
Calculul valorilor estimate ale parametrilor ecuatiei de regresie se realizeaza cu
ajutorul metodei celor mai mici patrate.
Sistemul de ecuatii obtinut prin metoda celor mai mici patrate care permite estimarea
parame trilor ecuatiei de regresie este:

 na + bΣ x = Σ y  5a + 30b = 20
 →
aΣ x + bΣx = Σxy 30a + 220b = 154
2

Rezolvarea matriciala a sistemului:


−1
−1  5 30   20   1,100 − 0,150  20   − 1,10
A ⋅ B = C →   ⋅   =   ⋅   =  
 30 220 154  − 0,150 0,025  154  0,85 

în care:
A reprezinta matricea sistemului de ecuatii
A-1 este matricea inversa a matricei A
B reprezinta vectorul termenilor liberi (Sy = 20; Sxy = 154 )
C reprezinta vectorul coeficientilor ecuatiei de regresie
(a = -1,10, b = 0,85).

Vectorul B poate fi obtinut astfel:


37

 1
 
 2
 1 1 1 1 1     20 
X ′ ⋅ y = B →   ⋅ 4 =  
 2 4 6 8 10  5  154
 
 8
 

1⋅ 1+ 1⋅ 2 + 1⋅ 4 + 1⋅ 5 = 20
2 ⋅ 1+ 4 ⋅ 2 + 6 ⋅ 4 + 8 ⋅ 5 + 10⋅ 8 = 154

Calculul termenilor care formeaza vectorul coeficientilo r ecuatiei de regresie, prin


înmultirea matricei ( A −1 ) cu vectorul (B), se realizeaza astfel:

1,100⋅ 20 + (−0,150) ⋅ 154 = −1,10


− 0,150⋅ 20 + 0,025⋅ 154 = 0,85
 5 30   220 − 30  220/ 200 − 30 / 200  1,100 − 0,150
  →   →   =  
 30 220  − 30 5   − 30/ 200 5 / 200   − 0,150 0,025 
transpusa asociata matricea
matricei A = A′ transpusei inversa = A-1
matricei A = A

Valoarea determinantului asociat matricei sistemului de ecuatii:


5 30
A = = 5 ⋅ 220− 30⋅ 30 = 200
30 220

Rezulta ca ecuatia de regresie are urmatoarea forma:

y = -1,10 + 0,85x
Parametrul, b = 0,85, este denumit coeficient de regresie sau propensiunea marginala
deoarece cuantifica modificarea fenomenului dependent atunci când variabila independenta
se modifica cu o unitate.
Calculul valorii estimate a erorii standard pentru fiecare parametru al ecuatiei de
regresie are la baza urmatoarea metodologie:
- se calculeaza produsul estimatiei patratului erorii standard a ecuatiei de regresie cu
matricea inversa a matricei sistemului de ecuatii,
)  1,100 − 0,150  0,403333 − 0,054999
σ 2y ⋅ y) ⋅ A −1 = 0,366666⋅   =  
 − 0,150 0,025   − 0,054999 0,009166 
Acelasi rezultat se obtine daca se opteaza pentru urmatoarea varianta de lucru:
38

−1
 1 2 
  
 1 1 1 1 1   1 4  
 ⋅ 1 6 
)
σ 2y ⋅ y) ⋅ (X′ ⋅ X) −1 = 0,366666⋅  =
 2 4 6 8 10  
 1 8 
  1 10 
  
−1
 5 30   1,100 − 0,150
= 0,366666⋅   = 0,366666  =
 30 220  − 0,150 0,025 
 0,403333 − 0,054999
=  
 − 0,054999 0,009166 

(X′ ⋅ X )−1 = A −1
- se calculeaza estimatia erorii standard a parametrului a,
s a = 0,403333 = 0,635085

- se calculeaza estimatia erorii standard a parametrului b,

s b = 0,009166= 0,095743

Nota: Estimatia erorii standard a parametrilor ecuatiei de regresie este reprezentata prin
)
radacina patrata a elementelor situate pe diagonala principala a matricei ( σ 2y ⋅ y) ⋅ A −1 ).

) 2
) S (y − y ) 1,10
s y . )y = = = 0,60553
n− k 5−2
)
s 2y . ŷ = 0 , 60553 2 = 0 , 366666

Verificarea semnificatiei parametrilor ecuatiei de regresie este realizata prin


compararea variabilei t-statistic cu t-tabelar.
Daca, t-statistic > t-tabelar , se respinge ipoteza nula si în aceste conditii parametrii
ecuatiei de regresie sunt semnificativ diferiti de zero.

Variabila t- statistic se obtine raportând estimatia parametrului la estimatia erorii


standard asociata fiecaruia dintre parametrii ecuatiei, astfel:
a − 1,10
- pentru parametrul a, t − statistic = = = −1,732051
s a 0,635085
t − statistic = −1,73205 < t − tabelar = 3,182
t − tabelar = t q=0,05 ; f = n-k =5-2= 3 = 3,182 ↔ (Anexa 4)
39

b 0,85
- pentru parametrul b, t − statistic = = = 8,877960
s b 0,095743
t − statistic = 8,87796 > t − tabelar = 3,182
t − tabelar = t q=0,05 ; f = n-k =5-2= 3 = 3,182 ↔ (Anexa 4)

În cazul studiului corelatiei dintre dinamica cheltuielilor pentru servicii - variabila


dependenta (y) si dinamica veniturilor - variabila independenta (x) se confirma statatistic ca
parametrul ”b” are o marime semnificativa în timp ce parametrul ”a” nu este atestat statistic
cu o marime semnificativ diferit de zero. În principiu, aceasta concluzie nu afecteaza, însa,
utilitatea ecuatiei de regresie deoarece infirmarea semnificatiei parametrului ”a” (ordonata la
origine) este o consecinta a numarului redus de valori luate în calcul (n = 5).
Analiza sistemului interdependent de indicatori statistici prezentati sub forma celor
doua serii dinamice se bazeaza pe interpretarea indicatorilor derivati prezentati în
tabelul 4.

Tabelul 4
Sistemul indicatorilor analitici care privesc corelatia dintre SERIA 01 si SERIA 02
Variabila dependenta - dinamica cheltuielilor pentru servicii: SERIA 01
Metoda celor mai mici patrate
Numarul observatiilor: 5
Variabila Coeficientul Eroarea t-Statistic
standard
b → coeficient ul 0,850000 0,095743 8,877960
de regresie
a -1,100000 0,635085 -1,732051
2
R - coeficientul de 0,963333 Media variabilei 4,000000
determinare dependente
R – raportul de
( )
corelatie R 2
0,981495

R 2 − ajustat 0,951111 Estimatia abaterii 2,738613


standard a variabilei
dependente
Eroarea standard a 0,605530 F-statistic 78,81818
ecuatiei de regresie
Suma patratului 1,100000 Prob. (F-statistic) 0,003013
reziduurilor: S ( y− ŷ) 2

Coeficientul Durbin- 2,509091


Watson

Metodologia de calcul a indicatorilor din tabelul 4 este urmatoarea:


40

- Coeficientul de determinare ( R 2 )

)
Σ( y − y ) 2 1,10
R = 1−
2
= 1− = 0,963333
Σ( y − y )
2
30

Intervalul de localizare a coeficientului de determinare si respectiv a raportului de


corelatie este:

0 ≤ R 2, R ≤ 1
- Raportul de corelatie (R) se obtine prin extragerea radacinii patrate din
coeficientul de determinare, R = R 2 = 0,963333 = 0,9815 , si indica, pentru corelatia
studiata, o intensitate foarte puternica.

- Coeficientul de determinare corectat în functie de numarul gradelor de


libertate aferente celor doua sume de patrate,

 Σ (y − )y )2 Σ( y − y) 2   1,10 30 
R corectat = 1−   = 1−   = 0,951111
2
: :
 n−k n −1   5 − 2 5 − 1
în care:
k – numarul parametrilor din ecuatia de regresie
n – numarul observatiilor

- Estimatia erorii standard a ecuatiei de regresie ,

) 2
) Σ (y − y ) 1,10
σ y. )y = = = 0,60553
n−k 5− 2

- Suma patratelor reziduurilor sau erorilor,


) 2
Σ (y − y ) = 1,10

- Se testeaza ipoteza privind existenta autocorelatiei între valorile variabilei


reziduale cu ajutorul criteriului statistic DURBIN-WATSON,

∑ (u t - u t-1 )2
n

2,76
DW = t =2
= = 2,509 ; u t = ( y − y) ) t
)2
∑ (y - y)t
n
1,10
t =1
41

În acest caz indicatorul statistic DW are o marime care depaseste limita de 2,2 si
obtinem astfel informatia ca la nivelul valorilor reziduale se înregistreaza o usoara
autocorelatie, fapt ce poate afecta eficacitatea ecuatiei de regresie daca aceasta va fi folosita
pentru extrapolarea dinamicii studiate. O explicatie a acestei concluzii poate fi argumentata
prin faptul ca studiul corelatiei este realizat, pe sema unui volum prea mic de date.

- Valoarea medie a variabilei dependente,

Σ y 1 + 2 + 4 + 5 + 8 20
y= = = =4
n 5 5

- Estimatia abaterii standard a variabilei dependente,

Σ (y − y )
2
30
sy = = = 2,738613
n −1 5−1

- Verificarea semnificatiei raportului de corelatie cu ajutorul “Criteriului F”,


)
Σ ( y - y )2 28,90
F statistic = k - 1) 2 = 2 − 1 =
28,90000
= 78,81818
Σ( y - y ) 1,10 0,36666
n -k 5− 2

)
Σ(y − y )
2
)2
σ y) . y = - estimatia dispersiei dintre sisteme
k −1
) 2
)2 Σ(y − y )
σy.y = ) - estimatia dispersiei dintre interiorul sistemelor
n−k
Σ( y − y)
2
)
σ 2y = - estimatia dispersiei totale
n −1
) )
Σ (y − y )2 = Σ (y − y )2 + Σ (y − y )2
30 = 28,90 + 1,10

 Σy 2  Σy  2 
Σ (y − y )2 =  −    ⋅ n = Σ y 2 − ny 2 → 30 = 110 - 5 ⋅ 4 2
 n  n  
)
Σ (y − y ) = aΣy + bΣxy − ny 2 → 28,90 = −1,10⋅ 20 + 0,85⋅ 154− 5 ⋅ 42
2

) 2
Σ (y − y ) = Σy 2 − aΣ y − bΣ xy → 1,10 = 110− (− 1,10) ⋅ 20 − 0,85⋅ 154
42

F statistic = 78,81818 > F tabelar = 10,1


F tabelar = FP ; f1 = k −1; f2 = n −k = F0, 95 ; f1 = 2−1=1; f 2 =5− 2=3 = 10,1

Deoarece, F statistic > F tabelar se respinge ipoteza nula si în consecinta Raportul de


corelatie (R) difera în mod semnificativ de zero, iar corelatia studiata este reala.
Nota:
- Se mentioneaza ca, F statistic este un criteriu cu ajutorul caruia se testeaza
veridicitatea modelului (ecuatiei de regresie) în ansamblul sau. Prin aceasta testare se
verifica, de asemenea, ipoteza de valoare “zero” a tuturor coeficientilor de regresie,
respectiv a coeficientilor variabilelor independente, cu exceptia coeficientului care
dimensioneaza ordonata la origine. Valoarea critica a acestui indicator, (F statistic), este
2,7 ce corespunde unei probabilitati de 95% si care atesta ca cel putin un coeficient de
regresie este în mod semnificativ diferit de zero.
În cazul exemplului considerat de noi, probabilitatea de a accepta ipoteza nula este
foarte mica: 0,003013 sau 0,30%. Riscul de a formula o concluzie gresita este, în aceasta
situatie, practic inexistent.
- Regula de adunare a dispersiilor se verifica numai atunci când nu se tine seama de
numarul gradelor de libertate aferente fiecarei sume de abateri ridicate la patrat si deci
fiecare din cele trei sume de abateri ridicate la patrat se raporteaza la numarul
observatiilor (n).

Tabel pentru efectuarea calculelor intermediare


) ) )
Anul y y = -1,10 + 0,85x u = y− y u 2 = ( y − y) 2
1 1 ) 0,4 0,16
y 1 = -1,10 + 0,85(2) = 0,6
2 2 ) -0,3 0,09
y 2 = -1,10 + 0,85(4) = 2,3
3 4 ) 0 0
y 3 = -1,10 + 0,85(6) = 4,0
4 5 ) -0,7 0,49
y 4 = -1.10 + 0,85(8) = 5,7
5 8 ) 0,6 0,36
y 5 = -1,10 + 0,85(10) = 7,4
Tota 20 20,0 0 1,10
l
)
Anul ( u t − u t −1 ) 2 y−y ( )y − y )2 y−y (y − y)2 y2 xy
t = 2,…,n
1 -3,4 11,56 -3 9 1 2
2 0,49 -1,7 2,89 -2 4 4 8
3 0,09 0 0 0 0 16 24
4 0,49 1,7 2,89 1 1 25 40
5 1,69 3,4 11,56 4 16 64 80
Tota 2,76 0 28,90 0 30 110 154
l
43
)
Nivelurile calculate ale variabilei dependente ( y ) , determinate pe baza ecuatiei de
regresie, pot fi obtinute si în varianta de calcul matricial, astfel:

1 2   0,6 
   
1 4   2,3
 − 1,10
X ⋅ C = y = 1 6  ⋅ 
) 
 =  4,0
   0,85   
1 8   5,7 
1 10  7,4 
   

În tabelul 5 se prezinta, în mod comparativ, seria reala a variabilei dependente sau


)
rezultative (y) cu nivelurile, aceleiasi variabile, estimate pe baza ecuatiei de regresie ( y ),
precum si distributia erorilor (reziduurilor).
Tabelul 5
Situatia reziduurilor: marimile absolute si dispunerea grafica
Anul Nivelurile Nivelurile Reziduuri
reale calculate sau (Termenul de Plaja reziduurilor
)
(y) estimate*) ( y ) eroare)
)
SER01 SER01F u = y- y
1 1,00000 0,60000 0,40000 | . | * . |
2 2,00000 2,30000 -0,30000 | . * | . |
3 4,00000 4,00000 0,00000 | . * . |
4 5,00000 5,70000 -0,70000 |* . | . |
5 8,00000 7,40000 0,60000 | . | * |
)
+ 0,60553 = + σ y ⋅ )y
)
- 0,60553 = - σ y ⋅ )y
*) Nivelurile calculate sau estimate ale variabilei dependente sunt determinate pe baza
ecuatiei de regresie: y = a + bx

Nota: - Este foarte bine atunci când dimensiunea reziduurilor nu depaseste plaja delimitata
)
de o estimatie a erorii standard a ecuatiei de regresie,( ± σ y⋅ )y ).
- Conditia de normalitate a distributiei seriei erorilor (reziduurilor) este îndeplinita
implicit daca n > 40, atunci când sunt date de natura experimentala sau, n > 15 în cazul
seriilor dinamice.

Metode de analiza a corelatiei rangurilor

În cazul considerarii unui sistem interdependent de variabile pentru care se infirma


ipoteza corespondentei cu legea de repartitie normala, calculul intensitatii corelatiei se
realizeaza prin aplicarea unor metode neparametrice.
44

Prezumtia parametrica a corelatiei este eliminata prin ordonarea, în mod crescator


sau descrescator, a valorilor variabilei independente (X), urmând sa se opereze cu marimi
echivalente, denumite ranguri.
Metodele neparametrice permit masurarea intensitatii corelatiei atât pentru variabile
cantitative cât si pentru variabile calitative.
Optiunea pentru aplicarea acestor metode este, de obicei, adoptata atunci când se
studiaza corelatii între variabile economice cu variabile proprii unor domenii neeconomice
(demografice, psihologice, medicale, sportive etc. ).

Coeficientul lui Spearman

6 ⋅ Σd 2
θ = 1-
( )
n n 2 −1
, în care:

d - reprezinta diferenta dintre rangurile (numerele de ordine) corespunzatoare lui “y”


si respectiv ”x”, d = ry − rx
n - numarul nivelurilor aferente variabilelor statistice

Coeficientul lui Kendall

2 ⋅S
τ= , în care:
n (n − 1)
S = P − Q , P - este indicatorul concordantei sau numarul rangurilor superioare
termenului respectiv, numarate în continuare, aferente variabilei dependente - y,
Q - este indicatorul discordantei sau numarul rangurilor inferioare
termenului respectiv, numarate în continuare, aferente variabilei dependente - y.

Intensitatea corelatiei este apreciata în functie de marimea coeficientului, care poate


lua o valoare în intervalul –1, +1.

Exemplul 5
Tabelul 6
Situatia cheltuielilor cu publicitatea efectuate de 17 societati care comercializeaza
produse alimentare
Nr. Cheltuie Cifra Rangul Rangul
crt. li cu de pentru pentru d = d2 P Q S=
publicita afaceri variabil variabil = r x − ry = P-
-tea (mil. aX aY Q
(mil. lei) lei) - rx - - ry -
-X- -Y-
1 5 420 1 1 0 0 16 0 16
2 5 450 2 2 0 0 15 0 15
3 5 570 3 6 -3 9 11 3 8
45

4 6 490 4 4 0 0 12 1 11
5 6 580 5 7 -2 4 10 2 8
6 7 600 6 8 -2 4 9 2 7
7 7 610 7 10 -3 9 7 3 4
8 7 660 8 11 -3 9 6 3 3
9 7 690 9 12 -3 9 5 3 2
10 8 520 10 5 5 25 6 1 5
11 8 600 11 9 2 4 5 1 4
12 8 720 12 14 -2 4 3 2 1
13 8 730 13 15 -2 4 2 2 0
14 10 710 14 13 1 1 2 1 1
15 14 1.000 15 17 -2 4 0 2 -2
16 50 450 16 3 13 16 1 0 1
9
17 120 990 17 16 1 1 0 0 0
Tot 25 84
al 6

6 ⋅ Σd 2 6 ⋅ 256
θ = 1- = 1− = 0,686
(
n n −1
2
) (
17⋅ 172 − 1)
2⋅ S 2 ⋅ 84
τ= = = 0,618
n(n − 1) 17⋅ (17 − 1)
Coeficientii calculati ne permit sa apreciem ca între suma cheltuielilor efectuate cu
publicitatea, de catre cele 17 societati comerciale cuprinse în cercetare, si cifra de afaceri,
este o corelatie suficient de puternica, deoarece marimea lor se situeaza în intervalul 0,6 -
0,8.

Indicii statistici

Pentru fundamentarea deciziilor care vizeaza conducerea activitatii economice o


utilitate deosebita prezinta metoda indicilor datorita continutului informational pe care îl
ofera dimensiunea statistica numita indice, obtinuta ca rezultat al comparatiei realizate în
raport dinamic sau în statica.
Indicele statistic este o marime relativa care exprima una din urmatoarele categorii
de stari a fenomenelor economice:
- dinamica,
- gradul de îndeplinire a indicatorilor programati sau planificati,
- nivelul relativ al sarcinii propuse pentru cresterea sau diminuarea unui
indicator economico-financiar în segmentul de timp care urmeaza,
- raportul de marime dintre doi indicatori economico-financiari identici din
punct de vedere al continutului si modului de calcul, referitori la doua entitati teritoriale
similare (oras, judet, tara) sau doi agenti economici, dar coexistenti în timp.
46

Prin urmare, indicele este rezultatul raportului a doi indicatori statistici referitori la
acelasi fenomen economic, care, la rândul lor, pot fi prezentati în forma absoluta, relativa
sau medie. Indicele exprima modificarea relativa a marimii indicatorului de la numarator în
comparatie cu marimea de la numitorul raportului.

Din punct de vedere al sferei de cuprindere se disting doua categorii de indici


statistici: indici individuali sau simplii si indici de grup.

Indicele individual exprima raportul de marime între doi indicatori statistici care
caracterizeaza colectivitati de unitati (obiecte sau tipuri de produse,) omogene sau fenomene
cu acelasi continut economic. De exemplu, se poate calcula indicele individual al dinamicii
volumului fizic, al dinamicii preturilor sau al dinamicii valorii marfurilor vând ute de un
agent economic pentru fiecare fel de marfa, în mod distinct.

Formulele generale de calcul a indicilor individuali de dinamica sunt:


- pentru un indicator economic de tip cantitativ,
f
i (f ) = 1 ,
f0
- pentru un indicator economic de tip calitativ,
x
i (x ) = 1 ,
x0
- pentru un indicator economic complex,
fx
i fx = 1 1
f 0 x0

Indicele de grup exprima modificarea medie relativa a caracteristicii unei


colectivitati de unitati care difera între ele prin continut sau valoare de întrebuintare.
De exemplu, indicele de grup al dinamicii valorii marfurilor vândute de o societate
comerciala (indicele de grup al dinamicii cifrei de afaceri), care este un indice al unui
indicator statistic complex, se calculeaza ca raport între suma încasarilor (valoarea
vânzarilor) din perioada curenta sau de calcul si suma încasarilor (valoarea vânzarilor) din
perioada baza de comparatie, conform urmatoarei relatii,
Σq p
I qp = 1 1 , în care,
Σq 0 p 0
“q” este volumul fizic al vânzarilor pe tip uri de marfuri (indicator economic de tip
cantitativ - f),
“p” reprezinta pretul unitar de vânzare pentru fiecare fel de marfa (indicator economic
de tip calitativ - x).

Se precizeaza ca atât volumul fizic al vânzarilor cât si preturile unitare de vânzare


sunt neînsumabile în mod direct deoarece se refera la tipuri diferite de marfuri si în
consecinta pentru a evidentia influenta sau modificarea separata a fiecaruia din cei doi
47

factori (q si p) se calculeaza indici de grup factoriali prin aplicarea unui anumit sistem de
ponderare.

Prin urmare, în cazul unei relatii factorial-deterministe de forma y = fx, sau


Σ y = Σfx , pentru a dimensiona modificarea separata a fiecaruia din cei doi factori
(cantitativ- f si calitativ- x) care au determinat modificarea indicatorului complex (y) sau, într-
o alta forma de interpretare, folosita numai în cazul indicilor de grup factoriali, pentru a
cuantifica modificarea medie a indicatorului cantitativ si respectiv a celui calitativ se
utilizeaza, de regula, metoda substituirilor succesive (în lant) dar, în practica de analiza se
recurge uneori si la alte modalitati de ponderare.

În vederea sistematizarii, generalizarii si rigurozitatii aplicarii metodei substituirilor


succesive, indicatorii economici sunt grupati astfel:
- indicatori economici cantitativi (f) cum ar fi: volumul fizic al productiei sau al
prestatiilor de servicii (q); numarul mediu al salariatilor (N); timpul lucrat de salariati,
exprimat în om-ore (Nh); timpul lucrat de salariati, exprimat în om- zile (Nz); valoarea medie
a mijloacelor fixe (Mf); valoarea medie a activelor circulante (Ac); locuri capacitate de
cazare turistica existenta sau capacitatea construita si destinata pentru cazarea turistilor - (L);
locuri- zile capacitate de caza re turistica existenta (Le); locuri- zile capacitate de cazare
turistica disponibila, în functiune sau activa (Lz); turisti cazati în unitatile de cazare turistica
(T); numarul de zile-turisti (Tz) etc.;

- indicatori economici calitativi (x): pretul de productie sau tariful pe unitate fizica
de servicii (p); pretul de vânzare cu amanuntul (pv); cheltuielile cu forta de munca efectuate
în medie cu un salariat (cfm ); costul complet unitar (c); consumul specific de resurse
materiale si energetice exprimat în unitati naturale (m); cheltuielile la 1000 lei cifra de
afaceri (Ch); rata rentabilitatii financiare (Rrf); productivitatea muncii (w); numarul mediu
de rotatii a activelor circulante (n), durata medie în zile a unei rotatii a activelor circulante
(d) si în general toti indicatorii care exprima eficienta economica;

- indicatori economici complecsi (fx): cifra de afaceri (CA); marja comerciala (Mc);
productia exercitiului (Q); valoarea adaugata (VA), cheltuielile totale (Ct); veniturile totale
(Vt); cheltuielile totale cu forta de munca (CFM); cheltuielile totale cu materiile prime,
materialele si energia aferente activitatii productive, de comert sau de prestare a serviciilor
(CM); consumul total de materii prime, materiale si combustibil exprimat în unitati naturale
- pe feluri de resurse - (M); rezultatul din exploatare (Re); rezultatul net al exercitiului
financiar (Rn), rezultatul brut al exercitiului (Rb).
Aplicarea metodei substituirilor succesive implica respectarea urmatoarelor doua
reguli de baza:

1) individualizarea si dimensionarea influentei unui factor de tip cantitativ care a


determinat modificarea indicatorului complex se realizeaza prin ponderare (mentinere
constanta) cu factorul de tip calitativ baza de comparatie;
48

2) individualizarea si dimensionarea influentei unui factor de tip calitativ care a


determinat modificarea indicatorului complex se realizeaza prin ponderare cu factorul de
tip cantitativ comparat.

Facem precizarea ca, în cazul analizei pe factori a indicatorilor care caracterizeaza


eficienta utilizarii factorilor de productie directi sau primari (forta de munca, mijloacele fixe
si activele circulante materiale sau resursele materiale si energetice), consumati pentru
obtinerea unui rezultat economic, indicatorii de efect economic sunt tratati ca indicatori de
tip calitativ, iar cei de efort economic au semnificatia si se comporta ca indicatori de tip
cantitativ.

Formulele generale de calcul folosite în cazul metodei substituirilor succesive, atunci


când dorim sa cuantificam modificarile respective în marimi relative si absolute, sunt
urmatoarele:
- modificarea totala a fenome nului (indicatorului) complex:
f x Σf x
I fx = 1 1 , sau I fx = 1 1
f0 x 0 Σf 0 x 0

∆ = f 1 x1 - f 0 x 0 , sau ∆ = Σ f 1x 1 - Σ f 0 x 0
din care:
- influenta modificarii factorului de tip cantitativ:
fx Σf x
I (f ) = 1 0 , sau I (f ) = 1 0
f0x 0 Σf 0 x 0

∆ (f ) = f1 x 0 - f 0 x 0 , sau ∆ (f ) = Σf 1 x 0 - Σ f 0 x 0
- influenta modificarii factorului de tip calitativ:
f x Σf x
I (x ) = 1 1 , sau I (x ) = 1 1
f1 x 0 Σ f 1x 0

∆ (x ) = f 1x 1 - f 1x 0 , sau ∆ (x ) = Σf 1 x 1 - Σf 1x 0
urmând sa se verifice egalitatile:
I fx = I(f) ⋅ I( x )

∆ = ∆(f ) + ∆ (x )

În cazul concret al indicilor de grup factoriali care explica, în dinamica, influenta


modificarii volumului fizic si respectiv influenta modificarii preturilor de vânzare asupra
modificarii cifrei de afaceri, sau exprima modificarea medie a volumului fizic si respectiv
modificarea medie a preturilor de vânzare pot fi scrise urmatoarele relatii de calcul:
- indicele de grup al dinamicii volumului fizic,
49

Σq 1p 0
q =
I qp
Σq 0 p 0
- indicele de grup al dinamicii preturilor de vânzare,
Σq 1p 1
p =
I qp
Σq 1p 0

O alta procedura metodologica folosita pentru a calcula influenta factorilor care au


determinat modificarea unui indicator complex, este cunoscuta sub denumirea “Metoda
separarii actiunii izolate a fiecarui factor“.
Aplicarea principiului de separare a actiunii individuale a factorilor care determina
modificarea unui indicator complex – prezentat în functie de mai multi factori conform unei
relatii factorial-deterministe - se bazeaza pe un sistem de ponderare care utilizeaza în mod
invariabil indicatorii baza de comparatie, indiferent ca sunt de natura cantitativa sau
calitativa. Rezulta, în acest caz, si o influenta suplimentara care este cauzata de interactiunea
factorilor sau a actiunii simultane a factorilor.
Metoda substituirilor succesive, prezentata anterior, permite obtinerea unor rezultate
multumitoare numai atunci când modificarea indicatorului complex nu are o amplitudine
mare si în consecinta si influentele factorilor considerati sunt relativ mici.
De aceea, schema de evidentiere izolata a influentei factorilor asupra fenomenului
complex îsi gaseste utilitatea în special atunci când marimea absoluta a interactiunii
factorilor este mai importanta. Pornind de la aceste considerente, metoda separarii actiunii
izolate a fiecarui factor se recomanda a fi utilizata atunci când marimea relativa a influentei
interactiunii factorilor în cresterea totala a fenomenului complex depaseste 5%, adica:

∆(f )(x ) (f - f )(x - x )


⋅ 100 = 1 0 1 0 ⋅ 100 > 5% , în care:
∆ f 1x 1 - f 0 x 0
? (f )( x ) - modificarea absoluta a indicatorului complex datorita interactiunii factorilor, f
si x, considerati printr-o relatie determinista.

În cazul aplicarii metodei separarii actiunii izolate a fiecarui factor, pentru indicii de
grup pot fi scrise urmatoarele relatii de calcul:
- influenta indicatorului de tip cantitativ,
Sf x
I(f) = 1 0
Sf 0 x 0
- influenta indicatorului de tip calitativ,
Sf x
I(x) = 0 1
Sf 0 x 0
- influenta interactiunii factorilor (actiunea simultana a factorilor),
Sf x Sf x
I(f) ( x ) = 1 1 : 0 1
Sf 1 x 0 Sf 0 x 0
În acest caz se confirma urmatoarea relatie de recurenta:
50

Sf 1 x 1 Sf 1 x 0 Sf 0 x1  Sf x Sf x 
I fx = = ⋅ ⋅ 1 1 : 0 1
Sf 0 x 0 Sf 0 x 0 Sf 0 x 0  Sf 1x 0 Sf 0 x 0 

Daca se efectueaza o analiza factoriala prin aplicarea metodei separarii actiunii


izolate a fiecarui factor si se doreste sa se calculeze expresiile absolute ale modificarilor
aferente unui indicator complex, se opteaza, de regula la varianta repartizarii proportionale a
modificarii datorate interactiunii factorilor.(metoda cresterilor proportionale ). Relatiile
generale de calcul, utilizate în acest caz, sunt urmatoarele:
- modificarea absoluta totala a indicatorului complex:
∆ = f 1 x1 - f 0 x 0
din care:
- influenta modificarii factorului de tip cantitativ:
f1 x 0 - f 0 x 0
∆ (f ) = (f 1 x 0 - f 0 x 0 ) + (f - f )(x - x ) ,
(f1 x 0 - f 0 x 0 ) + (f 0 x 1 - f0 x 0 ) 1 0 1 0
- influenta modificarii factorului de tip calitativ:
f 0 x 1 - f0 x 0
∆ (x ) = (f 0 x1 - f 0 x 0 ) + (f - f )(x - x ) ,
(f1x 0 - f 0 x 0 ) + (f 0 x 1 - f 0 x 0 ) 1 0 1 0
verificându-se egalitatea:
∆ = ∆(f ) + ∆ (x )

Nota. Se mentioneaza ca rezultatul interactiunii factorilor nu poate fi interpretat în


forma economica clara si în aceste conditii el trebuie repartizat factorilor individualizati prin
relatia functionala a indicatorului complex sau analizat, folosind un anumit criteriu de
repartizare.
Daca se considera, în mod conventional, ca modificarea indicatorului complex
datorata interactiunii factorilor este un rezultat exclusiv al actiunii factorului de natura
calitativa se ajunge la forma de ponderare care corespunde metodei substituirilor succesive.
Prin urmare, se poate aprecia ca metoda substituirilor succesive este un caz particular al
metodei separarii actiunii izolate a fiecarui factor în conditiile alocarii în totalitate a
modificarii datorate interactiunii factorilor, asupra factorului de natura calitativa.
Cele mai folosite sisteme alternative de calcul a indicilor de grup factoriali sunt cele
propuse de Laspeyres (care, în mod invariabil, utilizeaza ca ponderi indicatorii factoriali
corespondenti din perioada de baza), Paasche (care, în mod invariabil, utilizeaza ca ponderi
indicatorii factoriali corespondenti din perioada de calcul), Fisher (care realizeaza media
geometrica a indicilor Laspeyres si Paasche) sau Edgeworth (în care caz ponderile sunt
reprezentate de media aritmetica simpla a indicatorilor factoriali corespondenti, din cele
doua perioade de referinta), astfel:

- indicele de grup al factorului de tip cantitativ,


Σ f 1x 0
metoda substituirilor succesive: I (f ) =
Σf 0 x 0
51

Σ f 1x 0
indicele Laspeyres : I (f ) =
Σf 0 x 0

Σ f1 x 1
indicele Paasche: I (f ) =
Σ f 0 x1

Σf 1 x 0 Σf 1x 1
indicele Fisher: I (f ) = ⋅
Σf 0 x 0 Σf 0 x 1

x1 + x 0
Σf 1
Σf ( x + x 0 )
indicele Edgeworth: I (f ) = 2 = 1 1
x + x 0 Σf 0 ( x 1 + x 0 )
Σf 0 1
2

- indicele de grup al factorului de tip calitativ,

Σf 1 x1
metoda substituirilor succesive: I (x ) =
Σf 1 x 0

Σf 0 x 1
indicele Laspeyres : I (x ) =
Σf 0 x 0
Σf 1 x1
indicele Paasche: I (x ) =
Σf 1 x 0

Σf 0 x 1 Σf 1x 1
indicele Fisher: I (x ) = ⋅
Σf 0 x 0 Σf 1 x 0

f1 + f 0
Σx 1
indicele Edgeworth: I (x ) = 2 = Σ x 1 (f 1 + f 0 )
f +f Σ x 0 (f 1 + f 0 )
Σx 0 1 0
2
52

Tabelul 7
Sistemul calculelor implicate în conditiile folosirii metodei substituirilor succesive pentru analiza
factoriala a dinamicii unui indicator statistic complex (y = fx)
Felul modificarii Indici Indici de grup Modificarea absoluta a Proportii ale modificarilor Contributia procentuala a
individuali indicatorului complex absolute factoriale în factorilor la formarea
modificarea absoluta totala a ritmului indicatorului
indicatorului statistic complex statistic complex
Modificarea totala a y1 Σy1 ∆ = f 1 x1 - f 0 x 0 y1
indicatorului statistic iy = = Iy = = Ry = ⋅ 100− 100
complex y0 Σy 0 ∆ = Σf 1 x 1 - Σf 0 x 0 - y0
din care: f x Σ f1x 1 Σy 1
= 1 1 = Ry = ⋅ 100− 100
f0 x 0 Σf0 x 0 Σy 0

- modificarea Σf1 x 0 ∆ (f ) = ( f1 - f 0 )x 0 ∆(f ) ∆ (f )


i (f ) = I (f ) = ∆ (f )% = R (f ) =
f1 ⋅ 100
(influenta) ⋅ 100
indicatorului statistic f0 Σf 0 x 0 ∆ (f ) = Σf1 x 0 - Σf 0 x 0 ∆ (y ) y0
de tip cantitativ ∆(f )
R (f ) = ⋅ 100
Σy 0
- modificarea Σ f 1x 1 ∆ (x ) = ( x1 - x 0 )f 1 ∆ (x ) ∆(x )
(influenta) i (x ) =
x1
I (x ) = ∆ (x )% = ⋅ 100 R (x ) = ⋅ 100
indicatorului statistic x0 Σf 1 x 0 ∆ (x) = Σf1 x1 - Σf1 x 0 ∆ (y ) y0
de tip calitativ ∆(x )
R (x ) = ⋅ 100
Σy 0
Relatii de recurenta i y = i (f ) ⋅ i(x ) I y = I( f ) ⋅ I(x ) ∆ = ∆ (f ) + ∆ ( x ) ∆(f )% + ∆( x )% = 100% Ry = R(f)+R(x)
-53-

Exemplul 6
Vânzarile de marfuri cu amanumntul ale unei societati comerciale sunt prezentate în tabel.
Tabelul 8
Situatia vânzarilor de marfuri pe feluri de marf uri
Felul Unitatea Perioada de baza Perioada de calcul
marfurilor de Cantitati Pretul Valoarea Cantitati Pretul Valoarea
vândute masura vândute de vânzarilor vândute de vânzarilor
( q0 ) vânzare ( q0p0 ) ( q 1) vânzare ( q 1 p1 )
( p0 ) -lei- ( p1 ) -lei-
-lei- -lei-
“A” m 500 10 5.000 600 9 5.400
“B” buc. 200 30 6.000 300 30 9.000
“C” kg 1.000 5 5.000 900 4 3.600
Total 16.000 18.000
Pe baza datelor din tabel se vor calcula indicii elementari (individuali) si indicii de grup ai
volumului fizic a vânzarilor, ai preturilor de vânzare si ai valorii vânzarilor, precum si
corespondentul în cifre absolute al modificarilor relative exprimate prin indicii de grup.
Se precizeaza ca pentru calculul indicilor de grup factoriali se va aplica metoda
substituirilor succesive.
Indicii individuali ai dinamicii volumului fizic,
- pentru marfa “A”: i(q ) = 1 =
q 600
= 1,2 ; 120% ; + 20%
q 0 500

- pentru marfa “B”: i(q ) = 1 =


q 300
= 1,5 ; 150% ; + 50%
q 0 200

- pentru marfa “C”: i(q ) = 1 =


q 900
= 0,9 ; 90% ; − 10%
q 0 1.000
Prin urmare, în perioada de calcul vânzarile au fost mai mari din punct de vedere cantitativ,
comparativ cu perioada de baza, cu 20% la marfa “A”, si cu 50% la marfa “B”, în timp ce
vânzarile din marfa “C” au scazut cu 10%.

Indicii individuali ai dinamicii preturilor de vânzare,


- pentru marfa “A”: i(p ) = 1 =
p 9
= 0,9 ; 90% ; − 10%
p 0 10

- pentru marfa “B”: i(p ) = 1 =


p 30
= 1, 0 ; 100%
p0 30

- pentru marfa “C”: i(p ) = 1 = = 0,8 ; 80% ; − 20%


p 4
p0 5
Indicii elementari calculati arata ca la marfa “B” pretul de vânzare s-a mentinut la acelasi
nivel atât în perioda de calcul cât si în perioda de baza, în timp ce la marfurile “A” si “C” pretul de
vânzare a scazut cu 10% si respectiv cu 20%.
-54-

Indicii individuali ai dinamicii valorii vânzarilor,

q1p1 5.400
- pentru marfa “A”: i qp = = = 1,08 ; 108% ; + 8%
q 0p 0 5.000
qp 9.00 0
- pentru marfa “B”: i qp = 1 1 = = 1, 5 ; 150% ; + 50%
q 0 p 0 6.00 0
qp 3.600
- pentru marfa “C”: i qp = 1 1 = = 0,72 ; 72% ; − 28%
q 0 p 0 5.000
Aceste rezultate evidentiaza faptul ca în perioada de calcul valoarea vânzarilor a înregistrat
cresteri fata de perioada de baza, cu 8% la marfa “A” si cu 50% la marfa “B”, în timp ce la marfa
“C” valoarea vânzarilor s-a diminuat cu 28%.
Indicele degrup al valorii vânzarilor,
Sq 1 p1 18.000
I qp = = = 1,125 ; 112,5% ; + 12,5%
Sq 0 p 0 16.000

Indicele degrup al volumului fizic a vânzarilor,


Σ q1 p 0 600 ⋅10 + 300 ⋅ 30 + 900 ⋅ 5 19 .500
q =
I qp = = =
Σq 0 p 0 16.000 16 .000
= 1,21875 ; 121,875% ; + 21,875%

Indicele degrup al preturilor de vânzare,


Σq 1 p1 18.000
p =
I qp = = 0,92308 ; 92,308% ; - 7,692%
Σq1 p 0 19.500
Rezultatele calculelor efectuate ne confirma faptul ca valoarea vânzarilor a crescut, în
perioada de calcul comparativ cu perioada de baza, cu 12,5%. Aceasta crestere a fost determinata,
în totalitate, de majorarea cantitatilor vândute. Daca preturile de vânzare s-ar fi mentinut la nivelul
înregistrat în perioada de baza, valoarea vânzarilor ar fi crescut cu 21,875%, dar reducerile operate
la preturile de vânzare a provocat o diminuare a valorii vânzarilor cu 7,692%. În acest caz, se
poate interpreta acest rezultat si în felul urmator: în perioada de calcul comparativ cu perioada de
baza preturile de vânzare s-au micsorat în medie cu 7,692%.

Pe baza sumelor folosite la calculul indicilor de grup putem determina, în continuare,


volumul absolut al modificarii valorice a vânzarilor, totale si pe seama celor doi factori, astfel:
- modificarea absoluta totala a valorii vânzarilor,
? qp = Sq 1 p1 − Sq 0 p 0 = 18. 000 − 16.000 = +2.000 lei
din care
- influenta modificarii volumului fizic al vânzarilor,
? (q ) = Sq 1 p 0 − Sq 0 p 0 = 19.500 − 16.000 = +3.500 lei
- influenta modificarii preturilor de vânzare,
? (p ) = Sq 1 p1 − Sq1 p 0 = 18.000 − 19.500 = −1.500 lei
-55-

Indicii de grup medii armonici

Daca se analizeaza formulele de calcul a indicilor de grup care exprima influenta


modificarii relativa a factorilor cantitativi si calitativi (indicii de grup factoriali), construiti pe baza
metodei substituirilor succesive, se observa ca pentru a fi calculati este necesara o marime
recalculata (Sf 1x 0 ). Determinarea directa a acestei sume este, uneori, dificil de realizat datorita
lipsei datelor în evidenta. Din acest motiv, pentru calculul indicilor de grup factoriali se utilizeaza ,
dupa caz, si formula mediei armonice sau a mediei aritmetice. Aceste relatii de calcul se obtin prin
transformarea corespunzatoare a indicilor de grup prezentati în forma agregata.
Un exemplu practic de calcul al indicelui de grup mediu armonic se refera la modificarea
medie a preturilor de vânzare, astfel:

p = I(p ) =
Sq1 p1 Sq1 p1 Sq1 p1
I qp = =
Sq1 p 0 1 1
S ⋅ q1 p1 S ⋅ q1 p1
p1 i (p)
p0

Prin urmare, indicele de gr up al preturilor de vânzare se calculeaza pe baza formulei


mediei armonice ori de câte ori ni se ofera date asupra indicilor individuali ai preturilor de vânzare
(i(p)) si respectiv asupra cifrei de afaceri din perioada de calcul, pe tipuri de produse si pe total
( q1 p1 si Σ q 1 p1 ).

Indicii de grup medii aritmetici

În cazul particular al indicelui de grup al volumului fizic al vânzarilor, în forma agregata,


indicatorul recalculat ( Sq 1p 0 ) se situeaza la numarator si în aceste conditii se va opera o
transformare constructiva la numaratorul indicelui, folosind forma mediei aritmetice, astfel:
q
S 1 q0p0
Sq1 p 0 q0 S[i (q ) ⋅ q 0 p 0 ]
q = I(q ) =
I qp = =
Sq 0 p 0 Sq 0 p0 Sq 0 p 0

Aceasta este formula indicelui de grup mediu aritmetic al dinamicii volumului fizic, în care
i(q) reprezinta indicii individuali ai volumului fizic iar q 0 p 0 valoarea vânzarilor pe feluri de
marfuri.

Indicii de grup calculati ca raport între marimi medii

Indicii de grup determinati prin raportarea a doua marimi medii ofera posibilitatea
compararii în timp sau în raport cu planul a marimilor medii, pentru al caror calcul se poate
însuma factorul de tip cantitativ.
-56-

În lucrarile de calcul statistic se folosesc frecvent indici de grup calculati ca raport între
marimi medii în vederea analizei dinamicii sau pentru analiza îndeplinirii indicatorilor programati
privind productivitatea muncii, costul unitar, cheltuielile totale la 1000 lei venituri totale etc..
Formula generala de calcul a acestor indici de grup este:
x Sf x Sf x Sf 1x 1 Sg 1x 1
Ix = 1 = 1 1 : 0 0 = =
x0 Sf 1 Sf 0 x 0 ⋅ Sf 1 Sg 0 x 0
în care,
f
g= reprezinta structura factorului (indicatorului) cantitativ însumat.
Sf
Relatia generala de calcul a indicelui de grup reprezentat prin raportul a doua marimi medii
este denumit indice de grup cu structura variabila al modificarii indicatorului calitativ
mediu. Asupra indicelui de grup cu structura variabila exercita influenta doi factori:
a) modificarea structurii factorului de tip cantitativ (g).
b) modificarea nivelului factorului calitativ la fiecare unitate statistica în parte (x),

Prin urmare, este necesar sa remarcam ca, modificarea absoluta totala a indicatorului de tip
cantitativ nu este un factor de influenta asupra modificarii indicatorului calitativ mediu.

Daca dorim sa cunoastem dinamica relativa a indicatorului calitativ mediu datorata


modificarii structurii factorului cantitativ însumat, în formula indicelui cu structura variabila
consideram constant factorul calitativ individual din perioada de baza ( x 0 ) si obtinem indicele de
grup al schimbarii structurii,
Sg x
I xg = 1 0
Sg 0 x 0
Daca dorim, însa, sa calculam dinamica relativa a indicatorului calitativ mediu datorata
modificarii factorului calitativ individual, în formula indicelui cu structura variabila consideram
constant factorul de tip cantitativ (structura indicatorului cantitativ) din perioada de calcul ( g1 ) si
obtinem indicele de grup cu structura fixa,
Sg x
I xx = 1 1
Sg1x 0

Între indicii de grup cu structura variabila, al schimbarii structurii si cu structura fixa se


poate scrie urmatoarea relatie,
I x = I xg ⋅ I xx

Pe baza relatiilor de calcul a indicilor de grup obtinuti ca raport între marimi medii se
poate determina modificarea absoluta a indicatorului rezultativ (complex), ( Sfx ) ca urmare a
modificarii indicatorului calitativ mediu ( ? fxx ), a structurii indicatorului cantitativ însumat ( ? fxg ) si
respectiv a indicatorului calitativ individual ( ? fxx ), astfel:
? fxx = Sf 1 x 1 − x⋅ Sf 1 = (x1 − x 0 ) Sf 1
-57-

? fxg = (Sg1x 0 − Sg 0 x 0 ) Sf 1

? fxx = (Sg 1 x 1 − Sg 1 x 0 ) Sf1


Exactitatea calculelor este confirmata de urmatoarea relatie de recurenta:
? fxx = ? fxg + ? fxx
Exemplul 7
Pentru exemplificarea calculului indicilor determinati ca raport între doua marimi medii
vom utiliza datele sintetizate în “Contul de profit si pierdere” al unui agent econo mic.
Tabelul 9
Situatia veniturilor si cheltuielilor grupate pe feluri de activitati
Felul activitatii Venituri (mil. lei) Cheltuieli (mil. lei)
(Sursa veniturilor Perioada de Perioada de Perioada de Perioada de
si destinatia baza calcul baza calcul
cheltuielilor)
Exploatare Ve 0 8.000 Ve 1 10.000 Ce0 6.000 Ce 1 7.500
Financiara Vf0 500 Vf1 300 Cf0 1.000 Cf1 1.400
Extraordinara Vex0 1.500 Vex1 1.700 Cex0 1.000 Cex1 1.100
Total Vt 0 10.000 Vt 1 12.000 Ct 0 8.000 Ct 1 10.000
Pe baza acestor date ne propunem sa analizam dinamica cheltuielilor totale la 1.000 lei
venituri totale prin prisma modificarii structurii veniturilor totale si a cheltuielilor la 1000 lei
venituri pe feluri de activitati.

Pentru a pune în evidenta factorii enuntati, cheltuielile totale la 1.000 lei venituri totale
sunt prezentatate prin relatia urmatoare:
Ce + Cf + Cex S (Vi⋅ C/ 1000 )
= S (g Vt ⋅ C/ 1000 )
Ct
Ct/ 1000 = ⋅1000 = ⋅ 1000 =
Vt Ve + Vf + Vex SVi
Nota: Se mentioneaza ca indicatorul cheltuieli totale la 1.000 lei venituri totale este o marime
relativa de intensitate si care prin continutul si forma sa derivata de calcul are semnificatia de
valoare medie

În acest caz cheltuielile totale la 1.000 lei venituri totale (Ct/ 1000 ) sunt obtinute ca o
medie aritmetica ponderata a cheltuielilor la 1000 lei venituri calculate pe feluri de activitati
Vt
( C/ 1000 ), iar ponderea este reprezentata de structura veniturilor totale ( g ), asa cum rezulta din
ultima forma de scriere a indicatorului calitativ mediu, în care,
- Ct/ 1000 este indicatorul calitativ mediu
- C/ 1000 este indicatorul calitativ individual
- g Vt este structura indicatorului cantitativ însumat
- Vt = Venituri totale;
- Ct = Cheltuieli totale;
Vi
- g Vt =
SVi
-58-

Tabel cu calculele intermediare necesare


Structura Structura Cheltuielile la Cheltuielile la
veniturilor veniturilor 1000 lei 1000 lei
totale din totale venituri venituri pe g1Vt ⋅ C/ 1000 0
Felul perioada de din pe feluri de feluri de
activitatii baza perioada activitati, în activitati,
g Vt de perioda de în perioda de
0
calcul baza calcul
g 1Vt C/10000 C/10001
Exploatare 0,80000 0,83333 750,00 750,00 625,0
Financiara 0,05000 0,02500 2.000,00 4.666,67 50,0
Extraordinara 0,15000 0,14167 666,67 647,06 94,4
Total 1,00000 1,00000 800,00 833,33 769,4

Indicele de grup cu s tructura variabila al cheltuielilor totale la 1000 lei venituri totale,

Ct/ 1000 1 S(g1Vt ⋅ C/ 1000 1 ) 833 ,3


I Ct/1000 = = = = 1,04162 ; 104,162% ; + 4,162%
Ct/ 1000 0 S(g 0Vt ⋅ C/ 1000 0 ) 800 ,0
Indicele de grup al schimbarii structurii,
S(g1Vt ⋅ C/ 1000 0 ) 769 ,4
Ct/ 1000
Ig = = = 0,96175 ; 96,175% ; − 3,825%
0 ⋅ C/ 1000 0 )
S(g Vt 800,0

Indicele de grup cu structura fixa,

S(g 1Vt ⋅ C/ 1000 1 ) 833 ,3


I Ct/ 1000
= = = 1,08305 ; 108,305% ; + 8,305%
S(g1Vt ⋅ C/ 1000 0 ) 769 ,4
C/ 1000

I Ct/1000 = I Ct/
g ⋅ I C/ 1000 = 0 ,96175 ⋅1,08305% = 1,04162
1000 Ct/ 1000

Varianta calculelor reprezentând corespondentul în cifre absolute al modificarilor relative


exprimate de indicii de grup, este:
Modificarea totala a cheltuielilor totale la 1.000 lei venituri totale:
? = Ct/ 1000 1 − Ct/ 1000 0 = 833 ,3 − 800 ,0 = + 33,3 lei
? = ? (g) + ? (C/ 1000 ) = -30,6 + 63,9 = +33,3 lei
din care:
- influenta modificarii structurii veniturilor totale
? (g ) = S (g ⋅ C/ 1000 0 ) − S (g Vt
Vt
1 0 ⋅ C/ 1000 0 ) = 769, 4 − 800 ,0 = −30 ,6 lei

- influenta modificarii cheltuielilor la 1000 lei venituri pe feluri de activitati


∆ (C/ 1000 ) = S (g1Vt ⋅ C/ 1000 1 ) − S (g1Vt ⋅ C/ 1000 0 ) = 833,3 − 769 ,4 = +63,9 lei
-59-

Calculele efectuate ne permit sa constatam ca cheltuielile totale efectuate pentru 1.000 lei
venituri totale au crescut în perioada de calcul comparativ cu nivelul înregistrat în perioada de
baza cu 4,162%, respectiv cu 33,3 le i. Aceasta majorare este motivata astfel:
- cresterea cheltuielilor la 1000 lei venituri pe feluri de activitati a determinat o crestere a
cheltuielilor totale la 1.000 lei venituri totale cu 8,305% cu un corespondent valoric de 63,9 lei la
fiecare 1000 le i venituri,
- în timp ce schimbarea structurii veniturilor totale a favorizat reducerea cheltuielilor totale
la 1.000 lei venituri totale cu 3,825% sau cu 30,6 lei. Se observa ca a crescut proportia veniturilor
obtinute din exploatare, de la 80,00% la 83,33%, activitate la care nivelul cheltuielilor la 1.000 lei
venituri este mai mic comparativ cu nivelul relativ mediu general, care în perioada de calcul este
de 833,33 lei, fapt ce a avut un impact pozitiv asupra reducerii nivelului relativ al cheltuielilor
totale.
Activitatea financiara desfasurata de acest agent economic este finalizata cu pierderi
importante care sunt acoperite, în primul rând, pe seama rezultatelor financiare pozitive obtinut
din activitatea de exploatare.

Forma absoluta a modificarii cheltuielilor totale ca indicator complex sau rezultativ este
oferita de urmatoarele calcule,
- modificarea absolu ta a cheltuielilor totale datorata cresterii cheltuielilor totale la 1000 lei
venituri totale este,
 833,3 − 800,0 
Ct/ 1000 = (Ct/ 10001 − Ct/ 10000 ) SVt 1 = 
? Ct  ⋅ 12.000.000.000 =
 1000 
= +399,600 mil. lei
Ct/ 1000 = ? g + ?
? Ct = −367,200 + 766,800 = +399,600 mil. lei
Ct Ct
C/ 1000

din care:
- influenta modificarii structurii veniturilor totale,
? Ct [ Vt Vt
]
g = S (g 1 ⋅ C/ 1000 0 ) − S(g 0 ⋅ C/ 1000 0 ) ⋅ SVt 1 = (769, 4 − 800 ,0 ) SVt 1 =

 769 ,4 − 800 ,0 
=  ⋅ 12.000 .000 .000 = - 367,200 mil. lei
 1000
- influenta modificarii cheltuielilor la 1000 lei venituri pe feluri de activitati,
[( ) ]
C/ 1000 = S g 1 ⋅ C/ 10001 − S(g 1 ⋅ C/ 10000 ) ⋅ SVt 1 =
? Ct Vt Vt

 833,3 − 769,4 
=  ⋅ 12.000.000.000 = + 766,800 mil. lei
 1000 

Indicii teritoriali

Indicele teritorial rezulta din compararea indicatorilor statistici referitori la doua sau mai
multe unitati teritoriale similare (oras, judet, tara etc.) sau din compararea unui indicator
determinat pe o unitate teritoriala cu indicatorul corespunzator care se refera la întregul teritoriu.
Într-un sens mai general, indicele teritorial este o marime relativa de coordonare obtinuta din
-60-

compararea a doua fenomene de aceeasi natura coexistente în timp, dar situate în diferite domenii
spatiale.
Formula generala dupa care se calculeaza un indice individual teritorial este urmatoarea:
x x
i xA/B = A sau i xB/A = B
xB xA
în care:
x A - reprezinta marimea fenomenului cercetat în unitatea teritoriala “A”,
x B - reprezinta marimea fenomenului cercetat în unitatea teritoriala “B”.
Daca valorile caracteristicii studiate (x) se pot generaliza la nivelul celor doua colectivitati
pozitionate în teritorii diferite (A si B) sub forma marimilor medii, rezulta urmatoarele forme de
indici teritoriali:

xA xB
x A/B = sau x B/A =
xB xA
în care:
Sx Ai Sx Bi
xA = , xB =
nA nB
În cazul comparatiilor teritoriale se poate considera în egala masura ca baza de comparatie
oricare din teritoriile ”A” si ”B”.În acelasi timp, trebuie sa mentionam ca, la calculul indicilor
teritoriali nu ne este indiferenta ordinea comparatiei, aceasta depinde în întregime de sarcina de
cunoastere la care trebuie sa raspunda fiecare indice în parte.
Indicii teritoriali, de grup, se calculeaza în aceleasi conditii metodologice folosite al
calculul indicilor care respecta regulile metodei substituirilor succesive, astfel:
- pentru indicatorul complex,
Sf x Sf x
I fxA/B = A A sau I fxB/A = B B
Sf B x B Sf A x A

- pentru indicatorul de natura cantitativa,


Sf x Sf x
I fx(f ) A/B = A B sau I fx(f ) B/A = B A
Sf B x B Sf A x A

- pentru indicatorul de natura calitativa,


Sf x Sf x
I fx(x ) A/B = A A sau I fx(x )B/A = B B
Sf A x B Sf B x A

Problema ponderilor, în cazul indicilor teritoriali, se rezolva numai în urma unei analize
atente a fenomenului cercetat, deoarece o ponderare nerationala poate conduce la rezultate
contradictorii sau chiar paradoxale. În aceste conditii se propun si alte metode de ponderare, cum
ar fi:
- metoda ponderilor standard. Aceasta metoda exclude sistemul de ponderare al indicilor
teritoriali cu marimile unuia din teritoriile comparate, ea presupune alegerea unor ponderi care sa
-61-

se refere la un teritoriu mult mai larg, care cuprinde ambele zone teritoriale într-o expresie medie,
astfel:
- pentru indicele teritorial al indicatorului de natura cantitativa,
S (f A ⋅ X ) S (f B ⋅ X )
I fx(f ) A/B = sau I fx(f ) B/A =
S(f B ⋅ X ) S(f A ⋅ X )
- pentru indicele teritorial al indicatorului de natura calitativa,
S (F⋅ x A ) S(F⋅ x B )
I fx(x )A/B = sau I fx(x )B/A =
S(F⋅ x B ) S(F⋅ x A )
în care:
X este ponderea standard calitativa, determinata ca medie aritmetica ponderata,
f x +f x
X= A A B B,
fA + fB
F este ponderea standard cantitativa , determinata ca medie aritmetica simpla, astfel:
f +f
F= A B
2
Folosirea ponderilor standard elimina, în principiu, influenta subiectivismului la alegerea
ponderilor si deci asupra rezultatului obtinut prin calculul indicelui teritorial. Totusi, se precizeaza
ca la alegerea tipului de ponderare este indicat sa se tina seama de particularitatile fenomenului al
carui indice teritorial urmeaza a fi calculat.

Analiza statistica a seriilor dinamice

Sistemul de indicatori ai seriilor dinamice

O serie dinamica este formata din mai multi indicatori de nivel care dau masura
fenomenului respectiv la diferite momente sau pe anumite intervale de timp. Analiza evolutiei
unui fenomen care este prezentat sub forma unei serii dinamice se poate efectua prin simpla
comparare a indicatorilor, prin analiza reprezentarii grafice, prin prelucrarea datelor initiale si
obtinerea unor indicatori derivati exprimati în marimi absolute, marimi medii si marimi medii cât
si prin ajustarea seriei dinamice cu ajutorul unor metode specifice.
Sistemul indicatorilor statistici cu ajutorul carora pot fi caracterizate seriile dinamice, sunt:
- indicatorii exprimati prin marimi absolute:
- indicatorii de nivel
- indicatorii modificarilor absolute care pot fi calculati în doua variante: cu baza
fixa si cu baza variabila (în lant)
- indicatorii exprimati prin marimi relative
- indicii de dinamica calculati cu baza fixa sau cu baza variabila (în lant)
- ritmul dinamicii cu baza fixa sau cu baza variabila (în lant)
- valoarea absoluta a unui procent din ritmul dinamicii
- indicatorii exprimati prin marimi medii
- nivelul mediu
- cresterea sau scaderea medie
-62-

- indicele mediu de crestere sau de scadere


- ritmul mediu de crestere sau de scadere

Indicatorii exprimati prin marimi absolute

Indicatorii exprimati prin marimi absolute sunt prezentati în unitati de masura concrete (lei,
tone, metri etc.), specifice fenomenului a carui evolutie este analizata.
Indicatorii de nivel sunt reprezentati prin datele initiale, obtinute prin observare, care
dimensioneaza volumul caracteristicii studiate ( x i ).
Indicatorii modificarilor absolute pot fi calculati în doua variante:
- cu baza fixa: ? i/1 = x i − x 1 ; i = 2, 3, 4, ..., n
- cu baza variabila (în lant): ? i/i −1 = x i − x i −1

Indicatorii exprimati prin marimi relative

Pe baza indicatorilor initiali exprimati în marimi absolute se pot calcula indicatori relativi,
care dau o consistenta distincta concluziilor pe care le genereaza. Indicatorii exprimati prin marimi
relative sunt:
- indicii de dinamica:
x
- cu baza fixa: I i/1 = i ; i = 2, 3, 4, ..., n
x1
x
- cu baza variabila (în lant): I i/i −1 = i
x i −1
- ritmul dinamicii:
x x − x1
- cu baza fixa: R i/1 = i ⋅100 −100 = i ⋅ 100
x1 x1
x x − x i−1
- cu baza variabila (în lant): R i/i−1 = i ⋅ 100 − 100 = i ⋅ 100
x i−1 x i−1
- valoarea absoluta a unui procent din ritmul dinamicii
? xi − x1 x
- cu baza fixa: Vi/ 1 = i/ 1 = = 1
R i/ 1 x i − x 1 100
⋅ 100
x1
? x i − x i −1 x
- cu baza variabila (în lant): Vi/i−1 = i/i−1 = = i −1
R i/i−1 x i − x i −1 100
⋅100
x i −1

Indicatorii exprimati prin marimi medii

Varietatea nivelurilor absolute initiale, a modificarilor individuale exprimate în cifre


absolute sau relative ce caracterizeaza evolutia unui fenomen de la un segment de timp la altul
-63-

care formeaza perioada considerata pentru a fi cercetata, conditioneaza necesitatea generalizarii


acestora cu ajutorul indicatorilor medii.
Indicatorii exprimati prin marimi medii ofera o forma sintetica a evolutiei unui fenomen
înregistrata pe parcursul unei perioade de timp date si permit totodata conturarea tendintelor
generale de dezvoltare prin eliminarea influentelor datorate unor factori întâmplatori. Acesti
indicatori sunt:

a)- Nivelul mediu


Nivelul mediu al unei serii dinamice se calculeaza prin procedee distincte, dupa cum
aceaste este de intervale de timp sau de momente, asfel
- pentru o serie dinamica de intervale de timp nivelul mediu se calculeaza cu ajutorul
Sx i
mediei aritmetice simple: x =
n
- în cazul seriilor dinamice de momente, nivelul mediu al indicatorilor prezentati în serie
dinamica se calculeaza cu ajutorul mediei cronologice simple sau ponderate dupa cum intervalele
de timp dintre momente sunt egale sau inegale.

b)- Cresterea sau scaderea medie


Cresterea sau scaderea medie absoluta a unui fenomen pe parcursul perioadei supuse
studiului se calculeaza prin aplicarea mediei aritmetice simple la modificarile absolute cu baza în
lant, asfel:
S? i/i−1 ? n/1 x n − x1
? = = =
n−1 n−1 n−1

c)- Indicele mediu de crestere sau de scadere


Indicele mediu de crestere sau de scadere (I ) se calculeaza pe baza mediei geometrice
simple, a mediei geometrice ponderate, a mediei geometrice corectate sau a metodei autoregresiei,
dupa caz.
Indicele mediu caracterizeaza modificarea medie a unui fenomen, care a avut loc de la un
segment de timp la altul pe parcursul perioadei de timp supuse cercetarii, în numar de ori de
crestere sau de scadere.

d)- Ritmul mediu de crestere sau de scadere


Ritmul mediu de crestere sau de scadere a unui fenomen (R ) se determina în forma
procentuala pe baza indicelui mediu, astfel:
R = I ⋅100 − 100
Ritmul mediu exprima cu cât a crescut sau a scazut fenomenul în perioada studiata.
-64-

Ajustarea seriilor dinamice

Evolutia fenomenelor social-economice, modificarile care se produc de la un segment de


timp la altul, sunt influentate de un complex de factori esentiali si neesentiali, care pot actiona într-
o paleta larga de forme: concomitent sau succesiv; cu o intensitat e mai mare sau mai mica; în
acelasi sens sau în sensuri diferite.
Factorii esentiali sau de natura obiectiva imprima fenomenului o evolutie bine determinata,
care este reprezentata printr-o traectorie de dezvoltare constituita din doua componente: tendinta
generala si tendinta periodica sau sezoniera. Factorii neeesentiali au o reprezentare aleatoare în
structura factorilor de influenta si din acest motiv, din punct de vedere statistic, sunt considerati ca
formeaza “termenul de eroare”.
Analiza unei serii dinamice impune cunoasterea clara a tendintei generale pe care o
înregistreaza un fenomen sub actiunea factorilor obiectivi, amploarea modificarilor de natura
sezoniera dar si modificarea cauzata de factorii cu actiune întâmplatoare. Acest proces de
cunoastere complexa este denumit, “ajustarea seriilor dinamice” sau “modelarea statistica a
seriilor dinamice”.
Pentru ajustarea seriilor dinamice pot fi utilizate mai multe modalitati statistice, si anume:
- metoda de ajustare grafica
- metode de ajustare mecanica
- metode de ajustare analitica

A) Metoda de ajustare grafica

Ajustarea grafica se bazeaza pe reprezentarea grafica a seriei dinamice sub forma


cronogramei (historiogramei) si trasarea vizuala a unei linii drepte sau curbe, dupa caz, care este
considerata ca sintetizeaza în mod corespunzator evolutia fenomenului respectiv.
Aceasta metoda are ca suport metodologic intuitia cercetatorului de a identifica tendinta
generala atunci când linia empirica nu sugereaza în mod direct imaginea tendintei fenomenului.
Ajustarea grafica are un caracter orientativ si serveste, de regula, pentru alegerea functiei
matematice (ecuatiei de trend) când se procedeaza la aplicarea unor metode analitice de ajustare.

B) Metode de ajustare mecanica

Ajustarea mecanic a a seriilor dinamice se realizeaza prin aplicarea în mod mecanic a unei
metodologii sau formule considerata ca fiind adecvata pentru seria dinamica supusa analizei.
Metodele de ajustare a seriilor dinamice cu un suport metodologic mecanic de calcul sunt:
- metoda mediilor mobile
- metoda sporului (scaderii) mediu
- metoda indicelui mediu de crestere (scadere)

Ajustarea cu ajutorul mediilor mobile permite caracterizarea tendintei generale a evolutiei


unui fenomen prin eliminarea totala sau numai partiala a variabilitatii cauzata de factorii cu
actiune sezoniera precum si a termenului rezidual. Acest deziderat se realizeaza prin înlocuirea
indicatorilor reali ai seriei dinamice cu indicatori medii calculati pe baza unui numar determinat de
-65-

indicatori ai seriei initiale. Subperioadele de timp pentru care se calculeaza mediile mobile ramân
egale ca marime, deplasându-se de la primul nivel al seriei dinamice cu câte un nivel la calculul
fiecarei medii, pâna la includerea în calcul a nivelului final al seriei.
Numarul nivelurilor reale care intra în calculul mediilor mobile se stabileste dupa o
prealabila analiza calitativa a fenomenului studiat. În acest sens se mentioneaza ca este preferabil
sa se aleaga acel numar de termeni ai seriei dinamice care corespund unor perioade de schimbari
reale în evolutia fenomenului respectiv.

Ajustarea cu ajutorul sporului (scaderii) mediu


Procedeul sporului mediu se aplica cu suficienta încredere pentru ajustarea unei serii
dinamice, atunci când modificarile absolute calc ulate cu baza în lant din indicatorii de nivel
initiali, sunt apropiate ca marime între ele. Daca este îndeplinita aceasta conditie, ajustarea se
realizeaza cu ajutorul urmatoarei relatii:
y i = x B + (i − B ) ⋅ ? , în care,
i = 1, 2, 3, ... , n
yi reprezinta valoarea ajustata, care înlocueste termenul real x i
x B este unul din indicatorii reali, ales ca baza de ajustare, B = 1, 2, 3, ... , n . Nivelul baza
de ajustare se alege în urma unei ajustari grafice astfel: nivelul real care se apropie cel mai mult de
o linie conventionala considerata ca exprima în mod satisfacator evolutia fenomenului se alege ca
nivel baza de ajustare.
∆ este sporul sau diminarea medie absoluta

Ajustarea cu ajutorul indicelui mediu de crestere (scadere)


Aceasta metodologie de ajustare are ca suport aproximarea indicatorilor unei serii
dinamice pe baza relatiei existente între primul nivel al seriei ( x1 ), indicele mediu de crestere sau
scadere (I ) si nivelul final al seriei dinamice ( x n ).
Ajustarea cu ajutorul indicelui mediu de crestere (scadere) este recomandata atunci când
indicii de crestere (scadere) calculati cu baza în lant au valori apropiate ca marime între ei.
În aceste conditii relatia pentru ajustare este,
y i = x B ⋅ (I ) , în care,
i −B

I este indicele mediu calculat cu media geometrica

C) Metode de ajustare analitica

Pentru a caracteriza evolutia si tendinta fenomenelor cu ajutorul metodelor analitice se


folosesc serii dinamice de date statistice referitoare la perioade reprezentative de timp. Daca este
necesar, indicatorii analizati sunt supusi unor prelucrari preliminare pentru a asigura
comparabilitatea acestora în timp prin operarea acelor corectii care au în vedere, de exemplu,
nivelul indicelui inflatiei, respectiv transformarea indicatorilor din marimi nominale sau curente în
marimi reale prin raportarea nivelului nominal la indicele inflatiei sau, pentru a corecta indicatorii
înregistrati pe segmente de timp prin prisma numarului de zile aferente pentru a se referi la durate
perfect comparabile etc..
-66-

De asemenea, comparabilitatea indicatorilor prezentati în serie dinamica se asigura prin


folosirea aceleiasi metodologii de calcul, exprima fenomene cu acelasi continut, definite în acelasi
mod si se refera la structuri organizatorice similare.

Daca ne referim la evolutia unui indicator economico- financiar acesta are mai multe
componente care îsi pun amprenta pe marimea nivelurilor individuale, si anume:
- o componenta are un continut esential, marcheaza tendinta obiectiva sau evolutia
generala datorata cresterii sau regresului economic înregistrat în plan economic pe
termen lung,
- o componenta exprima modificarea ciclica, conjuncturala, sesizabila pe perioade mari
de timp (5, 10, 15 sau 20 de ani), determinata de factori care acumuleaza periodic efecte
ale contradictiilor obiective ce au loc în activitatea economico-sociala si politica,
-o componenta este reprezentata de manifestarea cu caracter sezonier, lunara sau
trimestriala,
- o componenta se refera la variatiile cu caracter întâmplator, neesentiale (variatia
reziduala sau termenul de eroare).
Toate activitatile si subactivitatile economice sunt influentate, într-o masura mai mare sau
mai mica, de factori naturali, de factori economici constanti sau cu caracter conjunctural, precum
si de factori dirijati prin decizii legislative, care pot determina în consecinta oscilatii ale marimii
indicatorilor economici si financiari.
Succesiunea anotimpurilor exercita în mod evident o anumita influenta asupra unor
activitati economice (transport, agricultura, unele ramuri industriale, turism) printr-o oferta diferita
de produse sau printr-o solicitare sezoniera diferentiata din partea beneficiarilor de produse si
servicii. În general, fiecare an calendaristic se constituie ca un ciclu economic prezentând aceleasi
regularitati sezoniere de crestere si de reducere a activitatii, dar pe fondul unei evo lutii si tendinte
medii a volumului de activitate.
Metodele analitice de ajustare constau în înlocuirea nivelurilor reale ale seriei dinamice cu
niveluri calculate (teoretice) pe baza unei ecuatii de tendinta, ai carei parametrii sunt estimati, de
regula, prin metoda celor mai mici patrate.
Alegerea ecuatiei de tendinta, care sa corespunda cât mai bine formei reale a evolutiei
fenomenului se face pe baza analizei atente a reprezentarii grafice a indicatorilor de nivel initiali
sau prin calculul unor indicatori derivati care caracterizeaza seria dinamica, astfel:
- daca modificarile absolute calculate cu baza în lant sunt apropiate ca marime , tendinta
poate fi sintetizata prin ecuatia liniei drepte, y = a + bt , în care ”t” este variabila timp pentru care
se acorda valori conventionale, iar “a” si ”b” sunt parametrii ecuatiei care o localizeaza în plan;
- daca diferentele de ordinul n, n>1, calculate pe baza indicatorilor de nivel, sunt apropiate
ca marime între ele, ecuatia de tendinta poate fi o parabola de gradul n, adica:
y = a + bt + ct 2 + ... + zt n ;
- daca indicii de dinamica calculati cu baza în lant au valori apropiate între ele, se poate
considera ca evolutia fenomenului respectiv urmeaza o curba de tipul functiei exponentiale,
y = ab t ;
-67-

- daca modificarile absolute calculate cu baza în lant, folosind logaritmii indicatorilor de


nivel reali, sunt aproximativ egale între ele, atunci ajustarea seriei dinamice se poate face cu
ajutorul urmatoarei ecuatii: log y = a + bt ;
- daca indicii de dinamica calculati cu baza în lant din logaritmii indicatorilor de nivel
reali, sunt de marimi apropiate între ele, ajustarea poate fi efectuata pe baza ecuatiei: log y = ab t .
Reprezentarea grafica a seriei dinamice ofera, de asemenea, solutii utile pentru alegea
formei ecuatiei de tendinta.

Exe mplul 8
Pentru exemplificarea metodelor analitice de analiza a evolutiei, sezonalitatii si tendintei
cifrei de afaceri pe care a înregistrat-o un agent economic, s-a constituit o serie dinamica cu
niveluri trimestriale pe o perioada de trei ani, iar în final pe baza analizei propuse ne propunem sa
calculam estimatia cifrei de afaceri, pe trimestre, în anul 4.
Tabelul 10
Calcule necesare analizei evolutiei si tendintei cifrei de afaceri
Cifra de Tendinta Coeficientul Tendinta
afaceri ti t2i xi t i liniara produsului liniara
(xi ) yi = a + bti componentei corectata în
Perioada sezonalitatii cu functie de
(T ⋅ S⋅ R) (T) termenul de eroare sezonalitatea
(x /y ) trimestriala
i i
(y i ⋅ Csi )
 T⋅ S⋅ R 
 T = S⋅ R  (T⋅ S)
 
trim.I 2 1 1 2 3,923077 0,5098 1,79332
trim.II 6 2 4 12 4,891608 1,2266 5,94947
trim.III 11 3 9 33 5,860140 1,8771 10,91389
trim.IV 3 4 16 12 6,828671 0,4393 3,16998
Total an 1 22 30 59 4,0528 21,82666
trim.I 4 5 25 20 7,797203 0,5130 3,56426
trim.II 10 6 36 60 8,765734 1,1408 10,66141
trim.III 18 7 49 126 9,734266 1,8491 18,12905
trim.IV 5 8 64 40 10,702797 0,4672 4,96842
Total an 2 37 174 246 3,9701 37,32314
trim.I 4 9 81 36 11,671329 0,3427 5,33521
trim.II 16 10 100 160 12,639860 1,2658 15,37336
trim.III 25 11 121 275 13,608392 1,8371 25,34420
trim.IV 7 12 144 84 14,576923 0,4802 6,76685
Total an 3 52 446 555 3,9258 52,81962
Total 111 78 650 860 111,000000 11,9487 111,96942
general
Nota: Seria dinamica a cifrei de afaceri ajustata cu ajutorul ecuatiei de tendinta liniara este prezentata în coloana,
“Tendinta liniara”.
-68-

Notatiile folosite în tabel au urmatoarele semnificatii:


x i ⇔ T⋅ S⋅ R
yi ⇔ T
y i ⋅ Cs i ⇔ T⋅ S
T = tendinta ; S = sezonalitatea ; R = termenul rezidual (termenul de eroare)

Dinamica cifrei de afaceri

30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12

Valori reale
Valori ajustate (trend liniar)
Valori ajustate corectate cu factorul de sezonalitate

Fig. 2
Relatiile de calcul pentru diferitele componente ce determina o anumita marime a
indicatorilor de nivel initiali sunt evidentiate în doua variante:

- prin procedeul multiplicativ :


xi T ⋅S ⋅ R T ⋅S ⋅ R S⋅ R
↔ = S⋅R ; =R ; =S
yi T T⋅S R
- prin procedeul aditiv :
(T + S+ R) − T = S+ R ; (T + S+ R) − (T + S) = R ; (S+ R) − R = S
Tendinta generala a cifrei de afaceri este estimata cu ajutorul ecuatiei de regresie liniara,
deoarece reprezentarea grafica (Fig. 1) sugereaza o forma liniara a evolutiei cifrei de afaceri, în
perioda celor trei ani supusi analizei, y = a + bt .
Calculul parametrilor din ecuatia de tendinta aleasa este realizat prin aplicarea metodei
celor mai mici patrate care conduce la urmatorul sistem de ecuatii:
-69-

 111 = 12a + 78b



860 = 78a + 650b
Rezolva rea sistemului de ecuatii a permis definirea ecuatiei de tendinta în forma: y = 2,
954545 + 0, 968531 t

111 ⋅ 650 - 860 ⋅ 78 5070 12 ⋅ 860 - 78 ⋅111 1662


a= = = 2,954545 b = = = 0,968531
12 ⋅ 650 - 78 ⋅ 78 1716 12 ⋅ 650 - 78 ⋅ 78 1716
Nota: Variabila timp este reprezentata prin notatia “t”, pentru care se acorda valori conventionale.
Daca se considera necesar, în vederea simplificarii calculelor implicate cu estimarea
parametrilor ecuatiei de tendinta se poate adopta, pentru evaluarea variabilei timp, un sistem care
sa îndeplineasca doua conditii, asfel:
- suma valorilor acordate lui t la puteri impare sa fie nula, St i2 m +1 = 0 , (m = 0, 1, 2, ...,) ,
- diferenta dintre oricare doua valori succesive ale lui t sa fie constanta.

Mediile trimestriale ale componentelor cumulate de sezonalitate si eroare:

a) Medii trimestriale individuale:

0,5098 + 0,5130 + 0,3427


M (x i : y i )1 = = 0,455167
3

1,2266 + 1,1408 + 1,2658


M (x i : y i )2 = = 1, 211067
3

1,8771 + 1,8491 + 1,8371


M (x i : y i )3 = = 1,854433
3

0,4393 + 0,4672 + 0,4802


M (x i : y i ) 4 = = 0,462233
3
b) Media trimestriala generala: M (x i : y i )0 =
11,9487
= 0,995725
12

Coeficientii medii de sezonalitate trimestriala aferenti perioadei anilor 1-3:


0,455167 1,211067
Cs1 = = 0,457121 ; Cs 2 = = 1,216266 ;
0,995725 0,995725

1,854433 0,462233
Cs 3 = = 1,862395 ; Cs 4 = = 0,464217
0,995725 0,995725
Nota: Coeficientii medii de sezonalitate trimestriala (Csi), fiind calculati ca raport între marimi
medii, exprima o tendinta centrala si nu sunt afectati de termenul de eroare.
-70-

Structura spectrala a evolutiei cifrei de afaceri (procedeul aditiv)


(T + S+ R) − (T + S+ R) −
(S+ R) −
Perioada − (T + S) = R − T = (S+ R) x T S R
− R =S
2001 : 1 0,20668 -1,92308 -2,12976 2 = 3,923 - 2,130 + 0,207
2001 : 2 0,05053 1,10839 1,05786 6 = 4,892 + 1,058 + 0,050
2001 : 3 0,08611 5,13986 5,05375 11 = 5,860 + 5,054 + 0,086
2001 : 4 -0,16998 -3,82867 -3,65869 3 = 6,829 - 3,659 - 0,170
Total an 1
2002 : 1 0,43574 -3,79720 -4,23294 4 = 7,797 - 4,233 + 0,436
2002 : 2 -0,66141 1,23427 1,89568 10 = 8,766 + 1,895 - 0,661
2002 : 3 -0,12905 8,26573 8,39478 18 = 9,734 + 8,395 - 0,129
2002 : 4 0,03158 -5,70280 -5,73438 5 = 10,703 - 5,734 + 0,031
Total an 2
2003 : 1 -1,33521 -7,67133 -6,33612 4 = 11,671 - 6,336 - 1,335
2003 : 2 0,62664 3,36014 2,73350 16 = 12,640 + 2,733 + 0,627
2003 : 3 -0,34420 11,39161 11,73581 25 = 13,608 + 11,736 - 0,344
2003 : 4 0,23315 -7,57692 -7,81007 7 = 14,577 -7,810 + 0,233
Total an 3
Total -0,96942 0,00000 +0,96942 111 =111,000 + 0,969 - 0,969
general

Prognoza : y p = (a + bt v ) ⋅ Cs
Anul 4 : 1 = 7, 10615 = (2,954545 + 0,968531 * 13) * 0,457121
Anul 4 : 2 = 20, 08539 = (2,954545 + 0,968531 * 14) * 1,216266
Anul 4 : 3 = 32, 55934 = (2,954545 + 0,968531 * 15) * 1,862395
Anul 4 : 4 = 8, 56529 = (2,954545 + 0,968531 * 16) * 0,464217
Aceasta analiza semnalizeaza managerilor când este necesar sa se aplice masuri prin care:
- sa se asigure capacitatea necesara pentru acoperirea cererii de produse (servicii) din
trimestrele II si III când sezonalitatea este supraunitara,
- sa se asigure executarea lucrarilor de raparatii la mijloacele fixe cu prioritate în
trimestrele cu activitate redusa,
- sa se realizeze aprovizionarea cu resursele necesare în mod diferentiat în functie de
marimea solicitarii trimestriale,
- sa se programeze în mod judicios concediile de odihna,
- sa se asigure o plasare profitabila a lichiditatilor,
- sa se adopte cea mai buna politica pentru contractarea creditelor curente (de trezorerie),
- sa se asigure personalul necesar pentru realizarea volumului de activitate previzibil, care
va fi solicitat pe trimestre.
Prognoza volumului de activitate poate fi completata cu o estimare a structurii cifrei de
afaceri pe subactivitati pe baza metodei lanturilor Markov.
-71-

Nota: Din punct de vedere metodologic, analiza prezentata poate fi considerata ca model si
pentru alte activitati cu o desfasurare sezoniera cum ar fi productia de conserve din fructe sau
produse agricole, productia si comercializarea de bere, productia de zahar etc.

Cercetarea statistica prin sondaj

Datele statistice care dau forma concreta de existenta si manifestare a colectivitatilor


statistice se obtin fie prin observarea totala a unitatilor componente , fie prin observari partiale de
tipul anchetelor, monografiilor sau cercetarilor statistice prin sondaj.
Cercetarea statistica prin sondaj are ca scop general efectuarea unei analize tematice
riguroase privind un ansamblu de unitati pe care îl vom numi “populatie” (în sens statistic) sau
colectivitate statistica, observând, prelucrând si interpretând rezultate ce se refera numai la oparte
din unitatile ce o compun, numita esantion.
Privita numai din acest punct de vedere se poate aprecia ca, cunoasterea umana bazata pe
observatii partiale este foarte veche, dar luata ca un procedeu fundamentat si utilizat în mod
stiintific, cercetarea prin sondaj s-a conturat dupa al doilea razboi mondial.
Pe plan mondial, cu toate progresele teoretice, incontestabile, înregistrate, cu precadere,
între cele doua razboaie mondiale, datorita unor ilustri specialisti ca Student, K. Pearson, R. A.
Fisher, Jerzy Neyman, A. N. Kolmogorov, P. C. Mahalanobis, aplicatiile metodei sondajului sunt
totusi modeste, în raport cu eficacitatea scontata a sa.
Cercetarea prin sondaj este forma cea mai eficienta de cercetare partiala, deoarece se
bazeaza pe studierea unei colectivitati de unitati relativ mici, însa constituita, prin aplicarea unor
reguli fundamentate în mod riguros si care permite sa se faca aprecieri foarte precise asupra
întregii mase de unitati ce formeaza populatia statistica.
Scopul aplicarii unei asemenea metodologii de cercetare este de a estima nivelurile unor
caracteristici ale populatiei statistice, cum sunt: media si dispersia, proportia unitatilor ce detin o
anumita caracteristica, corelatia dintre doua sau mai multe caracteristicii sau de a cunoaste
repartitia unitatilor populatiei dupa una sau mai multe caracteristici.
Folosirea pe scara din ce în ce mai mare a cercetarilor prin sondaj este determinata de
avantajele pe care le prezinta aceasta metoda, comparativ cu cercetarea totala, si anume:
- asigura o importanta economie de timp prin observarea, prelucrarea si interpretarea
rezultatelor obtinute de la un numar relativ mic de unitati ale populatiei;
- permite reducerea volumului de mijloace umane si financiare, comparativ cu necesitatile
de realizare ale unei observari totale;
- prin studierea caracteristicilor înregistrate numai la o parte a populatiei apare posibilitatea
desfasurarii unei observari mai extinse, mai amanuntite, mai complexe si mai exacte a unitatilor
supuse cercetarii;
- în cadrul organizatoric al unei cercetari prin sondaj este posibila exercitarea unui control
mai strict asupra operatiunilor de culegere si prelucrare a datelor;
- sondajul poate fi efectuat de un personal mai bine calificat pentru a culege, prelucra si
interpreta rezultate;
- sondajul poate fi aplicat cu succes atunci când observarea totala a unitatilor ce compun
populatia nu este posibila, fie datorita unor necesitati de resurse banesti si umane foarte mari, care
-72-

nu ar fi compensate de avantajele ce s-ar obtine prin folosirea rezultatelor oferite, fie datorita
faptului ca unitatile supuse observarii se distrug, fie ca populatia statistica ce urmeaza a fi
cercetata este infinita sau foarte numeroasa;
- prin sondaj se poate efectua verificarea modului de organizare si a programului unui
recensamânt ce urmeaza sa fie realizat;
- pe baza unui sondaj se poate determina gradul de precizie a datelor obtinute printr-un
recensamânt si respectiv se poate opera o corectie a datelor respective ;
- datele obtinute prin sondaj sunt afectate de unele erori de reprezentativitate
întâmplatoare, a caror marime poate fi însa estimata daca se respecta caracterul întâmplator de
formare a esantionului.
Teoria metodei sondajelor se bazeaza pe legea numerelor mari, care în esenta este
formulata astfel: se poate afirma cu o probabilitate apropiata de unitate ca, în cazul unui numar
suficient de mare de unitati cercetate, indicatorii medii care caracterizeaza esantionul difera cu o
cantitate foarte mica de indiatorii care caracterizeaza populatia statistica din care a fost extras.

Practica cercetarilor statistice prin sondaj a facut necesara consacrarea unor notiuni
specifice, cu o semnificatie adecvata acestui domeniu, astfel:
- Sondajul este un complex de operatiuni metodologice aferente cercetarii unei parti dintr-
o populatie statistica numita esantion constituit prin folosirea unor procedee adecvate de extragere.
Sondajul poate fi de tip aleator sau probabilist sau de tip nealeator, însa numai pentru sondajul
aleator este posibil sa se estimeze limitele erorilor de reprezentativitate, în timp ce pentru sondajul
care nu are un caracter aleator nu poate fi calculat un nivel estimativ al erorilor comise.
- Esantionul este o parte a unei populatii statistice constituita în urma unei operatii de
extragere a unora din unitatile ce o compun.
- Sondajul aleator sau probabilist este un sondaj efectuat pe baza teoriei probabilitatilor;
fiecare unitate din populatie are o probabilitate cunoscuta si diferita de zero de afi inclusa în
esantion.
- Sondajul nealeator este acela care nu respecta caracterul întâmplator de includere în
esantion a unitatilor statistice. Unitatile esantionului sunt alese în mod constient, premeditat.
- Esantionul aleator este esantionul constituit printr-un procedeu aleator de extragere a
unitatilor statistice din colectivitatea totala.
- Volumul esantionului reprezinta numarul unitatilor extrase din tr-o populatie statistica si
care au intrat în componenta esantionul.
- Unitatea de sondaj este unitatea care face parte dintr-o populatie si care urmeaza sa faca
obiectul unor extrageri.
- Baza de sondaj este o lista, o harta sau o colectie de formulare ce contine informatii cu
privire la unitatile populatiei statistice din care urmeaza sa se constituie un esantion.
- Fractia de sondaj reprezinta raportul dintre numarul unitatilor ce compun esantionul si
numarul total al unitatilor din populatie.

Organizarea practica a unei cercetari statistice prin sondaj implica rezolvarea mai multor
probleme metodologice în functie de specificul populatiei, scopul si programul observarii. În acest
sens se cere definirea completa si precisa a scopului cercetarii; delimitarea în timp si spatiu a
populatiei statistice din care urmeaza a se extrage esantionul; stabilirea unitatii de sondaj;
-73-

detalierea programului observarii; stabilirea celei mai convenabile baze de sondaj sau întocmirea
acesteia daca nu exista o baza oficial constituita; alegerea procedeului de formare a esantionului
care sa permita o buna reprezentativitate a populatiei; determinarea volumului esantionului si
constituirea acestuia; alegerea metodei de culegere a datelor care sa conduca la erori de observare
neglijabile; întocmirea planului de prelucrare a datelor culese.

Erorile în cercetarea statistica prin sondaj

Metodologia adoptata pentru constituirea esantionului influenteaza, în mod inevitabil,


fazele ulterioare ale cercetarii, nivelurile estimative ale caracteristicilor statistice si al erorilor
aferente.
În cazul cercetarilor prin sondaj rezultatele finale sunt afectate de unele erori, care însa
trebuie sa fie suficient de mici pentru a nu denatura concluziile referitoare la populatia cercetata.
Tipurile de erori considerate ca fiind specifice cercetarilor statistica prin sondaj sunt: erori
de înregistrare sau de observare cu o dimensiune minima, aproape inexistente si erori de
reprezentativitate.
Erorile de înregistrare sunt, de rgula, neglijabile în acest caz, deoarece este posibil ca etapa
de observare sa se desfasoare în conditii organizatorice superioare si cu un control mai riguros,
comparativ cu observarile totale.
Erorile de reprezentatvitate apar la toate cercetarile prin sondaj deoarece observarea se
extinde numai asupra partii din populatia statistica care a fost cuprinsa în esantion si care nu poate
fi, în nici-o situatie practica, o formatie perfect identica cu populatia, indiferent de marimea
esantionului si de procedeul de sondaj adoptat.
Eliminarea completa a erorilor de reprezentativitate nu este posibila deoarece aceasta ar
însemna sa înlocuim observarea partiala cu obsevarea totala.
Eroarea de reprezentativitate este apreciata prin diferenta care exista între valoarea medie
sau abaterea medie patratica a valorilor caracteristicii calculate pe baza datelor obtinute prin
observarea esantionului, si media sau abaterea medie patratica calculate la nivelul tuturor unitatilor
care formeaza populatia statistica.
Erorile de reprezentativitate pot fi identificate în doua variante: sistematice si
întâmplatoare.
În cazul cercetarilor prin sondaj, cauzele care pot provoca aparitia erorilor de
reprezentativitate sistematice, sunt:
a) - folosirea unor formule incorecte pentru estimarea nivelului caracteristicilor statistice
despre care s-au colectat date;
b) - alegerea constienta a unitatilor de sondaj, pretinzând ca acestea reprezinta în mod
corect ce este tipic în colectivitatea totala respectiva. Aplicarea unui procedeu de sondaj constient
implica posibilitatea afirmarii punctelor de vedere subiective cu repercursiuni deformatoare asupra
reprezentativitatii esantionului;
c) - constituirea esantionului prin extrageri dintr-o baza de sondaj incompleta sau
învechita;
d) - folosirea unui procedeu de tip nealeator pentru formarea esantionului;
e) - substituirea unor unitati din esantion cu altele mai comode pentru cercetare.
-74-

Când se organizeaza o cercetare statistica prin sondaj este necesar sa se asigure, de la bun
început, eliminarea tuturor surselor care pot provoca erori de reprezentativitate sistematice.
Modalitatea cea mai sigura de a evita aparitia erorilor de reprezentativitate sistematice este
adoptarea riguroasa a unei scheme de sondaj de tip aleator pentru formarea esantionului.
Erorile de reprezentativitate întâmplatoare nu pot fi eliminate, acestea se produc si atunci
când s-a respectat cu strictete caracterul aleator de extragere a unitatilor care vor constitui
esantionul. Dar, se remarca faptul ca este posibil, în acest caz, sa se calculeze cu exactitate
marimea probabila a acestor erori, ceea ce asigura metodei cercetarii statistice prin sondaj
avantajul unei metodologii riguroase de cercetare.
Valoarea medie a erorilor de reprezentativitate întâmplatoare depinde de volumul
esantionului, de gradul de variabilitate al caracteristicilor studiate si de procedeul de sondaj
aplicat.
Din punct de vedere al structurii, reprezentativitatea unui esantion se considera
corespunzatoare atunci când structura acestuia este identica, sau difera foarte putin de structura
populatiei din care a fost extras, acest fapt se apreciaza prin compararea marimilor relative de
structura ale esantionului si respectiv ale populatiei care nu trebuie sa evidentiaze diferente mai
mari de ± 5% . O concluzie utila cu privire la reprezentativitatea structurala a unui esantion poate
fi obtinuta si cu ajutorul “Criteriului ? 2 ” - “Testul de conformitate”.
Exemplul 9
Sa se verifice reprezentativitatea structurii esantionului pentru o colectivitate de salariati
grupati pe categorii profesionale cu ajutorul “Criteriului ? 2 ”

Tabelul 11
Categorii
profesionale
Colectivitatea totala Esantion
(Nr. pers.)
Frecvente
teoretice
(n i − nt i )
2

Numarul Structura
persoanelor ni nt i nt i
“A” 1961 0,37 400 370 2,4324
“B” 2385 0,45 420 450 2,0000
“C” 689 0,13 140 130 0,7692
“D” 265 0,05 40 50 2,0000
Total 5300 1,00 1000 1000 7,2016
Nota Distributia teoretica a frecventelor este calculata prin aplicarea marimilor relative de
structura de la nivelul colectivitatii totale asupra volumului esantionului.
Verificarea ipotezei propuse se realizeaza prin compararea lui χ 2 - statistic cu χ 2 - tabelar,
astfel:
(n − nt i )2
? 2 − statistic = S i = 7,20 < ? 2q=0,05;f =4−1 = 7,81
nt i
Deoarece a rezultat ca ? 2 - statistic este mai mic decât ? 2 - tabelar, care a fost extras din
”Anexa 3”, pentru o probabilitate de 95% si 3 grade de libertate, se accepta ipoteza nula si deci
între cele doua structuri nu se constata o deosebire semnificativa. Se confirma statistic faptul ca
esantionul este reprezentativ din punct de vedere al structurii pe categorii profesionale, comparativ
cu structura colectivitatii totale.
-75-

Procedee de sondaj

În vederea asigurarii caracterului aleator al esantionului, în practica cercetarilor prin


sondaj, se recurge la unul din urmatoarele doua procedee:
- procedeul tragerii la sorti,
- procedeul sondajului cu ajutorul tabelului cu numere întâmplatoare.

Procedeul tragerii la sorti

Procedeul tragerii la sorti sau al loteriei consta în extragerea la întâmplare dintr-o urna a
unor bile, discuri sau fise identice ca forma, ce reprezinta unitati de sondaj, pâna la constituirea
volumului necesar al esantionului. Acest procedeu poate fi aplicat în doua variante, astfel:
a) - extragerea cu reintroducere (sondajul aleator cu revenire), când unitatea
extrasa si supusa observarii este reintrodusa în popuplatia statistica, astfel încât la o extragere
urmatoare aceasta unitate poate fi cercetata înca odata.
În aceasta varianta, fiecare unitate de sondaj are aceeasi probabilitate de a fi extrasa si
1
respectiv de a fi cuprinsa în esantion cu o marime diferita de zero, egala cu, P = , în care,
N
P este probabilitatea unei unitati de sondaj a populatiei statistice de a fi inclusa în esantion,
N reprezinta numarul total al unitatilor populatiei statistice.
b) - extragerea fara reintroducere (sondajul aleator fara revenire), când unitatea extrasa si
supusa observarii nu mai este reintrodusa în colectivitatea totala. Prin acest procedeu de extragere
probabilitatea fiecarei unitati de a fi inclusa în esantion creste odata cu derularea procesului de
efectuare a extragerilor, ca urmare a micsorarii continue a volumului populatiei statistice. Astfel,
1
probabilitatea primei unitati de sondaj de a fi extrasa este: P = , probabilitatea celei de a doua
N
1
unitati este: P = si în final probabilitatea de a intra în esantion a ultimei unitati este,
N− 1
1
P= , în care cu “n” s-a notat numarul total de unitati ale esantionului.
N − (n − 1)
Dintre cele doua variante de extragere a unitatilor conform procedeului tragerii la sorti,
mai avantajos este sondajul fara revenire, deoarece în acest caz erorile de reprezentativitate
întâmplatoare sunt mai mici. Prin includerea în esantion a unei unitati de sondaj, o singura data, se
elimina posibilitatea deformarii frecventei variantelor caracteristicii.

Procedeul sondajului cu ajutorul tabelului cu numere aleatoare (întâmplatoare).

Acest procedeu consta în numerotarea, de la 1 la N, a tuturor unitatilor ce compun


populatia statistica, fara a avea în vedere o ordine dinainte stabilita, si extragerea unui numar de
“n” unitati de sondaj cu ajutorul unui tabel cu numere aleatoare.
În practica se cunosc mai multe tipuri de asemenea tabele, întocmite de Tippett, de Fisher
si Yates, de Burke Horton, de Kendall si Babington Smith si de Rond Corporation. Aceste tabele
-76-

au rezultat în urma a numeroase trageri la sorti, efectuate cu ajutorul unor masini de amestecat
numere.
Pentru exemplificarea tehnicii de obtinere a esantionului folosind procedeul sondajului cu
ajutorul tabelului cu numere aleatoare, vom considera o populatie statistica compusa din 200
unitati, din care dorim sa extragem 10 unitati. În primul rând, cele 200 de unitati ale populatiei vor
fi numerotate într-o ordine oarecare, de la 1 la 200. În continuare vom alege o coloana din tabelul
respectiv, sa zicem coloana a 7-a, din care retinem 10 grupe de numere. Deoarece grupele de
numere din tabel sunt formate din câte cinci cifre, acestea trebuie descompuse în grupe cu un
numar de cifre egal cu numarul din care este compus volumul total al populatiei (în cazul nostru în
grupe de câte trei cifre).
Daca luam din tabel (Anexa 1), de exemplu, numarul 50243, vom putea forma urmatoarele
grupe de trei cifre: 502, 024 si 243, deci dintr-o grupa de numere a tebelului putem alege una din
cele trei variante de grupe formate din câte trei cifre. Sa presup unem ca am ales varianta prin care
grupurile de trei cifre sunt situate în mijlocul numarului format din cinci cifre, în acest caz vom
retine:
024 164
046 090
115 062
144 043
083..................................060
Se mentioneaza ca numerele formate din câte trei cifre care sunt mai mari de 200, vor fi
neglijate, deoarece nu intra în limitele sondajului propus de noi.
Cele 10 numere retinute sunt apoi ordonate dupa marime în vederea usurarii extragerii
celor 10 unitati de sondaj din populatia statistica.
Daca unele grupe de cifre retinute se repeta sau sunt foarte apropiate ca marime se
recomanda a fi înlocuite cu alte numere extrase în continuare din tabel pe baza acelorasi principii.
Tabelele cu numere aleatoare pot fi folosite, pentru constituirea esantioanelor, începând cu
oricare coloana sau rând de numere, cu conditia ca sistemul de extragere a numerelo r sa fie
respectat în mod riguros, pe toata durata operatiunii, pâna la formarea volumului necesar al
esantionului.
Acest procedeu de sondaj este echivalent cu sondajul aleator fara revenire.

Practica cercetarilor prin sondaj a impus si alte procedee pe ntru constituirea esantioanelor
datorita existentei unor conditii particulare de existenta a populatiilor statistice, de inexistenta unei
baze de sondaj adecvate sau datorita unor posibilitati si scopuri specifice de realizare a sondajului,
pe care le vom prezenta în continuare.

Procedeul sondajului sistematic

În conditiile sondajului sistematic sau mecanic, pentru constituirea esantionului, unitatile


de sondaj sunt extrase dintr-o baza de sondaj de forma unei liste sau a unui pachet de fise care
cuprinde toate unitatile populatiei statistice.
În baza de sondaj, unitatile sunt pozitionate si numerotate conform unei criteriu oarecare,
independent de marimea caracteristicilor care vor fi studiate prin folosirea esantionului. O
-77-

eventuala corelare a criteriu lui de ordonare a unitatilor în baza de sondaj cu nivelul caracteristicii
studiate sau existenta unei periodicitati a nivelului caracteristicii în baza de sondaj constituie surse
de erori de reprezentativitate sistematice ce trebuie evitate.
Extragerea unitatilor de sondaj din baza de sondaj, în vederea formarii esantionului, se
N
efectueaza prin aplicarea unui interval sau pas de numarare, calculat astfel: i = . În acest fel,
n
populatia statistica este împartita în grupe conventionale neomogene cu un numar de unitati egal
cu marimea pasului de numarare, din fiecare grupa urmând a se extrage câte o unitate.
Operatiunea de extragere începe prin localizarea unei unitati din prima grupa prin aplicarea
tragerii la sorti, aceasta unitate va fi baza de plecare a extragerilor urmatoare (unitatea de start). La
numarul de ordine asociat primei unitati extrase se adauga marimea pasului de numarare si se
obtine numarul de ordine al urmatoarei unitati de sondaj, procesul continua pâna la formarea
completa a esantionului.
Sondajul sistematic, efectuat în acest mod, este asimilat procedeului de sondaj aleator cu
revenire, deoarece volumul colectivitatii totale ramâne constant pe toata durata realizarii
extragerilor, iar caracterul aleator se asigura prin folosirea unei baze de sondaj adecvate. De foarte
multe ori, în practica, se adopta sistemul de ordonare alfabetica a unitatilor, în baza de sondaj, care
permite, de regula, o pozitionare aleatoare a unitatilor.
Din punct de vedere teoretic, marimea reala a erorilor de reprezentativitate, introduse prin
aplicarea procedeului sistematic, este mai mica decât în cazul sondajului aleator cu revenire
deoarece se evita riscul cooptarii repetate a uneia si aceleasi unitati în esantion dar este mai mare
comparativ cu sondajul aleator fara revenire, deoarece volumul si ordinea populatiei statistice
ramân aceleasi pe toata durata sondajului.
Sondajul sistematic este aplicat cu succes în cercetarile sociologice si demografice, în
studiile de opinie sau de preferinte, cu conditia ca baza de sondaj folosita sa fie completa, actuala
si cu o ordine întâmplatoare a unitatilor.

Procedeul cotelor

Cazurile practice în care se recurge la procedeul cotelor sunt cele care au ca obiectiv
cunoasterea opiniilor, preferintele sau a cerintelor de consum ale unor grupuri de persoane.
Procedeul cotelor poate fi aplicat numai atunci când este cunoscuta structura populatiei
statistice care urmeaza sa fie cercetata prin sondaj.
Fiecare operator de interviu primeste o “cota” de unitati care vor fi observate, de exemplu,
câte persoane de sex feminin si câte de sex masculin sa fie intervievate, câte persoane active din
anumite profesii, câte persoane sa apartina unei anumite grupe de vârsta, câte persoane care au
domiciliul în mediul rural si câte în urban etc., astfel încât prin reunirea tuturor cotelor sa se
reconstituie structura populatiei statistice pe un volum al esantionului considerat satisfacator
pentru a obtine o caracterizare corespunzatoare a populatiei.
Includerea unitatilor statistice (persoanelor) în esantion se face prin alegerea subiectilor, în
conformitate cu cotele care i-au fost repartizate, la aprecierea subiectiva a fiecarui operator, fapt ce
favorizeaza aparitia unor erori de reprezentativitate sistematice.
Procedeul cotelor, datorita caracterului predominant al factorului subiectiv, comparativ cu
includerea întâmplatoare în esantion a unitatilor statistice, nu permite estimarea erorilor de
-78-

reprezentativitate si în consecinta nu poate fi calculat intervalul de încredere pentru marimea


medie sau totala a unei caracteristici.

Procedeul concentrat

Procedeul concentrat sau al partii principale poate fi adoptat atunci când, în functie de o
anumita caracteristica, populatia statistica este puternic asimetrica. Aceasta consta în aceea ca
procedam la cercetarea tuturor unitatilor în care este concentrata, într-o proportie mare (90-95%),
caracteristica ce ne intereseaza si care sunt putine la numar si respectiv sunt excluse în totalitate
din cercetare un numar mare de unitati în care caracteristica respectiva are o pondere mica (5-
10%).
Procedeul introduce în mod deliberat, fara îndoiala, o eroare de reprezentativitate
sistematica, dar care este posibil sa fie de proportii mici si sa fie considerata acceptabila.

Procedeul observatiilor la intervale egale sau neegale de timp

Acest procedeu se aplica în special la studiul statistic al calitatii productiei industriale si


consta în observarea, la anumite momente, a uneia sau mai multor unitati care apartin unui
fenomen ce se desfasoara în timp.

Felurile esantioanelor

a) Esantionul simplu aleator constituit prin tragere la sorti cu revenire

În cazul acestui tip de esantion pot fi fundamentate urmatoarele relatii de calcul atât în
varianta reala cât si în varianta estimata:
Pentru o caracteristica cantitativa
Valoarea reala Valoarea estimata
DENUMIREA -calculata pe baza datelor -calculata pe baza datelor
INDICATORILOR aferente colectivitatii totale- obtinute din sondaj-
1. Volumul colectivitatii totale (N)
2. Volumul esantionului (n)
3. Valoarea medie a caracteristicii de
Σx i Σx i
reprezentativitate m= m̂ = x =
N n
∑ (x i − m) ∑ (x i − x )
4. Dispersia caracteristicii de 2 2
reprezentativitate
σX =
2
σˆ X = s X =
2 2

N n −1
5. Eroarea medie a valorii medii de
S(x i − m ) s 2X
2
sondaj
sx = = σˆ x =
Nn n
s 2X
=
n
-79-

6. Eroarea medie a valorii totale a


caracteristicii de reprezentativitate σX = N⋅ σx σˆ X = N ⋅ σˆ x
7. Numarul total de esantioane care
pot fi formate prin aplicarea
procedeului de extragere prin tragere
n
la sorti cu revenire (N )
8. Eroarea limita sau maxima admisa
pentru valoarea medie ∆ x = z ⋅ σx ∆ˆ x = z ⋅ σˆ x

Pentru o caracteristica alternativa


Valoarea reala Valoarea estimata
DENUMIREA -calculata pe baza datelor -calculata pe baza datelor
INDICATORILOR obtinute din sondaj-
aferente colectivitatii totale -

1. Volumul colectivitatii totale(N)


2. Volumul esantionului (n)
3. Valoarea medie a caracteristicii
M m
alternative p= p̂ = w =
N n
4. Numarul de unitati statistice care
detin caracteristica alternativa
urmarita în colectivitatea totala
(M)
5 Numarul de unitati statistice care
detin caracteristica alternativa
urmarita în esantion (m)
σ 2p = p(1− p)
6. Dispersia caracteristicii
σˆ 2p = s 2w = w (1 − w ) ⋅
alternative
n
n −1

w (1 − w )
7. Eroarea medie a valorii medii de
sondaj s 2p p(1 − p) s 2w
sw = = σˆ w = =
n n n n−1
8. Eroarea medie a valorii totale a
caracteristicii alternative σM = N ⋅ σw σˆ M = N ⋅ σˆ w
9. Numarul total de esantioane care
pot fi formate prin aplicarea
procedeului de extragere prin
n
tragere la sorti cu revenire ( N )
10. Eroarea limita sau maxima
admisa pentru valoarea medie
∆ w = z ⋅ σw ∆ˆ w = z ⋅ σˆ w

b) Esantionul simplu aleator constituit prin tragere la sorti fara revenire


În cazul acestui tip de esantion pot fi fundamentate urmatoarele relatii de calcul, atât în
varianta reala cât si în varianta estimata:

Pentru o caracteristica cantitativa


-80-

Valoarea reala
DENUMIREA INDICATORILOR este calculata pe baza datelor aferente
colectivitatii totale
Valoarea estimata
este calculata pe baza datelor
obtinute din sondaj
1. Volumul colectivitatii totale (N)
2. Volumul esantionului (n)
3. Valoarea medie a caracteristicii de Valoarea reala
reprezentativitate
Σx i
m=
N
Valoarea estimata
Σx i
m̂ = x =
n
4. Dispersia caracteristicii de Valoarea reala
reprezentativitate
∑ (x i − m )
2

σ = 2
X
N
Valoarea estimata
N − 1 ∑ (x i − x ) N − 1
2

σˆ 2X = s 2X ⋅ = ⋅
N n −1 N
5. Eroarea medie a valorii medii de sondaj Valoarea reala
S(x i − m ) s 2X N − n
2
sx = = ⋅
C nN n N− 1
Valoarea estimata
s 2X N − n
σˆ x = ⋅
n N
6. Eroarea medie a valorii totale a Valoarea reala
caracteristicii de reprezentativitate
σX = N ⋅σx
Valoarea estimata
σˆ X = N ⋅ σˆ x
7. Numarul total de esantioane care pot fi
formate prin aplicarea procedeului de
extragere prin tragere la sorti fara revenire
( C nN )
8. Eroarea limita sau maxima admisa pentru Valoarea reala
valoarea medie
∆ x = z ⋅ σx
Valoarea estimata
∆ˆ x = z ⋅ σˆ x
Nota:
N!
C nN =
n!⋅( N - n )!
-81-

Pentru o caracteristica alternativa

Valoarea reala
DENUMIREA INDICATORILOR este calculata pe baza datelor aferente
colectivitatii totale
Valoarea estimata
este calculata pe baza datelor
obtinute din sondaj
1. Volumul colectivitatii totale (N)
2. Volumul esantionului (n)
3. Valoarea medie a caracteristicii alternative Valoarea reala
M
p=
N
Valoarea estimata
m
p̂ = w =
n
4. Numarul de unitati statistice care detin
caracteristica alternativa urmarita în colectivitatea
totala (M)
5 Numarul de unitati statistice care detin
caracteristica alternativa urmarita în
esantion (m)
6. Dispersia caracteristicii alternative Valoarea reala
σ 2p = p(1− p)
Valoarea estimata
N −1 n N −1
σˆ 2p = s 2w ⋅ = w (1 − w ) ⋅ ⋅
N n −1 N
7. Eroarea medie a valorii medii de sondaj Valoarea reala
σ p(1− p) N − n
2
N−n
σw = ⋅ = ⋅
p

n N −1 n N −1
Valoarea estimata
s 2w w (1− w ) N − n
σˆ w = = ⋅
n n −1 N
8. Eroarea medie a valorii totale a caracteristicii Valoarea reala
alternative
σM = N ⋅σw
Valoarea estimata
σˆ M = N ⋅ σˆ w
9. Numarul total de esantioane care pot fi formate
prin aplicarea procedeului de extragere prin
tragere la sorti fara revenire ( C nN )
10. Eroarea limita sau maxima admisa pentru Valoarea reala
valoarea medie
∆ w = z ⋅ σw
Valoarea estimata
∆ˆ w = z ⋅ σˆ w
-82-

CALCULUL VOLUMULUI ESANTIONULUI


TIPUL ESANTIONULUI
Esantion simplu aleatoriu cu revenire z 2 ⋅ σ 2X
(caracteristica cantitativa) n=
∆2x
Esantion simplu aleatoriu cu revenire z 2 ⋅ p(1− p)
(caracteristica alternativa sau calitativa) n =
∆2w
Esantion simplu aleatoriu fara revenire z 2 ⋅ σ 2X ⋅ N
n =
(caracteristica cantitativa)
( N − 1) ⋅ ∆2x + z 2 ⋅ σ 2X
Esantion simplu aleatoriu fara revenire z 2 ⋅ p(1− p ) ⋅ N
n =
(caracteristica alternativa sau calitativa)
( N − 1) ⋅ ∆2w + z 2 ⋅ p(1− p)
Nota:
- z este factorul de probabilitate extras din tabela cu valorile functiei de
repartitie normala, în functie de probabilitatea cu care se doreste sa fie garantate rezultatele ,
(Anexa 2);
- σ 2X este dispersia aracteristicii de reprezentativitate, cunoscuta dintr-o
cercetare totala efectuata anterior sau este o estimatie obtinuta pe baza unui esantion;
- p (1− p ) este dispersia caracteristicii alternative sau calitative cu doua variante, cunoscuta
dintr-o cercetare totala efectuata anterior sau este o estimatie obtinuta pe baza unui esantion;
- ∆ x este eroarea limita sau maxima admisa pentru valoarea medie a caracteristicii de
reprezentativitate cantitative, pentru care se opteaza, astfel încât marimea relativa a erorii limita în
raport cu valoarea medie sa nu depaseasca 5%;
- ∆ w este eroarea limita sau maxima admisa pentru valoarea medie a caracteristicii de
reprezentativitate alternative sau calitative cu doua variante, pentru care se opteaza, astfel încât
marimea relativa a erorii limita în raport cu valoarea medie sa nu depaseasca 5%.

c) Esantio nul simplu constituit prin procedeul sistematic

În cazul acestui tip de esantion pot fi fundamentate urmatoarele relatii de calcul, atât în
varianta reala cât si în varianta estimata:
Pentru o caracteristica cantitativa
În cazul ordonarii unitatilor statistice de sondaj în baza de sondaj dupa marimea
caracteristicii de reprezentativitate
Valoarea reala
DENUMIREA INDICATORILOR este calculata pe baza datelor aferente colectivitatii totale
Valoarea estimata
este calculata pe baza datelor obtinute din sondaj
1. Volumul colectivitatii totale (N)
2. Volumul esantionului (n)
-83-

3. Valoarea medie a caracteristicii de reprezentativitate Valoarea reala


Σx i
m=
N
Valoarea estimata
Σx i
m̂ = x =
n
4. Dispersia caracteristicii de reprezentativitate Valoarea reala
∑ (x i − m)
2

σ = 2
X
N
5. Eroarea medie a valorii medii de sondaj Valoarea reala
S (x i − m )
2
s 2X
sx = = ⋅ [1 + (n− 1) ⋅ ? ]
k n
Valoarea estimata
Yates
N − n n −1 (x i +1 − x i )
2

σˆ x = ⋅∑
N ⋅ n i =1 2(n − 1)
Cochran
N − n n /2
σˆ x = ⋅ ∑ (x 2i − x 2i−1 )
2

N ⋅ n i=1
2

6. Coeficientul de corelatie interclasa Valoarea reala

∑ ∑ ∑ (x ir − m) ⋅ (x i ′r − m )
k n n

r =1i =1i ′=1


ρ=
k ⋅ n ⋅ (n − 1) ⋅ σ 2X
7. Pasul sau intervalul de numarare
N
k=
n
8. Eroarea medie a valorii totale a caracteristicii de Valoarea reala
reprezentativitate
σX = N ⋅ σx
Valoarea estimata
σˆ X = N ⋅ σˆ x
9. Numarul total de esantioane care pot fi formate prin
aplicarea procedeului de extragere sistematica
(k)
10. Eroarea limita sau maxima admisa pentru valoarea Valoarea reala
medie
∆ x = z ⋅ σx
Valoarea estimata
∆ˆ x = z ⋅ σˆ x
-84-

11. Eroarea limita relativa pentru valoarea medie Valoarea reala Valoarea estimata

∆x ∆ˆ x
⋅ 100 ⋅ 100
m x

Nota:
- în relatia de calcul a coeficientului de corelatie interclasa, marimea “k” va fi folosita cu
zecimale, daca asa rezulta din calcul;
- daca pasul sau intervalul de numarare -k- este un numar întreg se aplica un sondaj
sistematic liniar. În acest caz “unitatea de start” este extrasa prin tragere la sorti din prima
grupa conventionala de unitati statistice de sondaj care are marimea pasului de numarare;
- daca pasul sau intervalul de numarare -k- este un numar zecimal, se foloseste partea
întreaga a numarului si se aplica un sondaj sistematic circular. În acest caz “unitatea de
start” este extrasa prin tragere la sorti din N;
- daca în baza de sondaj, unitatile statistice de sondaj au o ordine aleatorie, sau sunt
ordonate dupa o caracteristica independenta, necorelata cu caracteristice de
reprezentativitate, cum ar fi ordinea alfabetica, sondajul simplu sistematic este asimilat
sondajului simplu aleatoriu cu revenire;
- estimatiile oferite de Yates si Cochran, pentru eroarea medie a valorii medii de sondaj,
sunt “usor” distorsionate;
- sondajul sistematic sau mecanic, în cazul ordonarii unitatilor statistice de sondaj în baza
de sondaj dupa marimea caracteristicii de reprezentativitate, este considerat qvasi-
aleatoriu;
1 1
- valoarea minima a coeficientului de corelatie interclasa este: − ⇔− = -0,01 ;
n −1 100
- relatia necesara calculului volumului esantionului se poate obtine din formula erorii
z 2 ⋅ σ 2 ⋅ (1− ρ)
limita sau maxima admisa pentru valoarea medie, astfel: n = 2 X2 2 .
∆ x − z ⋅ σX ⋅ ρ

- Sondajul în trepte. În acest caz tipologia unitatilor de sondaj se modifica de la un


esantion la altul. De exemplu: - în prima treapta se extrag judete, - în treapta a doua se extrag din
judetele extrase în prima treapta, localitati, iar în treapta a treia, din localitati se extrag persoane
sau familii.
Sondajul în trepte presupune, prin urmare, existenta unei grupari a unitatilor care formeaza
colectivitatea statistica totala în grupe (cuiburi, serii) si subgrupe cu existenta permanenta.

Daca se opteaza pentru un sondaj în doua trepte (cu observarea totala a unitatilor statistice
elementare cuprinse în cuiburile extrase în treapta a doua), prin tragere la sorti fara revenire,
eroarea medie a valorii medii de sondaj se calculeaza astfel:
-85-

δ12 R 1 − r1 δ2 R − r
σx = ⋅ + 2 ⋅ 2 2 , în care:
r1 R 1 − 1 r2 ⋅ r1 R 2 − 1

- R 2 - numarul unitatilor de sondaj (cuiburilor), de forma treptei întâi, existente în


colectivitatea statistica totala,
- R 2 - numarul unitatilor de sondaj (cuiburilor), de forma treptei a doua, continute în r1 ,
- r1 - volumul esantionului format din cuiburile extrase, în prima treapta, din R 1 ,
- r2 - volumul esantionului format din cuiburile extrase, în treapta a doua din R 2 .

- Sondajul în faze. În cazul acestui tip de sondaj se formeaza esantioane succesive prin
extrageri dintr- un esantion, mai numeros, constituit anterior. Tipologia unitatilor de sondaj este
aceeasi în toate fazele de extragere a esantioanelor. În fiecare faza de esantionare se aplica un
program de observare mai complex.

Exemplul 10
În procesul de ambalare automata a unui antibiotic, se retine la anumite intervale de timp
câte un flacon si se cântareste continutul acestora cu o precizie de 0,1 mg.. Sunt cercetate, în acest
fel, 250 flacoane. Valorile referitoare la greutatea flacoanelor cântarite sunt prezentate, pe grupe,
în tabel. Se doreste sa se calculeze un interval de încredere pentru valoarea medie a greutatii
flacoanelor pentru o productie totala de 10.000 fiole. Rezultatele vor fi garantate cu o probabilitate
de 95% ( z q =0,05 = 1,96 ).

Tabelul 12
Grupe Numarul Mijlocul x i − 126,55 x i − 126,55 2
 x i − 126,55 
⋅ ni
de flacoane- interva-
2 2   ⋅ni
flacoane lor lului  2 
dupa (n i) ( xi )
greutate
(mg.)
115,6- 4 116,55 -5 -20 100
117,5
117,6- 6 118,55 -4 -24 96
119,5
119,6- 20 120,55 -3 -60 180
121,5
121,6- 36 122,55 -2 -72 144
123,5
123,6- 44 124,55 -1 -44 44
125,5
125,6- 55 126,55 0 0 0
127,5
127,6- 36 128,55 +1 36 36
-86-

129,5
129,6- 25 130,55 +2 50 100
131,5
131,6- 12 132,55 +3 36 108
133,5
133,6- 8 134,55 +4 32 128
135,5
135,6- 4 136,55 +5 20 100
137,5
Total 250 1.036
Nota: În cazul acestei cercetari procedeul adoptat pentru constituirea esantionului este aplicat pe
toata durata procesului tehnologic de productie a lotului de 10.000 fiole si poate fi asimilat
procedeului de extragere prin tragere la sorti fara revenire.
Marimea intervalului de grupare s-a calculat astfel:
⋅ 8 ⋅ (x max − x min ) = ⋅ 8 ⋅ (137 − 116 ) = 1,7 mg . ≈ 2 mg . , în care,
1 1
i=
100 100
1
⋅ 8 este un factor empiric iar, x max − x min , este amp litudinea variatiei
100

- estimatia valorii medii a greutatii flacoanelor,


x − 126,55
S i ⋅ n1
x= 2 ⋅ 2 + 126,55 = 126,182 mg .
n
- estimatia dispersiei greutatii flacoanelor (în cazul sondajului efectuat prin tragere la sorti
fara revenire),
  x i − 126,55  2 
 S  ⋅ n1 
2 N− 1    2  N −1
⋅ 2 − (126,182 − 126,55 ) ⋅
2
s ⋅ = 2
= 16,5
N  n− 1  N
 
 
- limita inferioara a intervalului (li) în care se situeaza greutatea medie a celor 10.000 fiole,
s 2  N− n 
li = x− z q ⋅ = 126 ,182 − 1,96 ⋅ 0,25367 = 125 ,685 mg.
n  N 
- limita superioara a intervalului (ls) în care se situeaza greutatea medie a celor 10.000
fiole,
s 2  N− n 
ls = x + z q ⋅ = 126 ,182 + 1,96 ⋅ 0,25367 = 126 ,679 mg.
n  N 

Exemplul 11
-87-

Din încarcatura de carbuni a unei garnituri de tren, destinat unei centrale electrice, s-a
constituit un esantion simplu aleator format din 400 probe. Pe baza analizelor efectuate s-au
obtinut urmatoarele date cu privire la continutul de cenuse a carbunilor:
Tabelul 13
Grupe Numarul Mijlocul xini x i − x (x i − x )2 (x i − x )2 ⋅ n i
dupa Probelor Intervalului
continutul ( n i ) ( xi )
în cenuse
al
carbunilor
(%)
9 - 11 5 10 50 -7,175 51,4806 257,403
11 - 13 30 12 360 -5,175 26,7806 803,419
13 - 15 45 14 630 -3,175 10,0806 453,628
15 - 17 100 16 1.600 -1,175 1,3806 138,063
17 - 19 130 18 2.340 0,825 0,6806 88,481
19 - 21 55 20 1.100 2,825 7,9806 438,934
21 - 23 25 22 550 4,825 23,2806 582,016
23 - 25 10 24 240 6,825 46,5806 465,806
Total 400 6.870 3.227,750
Sa se determine probabilitatea ca eroarea limita (maxima admisa) care revine pentru ca
estimatia procentului mediu de cenuse a carbunilor sa nu depaseasca 0,3%, ( ? x = 0,3% )
- estimatia procentului mediu al continutului de cenuse al carbunilor,
Sx i n i 6.870
x= = = 17,175 %
Sn i 400
- estimatia dispersiei procentului de cenuse,
S (x i − x ) ⋅ n i 3.227 ,75
2

s2 = = = 8,09
Sn i − 1 400 − 1

s2 ? 0,3
? x = 0,3% → ? x = z q⋅ → zq = x = = 2,11
n s2 8,09
n 400
În tabela cu valorile functiei lui Laplace (Anexa 2) se gaseste ca pentru z q = 2,11 , revine o
probabilitate de 96,60%.

Exemplul 12
Sa se calculeze marimea esantionului simplu care se doreste a fi constituit în vederea
cercetarii prin sondaj a rezistentei la presiune a unor piese. Procedeul de sondaj care urmeaza a fi
folosit este tragerea la sorti fara revenire. Dintr-o înregistrare de proba, efectuata anterior, asupra
unui numar de 100 piese s-a putut calcula o estimatie a dispersiei caracteristicii (rezistenta la
presiune), care are marimea de 20.000.
-88-

Cercetarea ce urmeaza a fi realizata admite o eroare limita pentru rezistenta medie la


presiune de 40 kg/ cm 2 si o probabilitate de garantare a rezultatelor de 95%, în care caz factorul de
probabilitate, conform legii de repartitie normale, este z q = 1,96 .

Nota: Cu toate ca, procedeul de sondaj ce se preconizeaza a fi utilizat este tragerea la sorti
fara revenire, formula de calcul folosita pentru determinarea numarului de piese ce vor fi
cercetate, este aceea utilizata în cazul tragerii la sorti cu revenire, deoarece nu se cunoaste volumul
colectivitatii totale.
z 2q ⋅ s 2 1,962 ⋅ 20.000
n= = = 48 piese
? 2x 40 2

Exemplul 13
Se doreste sa se estimeze proportia fumatorilor existenta într-o populatie statistica, cu o
probabilitate de 95%, iar pe baza unor informatii anterioare se apreciaza ca aceasta proportie este
de aproximativ 40%. Sa se calculeze marimea esantionului simplu ce va fi constituit prin tragere
fara revenire, considerând o eroare limita de 4%.
În aceste conditii date, numarul de pesoane care vor fi incluse în esantion este calculat
astfel:
z 2q ⋅ p(1 − p) 1,962 ⋅ 0,4 ⋅ 0,6
n= = = 576 persoane
? 2w 0,042

Exemplul 14
În cadrul unei cercetari statistice prin sondaj privind eficienta activitatii comisiilor de
judecata s-a urmarit si evaluarea duratei medii de solutionare a cauzelor. Prelucrarea datelor
înregistrate de la un esantion format prin tragere la sorti fara revenire si care reprezinta 20% din
totalitatea cauzelor, a condus la urmatoarea distributie:
Tabelul 14
Timpul Numarul Mijlocul xini (x i − x )2
(x i − x ) ⋅ n i
2

necesar pentru cauzelor intervalului


solutionarea ni xi
cauzelor (zile)
pâna la 15 20 8,0 160 473,0625 9.461,250
16-30 120 23,0 2.760 45,5625 5.467,500
31-60 50 45,5 2.275 248,0625 12.403,125
peste 60 10 75,5 755 2.093,0625 20.930,625
total 200 5.950 48.262,500
Sa se estimeze durata medie de solutionare o unei cauze din întregul lot de cauze si limitele
sale probabile, adoptându-se o probabilitate de garantare a rezultatelor de 95,45%.

- Estimatia duratei medii de solutionare a unei cauze:


-89-

Sx i n i 5.950
x= = = 29,75 zile
Sn i 200
- Estimatia dispersiei duratei de solutionare a cauzelor:
N− 1 S( x i − x ) ⋅ n i N − 1 48.262,500 999
2
s2 ⋅ = ⋅ = ⋅ =
N Sn i − 1 N 200 − 1 1.000
= 242,52512 ⋅ 0,999 = 242,28
- Estimatia erorii medii a valorii medii:
s2 N− n 242 ,52512 1.000 − 200
sx = ⋅ = ⋅ = 1, 2126 ⋅ 0,8 = 0,9849
n N 200 1.000
- Limitele probabile ale duratei medii de solutionare a unei cauze:
- limita inferioara:
s 2  N− n 
li = x − z q ⋅ = 29 ,75 − 2 ⋅ 0,9849 = 27 ,78 zile
n  N 
- limita superioara:
s 2  N− n 
li = x+ z q ⋅ = 29,75 + 2 ⋅ 0,9849 = 31,72 zile
n  N 
-90-

Anexa 1
Numere întâmplatoare1)
Seria 1 2 3 4 5 6 7 8
1 78994 36244 02673 25475 84953 61793 50243 63423
2 04909 58485 70786 93930 34880 73059 06823 80257
3 46582 73570 33004 51795 86477 46736 60460 70345
4 29242 89792 88634 60285 07190 97795 27011 85941
5 68104 81339 97090 20601 78940 20228 22803 96070
6 17156 02182 82504 19880 93747 80910 78260 25136
7 50711 94789 07171 02103 99057 98775 37997 18325
8 39449 52409 75095 77720 39729 03205 09313 43545
9 75629 82729 76916 72657 58992 32576 01154 84890
10 01020 55151 36132 51971 32155 60735 64867 35424
11 08337 89989 24290 08618 66798 25889 52860 57375
12 76829 47229 19706 30094 69430 92399 98749 22081
13 39708 30641 21267 56501 95182 72442 221445 17276
14 89836 55817 56747 75195 06818 83043 47403 58266
15 25903 61370 66081 54076 67442 52964 23823 02718
16 71345 03422 01015 68023 19703 77313 04555 83425
17 61454 92263 14647 08473 34124 10740 40839 05620
18 80376 08909 30470 40200 46558 61742 11643 92121
18 45144 54373 05505 90074 24783 86299 20900 15144
20 12191 88527 58852 51175 11534 87218 04876 85584
21 62936 59120 73957 35969 21598 47287 39394 08778
22 31588 96798 43668 12611 01714 77266 55079 24690
23 20787 96048 84726 17512 39450 43618 30629 24356
24 45603 00745 84635 43079 52724 14262 05750 89373
25 31606 64782 34027 56734 09365 20008 93559 78384
26 10452 33074 76718 99556 16026 00013 78411 95107
27 37016 64633 67301 50949 91298 74968 73631 57397
28 66725 97865 25409 37498 00816 99262 14471 10232
29 07380 74438 82120 17890 40963 55757 13492 68294
30 71621 57688 58256 47702 74724 89419 08025 68519
31 03466 13263 23917 20417 11315 52805 33072 07723
32 12692 32931 97387 34822 53775 91674 76549 37635
33 52192 30941 44998 17833 94563 23062 95725 38463
34 56691 72529 66063 73570 86860 68125 40436 31303
35 74952 43041 58869 15677 78598 43520 97521 83248
36 18752 43693 32867 53017 22661 39610 03796 02622
37 61691 04944 43111 28325 82319 65589 66048 98498
38 49197 63948 38947 60207 70667 39843 60607 15328
39 19436 87291 71684 74859 76501 9345 6 95714 92518
40 39143 64893 14606 13543 09621 68301 69817 52140
41 82244 67549 76491 09761 74494 91307 64222 66592
42 55847 56155 42878 23708 98999 40131 52360 90398
43 94095 95970 07826 25991 37584 56966 68623 83454
44 11751 69469 25521 44097 07511 88976 30122 67542
45 69902 08995 27821 11758 64989 61902 32121 28163
46 21850 25352 25556 92161 23592 43294 10479 37879
47 75850 46992 251665 55906 62339 88958 91717 15756
48 29648 22086 42581 85677 20251 39641 65786 80689
49 82740 28443 42734 25518 82827 35825 90288 32911
50 36842 42092 52075 83926 42875 71500 69216 01350
1) Reprodus dupa F. Mills – “Statistical Methodes”, Columbia University, Third edition,
New York.
-91-

Anexa 2
Distributia normala normata.
− z2
1
Functia lui Laplace φ(z ) = ⋅∫ e
z
0
2
⋅ dz

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3696 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4983 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
3,0 0,4987 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000
-92-

Anexa 3
Distributia χ 2

Valorile lui χ în functie de probabilitatea


2
( )
P χ 2 ≤ χ 2P = 1− q = P si numarul gradelor de
libertate f
q% 99,5 99,0 97,5 95,0 90,0 50,0 10,0 5,0 2,5 1,0 0,5
P% 0,5 1,0 2,5 5,0 10,0 50,0 90,0 95,0 97,5 99,0 99,5

f
1 0,0000 0,000 0,000 0,00 0,158 0,455 2,71 3,84 5.02 6,63 7,88
393 157 982 393
2 0,0100 0,2010 0,0506 0,103 0,211 1,39 4,61 5,99 7,38 9,21 10,6
3 0,0717 0,115 0,216 0,352 0,548 2,37 6,25 7,81 9,35 11,3 12,8
4 0,207 0,297 O,484 0,711 1,06 3,36 7,78 9,49 11,1 13,3 14,9
5 0,412 0,554 0,831 1,45 1,61 4,35 9,24 11,1 12,8 15,1 16,7
6 0,676 0,827 1,24 1,64 2,20 5,35 10,6 12,6 14,4 16,8 18,5
7 0,989 1,24 1,69 2,17 2,83 6,35 12,0 14,1 16,0 18,5 20,3
8 1,34 1,65 2,18 2,73 3,49 7,34 13,4 15,5 17,5 20,1 22,0
9 1,73 2,09 2,70 3,33 4,17 8,34 14,7 16,9 19,0 21,7 23,6
10 2,16 2,56 3,25 3,94 4,87 9,34 16,0 18,3 20,5 23,2 25,2
11 2,60 3,05 3,82 4,57 5,58 10,3 17,3 19,7 21,9 24,7 26,8
12 3,07 3,57 4,40 5,23 6,30 11,3 18,5 21,0 23,3 26,2 28,3
13 3,57 4,11 5,01 5,89 7,04 12,3 19,8 22,4 24,7 27,7 29,8
14 4,07 4,66 5,63 6,57 7,79 13,3 21,1 23,7 26,1 29,1 31,3
15 4,60 5,23 6,26 7,26 8,55 14,3 22,3 25,0 27,5 30,6 32,8
16 5,14 5,81 6,91 7,96 9,31 15,3 23,5 26,3 28,8 32,0 34,3
17 5,70 6,41 7,56 8,67 10,1 16,3 24,8 27,6 30,2 33,4 35,7
18 6,26 7,01 8,23 9,39 109 17,3 26,0 28,9 31,5 34,8 37,8
19 6,84 7,63 8,91 10,1 11,7 18,3 27,2 30,1 32,9 36,2 38,6
20 7,43 8,26 9,59 10,9 12,4 19,3 28,4 31,4 34,2 37,6 40,0
21 8,03 8,90 10,3 11,6 13,2 20,3 29,6 32,7 35,5 38,0 41,4
22 8,64 9,54 11,0 12,3 14,0 21,3 30,8 33,9 36,9 40,3 42,8
23 9,26 10,2 11,7 13,1 14,8 22,3 32,0 35,0 38,1 41,6 44,2
24 9,89 10,9 12,4 13,8 15,7 23,3 33,2 36,4 39,4 43,0 45,6
25 10,5 11,5 13,1 14,6 16,5 24,3 34,4 37,7 40,6 44,3 46,9
26 11,2 12,2 13,8 15,4 17,3 25,3 35,6 38,9 41,9 45,6 48,3
27 11,8 12,9 14,6 16,2 18,1 26,3 36,7 40,1 43,2 47,0 49,6
28 12,5 13,6 15,3 16,9 18,9 27,3 37,9 41,3 44,5 48,3 51,0
29 13,1 14,3 16,0 17,7 19,8 28,3 39,1 42,6 45,7 49,6 52,3
30 13,8 15,0 16,8 18,5 20,6 29,3 40,3 43,8 47,0 50,9 53,7
-93-

Anexa 4

Distributia Student

a) Valorile lui “t” în functie de probabilitatea P (t ≤ t q ) = 1− q = P si numarul gradelor de libertate “f”

b) Valorile lui “t” în functie de probabilitatea P(− t q < t < + t q ) = 1− 2 ⋅


q
= 1 − q = P si numarul gradelor de libertate
2
“f”

P % 60 70 80 90 95 97,5 99 99,5 99 ,9 99,95


q% 2,5 0 ,5 0,1
40 30 20 10 5 1 0,05
f
1 0,325 0,727 1,376 3,078 6,314 12,710 31,820 63,660 381,30 636,60
2 0,289 0,617 1,061 1,886 2,920 4,303 6,965 9,925 22,33 31,60
3 0,277 0,584 0,978 1,638 2,353 3,182 4,541 5,841 10,22 12,94
4 0,271 0,569 0,941 1,533 2,132 2,776 3,747 4,604 7,173 8,610
5 0,267 0,559 0,920 1,476 2,015 2,571 3,365 4,032 5,893 6,859
6 0,265 0,553 0,906 1,440 1,943 2,447 3,143 3,707 5,208 5,959
7 0,263 0,549 0,896 1,415 1,895 2,365 2,998 3,499 4,785 5,405
8 0,262 0,546 0,889 1,397 1,860 2,306 2,896 3,355 4,501 5,041
9 0,261 0,543 0,883 1,383 1,833 2,262 2,821 3,250 4,297 4,781
10 0,260 0,542 0,879 1,372 1,812 2,228 2,764 3,169 4,144 4,587

P% 20 40 60 80 90 95 98 99 99,8 99,90
q% 40 30 20 10 5 2,5 1 0 ,5 0,1 0,05
-94-

P % 60 70 80 90 95 97,5 99 99,5 99 ,9 99,95


q% 2,5 0 ,5 0,1
40 30 20 10 5 1 0,05
f
11 0,260 0,540 0,876 1,363 1,796 2,201 2,718 3,106 4,025 4,437
12 0,259 0,539 0,873 1,356 1,782 2,179 2,681 3,055 3,930 4,318
13 0,259 0,538 0,870 1,350 1,771 2,160 2,650 3,012 3,853 4,221
14 0,258 0,537 0,868 1,345 1,761 2,145 2,624 2,977 3,787 4,140
15 0,258 0,536 0,866 1,341 1,753 2,131 2,602 2,947 3,733 4,073
16 0,258 0,535 0,865 1,337 1,746 2,120 2,583 2,921 3,686 4,015
17 0,257 0,534 0,863 1,333 1,740 2,110 2,567 2,898 3,646 3,965
18 0,257 0,534 0,862 1,330 1,734 2,101 2,552 2,878 3,611 3,922
19 0,257 0,533 0,861 1,328 1,729 2,093 2,539 2,861 3,579 3,883
20 0,257 0,533 0,860 1,325 1,725 2,086 2,528 2,845 3,552 3,850
21 0,257 0,532 0,859 1,323 1,721 2,080 2,518 2,831 3,527 3,819
22 0,256 0,532 0,858 1,321 1,717 2,074 2,508 2,819 3,505 3,792
23 0,256 0,532 0,858 1,319 1,714 2,069 2,500 2,807 3,485 3,767
24 0,256 0,531 0,857 1,318 1,711 2,064 2,492 2,797 3,467 3,745
25 0,256 0,531 0,856 1,316 1,708 2,060 2,485 2,787 3,450 3,725
26 0,256 0,531 0,856 1,315 1,706 2,056 2,479 2,779 3,435 3,707
27 0,256 0,531 0,855 1,314 1,703 2,052 2,473 2,771 3,421 3,690
28 0,256 0,530 0,855 1,313 1,701 2,048 2,467 2,763 3,408 3,674
29 0,256 0,530 0,854 1,311 1,699 2,045 2,462 2,756 3,396 3,659
30 0,256 0,530 0,854 1,310 1,697 2,042 2,457 2,750 3,385 3,646

P% 20 40 60 80 90 95 98 99 99,8 99,90
q% 40 30 20 10 5 2,5 1 0 ,5 0,1 0,05
-95-

P % 60 70 80 90 95 97,5 99 99,5 99 ,9 99,95


q% 2,5 0 ,5 0,1
40 30 20 10 5 1 0,05
f
40 0,255 0,529 0,851 1,303 1,684 2,021 2,423 2,704 3,307 3,551
50 0,255 0,528 0,849 1,298 1,676 2,009 2,403 2,678 3,262 3,495
60 0,254 0,527 0,848 1,296 1,671 2,000 2,390 2,660 3,232 3,460
80 0,254 0,527 0,846 1,292 1,664 1,990 2,374 2,639 3,195 3,415
100 0,254 0,526 0,845 1,290 1,660 1,984 2,365 2,626 3,174 3,389
200 0,254 0,525 0,843 1,286 1,653 1,972 2,345 2,601 3,131 3,339
500 0,253 0,525 0,842 1,283 1,648 1,965 2,334 2,586 3,106 3,310
º 0,253 0,524 0,842 1,282 1,645 1,960 2,326 2,576 3,090 3,291
P% 20 40 60 80 90 95 98 99 99,8 99,90
q% 40 30 20 10 5 2,5 1 0 ,5 0,1 0,05
-96-

Anexa 5
Distributia Fisher
2
s
Valorile raportului F = corespunzatoare probabilitatii P(F ≤ Fq) = 95% si numarul gradelor de libertate
1
2
s 2

“f1 ” si “f2 ”. Dispersia mai mare, în cazul nostru s12 se ia la numarator.

1 2 3 4 5 6 7 8 9 10 12 16 20 24 80 100 º
f1
f2
1 161 200 216 225 230 234 237 239 241 242 244 246 248 249 252 253 254
2 18,5 19,0 19,2 19,2 19,3 19,3 19,4 19,4 19,4 19,4 19,4 19,4 19,4 19,5 19,5 19,5 19,5
3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,69 8,66 8,64 8,58 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,84 5,80 5,77 5,70 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,60 4,56 4,53 4,44 4,41 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,92 3,87 3,84 3,75 3,71 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,49 3,44 3,41 3,32 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,20 3,15 3,12 3,02 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 2,99 2,94 2,90 2,80 2,76 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,83 2,77 2,74 2,64 2,59 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,70 2,65 2,61 2,51 2,46 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,60 2,54 2,51 2,40 2,35 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,51 2,46 2,42 2,31 2,26 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,44 2,39 2,35 2,24 2,19 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,38 2,33 2,29 2,18 2,12 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,33 2,28 2,24 2,12 2,07 2,01
-97-

1 2 3 4 5 6 7 8 9 10 12 16 20 24 80 100 º
f1
f2
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,29 2,23 2,19 2,08 2,02 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,25 2,19 2,15 2,04 1,98 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,21 2,16 2,11 2,00 1,94 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,18 2,12 2,08 1,97 1,91 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,16 2,10 2,05 1,94 1,88 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,13 2,07 2,03 1,91 1,85 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,11 2,05 2,00 1,88 1,82 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,09 2,03 1,98 1,86 1,80 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,07 2,01 1,96 1,84 1,78 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,05 1,99 1,95 1,82 1,76 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,04 1,97 1,93 1,81 1,74 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,02 1,96 1,91 1,79 1,73 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,01 1,94 1,90 1,77 1,71 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 1,16 2,09 1,99 1,93 1,89 1,76 1,70 1,62
32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,07 1,97 1,91 1,86 1,74 1,67 1,59
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,05 1,95 1,89 1,84 1,71 1,65 1,57
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,03 1,93 1,87 1,82 1,69 1,62 1,55
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,02 1,92 1,85 1,81 1,68 1,61 1,53
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,90 1,84 1,79 1,66 1,59 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,82 1,75 1,70 1,56 1,48 1,39
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,85 1,75 1,68 1,63 1,48 1,39 1,28
200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,80 1,69 1,62 1,57 1,41 1,32 1,19
500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85 1,77 1,68 1,59 1,54 1,38 1,28 1,11
º 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,64 1,57 1,52 1,35 1,24 1,00
-98-

S-ar putea să vă placă și