Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
SUPORT CURS
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
CUPRINS
CAPITOLUL 1 - NECESITATEA ANALIZEI DE DATE ...................................................... 7
INTRODUCERE ................................................................................................................................. 7
OBIECTIVELE CAPITOLULUI .................................................................................................................... 7
CONTINUT ..................................................................................................................................... 7
Observarea statistica ............................................................................................................ 7
Principalele concepte utilizate in analiza de date ................................................................. 8
Sistematizarea datelor statistice .......................................................................................... 8
Prezentarea datelor sub forma de tabele si grafice statistice ............................................. 12
Crearea unui tabel de contingenta ..................................................................................... 15
Principalele fuctii utilizate in programul Microsoft Excel ..................................................... 18
SINTEZA ..................................................................................................................................... 20
EXERCITII SI APLICATII ...................................................................................................................... 20
CAPITOLUL 2 INDICATORII TENDINTEI CENTRALE .................................................. 23
INTRODUCERE ............................................................................................................................... 23
OBIECTIVELE CAPITOLULUI .................................................................................................................. 23
COTINUT ..................................................................................................................................... 24
Introducere ......................................................................................................................... 24
Media aritmetica ................................................................................................................. 24
Media armonic .................................................................................................................. 27
Media p tratic ................................................................................................................... 28
Media geometric . .............................................................................................................. 28
Mediana .............................................................................................................................. 29
Modul .................................................................................................................................. 30
Analiza indicatorilor medii cu ajutorul Microsoft Excel ........................................................ 31
SINTEZA ..................................................................................................................................... 38
EXERCITII SI APLICATII ...................................................................................................................... 38
CAPITOLUL 3 ANALIZA VARIATIEI SI ASIMETRIEI .................................................. 40
INTRODUCERE ............................................................................................................................... 40
OBIECTIVELE CAPITOLULUI .................................................................................................................. 40
COTINUT ..................................................................................................................................... 40
Indicatorii simpli ai varia iei ................................................................................................ 40
Indicatorii sintetici ai varia iei ............................................................................................. 41
Indicatorii asimetriei si boltirii ............................................................................................. 42
Calculul indicatorilor variatiei, asimetriei si boltirii utilizand functiile Microsoft Excel. ........ 43
SINTEZA ..................................................................................................................................... 49
EXERCITII SI APLICATII ...................................................................................................................... 49
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
CAPITOLUL 4 SONDAJUL STATISTIC ..................................................................... 52
INTRODUCERE ............................................................................................................................... 52
OBIECTIVELE CAPITOLULUI .................................................................................................................. 52
CONTINUT ................................................................................................................................... 52
Definire, concepte utilizate si etapele cercetarii selective (prin sondaj) ............................. 52
Concepte utilizate ............................................................................................................... 53
Tipuri de sondaj .................................................................................................................. 54
Etapele cercetarii selective (prin sondaj) ............................................................................ 55
Calculul indicatorilor de sondaj. Esimarea intervalelor de incredere ................................... 57
Determinarea volumul eantionului ................................................................................... 60
SINTEZA ..................................................................................................................................... 61
EXERCITII SI APLICATII ...................................................................................................................... 62
CAPITOLUL 5 TESTAREA IPOTEZELOR STATISTICE ................................................ 66
INTRODUCERE ............................................................................................................................... 66
OBIECTIVELE CAPITOLULUI .................................................................................................................. 66
CONTINUT ................................................................................................................................... 66
Introducere in testrea ipotezelor statistice ......................................................................... 66
Etapele testarii ipotezelor statistice .................................................................................. 67
Testul HI-patrat .................................................................................................................. 69
SINTEZA ..................................................................................................................................... 73
EXERCITII SI APLICATII ...................................................................................................................... 73
CAPITOLUL 6 ANALIZA LEGATURII DINTRE VARIABILELE STATISTICE ..................... 78
INTRODUCERE ............................................................................................................................... 78
OBIECTIVELE CAPITOLULUI .................................................................................................................. 78
COTINUT ..................................................................................................................................... 78
SINTEZA ..................................................................................................................................... 90
EXERCITII SI APLICATII ...................................................................................................................... 91
BIBLIOGRAFIE .................................................................................................... 109
ANEXE ............................................................................................................... 110
ANEXA 1 - PREZENTAREA FUNC IILE EXCEL UTILIZATE MAI FRECVENT N ANALIZE SOCIO-ECONOMICE ............................ 111
ANEXA 2 - PREZENTAREA COMPONENTELOR ANALYSIS TOOL PACK, CONFORM MICROSOFT HELP ............................... 116
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
LISTA de TABELE
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
LIST de FIGURI
FIG. NR. 1 - OPTIUNEA DE SORTARE A DATELOR......................................................9
FIG. NR. 2 CASUTA DE DIALOG DE LA SORTAREA DATELOR .................................10
FIG. NR. 3 SORTAREA DUPA CRITERII MULTIPLE...................................................10
FIG. NR. 4 CASUTA DE DIALOG A FUNCTIEI FREQUENCY .......................................12
FIG. NR. 5 ALEGEREA TIPULUI DE GRAFIC............................................................13
FIG. NR. 6 MODIFICAREA TIPULUI DE GRAFIC.......................................................14
FIG. NR. 7 SELECTAREA SURSEI DATELOR A UNUI GRAFIC....................................15
FIG. NR. 8 ALEGEREA ELEMENTELOR DE IDENTIFICARE A GRAFICULUI STATISTIC...15
FIG. NR. 9 ARGUMENTELE FUNCTIEI VLOOKUP.....................................................16
FIG. NR. 10 CREAREA UNUI TABEL DE CONTINGENTA (PIVOT)...............................17
FIG. NR. 11 INSTRUMENTELE DE CREARE A UNUI TABEL DE CONTINGENTA (PIVOT)18
FIG. NR. 12 ACCESAREA FUNCTIEI AVERAGE........................................................31
FIG. NR. 13 ACCESAREA FUNCTIEI GEOMEAN.......................................................32
FIG. NR. 14 ACCESAREA FUNCTIEI HARMEAN.......................................................32
FIG. NR. 15 ACCESAREA FUNCTIEI MEDIAN..........................................................33
FIG. NR. 16 ACCESAREA FUNCTIEI MODE.............................................................34
FIG. NR. 17 ACCESAREA FUNCTIEI SUMPRODUCT.................................................34
FIG. NR. 18 ACCESAREA EXCEL ADD-INS..............................................................35
FIG. NR. 19 ALEGEREA INSTRUMENTELOR DE ANALIZA.........................................36
FIG. NR. 20 ALEGEREA OPTIUNII DESCRIPTIVE STATISTICS...................................36
FIG. NR. 21 FEREASTRA DE DIALOG DESCRIPTIVE STATISTICS..............................37
FIG. NR. 22 ACCESAREA FUNCTIEIILOR MAX SI MIN PENTRU CALCULAREA
AMPLITUDINII VARIATIEI.......................................................................................44
FIG. NR. 23 ACCESAREA FUNCTIEI VARP..............................................................44
FIG. NR. 24 ACCESAREA FUNCTIEI VARP..............................................................45
FIG. NR. 25 ACCESAREA FUNCTIEI STDEVP..........................................................45
FIG. NR. 26 ACCESAREA FUNCTIEI STDEV............................................................46
FIG. NR. 27 ACCESAREA FUNCTIEI SKEW.............................................................46
FIG. NR. 28 ACCESAREA FUNCIEI SKEW...............................................................48
FIG. NR. 29 FEREASTRA DE DIALOG DESCRIPTIVE STATISTICS..............................48
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 30 ACCESAREA FUNCTIEI RANDBETWEEN...............................................56
FIG. NR. 31 CONSTRUIREA INTERVALELOR DE INCREDERE....................................59
FIG. NR. 32 DISTRIBUTIA HI-PATRAT...................................................................69
FIG. NR. 33 ACCESAREA FUNCTIEI CHIINV............................................................72
FIG. NR. 34 CONSTRUIREA GRAFICULUI DE TIP NOR DE PUNCTE (SCATTER)...........82
FIG. NR. 35 INTERDEPENDENTA DINTRE SALARIUL BRUT SI EXPERIENTA...............82
FIG. NR. 36 SELECTAREA FUNCTIEI DE REGRESIE PRIN METODA GRAFICA..............83
FIG. NR. 37 ALEGEREA TIPULUI FUNCTIEI DE REGRESIE ........................................84
FIG. NR. 38 AFISAREA FUNCTIEI DE REGRESIE PE GRAFICUL NORULUI DE PUNCTE. 85
FIG. NR. 39 ALEGEREA OPTIUNII DE REGRESIE .....................................................86
FIG. NR. 40 FEREASTRA DE DIALOG A O[IUNII REGRESSION ..................................86
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
CAPITOLUL 1 - NECESITATEA ANALIZEI DE DATE
Introducere
Prima etapa a cercetarii realitatii sosio-economice este cea a identificarii, obervarii si colectarii datelor ce caracterizeaza
fenoomenul sau procesul analizat, etapa denumita observare statistica, un proces care, de regula, se desfasora conform
unui plan al observarii, care precizeaza clar scopul observarii, colectivitatea statistica supusa observarii, unitatea de
observare, programul observarii, perioada de inregistrare a datelor, locul realizarii observarii statistice, masurile
organizatorice privind aspectele logistice ale desfasurarii procesului de observare statistica.
Dupa obtinerea datelor statistice in urma procesului de observare statistica, se trece la etapa de sistematizare a datelor,
obtinandu-se un set de date statistice sau o baza de date care va intra in procesul de realizare de calcul si analiza de date
si prezentare a datelor in tabele si grafice statistice adecvate.
Obiectivele capitolului
Capitolul isi propune sa analizeze principalele aspecte referitoare la necesitatea analizei de date in contextul unui
management performant, modalitatile de obtinere a datelor, de prelucrare a acestora, de prezentare a rezultatelor in
forme adecvate pentru a extrage cat mai rapid informatia necesara deciziei de afaceri, pentru a sustine cat mai
convingator o opinie etc.
Culegerea, sistematizarea, prelucrarea, prezentarea si interpretarea rezultatelor va fi prezentata utilizand programul
Microsoft Excel 2007.
Continut
Observarea statistica
Observarea statistica, ca prima etapa a procesului de analiza manageriala a datelor, poate urmari fie observarea directa,
pe teren , fie indirecta, documentara.
Observarea direct poate fi, in funcie de volumul colectivitii cercetate, observarea direct total sau parial.
Principalele modalitatii de observare directa totala sunt recensamantul (cea mai veche forma a observarii totale),
inventarierea, rapoartele statistice si monografia statistica.
Observarea directa partiala urmareste analizarea a unei parti din colectititatea statistica urmand ca, in urma
procesului de inferenta statistica, sa se generalizeze rezultatele analizei pe intreaga colectivitate statistica.
Principalele tipuri de observare parial sunt:
sondajul statistic (selecia statistic) presupune extragerea din populaia total ce se dorete a fi
cercetat, a unei pri, numit eantion sau mostr.
Observarea prii principale (observarea masivului de date) reprezint o metod ce se aplic
colectivitilor ce prezint grupe de importan diferit, estimarea indicatorilor pe ansamblul
colectivitii facndu-se pe baza datelor nregistrate pentru grupele semnificative, importante ca pon-
dere n colectivitatea general.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Ancheta de opinie const n culegerea de date de la o parte a populaiei i/sau completarea unor
chestionare speciale pentru a se obine unele informaii orientative despre fenomenul supus cercetrii,
dar fr a se face demersuri speciale ca n cazul sondajului statistic pentru asigurarea repre-
zentativitii eantionului.
Observarea indirect consta in preluarea datelor din alte surse de informare. In acest caz, insa, este important ca
managerul sa nu preia n mod automatic datele ci sa verifice atent continutul informatiei preluate. Mai mult, in cazul
coletarii datelor din mai multe surse, este absolut necesar verificarea compatibilitii metodologiilor intre datele
preluate.
Principalele concepte utilizate in analiza de date
Colectivitatea statistic (populaia statistic) cuprinde totalitatea manifestrilor unui fenomen sau proces supus
cercetrii statistice. Colectivitatea statistic specific vieii economico-sociale are un caracter obiectiv, concret, finit,
avnd o clar determinare n spaiu i timp, spre deosebire de colectivitile teoretice, abstracte, infinite, cu care
opereaz statistica matematic.
Unitatea statistic reprezint elementul, manifestarea sau concretizarea colectivitii cercetate. Fiecare unitate se
nregistreaz separat n timpul observrii statistice ntruct ea este purttoare att a trsturilor comune ale colectivitii
statistice, ct i a unor particulariti care o fac s se deosebeasc de alte uniti ale colectivitii.
Varianta reprezint nivelul observat al caracteristicii pentru fiecare unitate statistic nregistrat.
Frecvena de apariie a unei variante distincte sau a unui grup de variante, poate fi absolut, ceea ce const n numrul
de nregistrri (apariii) ntr-o colectivitate sau relativ adic, ponderea, greutatea specific sau cota parte n totalul
elementelor unei colectiviti.
Sistematizarea datelor statistice
In procesul de analiza a performantei firmei sau a mediului de afaceri apre de multe ori necesitatea analizei unor volume
mari de date.
De cele mai multe ori, dupa o prima etapa a culegerii de date se obtine un set de date o serie simple de date -
prezentata ntr-o form aleatoare, neregulat, facand dificila extragerea informatiilor esentiale ce caraterizeaza
colectivitatea analizata.
Prin urmare, apare necesitatea sistematizarii datelor, a organizarii acestora intr-o forma care sa permita extragerea a
tot ce este esential si necesar in procesul decizional.
Prelucrarea initiala a unei serii simple de date
O situatie uzuala in practica de afaceri este cea iin care se doreste prelucrarea unei baze de date simple aflata in format
Excel.
In Excel, baza de date este practic formata dintr-o lista, in care au fost introduse pe de o parte numele campului in
randul de sus al bazei de date (formand variabilele de analiza) apoi datele propriu-zise in celulele urmatoare. Este
necesar ca sa nu existe randuri goale intre numele campurilor si inregistrari.
Sortarea datelor
Sortarea datelor statistice prezentate in forma matriciala se realizeaza astfel:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
o Din meniul Data, se alege din sectiunea Sort & Filter optiunea Sort. Daca selectarea datelor s-a
realizat inclusiv cu denumirea variabilelor analizate, se selecteaza optiunea My data has header. Se
alege in cadrul optiunii Sort by denumirea variabilei dupa care se doreste realizarea sortarii primare a
datelor
FIG. NR. 1 - OPTIUNEA DE SORTARE A DATELOR
o Daca datele s-au selectat fara includerea denumirii variabilelor analizate, se alege in cadrul optiunii
Sort by coloana in care se afla variabila dupa care se doreste realizarea sortarii primare a datelor.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 2 CASUTA DE DIALOG DE LA SORTAREA DATELOR
Daca se dreste realizarea unei selectii multiple, se acceaseaza optiunea Add Level, si se adauga criterii suplimentare de
sortare a datelor.
FIG. NR. 3 SORTAREA DUPA CRITERII MULTIPLE
Crearea unei serii de frecvente (gruparea datelor)
Gruparea statistic este procedeul de sintetizare a datelor statistice, trecandu-se dintr-o serie de date simpla intr-o serie
de distributie de frecvente. Variabila dupa care se grupeaza datele poate fi atat cantitativa cat si calitativa.
Daca gruparea se realizeaza dupa doua variabile statistice simultan se obtine o grupare combinata sau un tabel de
contingenta.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Gruparea datelor dupa o singura variabila statistica
Gruparea datelor dup o singur variabil se poate realiza atat pe intervale egale cat si pe intervale inegale, in functie de
necesitatile de analiza ale managerului.
Gruparea datelor pe intervale egale dup o singur variabil presupune parcurgerea urmtoarelor etape:
Calculul amplitudinii variaiei, ca diferen ntre valoarea maxim (xmax) i, respectiv, valoarea minim (xmin)
nregistrat de variabila analizat: Ax = xmax xmin;
Stabilirea numrului de grupe/intervale (k). nu exista o regula unanim acceptata, insa numarul de grupe trebuie
astfel ales incat, pe de o parte, sa nu se piarda din complexitatea informatiei continuta de seria simpla de data iar, pe de
alt parte, suficient de mic pentru a permite o analiz rapid, dar coerent. De regul, numrul de grupe/intervale folosit
n analizele economice este cuprins ntre 5 i 15 grupe. Una dintre regulile prezentate in literatura de specialitate
precizeaza ca numarul de grupe k se poate alege astfel: k este primul numar intreg pentru care
N
k
> 2
, unde N
reprezinta numarul total de observatii cuprinse in seria simpla de date.
Determinarea mrimii (r) fiecrui interval de grupare:
k
x x
k
A
r
min max
[1.1]
unde: A = amplitudinea absolut a variaiei; r = numrul de grupe/intervale de variaie.
De obicei, n analizele economice se procedeaz la rotunjirea mrimii intervalului, astfel nct s permit o prezentare
ct mai sugestiv a datelor, precum i o prelucrare numeric simpl.
In Microsoft Excel, pentru a stabili amplitudinea variatie se face diferenta dintre maxim si minim, aplicand functiile:
MAX() returneaz argumentul cu valoarea maxim;
MIN() returneaz argumentul cu valoarea minim;
Calculul frecventelor absolute corespunzatoare fiecarei grupe se realizeaza in Excel utilizand functia frequency.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 4 CASUTA DE DIALOG A FUNCTIEI FREQUENCY
Argumentele functiei Frequency sunt:
Data_array reprezentand seria simpla de date initiale
Bins_array reprezinta o coloana nou creata, prezentand limitele superioare ale fiecarui interval de grupare
Prezentarea datelor sub forma de tabele si grafice statistice
Tabelul statistic este o form de prezentare ordonat i complet a datelor, care trebuie sa includa urmatoarele
elemente:
Titlul tabelului, trebuie s precizeze n puine cuvinte natura datelor cuprinse n tabel, fixnd, totodat, n spaiu
i timp fenomenul/procesul analizat.
Macheta tabelului este alcatuita din liniile orizontale i verticale a cror intersecie conduce la formarea de celule
si in care se vor prezenta datele analizate.
Subiectul tabelului este format din componentele variabilei supuse analizei si se regasesc in capetele rndurilor
tabelului
Predicatul tabelului este format din aspectele cantitative/calitative ce caracterizeaza populatia statistica
analizata si se regasesc in capetele coloanelor tabelului
Sursa datelor se trece ntr-o form explicit imediat sub tabel.
Nota explicativ se trece fie imediat dup sursa datelor, fie n subsolul paginii pe care se afl tabelul
Graficul statistic prezinta datele sub form de imagini spaiale cu caracter convenional, prezentand sintetic forma si
caracteristicile principale ale setului de date analizat.
Elementele unui grafic statistic sunt:
Titlul graficului are aceleai caracteristici ca i titlul tabelului statistic.
Axa sau axele de referin ale graficului.
Scara graficului se folosete pentru gradarea axei/axelor.
Legenda graficului explic simbolurile, diferitele culori sau hauri folosite n grafic.
Graficul propriu-zis este reprezentat de puncte, linii, figuri geometrice n plan sau spaiu, sau figuri natural-
convenionale construite la scar.
Sursa datelor se plaseaz imediat sub grafic.
Nota explicativ are aceleai caracteristici cu cele prezentate la tabelul statistic.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
In Excel, pentru realizarea unui grafic se parcurg mai multe etape:
Se alege tipul graficului in functie de caracteristicile varibilei (variabilelor) ce urmeaza a fi reprezentate;
alegerea tipului de grafic (diagrama prin coloane, diagrama de structura, linii etc) se poate face in mai multe
moduri:
o Din meniul Insert, se alege din Charts, tipul de grafic dorit:
FIG. NR. 5 ALEGEREA TIPULUI DE GRAFIC
o Din meniul Design, se alege din lista prezentata in Chart Type si, eventual, Charts Layout:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 6 MODIFICAREA TIPULUI DE GRAFIC
Se stabileste sursa de date:
o Din meniul Design, se alege din sectiunea Data, optiunea Select Data; selectarea valorilor prezentate
pe axa orizontala (de exemplu anii analizei, in cazul unei serii cronologice) se poate realiza cu
apeland selectia Horizontal (Category) Axis Label, - Edit si selectarea efectiva a valorilor ce se
doresc a fi evidentiate pe axa orizontala.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 7 SELECTAREA SURSEI DATELOR A UNUI GRAFIC
Se precizeaza elementele de identificare a graficului statistic: titlul graficului, formatul si intervalele de variatie
ale axelor verticale si/sau orizontale ale graficului, legenda, valorile observatiilor reprezentate grafic etc.
o Din meniul Layout se pot alege oricare din optiunile prezentate in sectiunile Labels and Axes
FIG. NR. 8 ALEGEREA ELEMENTELOR DE IDENTIFICARE A GRAFICULUI STATISTIC
Crearea unui tabel de contingenta
De multe ori se doreste analiza simultana a doua sau chiar mai multe variabile, ceea ce presupune gruparea simultana a
datelor dupa doua sau mai multe variabile statistice.
Pentru a analiza coerenta a datelor, variabilele de grupare trebuie sa fie variabile calitative sau variabile cantitative
grupate pe intervale de variatie.
Cu alte cuvinte, daca avem o serie simpla de date corespunzatoare unei variabile cantitative, prima etapa o constituie
impartirea variatiei pe un numar relativ redus de categorii sau de intervale de variatie. Spre exemplu, vechimea
angajatilor prezentata pentru fiecare din cei 48 angajati cuprinsi intr-un esantion (vezi aplicatia 1.2) poate fi grupata pe
trei intervale de variatie: vechime mica, vechime medie, vechime mare. O alta posibilitate ar fi prezentarea celor trei
intervale de variatie sub forma: vechime sub 10 ani, vechime 10-20 ani si vechime de 20 si peste.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Afisarea directa a categoriei de vecime intr-o foaie de lucru Excel se poate realiza utilizand functia VLOOKUP.
FIG. NR. 9 ARGUMENTELE FUNCTIEI VLOOKUP
Functia VLOOKUP.are urmatoarele argumente
Lookup_value reprezinta setul de date initiale pentru care se doreste defnirea categoriilor de variatiei;
Table_array reprezinta matricea unui tabel care trebui construit separat, in are prima coloana corespunde
valorii limitei inferioare a fiecarui interval de variatie, iar coloanele urmatoare denumirii fiecarei categorii/
intervalului definit de variatie;
Col_index_num reprezinta coloana din tabelul predefinit anterior, ale carui valori se doresc a fi afisate in
noua coloana creata in matricea de date;
Range_lookup este un argument optional, boolean, cu doua posibile valori TRUE sau 1 daca se doreste
gasirea valorii celei mai apropiate de cea definita in setul de date initial, FALSE sau 0 daca se doreste valoarea
exacta.
Utilizarea acestei functii permite definirea unei variabile suplimentare, ce va prezenta un numar redus de
categorii/intervale de variatie, si care va permite realizara unui tabel de contingenta (tabel pivot sau tabel cu dubla
intrare).
Tabelul pivot permite alegerea variabilelor prezentate pe coloanele/randurile tabelului.
Un tabel pivot are mai multe sectiuni importante:
1. Pivot Table Filed List afiseaza variabilele cuprinse in matricea initiala de date;
2. Casutele din dreapta jos aceasta sectiune defineste unde si cum vor arata informatiile in foaia de calcul. Aici se
poate specifica in ce forma sa fie prezentate datele analizate ca suma, produc, filtrate, etc;
3. Area tabelara din foaia de calcul, care este rezultatul combinarii sectiunilor anterioare.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Crearea unui Tabel Pivot
Crearea unui tabel pivot porneste de la pozitionarea cursorului pe oricare din celulele din aria care contine datele
statistice ce trebuiesc grupate intr-un astfel de tabel. Se acceseaza din meniul Insert, sectiuneaTables/ Pivot Table.
FIG. NR. 10 CREAREA UNUI TABEL DE CONTINGENTA (PIVOT)
Pozitionarea cursorului in campul de date va asigura selectarea implicita a setului de date. In caz contrar, se selecteaza
manual setul de date dorit. In ambele cazuri se specifica daca tabelul pivot se va construi intr-o foaie de calcul separata
(New worksheet) sau chiar in foaia de calcul cu datele primare.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 11 INSTRUMENTELE DE CREARE A UNUI TABEL DE CONTINGENTA (PIVOT)
Pentru a stabili variabilele dupa care se face analiza, acestea se vor selecta si se vor insera fie direct in tabel (Drag and
drop), in campurile Colum label si, respectiv, Row label.
Categoriile fiecarei variabile inserate pe rand sau coloana vor fi afisate in ordine alfabetica, de aceea uneori va fi
necesara rearanjarea categoriilor in functie de ordinea logica a acestora.
Datele din interiorul tabelului vor fi obtinute fie ca numar al observatiilor calculate simultan dupa cele doua variabile fie
dupa alte variabile (de exemplu vanzari totale, rate ale profitului etc).
Principalele fuctii utilizate in programul Microsoft Excel
Programul Excel ofer utilizatorului sute de funcii care se pot apela pentru a calcula rezultate folosite n finane,
contabilitate, statistic, matematic, inginerie sau n alte domenii tiinifice, economice, sociale.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
TABEL NR. 1 - CATEGORII DE FUNCII EXCEL
Categorie Exemple
Financial (financiare) Calculeaz valoarea actualizataneta, rata dobnzii, rata
lunar de rambursare a mprumutului, valoarea amortizarii
Date & Time (data i ora) Determin ora curent, ziua din sptamn sau din an, ora
sau data
Math & Trig (matematic i
trigonometrie)
Calculeaz valoarea absolut, rdcina ptratic, suma,
funcia exponenial, funcia logaritmic, funcii
trigonometrice, etc.
Statistical (statistic) Calculeaz medi aritmetice, geometrice, mediana, modul,
abateri medii ptratice, cuantile, teste statistice etc.
Look & Reference (cutare i
referin)
Caut i returneaz valori dintr-un domeniu, creeaz
hiperconexiuni n reele sau documente din INTERNET
Database (baz de date) Prelucreaz valori dintr-o baz de date (tabel) din Excel
Text (text) Convertete text n majuscule sau minuscule, elimin
caractere din dreapta sau stnga, concateneaz iruri de
caractere, etc.
Logical (logic) Evalueaz o expresie logic i returneaz o valoare TRUE
(adevrat) sau FALSE (fals), folosit pentru diverse aciuni
sau pentru formatare (condiionat)
Information (informaie) Returneaz informaii din programul Excel sau Windows,
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
referitoare la starea unei celule, a unui obiect sau mediu n
ansamblu
nainte de a apela o funcie, utilizatorul trebuie s cunoasc rezultatul afisat de funcie, ce argumente trebuie sa aib
funcia (tipul i semnificaia lor) i modul de apelare al funciei.
O prezentare mai detaliata a functiilor celor mai uzuale, si a argumentelor acestora este prezentata in Anexa 1
Sinteza
In obtinerea datelor statistice necesare realizarii de analize, pot fi utilizate doua mari categorii de oservare statistica:
observarea totala in care sunt culese date privind toate elementele populatiei statistice si observarea partiala in care
se culeg date despre un subset al populatiei, numit esantion, urmand ca, prin procesul de inferenta statistica, sa se
generalizeze rezultatele pentru intreaga colectivitate statistica, specificand un nivel de incredere in rezultat.
Dupa culegerea datelor, este necesarea sistematizarea acestora. Datele primare, culese direct de catre analist, sunt
prezentate, de regula, sub forma matriciala sub forma unei serii simple de date. In Microsoft Excel, pentru fiecare
variabila analizata, se constituie un vector (lista) de date.
Trecerea dintr-o serie simpla de date intr-o serie de frecvente se face pornind de la definirea intervalelor de grupare,
pentru care se vor calcula (utilizand, spre exemplu, functia Frequency) frecventele absolute corespunzatoare fiecarui
interval de grupare.
Dupa culegerea si sitematizarea datelor, urmeaza etapa prezentarii datelor sub forma de tabele si grafice statistice. Este
importanta realizarea in mod corect si complet a graficelor si tabelelor statistice, care sa includa numarul tabelului si/sau
figurii, titlul, clara definire a variabilelor prezentate, inclusiv unitatea de masura precum si sursa datelor.
Urmatoarea etapa o reprezinta analiza datelor, prin calculul unor indicatori specifici cum ar fi indicatorii medii,
indicatorii variatiei, indicatorii asimetriei etc. Prezentati in capitolele urmatoare.
Exercitii si aplicatii
Aplicatia nr. 1.1
Conform datelor publicate de catre clasamantul anual al celor mai mari corporatii din Statele Unite ale Americii
Fortune 500, primele 100 de companii dupa incasarille otinute in anul 2009 prezinta urmatoarele valori ale incasarilor si
profitului (exprimate in milioane dolari):
TABEL NR. 2 INCASARILE SI PROFITUL COMPANIILOR DIN TOP 100, CONFORM FORTUNE 500
Nr
crt
Compania
Incasar
i (mil
USD)
Profit
(mil
USD)
Nr
crt
Compania
Incasari
(mil
USD)
Profit
(mil
USD)
1 Exxon Mobil 442,851 45,220 51 Supervalu 44,048 593
2 Wal-Mart Stores 405,607 13,400 52 PepsiCo 43,251 5,142
3 Chevron 263,159 23,931 53 Kraft Foods 42,867 2,901
4 ConocoPhillips 230,764 -16,998 54 Lockheed Martin 42,731 3,217
5 General Electric 183,207 17,410 55 Hess 41,094 2,360
6 General Motors 148,979 -30,860 56 Best Buy 40,023 1,407
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Nr
crt
Compania
Incasar
i (mil
USD)
Profit
(mil
USD)
Nr
crt
Compania
Incasari
(mil
USD)
Profit
(mil
USD)
7 Ford Motor 146,277 -14,672 57 Cisco Systems 39,540 8,052
8 AT&T 124,028 12,867 58 Johnson Controls 38,062 979
9 Hewlett-Packard 118,364 8,329 59 FedEx 37,953 1,125
10 Valero Energy 118,298 -1,131 60 Walt Disney 37,843 4,427
11 Bank of America Corp. 113,106 4,008 61 Intel 37,586 5,292
12 Citigroup 112,372 -27,684 62 Sysco 37,522 1,106
13 Berkshire Hathaway 107,786 4,994 63 Honeywell International 36,556 2,792
14
International Business
Machines 103,630 12,334 64 Sprint Nextel 35,635 -2,796
15 McKesson 101,703 990 65 Enterprise GP Holdings 35,470 164
16 J.P. Morgan Chase& Co. 101,491 5,605 66 GMAC 35,445 1,868
17 VerizonCommunications 97,354 6,428 67 Ingram Micro 34,362 -395
18 Cardinal Health 91,091 1,301 68 Comcast 34,256 2,547
19 CVS Caremark 87,472 3,212 69 Northrop Grumman 33,940 -1,262
20 Procter & Gamble 83,503 12,075 70 News Corp. 32,996 5,387
21 UnitedHealth Group 81,186 2,977 71 Apple 32,479 -4,834
-22 Kroger 76,000 1,249 72 CHS 32,168 803
23 Marathon Oil 73,504 3,528 73 Coca-Cola 31,944 5,807
24 Costco Wholesale 72,483 1,283 74 American Express 31,877 2,699
25 Home Depot 71,288 2,260 75 DuPont 31,836 2,007
26 AmerisourceBergen 70,594 251 76 New York Life Insurance 31,416 -950
27 Archer Daniels Midland 69,816 1,802 77 Aetna 30,951 1,384
28 Target 64,948 2,214 78 Motorola 30,146 -4,244
29 Johnson & Johnson 63,747 12,949 79
Plains All American
Pipeline 30,061 437
30 Morgan Stanley 62,262 1,707 80 Abbott Laboratories 29,528 4,881
31
State Farm Insurance
Cos. 61,343 -542 81 Allstate 29,394 -1,679
32 WellPoint 61,251 2,491 82 TIAA-CREF 29,363 -3,345
33 Dell 61,101 2,478 83 General Dynamics 29,302 2,459
34 Boeing 60,909 2,672 84 Prudential Financial 29,275 -1,073
35 Microsoft 60,420 17,681 85 Humana 28,946 647
36 Walgreen 59,034 2,157 86
Liberty Mutual Insurance
Group 28,855 1,140
37 United Technologies 58,681 4,689 87 Deere 28,438 2,053
38 Dow Chemical 57,514 579 88 HCA 28,374 673
39 MetLife 55,085 3,209 89 Tyson Foods 28,130 86
40 Goldman Sachs Group 53,579 2,322 90 Alcoa 28,119 -74
41 Sunoco 51,652 776 91 Tesoro 28,031 278
41 Wells Fargo 51,652 2,655 92 Murphy Oil 27,513 1,740
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Nr
crt
Compania
Incasar
i (mil
USD)
Profit
(mil
USD)
Nr
crt
Compania
Incasari
(mil
USD)
Profit
(mil
USD)
43 United Parcel Service 51,486 3,003 93
Philip Morris
International 25,705 6,890
44 Caterpillar 51,324 3,557 94 Emerson Electric 25,281 2,412
45 Medco Health Solutions 51,258 1,103 95 3M 25,269 3,460
46 Pfizer 48,296 8,104 96 Macy's 24,892 -4,803
47 Lowe's 48,230 2,195 97 International Paper 24,829 -1,282
48 Time Warner 46,984 -13,402 98 Occidental Petroleum 24,480 6,857
49 Sears Holdings 46,770 53 99 Travelers Cos. 24,477 2,924
50 Safeway 44,104 965 100 Rite Aid 24,418 -1,079
Sursa: http://money.cnn.com/magazines/fortune/fortune500/2009/
Se cere:
1. Sa se caracterizeze cele doua serii simple de date privind incasarile si profitul companiilor din top 100
2. Sa se grupeze seria simpla de data intr-o serie de frecvente cu interval egale
3. Sa se constriasca un tabel de contingenta (table pivot).
Aplicatia nr. 1.2.
Un esantion de 48 angajati ai unei companii prezinta urmatoarele valori ale salariului brut lunar si al experientei in
domeniul in care activeaza fiecare angajat:
TABEL NR. 3 - SALARIUL BRUT SI EXPERIENTA ANGAJATILOR DIN ESANTION
Nr crt
Salariul
brut lunar
(RON)
Experienta
(ani)
Nr crt
Salariul
brut lunar
(RON)
Experienta
(ani)
1 1942 3 25 1833 7
2 3190 10 26 2207 14
3 3163 7 27 2533 16
4 3205 17 28 2123 13
5 3036 11 29 2096 8
6 2942 12 30 2373 8
7 1464 5 31 2306 11
8 1464 6 32 2413 9
9 2587 10 33 2393 7
10 1439 4 34 2533 24
11 3190 13 35 2207 12
12 3511 8 36 2207 9
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
13 3378 20 37 2500 11
14 2942 10 38 2306 6
15 2693 16 39 1014 1
16 12152 27 40 6523 18
17 10479 20 41 3166 11
18 6376 10 42 3578 33
19 7414 21 43 3849 14
20 4955 30 44 7062 22
21 6303 25 45 3727 10
22 7953 15 46 3874 9
23 6376 13 47 4201 10
24 2207 5 48 4215 25
Se cere:
1. Sa se caracterizeze cele doua serii simple de date
2. Sa se grupeze fiecare seria simpla de data intr-o serie de frecvente cu interval egale si inegale.
3. Sa se construiasca un tabel de contingenta luand in considerare ambele variabile
CAPITOLUL 2 INDICATORII TENDINTEI CENTRALE
Introducere
Managerul unei companii doreste sa extraga cat mai rapid informatia in activitatea de management current al firmei. De
cele mai multe ori, urmareste sa obtina un indicator care sa sintetizeze intr-o valoare unica ceeea ce este tipic, essential
pentru un set de date analizat.
Valorile tendintei centrale sunt calculate pentru a furniza, intr-o singura valoare, locatia centrala a unui set de date, sau,
altfel spus, un fel de centru de greutate al datelor care s permita exprimarea esenei comune a tuturor sau a majoritii
manifestrilor individuale ce alctuiesc populatia statistica sau esantionul de date analizat.
Obiectivele capitolului
Capitolul isi propune sa prezinta principalii indicatori ai tendintei centrale utilizati in activitatile curente de
management. Astfel, sunt prezetate modalitatea de calcul si situatiile in care se recomanda utilizarea mediilor. Mediile
sunt grupate in doua categorii - mediile calculate si mediile pozitionale mediana si valoarea modala. Mediile calculate
sunt analizate atat pentru seriile simple de date cat si pentru distributiile de frecvente.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Cotinut
Introducere
Mediile sunt indicatori statistici care au forma de calcul abstracta insa se exprima sub forma concret, n aceleai
uniti de msur ca i variabila analizata pentru care se calculeaz.
Pentru ca valoarea medie s fie reprezentativ pentru ntreaga colectivitate, trebuie s se in cont de urmtoarele
cerine:
utilizarea unui numr suficient de mare de observaii, astfel nct esena comun s poat fi evideniat;
aleagerea acelui tip de medie, care corespunde ct mai bine naturii variaiei fenomenului analizat.
n funcie de tipul datelor disponibile i de necesitile de analiz, poate fi folosit una din urmtoarele dou categorii de
mrimi medii:
medii calculate;
medii poziionale.
Mediile calculate se determin pe baza intregului set de date inregistrat pentru variabila analizata. Dintre mediile
calculate cele mai cunoscute sunt media aritmetica, media geometrica, media armonica, media patratica, media cubica,
media parabolica, media cronologica.
Mediile pozitionale nu se calculeaza ci se indentific n setul de date cu cte o variant real, care posed o anume
proprietate, n temeiul creia respectiva variant ofer o informaie satisfctoare despre esenialul, tipicul ntregii
colectiviti. Dintre mediile poziionale, mediana i modul sunt cel mai frecvent utilizate n analiza economic.
Media aritmetica
Media aritmetic ( x ) este cea mai utilizat medie; se folosete atunci cnd datele fenomenului cercetat se
prezint sub form de mrimi primare, direct nsumbile.
Media aritmetic este acea valoare abstract care, nlocuind toate variantele unei colectiviti (toi termenii
seriei), nu modific suma acestora.
Pentru o serie simpla de date, formula mediei aritmetice simple calculata la nivel de esantion se scrie::
n
x
x
n
i
i
1
, [2.1]
unde n reprezinta volumul esantionului
La nivelul populatiei totale, media arritmetica simpla se scrie similar:
N
x
N
i
i
, [2.2]
unde N reprezinta volumul populatiei generale
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Pentru o serie de distribuie (de frecvene) se calculeaza media aritmetica ponderata. Pentru a scurta procesul de
calcul, se ine seama de frecvene absolute (ni) nregistrate pentru fiecare variant distinct (
i
x ) a seriei sau pentru
fiecare interval de variaie:
Pentru o serie de frecvente, formula mediei aritmetice ponderate calculata la nivel de esantion se scrie::
i
i
i
i i
n
n x
x , [2.3]
Dac se iau n considerare frecvenele relative (
i
n ), formula de mai sus se rescrie astfel:
100
i
i i
n x
x
[2.4]
Pentru o serie de frecvente, formula mediei aritmetice ponderate calculata la nivel de populatie generala se scrie::
N
n x
i
i i
, [2.5]
Media aritmetica are avantajul de a fi uor de folosit i totodat este uor de neles, fiind cea mai frecvent folosit
medie (este o medie popular). Media aritmetic are ns i marele dezavantaj c este sensibil la valorile extreme
(valori fie foarte mici, fie foarte mari). Existena unor astfel de valori, n special n situaia n care extremele sunt numai
ntr-un singur sens (ceea ce nu duce la compensarea lor), va avea ca rezultat o medie aritmetic ce poate fi
nereprezentativ pentru colectivitatea pentru care s-a calculat.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Caseta 1. Principalele proprieti ale mediei aritmetice
Media aritmetic are mai multe proprieti. Unele dintre ele se ncadreaz n categoria
proprietilor de verificare a exactitii, n timp ce altele se nscriu n categoria proprietilor de
simplificare a calculului:
a) media aritmetic este cuprins ntre valorile minim i maxim ale caracteristicii:
max min
x x x < <
b) suma abaterilor valorilor individuale de la medie este zero, media avnd, prin definiie,
proprietatea de a compensa abaterile pozitive cu cele negative:
Pentru seria simpl: Pentru seria de frecvene:
n
i
i
x x
1
0 ) (
n
i
i i
n x x
1
0 ) (
Observaie: Aceast proprietate este echivalent cu definiia mediei. ntr-adevr, relaia
n
i
i
x x
1
0 ) ( se poate scrie:
n
i
i
x n x
1
0, ceea ce este o relaie echivalent cu ecuaia
[2.9] prezentat la definirea mediei.
c) dac toi termenii seriei sunt modificai (micorai/mrii) cu o constant a, media noii
serii se va modifica, n acelai sens, cu aceeai constant a.
Pentru seria simpl:
a x
n
na
n
x
n
a x
x
n
i
i
n
i
i
t t
t
1 1 /
) (
Pentru seria de frecvene:
a x
n
n a
n
n x
n
n a x
x
n
i
i
n
i
i
n
i
i
n
i
i i
n
i
i
i
n
i
i
t
1
1
1
1
1
1 /
) (
d) dac toi termenii seriei sunt multiplicai/simplificai cu o constant k,
media noii serii va fi de k ori mai mare/mic:
Pentru seria simpl:
k
x
n
x
k n
k
x
x
n
i
i
n
i
i
1 1 /
1
Pentru seria de frecvene:
k
x
n
n x
k
n
n
k
x
x
n
i
i
n
i
i i
n
i
i
i
n
i
i
1
1
1
1 /
1
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Caseta 1. (continuare)
e) Pe baza proprietilor c) i d) se obine formula de calcul simplificat al mediei:
Pentru seria simpl:
a k x a k
n
k
a x
x
n
i
i
+ +
/ 1
) (
Pentru seria de frecvene:
a k x a k
n
k
n a x
x
n
i
i
n
i
i i
+ +
/
1
1
) (
f) dac se multiplic/simplific printr-o constant c frecvena de apa-riie (n
i
) a
variantelor din colectivitate, media rmne neschimbat:
x
n c
n x c
c n
c n x
x
n
i
i
n
i
i i
n
i
i
n
i
i i
1
1
1
1
g) media aritmetic este asociativ;
h) media aritmetic este translativ;
i) media sumei a dou variabile independente X i Y este egal cu suma mediilor
celor dou variabile;
j) media produsului a dou variabile independente X i Y este egal cu produsul
mediilor celor dou variabile.
Sursa: M. Korka, L.S. Begu, E. Tusa, Bazele statisticii pentru economicti, Ed
Economica, 2006
Media armonic
Media armonic se calculeaz din valorile inverse ale termenilor seriei. Se recomand a fi folosit atunci cnd n
colectivitate predomin valorile mici (seria este asimptotic ctre valorile mici).
Media armonic este, prin urmare acea valoare care nu modific suma inverselor termenilor seriei.
Pentru serii simple, aceast afirmaie poate fi formulat astfel:
+ + +
n
i i n
x x x x
1 2 1
1 1
.....
1 1
[2.6]
nlocuind fiecare variant cu media armonic, relaia [2.12] devine:
+ + +
n
i i h h h
x x x x
1
1 1
.....
1 1
[2.7]
n
i i h
x x
n
1
1 1
[2.8]
de unde formula mediei armonice simple:
i
h
x
n
x
1
[2.9]
Pentru serii de frecvene media armonic ponderat este:
i
i
i
h
n
x
n
x
1 [2.10]
Media armonic are urmtoarele proprieti:
media armonic este o valoare intern seriei din care a fost calculat;
media armonic este asociativ;
media armonic nu este translativ.
Observaie: n analiza activitii economice, media armonic se folosete la calculul anumitor tipuri de indici (indici cu
ponderare curent)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Media ptratic
Media ptratic se calculeaz din ptratele termenilor seriei. Se recomand a fi folosit atunci cnd n colectivitate
predomin valorile mari (serie asimptotic ctre valorile mari) sau atunci cnd termenii au att valori pozitive, ct i
negative.
Cu alte cuvinte, media ptratic este aceea valoare care, nlocuind termenii nregistrai ai seriei de date, nu modific
suma ptratelor acestora:
+ + +
n
i
i n
x x x x
1
2 2 2
2
2
1
...... [2.11]
+ + +
n
i
i p p p
x x x x
1
2 2 2 2
...... [2.12]
n
i
i p
x x n
1
2 2
, [2.13]
de unde rezult:
Pentru serii simple, media ptratic simpl:
.
2
n
x
x
i
p
[2.14]
Pentru serii de frecvene, media ptratic ponderat:
.
2
i
i i
p
n
n x
x [2.15]
Media ptratic are proprietile urmtoare:
Este cuprins ntre valoarea minim i cea maxim a seriei de date;
Este influenat ntr-o foarte mare msur de variantele cu o valoare mare, deoarece, prin ridicare la
ptrat aceste valori devin foarte mari.
Media geometric.
Spre deosebire de mediile calculate anterior, aceast medie se bazeaz pe relaia de produs a termenilor seriei. n analiza
economic, se recomand calculul ei atunci cnd termenii colectivitii se prezint sub form de mrimi relative. De
obicei, acestea nu sunt direct nsumabile, dar admit operaia de nmulire.
Media geometric este valoarea care, nlocuind termenii seriei, nu modific produsul acestora:
n
i
i n
x x x x
1
2 1
...... [2.16]
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
n
i
i g g g
x x x x
1
...... [2.17]
sau
n
i
i
n
g
x x
1
[2.18]
de unde:
media geometric simpl:
.
n
i g
x x
[2.19]
media geometric ponderat:
.
i
i
n
n
i g
x x
[2.20]
Observaie: media geometric ponderat este rar folosit n analiza economic.
Media geometric se bucur de avantajul c nu este influenat nici de valorile mici, nici de cele mari, fiind apreciat a
fi o mrime medie mai exact. Dezavantajul principal este acela c nu poate fi calculat dac unele variante sunt
negative sau nule.
Media geometric are urmtoarele proprieti:
media geometric este o valoare intern seriei statistice din care a fost calculat;
media geometric este asociativ;
suma abaterilor logaritmilor variantelor unei variabile fa de logaritmul mediei lor geometrice este
egal cu zero;
puterea n a mediei geometrice calculat din k valori pozitive este egal cu media geometric a
puterii n a celor k valori;
Comparnd diferitele mrimi medii calculate pentru o aceeai serie de date se observ c ntre medii exist urmtoarea
relaie:
p g h
x x x x [2.21]
Mediana
Valoarea median (mijlocie) a seriei este acea variant care o mparte n dou pri egale.
Cu alte cuvinte, fa de valoarea median, jumtate din observaii au valori mai mici sau egale cu mediana, iar jumtate
au valori mai mari sau egale cu mediana.
Pentru seria simpla de date
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
o Dac seria are un numr impar de termeni, mediana este a (n+1)/2 valoarea din seria ordonat
(cresctor sau descresctor).
o n cazul unei serii cu un numr impar de termeni, mediana va fi egal cu media aritmetic a celor doi
termeni centrali.
Pentru seria de frecvene:
n calculul medianei unei distribuii de frecvene se parcurg urmtoarele etape:
o Se determina Locul medianei prin relaia:
2
1 +
n
Me Loc . [2.22]
o Se determina intervalul median.
ntr-o serie organizat pe intervale de grupare, dup aflarea locului medianei se procedeaz la identificarea
intervalului ce conine mediana. Adunnd treptat frecvenele ajungem la un numr mai mare sau egal cu
cel al locului medianei. Astfel rezult intervalul care conine mediana.
o Se estimeaza Mediana (Me) cu urmtoarea relaie de interpolare:
Me
Me Me
n
np n
k x Me
+
+
) 1 ( 5 , 0
0
, [2.23]
n care:
k
Me
= mrimea intervalului median;
0,5 (n +1) = locul medianei;
npMe = suma frecvenelor pn la intervalul ce conine mediana;
nMe = frecvena intervalului ce conine mediana.
Modul
Modul sau dominanta este varianta cu frecvena cea mai mare.
Valoarea modal se utilizeaz ca indicator al tendinei centrale atunci cnd media nu se poate calcula sau nu are sens s
fie calculat. De exemplu, n loc de stabilirea mrimii medii la confecii, a numrului mediu la pantofi etc. se prefer
observarea variantei cele mai frecvente.
Pentru seria simpl Modul este valoare care care se nregistreaz cel mai frecvent.
ntr-o serie organizat pe intervale de grupare, valoarea modal se afl, tot prin interpolare, n intervalul cu frecvena
cea mai mare. Nu este obligatoriu ca intervalul modal s coincid cu cel care conine mediana.
Modul (Mo) se estimeaz dup relaia de interpolare n intervalul modal:
2 1
1
0
+
+
Mo
k x Mo
[2.26]
n care: x0 = limita inferioar a intervalului modal;
k
Mo
= mrimea acestui interval;
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
1 = diferena dintre frecvena modal i frecvena intervalului imediat anterior;
2 = diferena dintre frecvena modal i frecvena intervalului imediat urmtor.
Analiza indicatorilor medii cu ajutorul Microsoft Excel
In Microsoft Excel, se utilizeaza urmatoarele functii:
pentru calculul mediei aritmetice se utilizeaza functia AVERAGE(NUMBER1, NUMBER2, ..)
FIG. NR. 12 ACCESAREA FUNCTIEI AVERAGE
Argumentele functiei sunt:
Number1, number2, ... sunt de la 1 pn la 255 de argumente numerice corespunztoare unui e antion dintr-o
popula ie sau populatiei generale; selectarea datelor se poate realiza seletand un vector/matrice de date sau
introducand ca si argument numele setului de date.
pentru calculul mediei geometrice se utilizeaza functia GEOMEAN (NUMBER1, NUMBER2, ..)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 13 ACCESAREA FUNCTIEI GEOMEAN
Argumentele functiei sunt:
Number1, number2, ... sunt de la 1 pn la 255 de argumente numerice corespunztoare unui e antion dintr-o
popula ie sau populatiei generale; selectarea datelor se poate realiza seletand un vector/matrice de date sau
introducand ca si argument numele setului de date.
pentru calculul mediei armonice se utilizeaza functia HARMEAN (NUMBER1, NUMBER2, ..)
FIG. NR. 14 ACCESAREA FUNCTIEI HARMEAN
Argumentele functiei sunt:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Number1, number2, ... sunt de la 1 pn la 255 de argumente numerice corespunztoare unui e antion dintr-o
popula ie sau populatiei generale; selectarea datelor se poate realiza seletand un vector/matrice de date sau
introducand ca si argument numele setului de date.
pentru calculul medianei se utilizeaza functia MEDIAN (NUMBER1, NUMBER2, ..)
FIG. NR. 15 ACCESAREA FUNCTIEI MEDIAN
Argumentele functiei sunt aceleasi ca si in cazul celorlalte valori medii.
pentru calculul valorii modale se utilizeaza functia MODE (NUMBER1, NUMBER2, ..) sau MODE.SIGL
(NUMBER1, NUMBER2, ..)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 16 ACCESAREA FUNCTIEI MODE
Argumentele functiei sunt aceleasi ca si in cazul celorlalte valori medii.
Calculul mediei ponderate se poate folosi si utilizand functia din excel SUMPRODUCT care inmul e te componentele
corespondente din matricele date i ntoarce suma acelor produse.
Sintaxa functiei este: SUMPRODUCT(array1;array2;array3; ...).
Argumentele functiei:
Array1, array2, array3, ... sunt de la 2 pn la 255 de matrice ale cror componente dori i s le nmul i i,
apoi s aduna i produsele.
Observa ii
Argumentele matrice trebuie s aib acelea i dimensiuni. Dac nu, SUMPRODUCT ntoarce valoarea de
eroare #VALUE!.
SUMPRODUCT trateaz nregistrrile din matrice care nu sunt numerice ca i cum ar fi egale cu zero.
FIG. NR. 17 ACCESAREA FUNCTIEI SUMPRODUCT
O alta varianta, este accesarea unei componente Excel denumita Analysis ToolPak (Pachet de instrumente de analiz) ;
instrumentul de analiz utilizeaz macro-func iile statistice i afi eaz rezultatele ntr-una sau mai multe matrice -
rezultate.
In cadrul acestui instrument de analiza, exista optiunea Descriptive Statistics, care furnizeaza o serie de indicatori
descriptivi, printre care se afla si media, mediana si modul.
Trebuie precizat faptul ca indicatorii calculati sunt considerati pentru serii de date obtinute prin selectie statistica (cu
alte cuvinte la nivel de esantion). Din punct de vedere al calculului nivelurilor medii nu exista diferente intre mediile
calculate pentru intreaga populatie statistica, dat la nivelul indicatorilor variatiei dispersia si abaterea standard
utilizarea optiunii descriptive Statistics trebuie realizata numai la nivelul unui esantion.
De regula, componenta Analysis ToolPak nu este direct disponibila, si necesita parcurgerea urmatoarelor etape pentru
instalarea initiala:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
se acceseaza din Meniul principal File, optiunea Option, care va duce la afisarea urmatoarei ferestre de dialog:
FIG. NR. 18 ACCESAREA EXCEL ADD-INS
se selecteaza optiunea Add Ins si, in josul casutei de dialog, se selecteaza comanda GO aflata in dreptul
optiunii Manage Excel Add-Ins. Se va deschide fereastra de dialog prezentata in figura urmatoare, din care se
selecteaza optiunea Analysis ToolPack Instrumente de Analiza.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 19 ALEGEREA INSTRUMENTELOR DE ANALIZA
Dupa inchiderea ferestrei de dialog prin selectarea optiunii OK, in meniul principal, sectiunea Data, va aparea optiunea
Data Analysis.
Se acceseaza Data analysis, ceea ce va duce la afisarea urmatoarei ferestre :
FIG. NR. 20 ALEGEREA OPTIUNII DESCRIPTIVE STATISTICS
Se selecteaza Instrumentul de analiz Descriptive Statistics, care afiseaza o serie de indicatori descriptivi, printre care si
media, mediana si modul.
Obtinerea acestor indicatori se face introducand la optiunea Input Range setul de date analizat, cu optiunea Labels in
First Row selectata in cazul in care prima celula selectata reprezinta denumirea variabilei analizate.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 21 FEREASTRA DE DIALOG DESCRIPTIVE STATISTICS
Se va alege optiunea de livrare a datelor fie in aceeasi foaie de calcul (prin selectarea Output options/ Output Range
si selectarea efectiva a celulei in care se va incepe prezentarea rezultatelor) fie intr-o foaie de calcul noua.
Se selecteaza cel putin optiunea Summary statistics.
Se obtine urmatorul output:
TABEL NR. 4 - OUTPUT-UL DESCRIPTIVE STATISTICS
Column1
Mean 3700
Standard Error 335.0
Median 2989
Mode 2207
Standard Deviation 2320.9
Sample Variance 5386751.5
Kurtosis 3.70
Skewness 1.87
Range 11138
Minimum 1014
Maximum 12152
Sum 177600
Count 48
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Valorile obtinute sunt identice cu cele furnizate de functiile Average. Median si Mode.
Sinteza
In urma culegerii si sistematizarii datelor statistice, urmeaza etapa urmatoare de calcul al indicatorilor medii, care sa
sintetizeze intr-o valoare unica tot ceea ce este tipic, essential pentru colectivitatea analizata.
Indicatorii medii determina fie prin calcul medii calculate, fie prin identificarea unei valori in cadrul unei serii de date
medii pozitionale.
Din prima categorie, cele mai importante medii sunt media aritmetica, armonica si geometrica, iar din cea de-a doua
categorie mediana si modul. Calculul indicatorilor medii se realizeaza diferit pentru seria simpla si seria de frecvente
(unde se vor calcula medii ponderate).
Alegerea mediei cele mai potrivite depinde de particularitaile setului de date spre exemplu de existenta unor valori
extreme, de omogenitatea seriei de date etc.
In Microsoft Excel, calculul mediilor pentru o serie simpla se poate face fie utilizand functiile Average, Median sau
Mode, fie apeland din optiunea Analysis ToolPack, optiunea Descriptive Statistics.
Exercitii si aplicatii
Aplicatia nr. 2.1.
Pornind de la datele prezentate in Aplicatia nr. 1.1 se cere:
a) Sa se calculeze si interpreteze indicatorii tendintei centrale (media, mediana si modul) pentru seria simpla de
date privind veniturile companiei;
b) Sa se calculeze si interpreteze indicatorii tendintei centrale (media, mediana si modul) pentru seria de
frecvente;
c) Sa se compare mediile calculate anterior. Sa se explice eventualele diferente.
Aplicatia nr. 2.2.
Ratele lunare ale inflatie pentru primele trei luni ale anului 2011 au inregistrat urmatoarele valori (calculate pe baza
IPC, luna anterioara =100, sursa datelor INS, Buletinul Statistic lunar nr 7): 0.77%, 0.77%, 0.60%.
Sa se calculeze:
a) Rata inflatiei corespunzatoare primului trimestru;
b) Rata mdie lunara a inflatiei;
c) Rata anualizata a inflatiei;
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
d) Stiind ca ratele lunare ale inflatiei in urmatoarele trei luni (aprilie, mai, iunie 2011) au fost: 0.66%, 0,21% si
-0.29%. Sa se reia caclculele de la punctele 1-3. Sa se interpreteze diferentele dintre rezultate. Sa se calculeze
rata anualizata a inflatiei pe baza datelor din preimul semestru al anului.
Aplicatia nr. 2.3.
Angajatii unei intreprinderi mici au urmatoarele niveluri salariale (salariu brut la nivelul lunii septembrie 2011, RON):
1240, 1454. 654, 785, 810, 741. 1685 si 8742.
Se cere:
Calculati si comparati mediile cunoscute.
Care dintre valorile medii caracterizeaza cel mai bine seria de date? Justificati raspunsul.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
CAPITOLUL 3 ANALIZA VARIATIEI SI ASIMETRIEI
Introducere
In cazul celor mai multe variabile socio-economice analizate in activitatea curenta de catre un manager, apare
variabilitatea termenilor seriei de date cauzat de faptul c, pe lng factorii hotrtori, eseniali, acioneaz i alti
factori - accidentali - care fac ca manifestarea individual s fie divers, distinct de alte manifestri. In functie de
raportul dintre cele doua tipuri de forte, seria va tinde fie catre o concentrare fie mprtiere a termenilor seriei, facand,
pe cale de consecinta, ca indicatorii tendintei centrale si ai asimetriei sa aiba un grad mai mare sau mai mic de
reprezentativitate. In plus, pe langa determinarea gradului de variatie prin indicatori specifici, managerul trebuie sa
identifice si inteleaga si tipul/forma distributiei.
Obiectivele capitolului
Capitolul isi propune sa prezinte cei mai utilizati indicatori de masura a variatiei si a asimetriei utilizati in analiza
fenomenelor si proceselor socio-economice. Sunt prezentate modalitatile de calcul (inclusiv utilizand functiile
Microsoft Excel) a amplitudinii absolute si relative a variatiei, dispersiei, abaterii standard si coeficientului de variatie,
ca principali indicatori folositi in masurarea variatiei masura a riscului - dintr-o serie de date.
Cotinut
Indicatorii variaiei i asimetriei. n funcie de numrul de variante luate n calcul i dup rolul ndeplinit n analiza
variaiei, distingem:
indicatori simpli ai variaiei;
indicatori sintetici ai variaiei.
Indicatorii simpli ai variaiei
Indicatorii simpli ai variatiei caracterizeaz poziia fiecrui termen al seriei (xi) fa de medie. Cei mai cunoscuti
indicatori simpli ai variatiei sunt amplitudinea absoluta si relativa a variatiei, abaterile individuale ale termenilor seriei
fata de medie, atat in valori absolute cat si relative.
Amplitudinea variaiei exprim mrimea cmpului de mprtiere n jurul mediei. Se exprim n mrime
absolut:
min max
x x A [3.1]
i n mrime relativ:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
100
min max %
x
x x
A . [3.2]
n general, se apreciaz c o amplitudine a variaiei care se situeaz sub 100%, este specific unor colectiviti
omogene. Pe msur ce aceasta se ndeprteaz de 100%, colectivitatea este din ce n ce mai eterogen, iar media ei mai
puin semnificativ.
Abaterile individuale ale termenilor seriei fata de medie cuantifica diferentele dintre fiecare observatie in parte si
valoarea medie. Se exprim n mrime absolut:
. x x d
i i
[3.3]
sau mrimi relative:
100
%
x
x x
d
i
i
. [3.4]
Aceti indicatori nu caracterizeaz variaia n cadrul colectivitii, ci poziia fiecrui termen al seriei (xi) fa de
medie.
Indicatorii sintetici ai variaiei
Indicatorii sintetici ai variaiei urmresc masurarea variatiei centrului fiecarui interval de grupare xi fata de medie,
pentru a exprima intensitatea mprtierii n jurul mediei.
n funcie de gradul de abstractizare i de relaia de calcul, distingem patru indicatori sintetici:
abaterea medie liniar ;
dispersia ;
abaterea standard numit i abatere medie ptratic ;
coeficientul de variaie .
Abaterea medie liniar este media aritmetic a abaterilor variantelor sau a centrelor de interval de grupare (xi) de la
media colectivitii. Pentru c abaterile de la media aritmetic se compenseaz, se iau n calcul valorile absolute ale
diferenelor .
Pentru o serie simpla, abaterea medie liniara la nivel de populatie generala se calculeaza astfel:
N
x
n
d
i
i
i
d
[3.5]
Pentru o serie de frecvente, abaterea medie liniara la nivel de populatie generala se calculeaza dupa formula:
i
i i
i
i i
n
n x
n
n d
d
[3.6]
Dispersia poate fi definit ca medie aritmetic a ptratelor abaterilor termenilor seriei de la media colectivitii. Este o
mrime abstract, adimensional ce nu servete direct analizei variaiei.
Pentru o serie simpla, abaterea medie liniara la nivel de esantion se calculeaza astfel:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
1
) (
2
2
n
x x
s
i
[3.7]
Pentru o serie simpla, abaterea medie liniara la nivel de populatie generala se calculeaza dupa formula:
N
x
i
2
2
) (
[3.8]
Pentru o serie de frecvente, formula dispersia calculata la nivel de esantion se scrie::
1
) (
2
2
n
f x x
s
i i
[3.9]
Pentru o serie de frecvente, formula dispersiei calculata la nivelul populatiei generale se scrie::
N
f x
i i
2
2
) (
[3.10]
Abaterea standard sau abaterea medie ptratic este, aa cum i spune i numele, o medie ptratic a abaterilor
termenilor seriei de la medie.
Indiferent de nivelul la care este calculat populatia generala sau esantion abaterea standard se calculeaza ca radical
din dispersie.
Pentru esantion abaterea standard se scrie:
2
s s
[3.11]
La nivelul populatiei generale, abaterea standard este:
2
[3.12]
Coeficientul de variaie este indicatorul sintetic care exprim ntr-o form abstract intensitatea variaiei. Se calculeaz
astfel:
100
x
v
[3.13]
Coeficientul de variaie se definete n domeniul numerelor pozitive. Din statistica experimental s-a preluat aprecierea
urmtoare: dac coeficientul de variatie este mai mic de 35%, se consider c intensitatea variaiei este redus,
colectivitatea este omogen i n consecin media este reprezentativ. Cu ct se depete pragul de 35%, cu att
intensitatea variaiei crete, iar colectivitatea este mai eterogen. n aceste condiii, media tinde s fie o mrime
nereprezentativ.
Indicatorii asimetriei si boltirii
Forma variaiei n jurul mediei se exprim statistic prin mai muli indicatori ai asimetriei, boltirii, excesului repartiiei
de frecvene etc. Cea mai simpl modalitate de descriere acceptabil, chiar dac incomplet a formei variaiei este
observarea diferenei ntre medie i mod care se numete asimetrie:
0 Mo x as [3.14]
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Dac atunci exist simetrie perfect;
Dac atunci exist asimetrie pozitiv sau de stnga;
Dac atunci exist asimetrie negativ sau de dreapta.
Aprecierea de stnga sau de dreapta provine din observarea poziiei n care se afl modul (Mo) fa de medie pe
axa absciselor n cazul unei serii de repartiie asimetric.
Pentru a aprecia calitativ aceast situaie, se recurge, n mod frecvent, la coeficientul de asimetrie propus de Karl
Pearson:
Mo x
C
as
[3.15]
Dac seria de repartiie este bi sau multimodal, dar tinde spre normalitate, se poate recurge i la estimarea:
.
) ( 3 Me x
C
as
[3.16]
Coeficientul de asimetrie ia valori n intervalul (3; 3).
n msura n care coeficientul de asimetrie se ncadreaz n intervalul (-0,3; 0,3) spunem c avem de-a face cu o
asimetrie moderat i, n consecin, indicatorii tendinei centrale caracterizeaz corect colectivitatea (sunt
reprezentativi).
Cu ct coeficientul de asimetrie depete limitele acestui interval, cu att asimetria este mai puternic, iar indicatorii
tendinei centrale tind s fie nesemnificativi.
Calculul indicatorilor variatiei, asimetriei si boltirii utilizand functiile Microsoft Excel.
Microsoft Excel 2007 furnizeaza o serie de functii care urmaresc masurarea variatiei din cadrul unei serii de date.
Aceste functii se utilizeaza numai in cazul seriilor simple de date. In cazul repartitiilor de frecvente, calculul
indicatorilor variatiei se realizeaza utilizand o foaie de calcul si aplicand formulele de calcul prezentate mai sus.
Pentru seriile simple de date, fucntiile prezentate in excel, au de regula urmatoarea sintaxa:
Number1, number2, ... corespunde setului de date pentru care se doreste calcularea variatiei; selectarea
acestui set de date se poate face fie introducand fiecare argument numeric (maxim 255 observatii), fie
selectand setul de date numerice (dispus, de regula, sub forma unei coloane sau linii de date) fie introducand
referinta unui camp de date anterior denumit.
Indicatorii variatiei se calculeaza astfel:
Amplitudinea varatiei se calculeaza ca diferenta dintre functiile MAX(number1;number2;...) si
MIN(number1;number2;...).
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 22 ACCESAREA FUNCTIEIILOR MAX SI MIN PENTRU CALCULAREA AMPLITUDINII VARIATIEI
Dispersia se calculeaza astfel:
In cazul in care datele sunt colectate la nivelul intregii populatii statistice se utilizeaza functia
VARP(number1;number2;...)
FIG. NR. 23 ACCESAREA FUNCTIEI VARP
In cazul in care datele sunt colectate la nivelul unui esanton statistic se utilizeaza functia
VAR(number1;number2;...)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 24 ACCESAREA FUNCTIEI VARP
Abaterea medie patratica sau abaterea standard se calculeaza astfel:
In cazul in care datele sunt colectate la nivelul intregii populatii statistice se utilizeaza functia
STDEVP(number1;number2;...)
FIG. NR. 25 ACCESAREA FUNCTIEI STDEVP
In cazul in care datele sunt colectate la nivelul unui esanton statistic se utilizeaza functia
STDEV(number1;number2;...)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 26 ACCESAREA FUNCTIEI STDEV
In cazul in care argumentul oricarei din functiile mentionate mai sus este un set de date sau o referin , sunt luate n
calcul numai numerele din matrice sau din referin . Celulele goale, valorile logice, textele sau valorile de erori din
matrice sau din referin sunt ignorate, orce tip de argumentele nenumerice fiind generatoare de erori. Pentru a include
valori logice i reprezentri text ale numerelor ntr-o referin ca parte a unui calcul, se utilizeaza func iile VARPA si
VARA (dispersii calculate pe date colectate la nivel de populatie statistica si, respectiv, esantion) si STDEVPA si
STDEVPA (abateri standard calculate pe date colectate la nivel de populatie statistica si, respectiv, esantion).
Analiza asimetrie cu ajutorul functiilor Excel se face apland functia SKEW(Nmber 1, Number 2, ) avand ca
argumente setul de date pentru care se doreste calculul coeficientului de asimetrie
FIG. NR. 27 ACCESAREA FUNCTIEI SKEW
Microsoft Excel defineste calculeaza un pic diferite coeficientul de asimetrie, utilizand formula:
[3.17]
Unde:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
n reprezinta volumul esantionului
xi sunt valorile individuale ale termenilor seriei unifactoriale analizate
x
reprezinta media esantionului
S este abaterea standard la nivelul esantionului
Asimetria pozitiva este specifica unei distributii cu o coada a distributiei prelungindu-se catre valorile mari (pozitive)
iar o asimetrie negativa este specifica unei distributii cu o coada a distributiei prelungindu-se catre valorile mici
(negative)
Diferentele fata de coeficientul de asimetrie Pearson exista, dar nu sunt foarte mari.
Boltirea/Aplatizarea (Kurtosis)
Kurtosisul sau Botirea/Aplatizarea masoara cat de boltita (ascutita) sau neteda este distributia. Distributia normala are
un coeficient de aplatizare de 3.
Coeficientul de aplatizare este:
[3.18]
In Microsoft Excel coeficientul de aplatizare compara aplatizarea relativa a distributiei analizate fata de distributia
normala. Un Kurtosis pozitiv indica o distributie ascutita in timp ce un Kurtosis negativ indica o distributie relativ
neteda.
Functia folosita in calculul excel este:
[3.19]
Cele doua formule furnizeaza valori relativ diferite. In primul caz, spre exemplu, distributia normala va avea un
coeficient de 3. In cazul formulei din Microsoft Excel, se calculeaza diferentele fata de distributia normala, prin urmare,
un set de date corespunzatoare unei variabile cu o distributie normala va furniza un coeficient de aplatizare egal cu
zero.
Accesarea coeficientului de aplatizare/boltire se face utilizand functia KURT (Number 1, Number 2,) avand ca
argument setul de date pentru care se realizeaza calculul coeficientului.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 28 ACCESAREA FUNCIEI SKEW
O alta varianta de obtinere a indicatorilor variatiei la nivel de esantion este utilizarea secventei Data Analysis/
Descriptive Statistics.
Se selecteaza Instrumentul de analiz Descriptive Statistics, care afiseaza o serie de indicatori descriptivi, printre care si
valoarea minima, maxima, dispersia si abaterea standard.
Obtinerea acestor indicatori se face introducand la optiunea Input Range setul de date analizat, cu optiunea Labels in
First Row selectata in cazul in care prima celula selectata reprezinta denumirea variabilei analizate.
FIG. NR. 29 FEREASTRA DE DIALOG DESCRIPTIVE STATISTICS
Se va alege optiunea de livrare a datelor fie in aceeasi foaie de calcul (prin selectarea Output options/ Output Range
si selectarea efectiva a celulei in care se va incepe prezentarea rezultatelor) fie intr-o foaie de calcul noua.
Se selecteaza cel putin optiunea Summary statistics.
Se obtine urmatorul output:
TABEL NR. 5 - OUTPUT-UL DESCRIPTIVE STATISTICS
Column1
Mean 3700
Standard Error 335.0
Median 2989
Mode 2207
Standard Deviation 2320.9
Sample Variance 5386751.5
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Kurtosis 3.70
Skewness 1.87
Range 11138
Minimum 1014
Maximum 12152
Sum 177600
Count 48
Valorile obtinute sunt identice cu cele furnizate de functiile STDEV, VAR, KURT, SKEW, MIN, MAX. Amplitudinea
variaiei (range) se calculeaza ca diferenta dintre valorile maxima si minima.
Sinteza
In analiza unei serii simple sau de frecvente, prima etapa este calcularea indicatorilor tendintei centrale media,
mediana si modul. Avand in vedere ca, pe de o parte, aceeasi medie poate proveni din diferite tipuri de distributii, iar pe
de alta parte, este importanta intelegerea reprezentativitatii valorii medii calculate, apare necesitatea intelegerii
imprastierii termenilor seriei, sau, cu alte cuvinte, calcularea indicatorilor variatiei.
Indicatorii variatiei se impart in doua categorii: indicatori simpli ai variatiei (amplitudinea absoluta sau relative,
abaterile individuale fata de medie in valori absolute sau relative) si indicatorii sintetici ai variatiei (abaterea medie
liniara, dispersia, abaterea standard si coeficientul de variatie).
Cei mai utilizati indicatori si variatiei sunt abaterea standard (care arata abaterea medie a termenilor seriei fata de
medie) si coeficientul de variatie care arata variatia relativa, recomandata fie pentru a testa omogenitatea seriei si
reprezentativitatea mediei fie in comparatiile dintre serii de date cu valori medii diferite.
Formulele de calcul difera in functie de tipul seriei de date serie simpla sau serie de frecventa. In plus, atat calculul
direct precum si functiile din excel utilizate pentru calcularea indicatorilor variatiei difera in functie de modul de
obtinere a datelor prin observare totala la nivelul intregii populatii generale sau prin observare partiala pe baza de
sondaj statistic (esantion).
Exercitii si aplicatii
Aplicatia 3.1
Distributia cifrei de afaceri ale celor 540 companii ce performeaza intr-o anumita industrie se prezinta in tabelul de mai
jos:
TABEL NR. 6 - DISTRIBUTIA CIFREI DE AFACERI A COMPANIILOR
Intervale de variaie a
cifrei de afaceri
(mil lei)
Numr
companii
pn la 3,5
*)
58
3,5 4,5 119
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
4,5 5,5 140
5,5 6,5 102
6,5 7,5 58
7,5 8,5 39
8,5 i peste 24
Total 540
*)
limita superioar nu este cuprins n interval
Se cere:
S se determine indicatorii tendinei centrale i s se comenteze rezultatele folosind indicatorii variaiei n jurul
mediei i indicatorii asimetriei.
Rezolvare
a) Indicatorii tendintei centrale media, mediana si modul sunt:
Media artmetica ponderata:
lei mil
N
n x
i i
363 , 5
540
2896
Cifra medie de afaceri a celor 540 companii este de 5.36 mil lei/an.
Mediana
Intervalul median este [4.5 5.5] mil lei, pentru un loc al medianei egal cu 270.5. Prin urmare, valoarea estimata a
medianei este:
lei mil
n
npMe n
Me
k
Me
x Me
Me
i
168 , 5
140
177 5 , 270
1 5 , 4
) 1 ( 5 , 0
+
+
+
Astfel, jumatate dintre companii au inregistrat o cifra de afaceri peste 5.17 milioane lei, iar cealalta jumatate sub 5.17
milioane lei.
Modul sau valoarea modala
Intervalul modal este [4.5 5.5] mil lei, corespunzator celei mai mari frecvente 140 companii. Valoarea estimata a
modului este:
lei mil
Mo
k
Mo
x Mo
856 , 4
38 21
21
1 5 , 4
2 1
1
+
+
+
+
Cea mai des intalnita valoare a cifrei de afaceri este de 4.86 milioane lei
Deoarece x Me Mo < < , rezult c seria prezint o asimetrie de stnga (a se vedea mai jos intensitatea asimetriei).
Intervalele marginale sunt deschise, ceea ce impune o estimare a amplitudinii variaiei cu cu ajutorul centrelor
intervalelor de grupare:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
lei mil x x A 6 3 9
min max
% 9 , 111 100
%
x
A
A
ntruct amplitudinea variaiei comparat cu media colectivitii depete 100%, se poate afirma c mrimea
mprtierii este destul de mare.
Dispersia se determin cu ajutorul formulei de calcul simplificat astfel:
4979 , 2 363 , 5
540
16880
) (
2 2
0
2
2
0
x
n
n x
i
i i
,
iar abaterea medie ptratic este:
lei mil ,58 1
2
0 0
.
In medie, cifra de afacei a celor 540 companii analizate se abate in plus sau minus cu 1.58 mil lei fata de cifra medie de
afaceri de 5.363 milioane lei.
Coeficientul de variaie:
% 5 , 29 100
0
0
0
x
v
.
Pentru c intensitatea mprtierii este sub 35%, putem accepta c, pe total, colectivitatea salariailor este relativ
omogen din punct de vedere al salariului lunar.
Indicatorii asimetriei propui de Pearson sunt:
Asimetria absolut:
lei mil Mo x as 507 , 0 856 , 4 363 , 5 +
Coeficientul de asimetrie:
3209 0
58 1
507 0
,
,
, Mo x
C
as
+
.
Valoarea coeficientului indic o asimetrie moderat de stnga (pozitiv).
Aplicatia 3.2
Pornind de la datele prezentate in aplicatia 2.2, calculati si interpretati urmatorii indicatori ai variatie si asimetriei:
a) Amplitudinea absoluta a variatiei
b) Amplitudinea relativa a variatiei
c) Abaterea medie liniara
d) Dispersia
e) Abaterea medie patratica (abaterea standard)
f) Coeficientul de variatie
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
g) Coeficientul de asimetrie
CAPITOLUL 4 SONDAJUL STATISTIC
Introducere
Sondajul sau selectia statistica reprezinta unul dintre cele mai utilizate forme de observare statistica partiala, avand in
vedere faptul ca cercetarea statistica exhaustiva poate implica resurse foarte mari atat in termeni financiari cat si de
timp. In plus, exista situatii in care observarea totala sa nu fie posibila sau indicata (spre exemplu, verificarea
controlului de calitate al produselor poate implica distrugerea acestora).
Prin sondajului statistic se realizeaza o analiza, investigare a unei pri din populaia statistic general. Pe baza analizei
datelor din esantion se urmareste, prin procedeul de inferenta statistica, sa se generalizeze rezultatele prelucrrii datelor
de sondaj asupra intregii poplatii statistice, lunadu-se in acelasi timp in considerare erorile obiective de
reprezentativitate ce apar in cadrul procesului de selectie statistica.
Obiectivele capitolului
Capitolul isi propune sa prezinte principalele avantajele i inconvenientele sondajului statistic, etapele acestei forme de
cercetare a realitii economice, principalele procedee de eantionare, precum i modul de calcul al indicatorilor
specifici celor mai frecvent utilizate tipuri de selecie. Sunt artate, de asemenea, modalitile de extindere a rezultatelor
sondajului asupra ntregii colectiviti supuse cercetrii, precum i cile de determinare a volumului necesar al
eantionului ntr-un sondaj statistic, pentru un nivel ales al marjei de eroare.
Continut
Definire, concepte utilizate si etapele cercetarii selective (prin sondaj)
Sondajul statistic sau selectia statistica consta in nregistrarea unor uniti statistice cu scopul de a estima parametri
populatiei generale pornind de la statisticile calculate la nivel de esantion.
Sondaj statistic permite analiza unui subset al populatiei generale iar rezultatele obinute se vor generaliza, prin procesul
de inferenta statistica, la nivelul ntreagii populatii statistice.
Sondajul presupune dou faze distincte:
Etapa descriptiva - observarea sau descrierea statistic const n extragerea eantionului i calcularea
indicatorilor descriptivi la nivel de esantion, numiti si statistici: media, abaterea medie ptratic, coeficientul
de variaie etc;
Inferen statistic - const n extinderea rezultatelor obtinute la nivelul eantionului asupra intregii populaii
statistice.
Din aceeai populatie statistica pot fi extrase un numar considerabil de mare de eantioane, de volume diferite sau
de acelai volum, dar cu structuri diferite, informaiile obinute n urma prelucrrii datelor de selecie nu sunt informaii
certe i au un caracter incert datorit erorilor obiective de reprezentativitate.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Prin urmare, generalizarea rezultatelor obtinute la nivel de esantion asupra intregii populatii pornind de la prelucrrii
datelor de esantion se face n termeni probabilistici.
Sondajul statistic are mai multe avantaje, printre care:
Este mai putin costisitor fata de observarea totala;
Dureaza mai putin timp;
Poate oferi raspunsuri in situatiile in care cercetarea populaiei generale este greu sau imposibil de realizat de
exemplu se poate folosi n testarea calitii produselor fr s duc la distrugerea ntregului lot;
Avand in vedere ca informaiile vor fi culese doar de la un numar relativ redus de uniti statistice selectate n
eantion, este posibila obtinerea de informatii mult mai detaliate ceea ce permite o caracterizare mai profund a
fenomenelor analizate;
Avad in vedere volumul mult mai redus de munca si personalul mai bine instruit (de obicei specializat in
analiza de sondaj) se reduc erorile de observare;
Poate fi utilizat in verificarea programului unei observri totale n vederea corectrii eventualelor necorelri
sau carene n organizare;
Poate fi utilizat in verificarea i testarea unei ipoteze statistice.
Trebuie subliniat insa faptul ca, rezultatele obtinute prin sondaj sunt prezentate in termeni probabilistici fara a oferi
valoarea exacta a parametrilor populatiei generale.
Concepte utilizate
Selecia statistic reprezint operaia de extragere a unei pri/subset din populatia generala numit i eantion (mostr
sau colectivitate de selecie).
Eantionul reprezint un subset de elemente extras dintr-o colectivitate statistic general.
Volumul eantionului este ntotdeauna mai mic dect al colectivitii totale sau generale.
De regula, se noteaza cu N volumul populatieii generale i cu n volumul esantionului (colectivitii de selecie).
ntotdeauna 1 n N-i.
In general, esantioanele de volum sub 30 observatii se considera esantioane de volum mic.
Indicatori statistici calculati la nvelul populatiei generale se numesc parametri.
Indicatori statistici calculati la nvelul eantionului se numesc estimatori sau statistici. Estimatorul calculat pentru un
eantion va oferi o estimaie a parametrului din populaia general. Estimatorul este ntotdeauna o variabil aleatoare,
deoarece se bazeaz pe datele obinute dintr-un eantion aleator.
Eroarea de estimaie reprezint diferena dintre estimatorul obinut pe eantion i valoarea parametrului de la nivelul
populatiei generale.
Erorile cercetrii prin sondaj pot fi: erori de nregistrare i erori de reprezentativitate.
Erorile de nregistrare care intervin n cadrul unui sondaj datorit volumului mic, sunt mai puin numeroase
dect n cadrul unei observri totale i pot fi nlturate prin efectuarea controlului cantitativ obinuit.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Erorile de reprezentativitate ntlnite sunt de 2 feluri: sistematice i ntmpltoare. Erorile de
reprezentativitate provin din nerespectarea strict a principiului de baz al seleciei ntmpltoare, care cere ca
unitile s fie incluse n eantion fr nici un fel de preferin subiectiv din partea celui care efectueaz
sondajul.
In practica se intanesc doua tipuri de estimatori:
Estimatori punctuali
Estimator sub forma intervalelor de incredere
Estimatorii trebuie sa aiba mai multe caracteristici, sau, cu alte cuvinte, un estimator trebuie sa fie
Nedeplasat sa aiba valoarea asteptata (media estimaiilor din toate eantioanele posibile) egala cu parametrul
pe care il estimeaza
Consistent un estimator nedeplasat este consistent daca diferenta dintre estimator si parametru scade pe
masura ce volumul esantionului creste
Eficient dintre doi estimatori nedeplasati, cel cu dispersia mai mica se spune ca este eficient.
Tipuri de sondaj
Dup modul de organizare a colectivitii generale i dup modul de selecie a unitilor n eantion, se disting mai
multe tipuri de sondaj:
A. Sondaje aleatoare (probabiliste):
o sondajul simplu repetat i nerepetat;
o sondajul tipic (stratificat);
o sondajul de serii;
o sondajul n mai multe trepte;
o sondajul secvenional.
B. Sondaje cu extracie nealeatoare:
o sondajul dirijat;
o sondajul sistematic (sau mecanic).
In practica, cele mai utilizate tipuri de sondaje il reprezinta sondajul aleator simplu, sondajul stratificat si sondajul de tip
cluster
Sondajul aleator simplu se utilizeaza in situatia in care populatia generala este relativ omogena.
Procedeul consta in extragerea unui eantion simplu aleator pentru care:
- fiecare unitate statistic are aceeai ans de a fi aleas n eantion
- alegerea unei uniti nu este influenat de alegerea unei alte uniti statistice
Sondajul aleator simplu se poate realiza utilizand mai multe procedee:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
procedeul loteriei;
procedeul tabelului cu numere ntmpltoare sau un program pe calculator de generare de numere
ntmpltoare (vezi descrierea functiei RANDBETWEEN);
procedeul mecanic sau al pasului de numrare.
Procedeul loteriei/tragerii la sori
o schema bilei revenite- eantionul se numete eantion aleator repetat, este procedeul de
sondaj implementat in Microsoft Excel
o schema bilei nerevenite - eantionul se numete eantion aleator nerepetat.- este procedeul
de sondaj implementat in SPSS
La fiecare extragere, probabilitatea unei uniti (nc neextrase) de a fi aleas n eantion crete, astfel
nct la extragerea cu numrul i (1 i n), probabilitatea unei uniti de a fi
selectat n eantion este
Numrul eantioanelor distincte, de volum n, ce pot fi extrase n sondajul aleator simplu fr revenire
este
De exemplu, daca se doreste exragerea unui esantion de volum n=10 dintr-o populatiei statitics de 100, exista
17 310 309 456 440 eantioane diferite.
Sondajul tipic (stratificat)
Dac elementele colectivitii generale sunt eterogene, constatndu-se exitenta anumitori variabile de stratificare (de
exemplu: sexul, varsta, mediul urban/rural, zona geografica, venitu, educatia etc) se recomand utilizarea un sondaj
dirijat (nealeator). Astfel se asigur ptrunderea n eantion a unor elemente din toate straturile tipice.. Dup stabilirea
volumului n al eantionului, se stabilete componena pe straturi (numr de elemente din fiecare strat), astfel nct
structura eantionului s corespund structurii colectivitii generale. Pentru extragerea separat din fiecare strat a
numrului corespunztor de elemente, se utilizeaz selectia aleatoare.
Sondajul de serii
Sondajul de serii (tip cluster sau de uniti complexe) se utilizeaza in cazul unei populatii generale structurate pe uniti
complexe (populaia organizat pe familii sau personalul direct implicat n producie/distribuie organizat pe echipe sau
loturile de mrfuri aranjate pe palei, n vederea facilitii transportului), se recomand s nu ignorm aceste structuri
pentru a extrage uniti simple, ci s preferm prelevarea de uniti complexe (extragerea de serii).
Etapele cercetarii selective (prin sondaj)
Orice cercetare prin sondaj presupune o pregtire prealabil pe baza unui plan numit i dosarul unui sondaj, care
necesit parcurgerea unor etape:
o Determinarea obiectivelor sondajului pot consta fie in estimarea parametrilr populatiei generale (media,
proportia, dispersia popolatiei generale) sau verificarea unor ipoteze privind forma distribuiilor statistice,
legturile dintre fenomene, evoluia fenomenelor etc.;
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
) 1 (
1
i N
n
N
C
o eantionarea, care presupune alegerea bazei de sondaj, adic populaia asupra creia se extind rezultatele
obinute prin sondaj, delimitarea populaiei i verificarea gradului de omogenitate; alegerea unitilor statistice;
alegerea tipului de sondaj i a procedeelor de eantionare etc
o elaborarea unui plan de culegere a datelor i de prelucrare a informaiilor cu precizarea indicatorilor
statistici care vor rspunde cel mai bine scopului de cunoatere;
Rezultatele unui sondaj statistic depind de reprezentativitatea eantionului. Un eantion este reprezentativ dac este o oglinda a
structurii populatiei generale. O reprezentativitate perfect nu se poate realiza dect cu totul ntmpltor; de aceea se admite c
reprezentativitatea este bun dac greutile specifice ale fiecrei grupe nu difer cu mai mult de 5%, n raport cu
structura colectivitii generale.
Asigurarea reprezentativitii eantionului presupune respectarea urmtoarelor condiii:
alegerea unitilor care formeaz eantionul s se realizeze aleator i cu o posibilitate calculat anticipat diferit
de zero;
volumul eantionului s fie suficient de mare pentru a reda trsturile eseniale ale colectivitii generale;
selectarea unei uniti de observare statistica n eantion s se fac independent de alte uniti.
Observatie: pentru a selecta in mod aleator un set de unitati de observare, in conditiile in care exista o lista a
elementelor populatiei totale, prezentata in excel (evident, este vorba de populatii totale de volum relative redus, maxim
in ordinal zecilor de mii de observatii) se utilizeaza functia RANBETWEEN.
FIG. NR. 30 ACCESAREA FUNCTIEI RANDBETWEEN
Functia Randbetween are urmatoarele argumente:
Bottom limita inferioara de la care se genereaza numarul aleator (de regula egala cu 1)
Top - limita superioara pana la care se genereaza numarul aleator (de regula egala cu volumul esantionului, n)
Rezultatul va fi un numar aleator cuprins intre 1 si n. Se vor genera un numar de valori cu 10%-20% mai mare decat
volumul esantionului, pentru a elimina valorile repetitive. Odata numerele aleatoare generate, se recomanda copierea lor
si utilizarea optiunii Paste Special/Values avand in vedere volatilitatea functiei Randbetween.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Calculul indicatorilor de sondaj. Esimarea intervalelor de incredere
Indicatorii de sondaj calculati in procesul de construire a intervalului de incredere pentru parametru populatiei generale
sunt:
- media de sondaj,
- dispersia mediei de sondaj,
- eroroarea medie de reprezentativitate
- eroroarea limit maxim admisibil.
Dispersia mediei de sondaj se calculeaz ca:
n
x
x
2
2
. [5.1]
Eroarea standard a mediei de sondaj este
x
2
. [5.2]
Teorema limita central stipuleaza ca, dac variabila analizata urmeaza o distributie normala, atunci si mediile de
esantionare urmeaza o distributie normala. Daca insa variabia analizata nu este normal distribuit, atunci si mediile de
esantionare urmeaza o distributie normal doar pentru eantioane57suficient de mari (volumul esantionului n>30).
In situatia in care dispresia populatiei totale nu este cunoscuta, estimatorul dispersiei mediei de sondaj (
2
x
s
) se scrie:
n
s
s
x
x
2
2
[5.3]
i estimatorul erorii medii a mediei de sondaj (adic eroarea medie de reprezentativitate):
n
s
s
x
x
. [5.4]
Construirea intervalelor de incredere
Analiza rezultatelor obtinute pe un eantion are o o valoare relativ, avand in vedere ca esantionul extras se poate gasi
in orice parte a distributiei esantioanelor in jurul parametrului (necunoscut) al populatiei generale
Construirea intervalelor de incredere presupune urmatorii pasi:
1. Identificarea datelor problemei: in principal daca este sau nu cunoscuta dispersia populatiei generale, volumul
esantionului, indicatorii descriptive de la nivel de esantion media esantionului, abaterea standard a
esantionului
2. Calculul eroarii medii de reprezentativitate
3. Calculul erorii limita
4. Construirea intervalului de incredere
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Calculul erorilor pentru selecia aleatoare simpl repetat
1. Presupunem un esantion de volum n, cu media x si abaterea standard , estimatorul dispersiei mediei de sondaj
(
2
x
s
) este
n
s
s
x
x
2
2
2. Calculul eroarii medii de reprezentativitate reprezinta abaterea medie ptratic a mediei de sondaj de la media
colectivitatii generale.
Daca dispersia/ abaterea standard a colectivitatii generale este cunoscuta, eroarea medie de
reprezentativitate este:
n
n
x
x
x
2
[5.5]
Daca dispersia/ abaterea standard a colectivitatii generale nu este cunoscuta, eroarea medie de
reprezentativitate este:
n
s
n
s
s
x
x
x
2
[5.6]
3. Calculul erorii limita (erorii maxim admisibile), pentru o probabilitate de garantare a rezultatelor de rezultatele
100(1-)%,:
Daca dispersia/ abaterea standard a colectivitatii generale este cunoscuta
n
z z
x
x x
2 / 2 /
, [5.7]
unde z este argumentul functiei Gauss-Laplace si depinde de probabilitatea de garantare a rezultatelor (valorile
lui z sunt tabelate pentru diverse niveluri de semnificatie).
Daca dispersia/ abaterea standard a colectivitatii generale nu este cunoscuta:
n
s
z s z
x
x x
2 / 2 /
, [5.8]
Cu alte cuvinte, n 100(1-)% din cazuri, media de sondaj (
x
) se abate, in plus sau minus, de la media
colectivitii generale, cu o marja de eroare data de eroarea limita (maxim admisibila).
4. Construirea intervalului de incredere in care se va situa media reala, dar necunoscuta, a populatiei
generale (parametrul populatiei generale):
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 31 CONSTRUIREA INTERVALELOR DE INCREDERE
Deoarece eantion de volum n a fost extras dintr-o colectivitate general de N uniti, nu putem fi siguri 100%
n privina valorii adevrate a arametrului colectivitii generale. De aceea, intervalul de incredere se defineste
ca:
[5.9]
Calculul erorilor pentru selecia aleatoare simpl nerepetat
In cazul selectiei aleatoare nerepetate, pasii sunt similari cu cei prezentati anterior. Astfel:
1. Esantionul se presupne a avea volumul egal cu n observatii, cu media x si abaterea standard , estimatorul
dispersiei mediei de sondaj (
2
x
s
) este
n
s
s
x
x
2
2
2. Calculul eroarii medii de reprezentativitate abaterea ntre media de selecie i media colectivitii generale
se va calcula utilizand este coeficient de corecie a erorii medii de reprezentativitate, care are urmatoarea
formula:
[5.10]
Daca dispersia/ abaterea standard a colectivitatii generale este cunoscuta, eroarea medie de
reprezentativitate este:
1 1
2
N
n N
n N
n N
n
x
x
x
[5.11]
Raportul n/N se mai numeste si fracia de sondaj. Pentru o fracie de sondaj sub 5% , n practica,, coeficientul de
corecie n populaie finit
1 N
n N
N
n N
Daca dispersia/ abaterea standard a colectivitatii generale nu este cunoscuta, eroarea medie de
reprezentativitate este:
1 1
2
N
n N
n
s
N
n N
n
s
s
x
x
x
[5.12]
3. Calculul erorii limita (erorii maxim admisibile), pentru o probabilitate de garantare a rezultatelor de rezultatele
100(1-)%,:
Daca dispersia/ abaterea standard a colectivitatii generale este cunoscuta
n
z z
x
x x
2 / 2 /
, [5.13]
unde z este argumentul functiei Gauss-Laplace si depinde de probabilitatea de garantare a rezultatelor (valorile
lui z sunt tabelate pentru diverse niveluri de semnificatie)
Daca dispersia/ abaterea standard a colectivitatii generale nu este cunoscuta
n
s
z s z
x
x x
2 / 2 /
, [5.14]
Cu alte cuvinte, n 100(1-)% din cazuri, media de sondaj (
x
) se abate, in plus sau minus, de la media
colectivitii generale, cu o marja de eroare data de eroarea limita (maxim admisibila).
4. Construirea intervalului de incredere in care se va situa media reala, dar necunoscuta, a populatiei generale
(parametrul populatiei generale)
[5.15]
Determinarea volumul eantionului
Determinarea volumul eantionului pentru sondaj aleator simplu repetat
De multe ori, marimea erorii limite admisibile poate fi prea mare ca furnizeze o valoare analitica semnificativa. De
aceea, pentru a scadea aceasta eroare, avand in vedere ca ceilalti doi factori de influenta a erorii limita (abaterea
standard din populatie/esantion si constanta z corespunzatoare nvelului de incredere ales) se mentine, de regula,
constant, singura possibilitate ramane cresterea volumului esantionului.
Astfel, in practica se poate specifica eroarea limit maxim admisibil (
x
.
Cu aceste notatii:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
x x
x x + < <
x
x
n
s
z
2 /
sau
2
2 /
L
n
s
z
x
[5.16]
Volumul esantionul se determina ca:
2
x
2
x
2
2 /
s ) z (
n
[5.17]
sau
2
2
x
2
2 /
L
s ) z ( 4
n
. [5.18]
Daca dispersia populatiei generale este cunoscuta, in formulele prezentate anterior in loc de sx
2
se folosete
2
x
.
Volumul estimat al esantionului n astfel determinat se va exprima ca un numar intreg, prin rotunjirea la numrul ntreg
superior (fiind vorba de uniti statistice), pentru a fi siguri c mrimea eantionului este suficient n scopul obinerii
preciziei dorite. (in acest scop se poate utiliza functia excel ROUNDUP)
Volumul eantionului pentru sondaj aleator simplu nerepetat se poate calcula pornind de la acealeasi ipoteze:
N
n
n
s
z
N
n N
n
s
z
x x
x
1
1
2 / 2 /
[5.18]
Pe baza formulei:
N
s z
s z
N s z
N s z
n
x
x
x
x
2 2
2
2 2
2 2 2
2 2
2 /
2 /
2 /
2 /
. [5.19]
Sinteza
Capitolul prezinta principalele metode de selectie statistica, modalitatea de obtinere a estimatorilor punctuali si a
intervalelor de incerdere pentru parametrii poplatiei generale.
Selectia statistica este un procedeu cu larga aplicabilitate practica, datorita numeroaselor avantaje date de analiza unui
volum mult redus de date (avantaje de cost, timp, extindere a programului cercetarii, acuratete a rezultatelor etc).
Principalele procedee de selectie statistica sunt sondajul aleator repetat sau nerepetat, sondajul stratificat si sondajul de
serii.
Pe baza rezultatelor analizei la nivel de esantion (estimatori) se urmareste aplicarea inferentei statistice, sau, cu alte
cuvinte, generalizarea, in termini probabilistici, a rezultatelor cercetarii la nivelul populatiei generale.
Astfel, pentru a construi intervalul de incredere pentru parametrul (necunoscut) al populatiei generale, este necesara
calculul eroarii medii de reprezentativitate (abaterea ntre media de selecie i media colectivitii generale) si a erorii
limita (sau eroarea maxim admisibila ce reprezinta diferena ntre media unui eantion (estimator) i media
colectivitii generale (parametru) la estimarea acestuia cu o anumit probabilitate).
Intervalul de incredere se construieste prin adaugarea si substragerea (corespunzator limitei superioare si, respective,
inferioare a intervalului de incredere) din media esantionului, a erorii limite.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Exercitii si aplicatii
Aplicatia 4.1.
Un utilaj de productie este astfel reglat nct s produca pungi cu chipsuri de greutate cte 20 de grame, cu o toleran
de t 1 gram.
Controlul tehnic de calitate de rutina al companiei producatoare a obtinut, prin extragere mecanic, un eantion de 150
pachete care cantareau n total 3015 grame. Din cercetarea eantionului rezult c 129 pachete cantareau exact 20 g, 12
pachete cantareau peste 20g, iar 9 pachete cantareau sub 20g.
Calculand indicatorii descriptivi la nivel de esantion, se constata ca media esantionului este de .20,1 grame/pachet,
intensitatea mprtierii era de 7,2%.
Se cere:
a) S se estimeze cu o probabilitate (z) = 0,9973 (z = 3) greutatea totala a lotul de N = 3000 pachete realizate n
cursul zilei i s se observe dac echipamentul se ncadreaz n tolerana admis;
b) Ct de mare ar trebui s fie un eantion, dac greutatea medie/pachet ar trebui estimat cu (z) = 0,9545 (z = 2)
n limitele unui interval de t 0,5 grame?
c) S se observe n eantionul de 150 pachete, cota de produse care nu ndeplinesc cerina de 20 grame/pachet i
s se estimeze cu (z) = 0,90 (z = 1,65) cota minim i maxim, precum i numrul minim i maxim de
pachete necorespunztoare din punct de vedere al greutatii n producia unei zile;
d) Avnd n vedere c un client nu va reclama dect n situaia n care greutatea pachetului de chipsuri este mai
mica de 20 grame (care apare nscris pe pachet), se cere refacerea calculelor, considernd c m = 9 pachete din
150 verificate.
Rezolvare:
a) Din enunul problemei rezult c eantionul se caracterizeaz prin:
Volumul n = 150 pachete;
Media
x
= 20,1 grame/pachet;
Abaterea standard
1,4472 grame/pachet (din relaia coeficientului de variaie
% 2 , 7 100
x
v
)
Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, tiind c n cazul extragerii
mecanice se aplic relaia de la sondajul simplu, aleator, repetat:
pachet grame
n
x
/ 118 , 0
150
0944 , 2
2
Un eantion de 150 produse prelevate mecanic din producia zilei, prezint, n medie, o abatere cu 0,118
grame/pachet fa de numrul mediu (
0
x ) ce caracterizeaz ntrega producie.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Eroarea limit pentru (z) = 0,9973:
pachet grame z
x x
/ 35 , 0 118 , 0 3
Greutatea medie/pachet pentru intreaga productie a zilei se situeaz, cu probabilitatea de 0,9973 n intervalul:
) 35 , 0 1 , 20 ( , ), (
0 0
t t x adica x x
x
Prin urmare: 45 , 20 75 , 19 , ceea ce, aplicat ntregii producii a zilei conduce (prin multiplicarea cu N =
3000) la o greutate totala (T) de:
61350 59250 T , cu (z) = 0,9973, n condiiile n care reglajul trebuia s ncadreze acest numr ntre
(20-1) 3000 = 57.000 grame i (20+1) 3000 = 63.000 grame.
ntruct intervalul de estimare (59.250, 61.350) este mult mai mic dect tolerana admis (57.000, 63.000),
rezult c reglajul este corespunztor.
b) pachete
z
n
x
34 5104 , 33
5 , 0
0944 , 2 4
2 2
2 2
.
Deci, pentru a rspunde unei astfel de exigene, ar fi suficient s se preleveze prin extragere mecanic doar 34
pachete, ceea ce la o producie total de 3000 pachete nseamn un pas de numrare 88
n
N
.
c) Din 150 pachete prelevate, 12+9 = 21 pachete conin fie mai multe, fie mai puine produse dect numrul
standard de 20 grame/pachet.
n cadrul eantionului, media (w) i dispersia (
2
w
) caracteristicii alternative sunt:
14 , 0
150
21
n
m
w , ceea ce nseamn c 14% din eantion nu corespunde standardului de productie.
1204 , 0 86 , 0 14 , 0 ) 1 (
2
w w
w
Eroarea medie de reprezentativitate a unui eantion de volum 150 obinut prin prelevare mecanic este de:
% 83 , 2 0283 , 0
150
1204 , 0
2
sau
n
w
w
Un eantion de volum 150 prelevat mecanic se caracterizeaz, n medie, printr-o cot de produse
necorespunztoare cu 2,83% mai mare sau mai mic dect cota parte specific ntregii producii a unei zile.
Eroarea limit pentru o probabilitate de 0,90 este de:
% 7 , 4 0467 , 0 0283 , 0 65 , 1 sau z
w w
.
La probabilitatea menionat, abaterea maxim a unui eantion de volum 150 prelevat mecanic fa de cota
real de produse necorespunztoare din producia unei zile este 4,7%.
n aceste condiii, la (z) = 0,90, cota minim i maxim de defecte n producia zilei este cuprins n
intervalul:
) (
w
w p t , adic: ) 047 , 0 14 , 0 ( t p sau:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
187 , 0 093 , 0 p , cu (z) = 0,90.
Numrul minim i maxim de pachete necorespunztoare (M) n producia unei zile se obine nmulind cu N =
3000 limitele intervalului n care se ncadreaz cota de defecte:
561 279 M pachete, cu (z) = 0,90.
Cel puin 279 pachete i cel mult 561 pachete din lotul fabricat de 3000, cuprinde mai mult sau mai puin de 20
grame/pachet, cu o probabilitate de 0,90 (sau cu o marj de eroare acceptat de 1-0,90 = 0,10 sau 10%).
d) n situaia n care se consider c un client nu va reclama dect n situaia n care obine mai puine grame
dect numrul de 20 (care apare nscris pe pachet (m = 9 pachete din 150 verificate).
w = 0,06; w(1-w) = 0,0564; 09 , 0 03 , 0 ; 03 , 0 ; 02 , 0 p
w w
;
270 90 M pachete, 9 , 0 ) ( z cu .
Aplicatia 4.2.
Managerul unui restaurant doreste sa estimeze suma medie cheltuita de clientii restaurantului in perioada aferenta
pranzului weekend (Sambata si Duminica). Un esantion obtinut in urma unui proces de selectie aleatoare pe un esantion
de 400 clienti arata ca nivel mediu de cheltuielilor pentru cei consumatori a fost de 620 lei cu o abatere standard de 250
lei.
Se cere sa se construiasca intervalul de incredere al populatiei generale, cu un nivel de incredere de 95%.
Care ar fi nivelul incasarilor resturantului intr-o zi cu in care vor servi masa de pranz 57 clienti?
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Aplicatia 4.3.
Un esantion de 100 clienti ai unei salon de cosmetica a fost chestionat cu privire la satidfactia fata de serviciile oferite.
Din cei 100 clienti intrebati, 75 au declarat ca sunt foarte multumiti de serviciile primite.
Se cere sa se construiasca construiasca intervalul de incredere al pentru procentul de satifactie l tuturor clientilor
salonului de cosmetica, cu un nivel de incredere de 95%.
Un articol de ziar a prezentat rezultatele acestui sondaj astfel: Un esantion de 100 clienti a aratat ca 75% sunt foarte
multumiti de serviciile salonului de cosmetica. Rezultatele au o marja de eroare de 2,7 procente, in 19 cazuri din 20.
Este aceasta afirmatie corecta?
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
CAPITOLUL 5 TESTAREA IPOTEZELOR STATISTICE
Introducere
Testele statistice se impart in teste parametrice si neparametrice, in functie de cunoasterea sau nu a distributiei
populatiei analizate. In prima categorie cele mai cunoscute teste sunt testul Student (testul t), testul z pentru distributia
normal sau testul Hipatrat.
In cadrul testele neparametrice se incadreaza, spre exemplu, testul Wilcoxon (verifica existent unor diferente
semnificative intre doua populatii, pebaza datelor din esantioane), testul Mann-Whitney (utilizat pentru verificarea
existentei egalitatii dintre doua populatii), testul Kolmogorov-Smirnov (testeaza identitatea a doua functii de repartitie),
etc
.
Obiectivele capitolului
Capitolul isi propune sa prezinte obiectivele si metodele de testare a ipotezelor statistice, in contexul procesului de
inferenta statistica, in vederea confirmarii sau infirmarii unor presupuneri legate de parametrii unei populatii statistice,
pornind de la datele obtinute in urma analizei datelor dintr-un esantion.
Continut
Introducere in testrea ipotezelor statistice
Prin ipoteza statistica se intelege presupunerea care se face cu privire la parametrul unei repartitii sau a legii de
repartitie pe care o urmeaza anumite variabile aleatoare.
Exista doua ipoteze statistice:
ipoteza nula este ipoteza care urmeaza a fi testata si este notata cu H0. Aceasta presupune ca nu exista
deosebiri esentiale sau ca eventualele deosebiri au un caracter intamplator;
ipoteza alternativa reprezinta negarea ipotezei nule si se noteaza cu H1.
Procedeul de verificare a unei ipoteze statistice se numeste test de semnificatie. Pentru cele mai multe testari statistice,
testul este derivat din estimatorul punctual al parametrului ce va fi testat.
Concepte utilizate
Regiunea critica reprezinta valorile numerice ale testului statistic pentru care ipoteza nula va fi respinsa.
Eroarea pe care o facem eliminand o ipoteza nula, desi este adevarata, se numeste eroare de tip unu. Probabilitatea
comiterii unei astfel de erori () si se numeste nivel sau prag sau nivel de semnificatie
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Nivelul de incredere al unui test statistic este (1-)
Eroarea pe care o facem acceptand o ipoteza nula, desi este falsa, se numeste eroare de tipul al doilea, iar
probabilitatea (riscul) comiterii unei astfel de erori se noteaza cu . Puterea testului statistic este (1-).
Regiunea critica reprezinta valorile numerice ale testului statistic pentru care ipoteza nula va fi respinsa.
Cele patru posibilitati ce deriva din combinarea celor doua ipoteze statistice (ipoteza nula si ipoteza alternative) cu cele
doua posibile decizii (respingerea sau nu a ipotezei nule) sunt prezentate schematic in tabelul de mai jos:
Ipoteza adevarata
Decizia de acceptare
Ho H1
Ho Decizie corecta Eroare de tip I
H1 Eroare de tip II Decizie corecta
Etapele testarii ipotezelor statistice
Testarea ipotezelor statistice poate fi realizata urmand urmatoarele etape:
1. formularea ipotezelor ipotezele pot fi sub forma testului bilateral sau unilateral de stanga sau de dreapta;
in cazul testarii parametrul medie al unei colectivitati generale cu valoarea 0, formularea ipotezei nule si
alternative se realizeaza intr-una din urmatoarele forme:
test bilateral:
H0: = 0
H1: 0
test unilateral de dreapta:
H0: = 0
H1: > 0
test unilateral de stanga:
H0: = 0
H1: < 0
2. alegerea tipului de distributie coresunzatoare variabilei analizate depinde tipul testarii, de volumul
esantionului extras si de cunoasterea sau nu a dispersie populatiei statistice, etc
In cazul in care se cunoaste dispersia populatiei statistice se foloseste statistica Z (testul Gauss-Laplace)
[5.1]
In cazul in care nu se cunoaste dispersia populatiei statistice ci numai a esantionului (s) se observa vlumul
esantionului (n):
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
n
x
Z
calc
o Daca volumul esantionului este mai mare de 30 observatii, se foloseste statistica Z (testul Gauss-
Laplace)
[5.2]
o Daca volumul esantionului este mai mare de 30 observatii, se foloseste statistica Z (testul Gauss-
Laplace)
[5.3]
3. specificarea unui prag de semnificatie , altfel spus, riscul asumat in respingerea ipotezei nule cand
aceasta este adevarata.
4. Definirea regiunii de acceptare/ de respingere
5. calcularea valorii statisticii test folosind formulele
In cazul in care se cunoaste dispersia populatiei statistice se foloseste statistica Z (testul Gauss-Laplace)
[5.4]
In cazul in care nu se cunoaste dispersia populatiei statistice ci numai a esantionului (s) se observa vlumul
esantionului (n):
a. Daca volumul esantionului este mai mare de 30 observatii, se foloseste statistica Z (testul Gauss-
Laplace)
[5.5]
b. Daca volumul esantionului este mai mic de 30 observatii, se foloseste statistica t (testul Student)
[5.6]
6. Decizia statistica se compara valoarea calculata a statisticii respective cu valoarea critica a lui Z sau t cu
(n-1) grade de libertate pentru pragul de semnificatie ales;
Daca valoarea calculata se gaseste in regiunea de acceptare, concluzia este ca nu exista suficienta evidenta
statistica pentru a respinge ipoteza nula; daca valoarea calculata se afla in regiunea de respingere, se respinge
ipoteza nula;
7. Interpretarea rezultatelor se interpreteaza rezultatele in contextul explicit al problemei manageriale
analizate.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
n
s
x
z
0
n
s
x
t
0
n
x
Z
calc
n
s
x
z
0
n
s
x
t
0
Testul HI-patrat
Este un test de concordan, neparametric, folosit pentru a testa gradul de apropiere" dintre o distribuie observata i
una teoretic. putand fi utilizat att n cazul variabilelor cantitative ct i calitative.
Testul Hi-patrat poate fi utilizat in urmatoarele situtii:
1. Compararea a mai multor procente
2. Testul de independenta
Tabel de contingenta
Existenta unei legaturi intre 2 variabile calitative
3. Goodness of fit test - daca o distributie data corespunde unei distributii teoretice (normala, uniforma,
Poisson, Student, etc )
Distributia functie Hi patrat pentru diferite grade de libertate se prezinta in graficul de mai jos::
FIG. NR. 32 DISTRIBUTIA HI-PATRAT
Etapele testatii in cazul testu;u Hi patrat sunt similare cu cele prezentate anterior:
1. Formularea ipotezei nule si ipotezei alternative;
2. Selectarea nivelului de semnificatie;
3. Stabilirea frecventelor absolute observate (din esantion) (oi);
4. Calcularea frecventelor asteptate (ei) pe baza distributiei din ipoteza nula;
5. Calcularea statisticii Hi-patrat:
[5.7]
Unde oi reprezinta frecventele absolute observate (inregistrate in esantion)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
k
i i
i i
e
e o
1
2
2
) (
k
i i
i i
e
e o
1
2
2
) (
2
1 ,
2
>
k
18 . 8
30
) 30 16 (
80
) 80 82 (
90
) 90 102 (
2 2
k
1 i
2
2
99147 . 5
2
1 3 , 05 .
2
1 k ,
Ho variabilele sunt independente
H1 exista o relatie de dependent intre cele doa variabile analizate
2. Distributia este Hi patrat
3. Nivelul de semnificatie 5%, Gradele de libertate d.f. = (r-1)*(c-1), unde r reprezinta numarul de variante
inregistrate pe randurile tabelului de 72ontingent iar c reprezinta numarul de variante inregistrate pe coloanele
tabelului de 72ontingent.
Valoarea din tabele statistice se poate obtine si in excel , utilizand functia CHIINV
FIG. NR. 33 ACCESAREA FUNCTIEI CHIINV
Argumentele functiei CHIINV sunt:
o Probability reprezinta probabilitatea corespunzatoare nivelului (pragului) de semnificatie ;
o Deg_freedom reprezinta gradele de libertate, d.f. = (r-1)*(c-1),
4. Valorile asteptate se calculeaza astfel:
[5.8]
5. Statistica calculate este:
[5.9]
6. Regiunea de respingere este:
[5.9]
7. Se ia decizia statistca de respingere sau nu a ipotezei nule si se interpreteaza rezultatele obtinute
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
ui esantionul volumul
) coloana (Total ) rand (Total j i
e
ij
k
i i
i i
e
e o
1
2
2
) (
2
1 ,
2
>
k
3. Goodness of Fit Test
Verifica daca o anumita distributie (data) corespunde unei distributii teoretice (
Exemple:
- distributia uniforma (frecvente absolute egale)
- Distributia normala
- Distributia Student
- Distributia binomiala
- Distributia Poisson, etc
Se aplica etapele testarii de ipoteze, corespunzatoare testului Hi-patrat, in care ipoteza nula este ca distributia valorilor
din esantion corespun distributiei teoretice
Sinteza
In analiza datelor obtinute printr-un eantion, rezultat obinute sunt estimatori, n sensul c datele respective nu numai
c nu coincid cu parametrii populaiei, dar nici mcar nu se poate ti cu certitudine care este diferena dintre estimator si
parametru, de vreme ce starea populaiei este, de regul, necunoscut.
Prin urmare, asupra populaiilor studiate selectiv se pot exprima numai supoziii in termini probabilistici, denumirte
ipoteze statistice. Prin testarea ipotezelor statistice, se urmareste obtinerea de suficienta evidenta statistica in urma
studierii unui esantion, pentru a putea respinge sau nu ipoteza nula.
Testarea ipotezelor statostoce se poate realiza urmand o serie de pasi descrisi mai devreme, care se pot aplica oricarui
tip de distributie a variabilei analizate fie ea distributia normala (Gauss-Laplace), distributia Student (sau t), distributia
Hi-patrat .
Exercitii si aplicatii
Aplicatia 5.1
Managementul unei filiale de banci dorete s fluidizeze servirea clienilor. Din studii anterioare realizate de banca, se
cunoaste c timpul de servire a clienilor este normal distribuit, de medie 10 de minute i abatere medie ptratic 4
minute.
Din activitatea desfasurata, managerul are indoieli cu privire la timpul mediu de servire in cadrul filialei. In acest sens,
nregistreaz timpii de servire pentru 100 de clieni selectati intr-un esantion aleator. Media esantionului este 12 minute.
Sa se testeze la un nivel de semnificatie de 95%, c timpul mediu de servire al clientilor este diferit de 13 minute.
Parametrul ce ne intereseaz este timpul mediu n colectivitatea general. Raspunsul la intrebarea managerului se poate
obtine aplicand etapele testarii ipotezelor statistice, dupa cum urmeaza:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
1. Formularea ipotezelor
13 :
13 :
1
0
H
H
Trebuie, aadar, s rspundem la ntrebarea: Este media esantionului de 12 minute suficient de aproape/diferit de
media persupusa de 13 minute a populatiei generale, pentru a oferi suficienta evidenta statistica in a concluziona c
media populaiei este egal cu 13 minute?
2. Stabilirea formei distributiei
Avand in vedere ca se cunoaste dispersia populatiei generale si, in plus, volumul esantionului este mai mare de 30
observatii, se poate concluziona ca distributia este normal,
3. specificarea unui prag de semnificatie
Conform datelor problemei, pragul de semnificatie este de 5%
n exemplul nostru, 96 . 1
025 . 0 2 /
z z
z
.
Cum testul statistic calculat are valoarea in regiunea de respingere, rezult c sunt suficiente dovezi pentru a respinge
ipoteza nul H0 i a accepta ipoteza alternativ, aceea c timpul mediu de servire a unui client este diferit de 13 minute.
Aplicatia 5.2
Managerul unei companii doreste sa afle daca numarul de absente ale angajatilor este distribuit uniform pe parcursul
saptamanii de lucru. (altfel spus, numarul mediu de zile absentate este acelasi Luni, Marti, Miercuri, Joi si Vineri).
Un esantion aleator de 4 saptamani a aratat urmatoarea distributie a numarului de zile absentate de angajati in functie de
ziua saptamanii:.
- Luni : 5
- Marti: 4
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
- Miercuri: 2
- Joi: 3
- Vineri: 6
Pentru populatia de angajati, se poate afirma ca absenteismul apare cu aceeasi frecventa in fiecare zi a saptamanii?
(utilizati = 5% )
Solutie: se parcurg pasii prezentati anterior.
Se specifica ipoteza nula si ipoteza alternative:
o Ho: abseteismul nu depinde de ziua saptamanii
o H1: nr de zile de asbsente apar cu frecvente inegale in diferite zile ale saptamanii (nu urmeaza
distributia uniforma)
Se specifica nivelul de semnificatie - 5%
Se identifica distributia - Hi patrat, cu gradele de libertate d.f.= 5-1 = 4
Valoarea din tabele (obtinuta cu funtia CHIINV) = 9,49
Se identifica frecventele absolute observate si se calculeaza frecventele absolute asteptate
Se calculeaza testul statistic
2
= 2,5
Valoarea calculata se afla in regiunea de acceptare, prin urmare nu exista suficienta evdenta statistica sa
respingem ipoteza nula
In concluzie, nu avem suficienta evidenta statistica pentru a demonstra ca absenteism nu apar cu frecvente
egale pe parcursul saptamanii.
Aplicatia 5.3
Exemplu Managerul unei companii doreste sa afle gradul de satisfactie a angajatilor la locul de munca. In acest sens, a
extras un esantion aleator de angajati, pe care i-a rugat sa clasifice gradul lor de satisfactie in desfasurarea activitatii
curente.. Distributia nivelului de interes in functie de sex se prezinta in tabelul de mai jos. Exista suficienta evidenta
statistica pentru a concluziona ca nivelul de interes depinde de sexul? Utilizati = 0.05 (valoarea tabelata a statisticii =
5,99)
TABEL NR. 7 VALORILE OBSERVATE DIN TABELUL DE CONTINGENTA
Valori observate Raspuns: activitatea curenta este:
Gen Foarte interesanta Relativ interesanta Neinteresanta
Feminin 40 60 20
Masculin 20 40 20
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Acesta este un exemplu classic in care se aplica testul de independent.
Valorile asteptate, in cazul care cele doua variabile gradul de interes si genul - sunt independente (cu ate cuvinte,
satisfactia la locul de munca este independent de genul angajatului) sunt:
TABEL NR. 8 VALORILE ASTEPTATE DIN TABELUL DE CONTINGENTA
Valori asteptate Raspuns: activitatea curenta este:
Gen Foarte interesanta Relativ interesanta Neinteresanta
Feminin 36 60 24
Masculin
24 40 16
Testul statistic Hi patrat calculate este:
Valoarea din tabele statistice pentru (2-1)*(3-1) =2 grade de libertate si un prag de semnificatie alfa de 5% este de 5.99.
Valoarea calculata a trstului este mai mica decat valoarea teoretica, prin urmare nu exista suficienta evidenta statistica
pentru a se respinge ipoteza nula in favoarea celei alternative.
In concluzie, satisfactia muncii si sexul sunt independente.
Aplicatia 5.4
Presupunem ca doua monede sunt aruncate impreuna de 100 ori. Rezultatele sunt:
20 CC, 27 CP, 30 PC si 23 PP.
Testati pentru un nivel de semnificatie de 5% daca monedele sunt corecte.
Aplicatia 5.5
Durata de viata a unei componente electronice se considera a fi normal distribuita. Se observa 500 componente pentru
care distributia duratei de viata este prezentata in tabelul de mai jos.
Urmeaza aceste date distributia normala?
TABEL NR. 9 DISTRIBUTIA DURATEI DE VIATA A COMPONENTELOR
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
78 . 2
) (
2
2
calculat
ij
ij ij
e
e o
Aplicatia 5.6
Sase analisti bancari cu vasta experiena sunt rugati sa furnizeze previziuni asupra ratei medi ale inflatiei pe anul curent.
Valorile previzionate de experti au fost:: 4,60%; 3,50%; 5,0%; 4,80%; 4,00% si 4.50%.
tiind c rata inflatiei n anul anterior a fost de 4.21% mld. lei, sunt suficiente dovezi pentru a concluziona c media
previziunilor experilor este semnificativ mai mare dect rata infatiei corespunzatoare anului anterior (pentru = 0,05)?
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
CAPITOLUL 6 ANALIZA LEGATURII DINTRE VARIABILELE STATISTICE
Introducere
n foarte multe situaii, n analiza fenomenelor economico-sociale, dou sau mai multe variabile trebuie studiate
mpreun. De exemplu, vnzrile unei societi comerciale pot fi varia in functie de nivelul preturilor si/sau valoarea
cheltuielilor cu publicitatea; cererea pentru un grup de produse poate fi studiat n funcie de preurile de vnzare i/sau
veniturile cumprtorilor; produsul intern brut al unei tari este dependent de consumul final, investitiile brute si
exporturile etc.
Cunoaterea acestor fundamente ale analizei legturii ntre variabilele economice poate fi de un real folos n nelegerea
raporturilor de cauzalitate sau de interdependen ntre caracteristicile unui sistem micro- sau macroeconomic. O astfel
de analiz se ntreprinde fie pentru a explica o evoluie trecut sau o situaie prezent, fie pentru a proiecta modificarea
viitoare a parametrilor sistemului condus.
Analiza corelatiei si regresiei reprezinta instrumente statistice de investigare a legaturilor dintre doua sau mai multe
variabile, utilizate in a determina intensitatea si forma legaturii cauzale dintre variabile. Pentru a intelege aceste aspect,
analistul va urmari identificarea clara a variabilelor supuse analizei, obtinerea setului de date si dezvoltarea unui model
de regresie pentru a putea cuantifica efectele variabilelor cauzale, factoriale, asupra variabilei analizate, in conditiile
unui grad de incredere ales in rezultatele analizei.
Obiectivele capitolului
Capitolul isi propune sa furnizeze instrumentele prin care analistul poate intelege natura si intensitatea legaturii dintre
doua sau mai multe variabile statistice. Sunt prezentati cei mai utilizati indicatori de masurare a intensitatii legaturii
dintre variabile covarianta si coeficientul de corelatie liniara precum si metodologia de construire si aplicare a unui
model de regresie simpla si multipla, inclusiv folosind Microsoft Excel.
Cotinut
Termenul de regresie a aparut la finele secolului al XIX-lea, fiind propus de catre sir Francis Galton (1822 1911), care
a realizat mai multe studii privind asocierea dintre variabile, cel mai cunoscut fiind acela in care a analizat legatura
statistica dintre inaltimea parintilor si cea a copiilor. Contributii importante au mai avut K. Pearson (corelatia a trei
variabile) G.U. Yule (corelatia multipla), Spearman si Kendal (corelatia neparametrica) sau Mosteller si Tukey
(corelatia robusta).
Analiza interdependentelor dintre doua sau mai multe variabile socio-economice poate fi realizata utilizand mai multe
concepte:
Regresia - permite identificarea formei lagaturii dintre doua sau mai multe variabile, cu ajutorul unei functii de
regresie,
Corelatia permite masurarea intensitatii legaturii dintre variabilele analizate,
Covariatia masoara variatia simultana a doua variabile.
In cadrul analizei dependentei dintre variabile se utilizeaza urmatoarele notatii:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Variabila dependenta denumita si variabila rezultativa, este variabila analizata, notata cu Y
Variabila independenta denumita si variabila factoriala, explicativa, notata cu X.
Variabila aleatoare eroare denumita si variabila reziduala, sintetizeaza influenta tuturor factorilor nespecificati in
model, din diferite motive (factori ce nu pot fi depistai, sunt greu de cuantificat, sunt nesemnificativi etc.)., notate cu e.
Forma generic a funciei de regresie este:
i
Y
= f (X1, X2,...., Xk) + e [6.1]
Regresia unifactoriala liniara
Acest model de regresie consider c variabila dependent (Y) se modific liniar sub influena semnificativ a unei
singure variabile independente (X).
Modelul liniar :
Yi =o + 1*xi + i, i=1,n [6.2]
Componenta determinista
Componenta rezidual (eroarea aleatoare)
In practica economica, de cele mai multe ori datele sunt obtinute dintr-un esantion (n perechi de observatii) pe baza
carora se estimeaza parametrii ecuatiei de regresie liniar simpl, o i 1.
In contextual actual al modelarii din domeniul socio-economic, realizarea de modele matematice care sa masoare
dependenta dintre doua sau mai multe variabile se face in termeni probabilistici. Aceste modele sunt compuse atat dintr-
o component determinista cat si una aleatoare, ce urmareste sa masoare impactul variabilelor care sunt greu de
cuantificat cat si a factorilor accidentali, intamplatori.
Modelul de regresie liniara specifica la nivel de esantion se poate scrie:
yi = bo + b1 + ei [6.3]
unde:
bo + b1 sunt estimatorii parametrilor o si 1
ei este valoarea reziduala (pentru unitatea i) din esantion:
cu componenta predictibil:
termen liber bo - reprezint ordonata la origine i exprim valoarea lui y cnd x = 0 (punctul n care
linia intersecteaz axa Oy). Acest parametru nu are semnificaie economic.
panta dreptei de regresie b1 - poart denumirea de coeficient de regresie - arat cu cte uniti se
modific variabila rezultativ (Y) la modificarea cu o unitate a variabilei factoriale (X).
Semnul coeficientului de regresie arat direcia legturii dintre cele dou variabile cercetate. Astfel:
dac b1 > 0 legtura ntre variabile este direct;
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
i i
x b b y +
1 0
'
+
+
n
i
i i
n
i
i
n
i
i
n
i
i
n
i
i
y x x b x b
y x b nb
1 1
2
1
1
0
1 1
1 0
[6.4]
Prin rezolvarea sistemului de ecuaii se obin coeficientii
0
b si
1
b :
x b y b
x x n
y x x x y
b
x x n
y x y x n
b
i i
i i i i i
i i
i i i i
1 0
2 2
2
0
2 2
1
,
) (
) (
[6.5]
Observatie : Calcularea coeficientilor functiei de regresie se realizeaza, mult mai simplu, cu ajutorul soft-urilor
statistice. In Microsoft Excel, calculul coeficiemtilor de regresie poate fi realizat fie utilizand functii specifice, fie
utilizand reprezentarea grafica, fie utilizand componenta Data Analysis, din care se alege optiunea Regression.
Dup estimarea celor doi parametrii, se scrie funcia de regresie. Pe baza ei se determin fiecare valoare teoretic
(predicted value) prin nlocuirea in ecuaia de regresie a valorilor inregistrate in setul de date ale caracteristicii
factoriale.
Spre exemplu, un manager de companie doreste sa inteleaga natura relatiei dintre salariile angajatilor si experienta lor
profesionala in domeniul in care activeaza in cadrul companiei.
Un esantion aleator de 48 angajati a fost selectat printr-un sondaj statistic aleator, nerepetat si prezinta urmatoarele
valori ale celor doua variabile analizate salariul brut si experienta valori prezentate in TABELUL NR. 11
Este evidenta natura univoca a relatiei dintre cele doua variabile statistice, experienta (variabila independenta,
factoriala, ale carei valori se noteaza cu xi) fiind cea care are o influeta asupra salariului brut (variabila dependenta ale
carei valori se noteaza cu yi).
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
TABEL NR. 10 SALARIUL BRUT (RON) SI EXPERIENTA ANGAJATILOR DIN ESANTION
Nr crt
Salariul
brut lunar
(RON)
Experienta
(ani)
Nr crt
Salariul
brut lunar
(RON)
Experienta
(ani)
1 1942 3 25 1833 7
2 3190 10 26 2207 14
3 3163 7 27 2533 16
4 3205 17 28 2123 13
5 3036 11 29 2096 8
6 2942 12 30 2373 8
7 1464 5 31 2306 11
8 1464 6 32 2413 9
9 2587 10 33 2393 7
10 1439 4 34 2533 24
11 3190 13 35 2207 12
12 3511 8 36 2207 9
13 3378 20 37 2500 11
14 2942 10 38 2306 6
15 2693 16 39 1014 1
16 12152 27 40 6523 18
17 10479 20 41 3166 11
18 6376 10 42 3578 33
19 7414 21 43 3849 14
20 4955 30 44 7062 22
21 6303 25 45 3727 10
22 7953 15 46 3874 9
23 6376 13 47 4201 10
24 2207 5 48 4215 25
Primul pas in identificarea unei eventuale interdependente intre cele doua variabile este reprezentarea grafica prin
diagrama norului de puncte.
In Excel, pentru realizarea acestui tip de grafic, din meniul Insert, se alege din Charts, tipul de grafic potrivit evidentierii
interdependentei dintre 2 variabile si anume Scatter (Diagrama norului de puncte)
Observatie: Cand se selecteaza matricea de date statistice pentru intocmirea graficului de tip Scatter, este importanta
trecerea variabilelor in urmatoarea ordine: intai variabila independenta (X) si apoi variabila dependenta (Y).
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 34 CONSTRUIREA GRAFICULUI DE TIP NOR DE PUNCTE (SCATTER)
Se obtine urmatorul grafic :
FIG. NR. 35 INTERDEPENDENTA DINTRE SALARIUL BRUT SI EXPERIENTA
Pentru a insera dreapta de regresie, se face click drepta pe oricare din punctele graficului, obtinandu-se urmaoarea
fereastra de dialog :
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 36 SELECTAREA FUNCTIEI DE REGRESIE PRIN METODA GRAFICA
Se alege Add trendlime, si va aparea urmatoarea fereastra de dialog :
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 37 ALEGEREA TIPULUI FUNCTIEI DE REGRESIE
Alegerea tipului de functie/regresie se va face in functie de modul de dispunere a punctelor pe grafic. In exemplul
nostru, graficul a aratat o imprastiere destul de mare a punctelor, sau, cu alte cuvinte, lipsa unei corelatii foarte puternice
intre variabila dependenta si cea independenta.
Se va alege functia liniara, bifandu-se totodata si optiunile Display Equation on Chart si Display R-squared value on
chart pentru a obtine ecuatia de regresie si coeficientul de determinatie.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FIG. NR. 38 AFISAREA FUNCTIEI DE REGRESIE PE GRAFICUL NORULUI DE PUNCTE
Prin urmare, ecuatia de regresie se scrie :
[6.6]
Ordonata la origine nu are interpretare economica.
Coeficientul de regresie (panta dreptei) are valoarea 187.63. Valoarea pozitiva arata o legatura directa intre cele doua
variabile (altfel spus, in medie, o experienta mai mare conduce la un nivel al salariului brut mai mare). Valoarea de
187.63 poate fi interpretata astfel : pentru fiecare an suplimentar de experienta, nivelul salariului brut creste, in medie,
cu 187.63 lei.
O a doua modalitate de realizare a analizei regresiei cu ajutorul functiei Excel LINEST.
Sintaxa funciei este :
LINEST (known ys, known xs, const, stat) - pentru varianta n care nu precizm parametrii const i stat, rezultatul
consta in cei doi coeficienti ai dreptei de regresie.
parametrii de intrare, known ys, known xs, reprezint datele sub forma de vector corespunzand valorilor
cunoscute ale variabilei dependente si, respectiv, variabilei independente
parametrii de intrare, const i stat, sunt parametri de tip logic care permit specificarea unor particulariti n
model respectiv afiarea suplimentar a unor indicatori de regresie.
O a treia varianta, este accesarea unei componente Excel denumita Analysis ToolPak (Pachet de instrumente de
analiz) ; instrumentul de analiz utilizeaz macro-func iile statistice i afi eaz rezultatele ntr-una sau mai multe
matrice - rezultate.
Se acceseaza componenta Data Analysis, din cadrul careia se alege Regression.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
i i
x y + 63 . 187 1253
FIG. NR. 39 ALEGEREA OPTIUNII DE REGRESIE
Instrumentul de analiz Regresie execut analiza de regresie liniar prin utilizarea metodei ptratelor mici pentru a
gsi o linie care corespunde unui set de observa ii. Ave i posibilitatea analizrii modului n care o singur variabil
dependent este afectat de valorile uneia sau a mai multor variabile independente.
Instrumentul Regresie utilizeaz func ia LINEST a foii de lucru.
FIG. NR. 40 FEREASTRA DE DIALOG A O[IUNII REGRESSION
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
TABEL NR. 11 OUTPUT-UL OPTIUNII DATA ANALYSIS/REGRESSION
SUMMARY
OUTPUT
Regression Statistics
Multiple R 0.584
R Square 0.342
Adjusted R
Square 0.327
Standard Error 1903.75
Observations 48
ANOVA
df SS MS F Significance F
Regression 1 86461097 86461097 23.86 0.000
Residual 46 166716225 3624266
Total 47 253177322
Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95%
Intercept 1252.98 571.41 2.19 0.033 102.80 2403.17
Experienta (ani) 187.63 38.42 4.88 0.000 110.30 264.96
n Excel, prognoza poate fi fcut fie cu funcia FORECAST, fie cu funcia TREND, cea de-a doua avnd avantajul c
poate obine previziunea pe mai multe valori ale lui X, n acelai timp.
Sintaxele funciilor sunt :
FORECAST(x; known ys, known xs), valoarea lui y corespunztoare lui
0
x x , dintr-o regresie liniar (valoarea
previzionat pe baza unui model liniar).
o parametrii de intrare, known ys, known xs, reprezint doi vectori de aceeai dimensiune, care conin
valorile celor dou variabile, pe baza crora fundamentm modelul de regresie;
o parametrul de intrare, x, reprezint o nou valoare a variabilei X, valoare pentru care dorim s previzionm
valoarea lui Y corespunztoare.
TREND (known ys, known xs, new x, const), adic un vector format cu valorile previzionate ale lui y din regresia
liniar, corespunzatoare valorilor new x; vectorul este de aceeai dimensiune cu new x.
o parametrii de intrare, known ys, known xs, reprezint doi vectori de aceeai dimensiune, care conin
valorile celor dou variabile, pe baza crora fundamentm modelul de regresie;
o parametrul de intrare new x, este un vector care conine noile valori ale lui X, valori pentru care dorim s
facem previziunea;
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
o parametrul de intrare, const are aceeai semnificaie ca i n LINEST, prin urmare, pentru simplificare, vom
omite precizarea acestuia n fereastra de dialog a funciei.
Observaie: Dac lucrm cu modele de timp, deci cu variabilele Z i t, atunci, n funciile LINEST, FORECAST i
TREND, vom avea Z i t, n loc de X i Y.
Pentru valorile variabilei t, fie vom preciza valorile convenionale 1,2,3,, fie vom omite precizarea lor. Se va proceda
asemntor i pentru noile valori pentru care dorim prognoza. Spre exemplu, dac valorile vechi pentru t, au fost, 1, 2,
3, 4, 5, putem previziona valoarea lui Z, corespunztoare lui 6 t , etc.
Validarea calitatii functiei de regresie
Calitatea funciei de regresie alese se poate aprecia prin analizarea domeniului de dispersie constituit de mulimea
patratelor diferenelor dintre valorile observate si cele teoretice.
Cei mai utilizatii indicatori sunt:
Eroarea standard a estimatiei (standard error of the mean)- abaterea medie patratic a erorilor n esantion se poate
calcula dupa formua:
[6.7]
unde: k reprezint numrul variabilelor independente considerate, iar (n-k-1) reprezint numrul gradelor de libertate.
Coeficientul de determinaie arat proporia n care variabila independent (X) explic variaia caracteristicii
dependente (Y), fiind o alt modalitate de apreciere calitativ a funciei de regresie:
100
) (
) (
1
2
2
1
1
]
1
y y
y y
D
i
i i
. [6.8]
De aceast dat, cu ct valoarea acestui indicator este mai mare (mai apropiat de 100%), cu att funcia este o mai bun
reprezentarea a legturii dintre cele dou variabile.
Validarea modelului de regresie se realizeaz pentru a verifica din punct de vedere statistic, n ce msur valorile
teoretice reconstituie valorile empirice. Aceast validare se realizeaz aplicnd testul Fisher-Snedecor (testul F).
Valoarea testului se calculeaz pe baza relaiei:
k n
Y y
k
y Y
F
i i
x i x
calc
2 2
) (
:
1
) (
[6.9]
unde: k = numrul parametrilor modelului;
n = numrul de perechi de valori
Valoarea calculat a testului se compar cu valoarea teoretic, care se obine din tabele statistice -
k n , k ,
F
1
,
pentru un prag de semnificaie i k-1, n-k grade de libertate.
Condiia necesar pentru validarea modelului de regresie este ca:
k n k calc
F F
>
, 1 ,
.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
2
) (
1
2
n
y y
s
n
i
e
Analiza corelatiei
Corelatia masoara intensitatea legturii dintre variabile. Spre deosebire de regresie, ns, metoda corelaiei nu ia n
considerare relaia cauzal ntre variabilele X i Y, ci analizeaz simetric legtura ntre cele dou variabile, corelaia
ntre X i Y fiind egal cu cea ntre Y i X.
Corelaia poate fi pozitiv sau negativ, funcie de natura legturii dintre cele dou variabile (legtur direct sau
invers).
Exista mai multi indicatori de masurare a corelatiti dintre variabile, dintre care cei mai cunoscuti sunt covrianta si
coeficientul de corelatie liniara Pearson.
Covariana surprinde existena i direcia legturii dintre variabil depemdent i cea variabil independent; se
determin ca o medie aritmetic simpl a produselor perechilor de abateri ale valorilor individuale ale celor dou
caracteristici analizate de la mediile lor:
n
) (y ) (x
Y) Cov(X,
1 i
i i
n
y x
[6.10]
unde n este numrul de perechi de date nregistrate.
Semnul covarianei arat direcia legturii dintre variabile: covariana pozitiv denot o legtur direct iar cea negativ
o legtur invers.
Covariana nu are un interval fix de variaie. Limita sa inferioar este zero (situaie ce arat lipsa legturii dintre X i
Y), iar limita superioar de variaiei, dat de de produsul abaterilor standard ale celor dou variabile analizate ( y x
),
apare n cazul unei legturi deterministe, ceea ce face dificil interpretarea direct a rezultatului.
Coeficientul de corelaie liniar (coeficientul Pearson), ca expresie a direciei i intensitii legturii dintre dou
variabile, se calculeaz ca raport ntre covarian i produsul abaterilor standard ale variabilelor analizate:
y x
n
y x
y x
Y X Cov
r
n
) (y ) (x
) , (
1 i
i i
[6.11]
n practic, este utilizat o alt formul, echivalent, a coeficientului de corelaie liniar:
[ ] [ ]
2 2 2 2
) ( ) (
i i i i
i i i i
y y n x x n
y x y x n
r
[6.12]
Cnd r este pozitiv relaia ntre variabilele X i Y este directa adic o cretere a lui X determin n general o cretere a
lui X.
Cnd r este negativ relaia ntre cele dou variabile este invers proportionala adic o cretere a lui X are n general ca i
consecin o diminuare a lui Y.
Colton (1974) sugereaz urmtoarele reguli empirice privind interpretarea coeficientului de corelaie:
valoare a coeficientului de corelatie liniara cuprisa in intervalul (-0,25 la 0,25) reprezinta o
corelaie practic inexistenta
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
O valoare a coeficientului de corelatie liniara cuprisa in intervalul 0,25 - 0,50 reprezinta o
corelaie slaba
O valoare a coeficientului de corelatie liniara cuprisa in intervalul 0,50 - 0,75 corespunde unei
legaturi de intensitate medie intre cele doua variabile analizate
O valoare a coeficientului de corelatie liniara peste 0,75 corespunde unei legaturi de intensitate
medie intre cele doua variabile analizate
O valoare a coeficientului de corelatie liniara cuprisa in intervalul 0,50 - 0,75 corespunde unei
corelatii intense
Valoarea (teoretica) de 1 reprezinta corelatia perfecta (pozitiva sau negativa)
Regresia liniara multipla
Coeficientii de regresie arat cu cte unitati se modific variabila dependent la modificarea cu o unitate a variabilei
independent, n condiiile n care celelalte variabile independente rmn constante.
Observatie In situatia in care variabilele (atat cea dependent cat si cele independente) sunt exprimate sub forma de
logaritmi naturali, atunci coeficienii de regresie ai variabilelor independente pot fi interpretai ca elasticiti. (prin
urmare vor arata modificarea procentuala a variabilei dependent la modificarea cu 1 procent a variabilei independente).
Pentru ca inferena bazat pe rezultatele regresiei liniare multiple s fie valid, este necesara indeplinireaa urmatoarelor
conditii:.
1. Legtura dintre variabila dependent i variabilele independente este liniar.
2. Variabilele independente sunt aleatoare. De asemenea ntre variabileleindependente incluse ntr-o regresie nu exist
nici o relaie liniar. Dac variabilele independente sunt corelate atunci exist multicoliniaritate.
3. Termenul eroare aleatoare are o distributie normala, de medie zero si dispersie constanta. In cazul in care dispersia
termenului de eroare este variabil, erorile se numesc heteroskedastice, i trebuie utilizate metode diferite de estimare a
regresiei.
4. Nu exista corelatie a termenilor eroare aleatoare.
Sinteza
In procesul de management curent al afacerilor, este foarte importanta intelegerea si cuatificarea interdependentelor
dintre o variabila dependenta (variabila a carei modificare dorim sa o analizam) si una sau mai multe variabile
dependente (variabile factoriale sau cauzale, care determina modificarea nivelurilor varibilei dependente).
Cele doua metode de analiza a interdependentelor dintre variabile sunt regresia si corelatia. In timp ce metoda regresiei
urmareste sa stabileasca forma legaturii, urmand a folosi ecuatia de regresie pentru realizarea de predictii. metoda
corelatiei urmareste cuantificarea intensitatii legaturii dintre variabile, pe baza covariantei si/sau coeficientului de
corelatie.
Microsoft Excel prezinta mai multe functii utilizate in analiza regresiei, fie ea liniara sau neliniara, simpla sau multipla.
Astfel, in analiza regresiei liniare se pot utiliza functiile LINEST, TREND, FORECAST, SLOPE sau STEYX, in
analiza regresiei exponentiale se pot utiliza functiile LOGEST si GROWTH. Argumetele acestor functii constau in
seturile de date corespunzatoare pe de o parte, variabilei dependente (sau rezultative) iar pe de alta parte variabilei (sau
variabilelor in cazul regresiei multiple) independente (sau explicative)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
O varianta mai des utilizata este cea in care determinarea ecuatiei de regresie (insotita de valoarea coeficientului de
determinatie) se realizeaza utilizand functia Add trendline in graficul de tip nor de puncte (scatter diagram).
Exercitii si aplicatii
Aplicatia 6.1.
Sa se analizeze interdependenta dntre exporurile si importurile tarilor din Uniunea Europeana in anul 2008.
Solutie
Exportul reprezinta o cheltuiala pe care strainatatea o face pentru achizitionarea de bunuri produse de economia
nationala .
De asemenea este o operatiune comerciala de vanzare a unor bunuri materiale si/sau servicii catre persoane fizice sau
juridice dintr-o alta tara in schimbul unei sume dintr-o valuta convenita. Cuprinde exportul de marfuri (bunuri
corporale, stabile) si exportul invizibil (de servicii). Exportul poate fi si de capital, reprezentand investitii directe si
plasarea de titluri de valoare in alte tari.
Importul reprezinta o operatiune comerciala de cumparare din strainatate a unor bunuri materiale si/sau servicii contra
unei cantitati de moneda convenita, implicand trecerea de catre acestea a frontierei vamale a importatorului. Importul
poate fi: - direct sau indirect; - de bunuri materiale si/sau de servicii; - propriu-zis sau de completare; - temporar sau
eprmanent; - cu plata imediata sau cu plata amanata, etc.
Intre cele doua variabile este o legatura directa si anume prin suma atrasa de catre economia nationala din exporturi,
tara de referinta isi asigura nivelul de importuri necesar.
Sursa datelor o reprezinta Eurostat si anume Europe in figures , 2010 prezent pe site-ul ec.europa.eu/eurostat.
Variabilele alese sunt exprimate In miliarde Euro si reflecta valorile exporturilor si importurilor Inregistrate statele
membre ale Uniunii europene In anul 2008.
Se identifica cele doua variabile:
xi variabila factoriala = exporturile (In 1000 milioane EUR) din statele membre UE 2008
yi - variabila dependenta = importurile (In 1000 milioane EUR) din statele membre UE 2008
TABEL NR. 12 EXPORTURILE SI IMPORTURILE CELOR 27 TARI ALE UE (MILIARDE EURO)
Nr crt. Tara Exporturi (xi) Importuri (yi )
1. Belgia 323.3 319.2
2. Bulgaria 15.3 25.3
3. Republica Ceha 99.4 96.2
4. Danemarca 79.5 75.6
5. Germania 993.9 818.5
6. Estonia 8.4 10.9
7. Irlanda 84.5 56.4
8. Grecia 17.2 52.9
9. Spania 182.4 272.9
10. Franta 411.7 479.7
11. Italia 365.8 377.3
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Nr crt. Tara Exporturi (xi) Importuri (yi )
12. Cipru 1.1 7.2
13. Letonia 6.9 10.9
14. Lituania 16.1 21.0
15. Luxemburg 17.3 21.5
16. Ungaria 73.2 73.4
17. Malta 1.9 3.1
18. Olanda 430.4 389.8
19. Austria 123.0 124.7
20. Polonia 114.3 138.9
21. Portugalia 38.0 61.2
22. Romania 33.6 56.2
23. Slovenia 23.2 25.1
24. Slovacia 48.2 49.8
25. Finlanda 65.5 61.7
26. Suedia 124.6 113.5
27. Marea Britanie 311.7 429.7
Sursa : Eurostat (tet00002)
Definirea modelului de regresie simpla liniara
Urmatorul pas consta in constructia diagramei norului de puncte care poate indica forma si directia legaturii dintre cele
doua variabile.
Din grafic se poate observa ca distributia celor doua variabile poate fi aproximata cu o dreapta, deci modelul
econometric care descrie legatura dintre cele doua variabile este un model liniar.
Intre exportul si importul unei tari exista o legatura directa, de obicei de forma liniara. Incasarile din export determina
nivelul importurilor, iar nevoia de a completa oferta interna cu marfuri din import determina fiecare tara sa stabileasca
masuri de politica comerciala de promovare a exporturilor. Prin urmare, intre export si import exista o interdependenta.
Estimarea parametrilor modelului si interpretarea acestora
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Pentru analizarea legaturii dintre cele doua variabile, consideram exportul variabila independenta, iar importul variabila
dependenta.
Metoda regresiei liniare presupune analiza modului in care variabila dependenta Y evolueaza in raport cu modificarea
variabilei independente X.
Pentru a estima parametri functiei de regresie liniara Yi = a + b Xi + i unde:
Yi = variabila dependenta (raspuns)
Xi = variabila independenta (explicativa)
i = variabila de perturbatie
a = termenul constant (intercept)
b = panta de regresie
Vom continua prin minimizarea erorilor observate pornind de la ecuatia de baza: ei = yi - a - bxi .Astfel, vom urmari :
Se scrie sistemul de ecuatii normale:
Rezolvarea sistemului de ecuatii normale (ale carei etape intermediare sunt prezentate in urmatoru tabel) va furniza
valorile celor doi coeficienti ai dreptei de :
Coeficientul de regresie sau panta dreptei (b)
Ordonata la origine (a)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
i
i i
i
i
bx a y e
2 2
) ( min min
'
+
+
i
i
i
i
i
i i
i
i
i
i
x b x a y x
x b na y
2
'
,
_
,
_
,
_
2
2
2
1 1
2
1 1 1
2
1
x n x
y x n y x
b
x b y
x x n
y x x x y
a
i
i
i
i i
n
i
i
n
i
i
n
i
i i
n
i
i
n
i
i
n
i
i
TABEL NR. 13 CALCULUL VALORILOR INTERMEDIARE PENTRU
SISTEMUL DE ECUATII (MILIARDE EURO)
Nr crt. Tara Exporturi
(xi)
Importuri
(yi )
xi
2
xiyi yi
2
1 Belgia 323.3 319.2 104523 103197 101889
2 Bulgaria 15.3 25.3 234 387 640
3 Republica Ceha 99.4 96.2 9880 9562 9254
4 Danemarca 79.5 75.6 6320 6010 5715
5 Germania 993.9 818.5 987837 813507 669942
6 Estonia 8.4 10.9 71 92 119
7 Irlanda 84.5 56.4 7140 4766 3181
8 Grecia 17.2 52.9 296 910 2798
9 Spania 182.4 272.9 33270 49777 74474
10 Franta 411.7 479.7 169497 197492 230112
11 Italia 365.8 377.3 133810 138016 142355
12 Cipru 1.1 7.2 1 8 52
13 Letonia 6.9 10.9 48 75 119
14 Lituania 16.1 21 259 338 441
15 Luxemburg 17.3 21.5 299 372 462
16 Ungaria 73.2 73.4 5358 5373 5388
17 Malta 1.9 3.1 4 6 10
18 Olanda 430.4 389.8 185244 167770 151944
19 Austria 123 124.7 15129 15338 15550
20 Polonia 114.3 138.9 13064 15876 19293
21 Portugalia 38 61.2 1444 2326 3745
22 Romania 33.6 56.2 1129 1888 3158
23 Slovenia 23.2 25.1 538 582 630
24 Slovacia 48.2 49.8 2323 2400 2480
25 Finlanda 65.5 61.7 4290 4041 3807
26 Suedia 124.6 113.5 15525 14142 12882
27 Marea Britanie 311.7 429.7 97157 133937 184642
Total 4010.4 4172.6 1794691 1688191 1645084
Pe baza datelor din tabel sistemul de ecuatii devine:
'
+
+
b a
b a
1794691 4 , 4010 1688191
4 , 4010 27 6 . 4172
'
+
b a
b a
5 , 447 9 . 420
5 . 148 5 . 154
'
891 , 0
18 , 22
b
a
Rezolvarea acestui sistem conduce la obtinerea urmatoarelor rezultate: a = 22,18 si b = 0,891
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Prin urmare, dreapta care aproximeaza cel mai bine norul de puncte ce exprima relatia dintre exporturile si importurile
statelor membre UE in anul de referinta 2008 este : y = 22.18 + 0.891x
Analizand rezultatele, b = 0,891 se constata ca, intre export si import exista o relatie directa deoarece parametrul este
mai mare decat 0. De asemenea, panta dreptei de regresie este pozitiva, deci exista o legatura directa Intre nivelul
exporturilor si cel al importurilor. In plus, daca nivelul exporturilor creste cu 1 unitate se poate aprecia ca valoarea
exporturilor va creste cu cu 0.891 unitati.
Testarea semnifica iei corela iei si a parametrilor modelului de regresie
TABEL NR. 14 CALCULUL VALORILOR INTERMEDIARE PENTRU DETERMINAREA
COVARIANTEI (MILIARDE EURO)
Nr crt.
1 174.8 164.7 28776.9 30543.4 27112.7
2 -133.2 -129.2 17219.2 17751.1 16703.2
3 -49.1 -58.3 2866.5 2414.1 3403.6
4 -69.0 -78.9 5449.5 4765.6 6231.6
5 845.4 664.0 561289.0 714644.8 440841.9
6 -140.1 -143.6 20128.9 19637.4 20632.7
7 -64.0 -98.1 6284.3 4100.3 9631.6
8 -131.3 -101.6 13348.8 17248.4 10330.8
9 33.9 118.4 4008.4 1147.0 14008.9
10 263.2 325.2 85571.1 69256.7 105728.5
11 217.3 222.8 48398.2 47204.8 49621.7
12 -147.4 -147.3 21722.9 21736.6 21709.3
13 -141.6 -143.6 20344.3 20060.0 20632.7
14 -132.4 -133.5 17685.2 17538.6 17833.1
15 -131.2 -133.0 17459.4 17222.2 17699.8
16 -75.3 -81.1 6112.6 5675.1 6583.8
17 -146.6 -151.4 22206.3 21501.3 22934.3
18 281.9 235.3 66311.7 79448.8 55346.9
19 -25.5 -29.8 761.9 652.0 890.5
20 -34.2 -15.6 535.4 1171.9 244.6
21 -110.5 -93.3 10317.3 12217.6 8712.5
22 -114.9 -98.3 11302.6 13209.7 9670.9
23 -125.3 -129.4 16223.2 15708.4 16754.9
24 -100.3 -104.7 10509.0 10066.8 10970.6
25 -83.0 -92.8 7708.9 6894.5 8619.4
26 -23.9 -41.0 982.2 572.8 1684.3
27 163.2 275.2 44896.8 26623.4 75712.6
TOTAL 0 0 1068420.7 1199013.2 1000247.6
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
( ) x x
i
( ) ( ) y y x x
i i
( )
2
x x
i
( )
2
y y
i
( ) y y
i
Unde
x
=
n
x
n
i
i
1
=
27
4 , 4010
= 148,5
y
=
n
y
n
i
i
1
=
27
4172.6
= 154,5
Covarianta:
( ) ( )
n
y y x x
i i
xy
cov
27
1068420.7
1 . 39571
Coeficientul de corelatie r:
( ) ( )
( ) ( )
1
]
1
1
]
1
n
i
i
n
i
i
n
i
i i
y x
y y x x
y y x x
s s
y x
r
1
2
1
2
1
) , ( cov
=
( ) ( )
1199013.2 1000247.6
39571.1
0.98
r > 0 ceea ce ne arata ca intre nivelul exporturilor si cel al importurilor exista o legatura directa si foarte puternica.
Testarea semnifica iei corela iei
1. Formularea ipotezelor:
H0: = 0
H1: 0
2. Alegem un prag de semnificatie de 95% (= 0.05)
3. Deoarece numarul observatiilor este mai mic de 30 vom alege Testul Student (t) cu n-2 grade de libertate.
Unde coeficientul de corelatie poate fi calculat prin urmatoarea metoda:
( ) ( )
( ) ( )
1
]
1
1
]
1
n
i
i
n
i
i
n
i
i i
y x
y y x x
y y x x
s s
y x
r
1
2
1
2
1
) , ( cov
=
( ) ( )
1199013.2 1000247.6
39571.1
0.98
Iar covarianta este :
( ) ( )
n
y y x x
i i
xy
cov
27
1068420.7
1 . 39571
4.
38 , 2
25 ; 025 , 0 2 ; 2 /
t t t
n tab
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
2
1
2
r
n
r t
calc
62 . 24
0396 . 0
25
98 . 0
calc
t
5.
6. Construirea graficului pentru reprezentarea zonelor critice:
7. Concluzii : Avand in vedere ca
calc
t >
tab
t pentru un prag de semnificatie = 0.05 vom respinge ipoteza nula
si vom accepta ipoteza alternativa, deci modelul este valid.
Pe baza functiei de regresie se determina fiecare valoare teoretica (
i
x
Y
), prin inlocuirea succesiva a argumentului din
ecuatia de regresie:
i x
bx a Y
i
+
cu valorile (xi) ale caracteristicii factoriale.
Dupa aflarea valorilor teoretice, se trece la verificarea corectitudinii estimarii parametrilor ecuatiei de regresie, utilizand
una din urmatoarele relatii:
i i
y Y sau 0 ) (
i i
Y y
TABEL NR. 15 CALCULUL VALORILOR TEORETICE ALE IMPORTURILOR PE BAZA FUNCTIEI
DE REGRESIE (MILIARDE EURO)
Nr crt. Tara Exporturi (xi) Importuri (yi ) Valori
teoretice
Y
Erorile/
Reduals
yi-Y
(yi-Y)
2
=
2
1 Belgia 323.3 319.2 310.3 8.9 79.6
2 Bulgaria 15.3 25.3 35.8 -10.5 110.6
3 Republica Ceha 99.4 96.2 110.8 -14.6 212.0
4 Danemarca 79.5 75.6 93.0 -17.4 303.7
5 Germania 993.9 818.5 907.8 -89.3 7983.3
6 Estonia 8.4 10.9 29.7 -18.8 352.3
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Nr crt. Tara Exporturi (xi) Importuri (yi ) Valori
teoretice
Y
Erorile/
Reduals
yi-Y
(yi-Y)
2
=
2
7 Irlanda 84.5 56.4 97.5 -41.1 1687.8
8 Grecia 17.2 52.9 37.5 15.4 236.8
9 Spania 182.4 272.9 184.7 88.2 7775.4
10 Franta 411.7 479.7 389.1 90.6 8217.3
11 Italia 365.8 377.3 348.1 29.2 849.8
12 Cipru 1.1 7.2 23.2 -16.0 254.9
13 Letonia 6.9 10.9 28.3 -17.4 303.9
14 Lituania 16.1 21 36.5 -15.5 241.2
15 Luxemburg 17.3 21.5 37.6 -16.1 259.2
16 Ungaria 73.2 73.4 87.4 -14.0 196.4
17 Malta 1.9 3.1 23.9 -20.8 431.7
18 Olanda 430.4 389.8 405.7 -15.9 253.3
19 Austria 123 124.7 131.8 -7.1 50.3
20 Polonia 114.3 138.9 124.0 14.9 220.9
21 Portugalia 38 61.2 56.0 5.2 26.6
22 Romania 33.6 56.2 52.1 4.1 16.6
23 Slovenia 23.2 25.1 42.9 -17.8 315.4
24 Slovacia 48.2 49.8 65.1 -15.3 235.2
25 Finlanda 65.5 61.7 80.6 -18.9 355.4
26 Suedia 124.6 113.5 133.2 -19.7 388.7
27 Marea Britanie 311.7 429.7 299.9 129.8 16837.4
TOTAL 4010.4 4172.6 4172.7 0 48195.7
Calitatea functiei de regresie:
SEM - eroarea standard a estimatiei
Rezultatul ne arata ca in anul de referinta 2008, intre valorile reale si cele estimate pe baza functiei liniare de regresie
exista o diferenta medie de 43.91 (EUR 1 000 milioane).
Testarea coeficientilor de regresie:
Testarea semnificaiei parametrului a:
1. Stabilirea ipotezelor :
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
2
) (
1
2
n
Y y
s
n
i
e
25
7 . 48195
91 . 43
ipoteza nula: H0: a = 0
ipoteza alternativa: H1: a 0
2. Deoarece numarul de observari este n= 27 vom alege prin urmare testul Student (t) cu n-2 grade de libertate (in
cazul nostru 25 d.f)
3.
Unde Sa este eroarea standard a parametrului a:
( )
( )
1
1
]
1
2
2
1
x x
x
n
S S
i
e a
34 . 10
1199013.2
5 . 148
25
1
91 , 43
2
,
_
+
a
calc
S
a
t
15 , 2
34 . 10
19 . 22
38 , 2
25 ; 025 , 0 2 ; 2 /
t t t
n tab
Construirea graficului pentru reprezentarea zonelor critice:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
a a
calc
s
a
s
a
t
0
Avand in vedere ca
calc
t <
tab
t pentru un prag de semnificatie = 0.05 vom respinge ipoteza alternativa, deci
acceptam ipoteza nula. Vom concluziona ca este foarte probabil ca estimatorul a sa provina dintr-o populaie cu = 0.
Intervalul de incredere pentru parametrul este:
a n a n
s t a s t a +
2 ; 2 / 2 ; 2 /
+ 34 . 10 38 . 2 18 . 22 34 . 10 38 . 2 18 . 22 48 . 43 89 . 0
Testarea semnificaiei parametrului b:
1. Stabilirea ipotezelor :
ipoteza nul: H0: b= 0
ipoteza alternativ: H1: b 0
2. Deoarece numarul de observari este n= 27 vom alege prin urmare testul Student (t) cu n-2 grade de libertate (in
cazul nostru 25 d.f)
3.
Unde Sb este eroarea standard a parametrului b:
( )
04 , 0
1199013.2
1
91 . 43
1
2
,
_
x x
S S
i
e b
b
calc
S
b
t
22 , 22
04 . 0
89 . 0
38 , 2
25 ; 025 , 0 2 ; 2 /
t t t
n tab
4. Construirea graficului pentru reprezentarea zonelor critice:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
b b
calc
s
b
s
b
t
0
5. Avand in vedere ca
calc
t >
tab
t pentru un prag de semnificatie = 0.05 vom respinge ipoteza nula si vom
accepta ipoteza alternativa, vom concluziona c este foarte improbabil ca estimatorul b s provin dintr-o
populaie cu = 0.
Intervalul de incredere pentru parametrul este:
97 . 0 81 . 0
Rezultatele obtinute corespund celor calculate in Output-ul de regresie:
TABEL NR. 16 COEFICIENTII DREPTEI DE REGRESE LINIARA CONFORM OUTPUT-
ULUI EXCEL
Coefficients
Standard
Error
t
Stat
P-
value
Lower
95%
Upper
95%
Lower
95.0%
Upper
95.0%
Intercept 22.19 10.34 2.15 0.042 0.89 43.48 0.89 43.48
Exporturi
(xi) 0.89 0.04
22.2
2 0.000 0.81 0.97 0.81 0.97
Aplicarea analizei de tip ANOVA si interpretarea rezultatelor
TABEL NR. 17 INDICATORII DE REGRESE LINIARA SI CORELATIE CONFORM
OUTPUT-ULUI EXCEL
Regression Statistics
Multiple R 0.98
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
b n b n
s t b s t b +
2 , 2 ,
R Square 0.95
Adjusted R Square 0.95
Standard Error 43.91
Observations 27
Exporturile explica 95% din variatia nivelului importurilor, prin modelul liniar, ce denota o legatura foarte puternica
intre cele doua variabile . Astfel proportia variatiei explicata prin model fiind semnificativa, putem aprecia ca modelul
este valid.
De asemenea Multiple R coeficientul de corelatie - care ia valori intre -1 si 1, observam ca in cazult acesta atinge
valoarea de 0.98 ceea ce ne arata ca intre nivelul exporturilor si cel al importurilor exista o legatura directa si foarte
puternica.
Eroarea standard ne arata ca In anul de referinta 2008, Intre valorile reale si cele estimate pe baza functiei liniare de
regresie exista o diferenta medie de 43.91 (miliarde Euro).
TABEL NR. 18 TABELUL ANOVA CONFORM OUTPUT-ULUI EXCEL
ANOVA
df SS MS F Significance F
Regression 1 952051.9 952051.9 493.8 5.557E-18
Residual 25 48195.7 1927.8
Total 26 1000247.6
Acest tabel se refera la descompunerea variantei totale (SST) a variabilei dependente n doua componente: varianata
explicata prin regresie (SSR) si varianta neexplicata (SSU) sau varianta reziduala.
Aici identificam i gradele de libertate asociate descompunerii, mai precis, dac avem k regresori in model si n
observatii, avem egalitatea ) 1 ( 1 + k n k n .
Valorile din aceste celulele F i Significance F ne dau elemente importante ce stau la baza validarii modelului de
regresie (n totalitatea sa). Ele ne furnizeaza informaii privind valoarea calculata a statisticii test F si erorii pe care
putem s-o facem cnd respingem modelului de regresie ca fiind neadecvat.
Deoarece F= 493.8, iar Significance F (pragul de semnificatie) este 5.557E-18 (valoare mai mica de 0,05), atunci
modelul de regresie construit este valid si poate fi utilizat pentru analiza dependentei dintre cele doua variabile.
TABEL NR. 19 COEFICIENTII DREPTEI DE REGRESE LINIARA CONFORM OUTPUT-
ULUI EXCEL
Coefficien
ts
Standard
Error
t
Stat
P-
value
Lower
95%
Upper
95%
Lower
95.0%
Upper
95.0%
Intercept 22.19 10.34 2.15 0.042 0.89 43.48 0.89 43.48
Exporturi
(xi) 0.89 0.04
22.2
2 0.000 0.81 0.97 0.81 0.97
Acest tabel ne ofera informatii despre valorile estimate ale coeficientilor modelului de regresie in coloana Coefficients,
erorile standard ale coeficientilor n coloana Standard Error, elemente pentru aplicarea testului de semnificatie t-
Student pentru fiecare coeficient (coloanele t Stat i P-value.).
Intercept este parametrul a cu valoarea 22.19. Acesta este punctul in care variabila explicativa este 0.
Adica nivelul importurilor daca valoarea exporturilor este 0 va fi 22.19 (1000 mil Eur) .
Deoarece pragul de semnificatie P-value este 0.042 < 0,05 inseamna ca acest coeficient este semnificativ.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Limita inferioara si superioara a intervalului de incredere pentru acest parametru este (0.89 43.48).
Coeficientul b este 0.89, ceea ce insemna ca la cresterea exporturilor cu o unitate (1000 mil EUR), nivelul
importurilor va creste cu 0.89 (100 mil EUR) .
Deoarece pragul de semnificatie P-value este 0.00 < 0,05 inseamna ca acest coeficient este semnificativ.
Intervalul de incredere pentru acest parametru este 081 0.97, mult mai restrans decat intervalul de incredere al
parametrului
.
Testarea ipotezelor clasice asupra modelului de regresie
Ipoteze statistice clasice asupra modelului de regresie simpla
1. Forma functional: yi = + xi + i, i=1,n
2. Normalitatea erorilor: i N(0, )
3. Media zero a erorilor: (i)=0 i
4. Homoscedasticitatea:
2
(i)= constant i
5. Non autocorelarea erorilor: Cov(i,j)=0 i j
6. Necorelarea ntre regresor i erori: Cov(xi,j)=0 i i j
Testarea liniarit ii modelului propus:
Coeficientul de corelatie r ne arata cat de puternica este legatura intre cele doua variabile. Acesta ia valori intre 0 si 1,
iar cu cat r tinde spre valoarea 1 legatura este mai puternica.
1. Formularea ipotezelor:
H0: = 0 (nu exista legatura liniara)
H1: 0
2. Alegem un prag de semnificatie de 95% (= 0.05)
3. Deoarece numarul observatiilor este mai mic de 30 vom alege Testul Student (t) cu n-2 grade de libertate.
4.
Unde coeficientul de corelatie poate fi calculat prin urmatoarea metoda:
( ) ( )
( ) ( )
1
]
1
1
]
1
n
i
i
n
i
i
n
i
i i
y x
y y x x
y y x x
s s
y x
r
1
2
1
2
1
) , ( cov
=
( ) ( )
1199013.2 1000247.6
39571.1
0.98
unde covarianta este :
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
2
1
2
r
n
r t
calc
( ) ( )
n
y y x x
i i
xy
cov
27
1068420.7
1 . 39571
5.
38 , 2
25 ; 025 , 0 2 ; 2 /
t t t
n tab
6. Construirea graficului pentru reprezentarea zonelor critice:
7. Avand in vedere ca
calc
t >
tab
t pentru un prag de semnificatie = 0.05 vom respinge ipoteza nula si vom
accepta ipoteza alternativa, deci modelul este valid.
Testarea normalit ii erorilor
Corelograma pentru valorile variabilei independente (pe axa Ox) i valorile erorilor (pe axa Oy):
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
62 . 24
0396 . 0
25
98 . 0
calc
t
Aceasta corelograma execuata in Excel ne arata o concentrare a erorilor la intersectia axei OX cu OY si o usoara
dispersie a lor de alungul graficului. In prima faza am selectat un trend liniar ( dreapta rosie) si se pot observa cateva
abateri.
Corelograma pentru valorile variabilei independente (pe axa Ox) i valorile erorilor (pe axa Oy):
In a doua faza am selectat un trend polinomial si se poate observa ca acesta reprezinta mai bine dispersia erorilor,
abaterile acestora fiind mai mici decat in cazul unui trend liniar.
Putem afirma ca functia polinomiala reprezinta mai bine dispersia erorilor pe grafic, abaterile de la aceasta find aproape
minime. De asemenea R
2
(coeficientul de determinatie) in cel de-al doilea caz este mai mare decat in primul ceea ce
demonstreaza afirmatiile de mai sus.
Testarea ipotezei de homoscedasticitate
O ipoteza de baza a modelului de regresie este ca dispersia erorilor este constanta. Daca aceasta ipoteza nu se verifica
atunci putem afirma ca suntem in cazul de heteroscedasticitate. Astfel coeficientii obtinuti sunt afectati de eroare
rezultand intervale de incredere incorecte.
Etapele tastarii:
1. Se ordoneaza seria de date dupa valorile lui xi in ordine crescatoare;
2. Se imparte seria de date in 3 intervale dupa urmatorul principiu:
prima si ultima serie sa aiba fiecare aproximativ 40% din numarul total de date ( in cazul de fata 11 date
statistice)
seria de mijloc va avea restul de 20% respectiv 5 in cazul nostru;
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
3. Se efectueaza 2 analize de regresie pentru setul 1 respectiv 3 de date:
ANOVA 1
df SS
Regression 1 3366,3441
Residual 9 880,9031
Total 10 4247,2473
4. Se vor extrage din tabele ANOVA pentru cele doua seturi valoarea SSE;
5.
71 . 7
5 , 4 ; 1 ; 05 , 0
2
2
; ;
F F F
k d n
k
tab
6. Avand in vedere ca
calc
F >
tab
F pentru un prag de semnificatie = 0.05 vom respinge ipoteza nula si vom
accepta ipoteza alternativa, astfel variatia erorilor nu este constanta, deci avem heteroscedasticitate.
Testarea ipotezei de autocorelare a erorilor (Testul Durbin Watson)
Se pleaca de la ipoteza clasica ce ne descrie ca erorile la momentul t sunt corelate cu erorile de la momentul t-1 , deci
acestea nu sunt independente.
TABEL NR. 20 CALCULUL VALORILOR INTEMEDIARE PENTRU TESTUL DURBIN-
WATSON
Nr crt.
Y
i
e
i
e
2
1 i
e
1
i i
e e
2
1
) (
i i
e e
1 310,3 8,9 79,6
2 35,8 -10,5 110,6 8,9 -19,4 376,36
3 110,8 -14,6 212 -10,5 -4,1 16,81
4 93 -17,4 303,7 -14,6 -2,8 7,84
5 907,8 -89,3 7983,3 -17,4 -71,9 5169,61
6 29,7 -18,8 352,3 -89,3 70,5 4970,25
7 97,5 -41,1 1687,8 -18,8 -22,3 497,29
8 37,5 15,4 236,8 -41,1 56,5 3192,25
9 184,7 88,2 7775,4 15,4 72,8 5299,84
10 389,1 90,6 8217,3 88,2 2,4 5,76
11 348,1 29,2 849,8 90,6 -61,4 3769,96
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
ANOVA 2
Df SS
Regression 1 426567,8396
Residual 9 33366,58217
Total 10 459934,4218
88 . 37
9 , 880
58 , 33366
1
2
SSE
SSE
F
calc
12 23,2 -16 254,9 29,2 -45,2 2043,04
13 28,3 -17,4 303,9 -16 -1,4 1,96
14 36,5 -15,5 241,2 -17,4 1,9 3,61
15 37,6 -16,1 259,2 -15,5 -0,6 0,36
16 87,4 -14 196,4 -16,1 2,1 4,41
17 23,9 -20,8 431,7 -14 -6,8 46,24
18 405,7 -15,9 253,3 -20,8 4,9 24,01
19 131,8 -7,1 50,3 -15,9 8,8 77,44
20 124 14,9 220,9 -7,1 22 484
21 56 5,2 26,6 14,9 -9,7 94,09
22 52,1 4,1 16,6 5,2 -1,1 1,21
23 42,9 -17,8 315,4 4,1 -21,9 479,61
24 65,1 -15,3 235,2 -17,8 2,5 6,25
25 80,6 -18,9 355,4 -15,3 -3,6 12,96
26 133,2 -19,7 388,7 -18,9 -0,8 0,64
27 299,9 129,8 16837,4 -19,7 149,5 22350,25
TOTAL 4172,7 0 48195,7 48936,05
1. Ipotezele de lucru sunt :
Ho : nu exista autocorelare pozitiva
Ho*: nu exista autocorelare negativa
2. Verificarea se face prin Testul Durbin Watson :
3. La un numar de date statistice n=27, extragem din tabelul Durbin-Watson dStatistic cei doi indicatori dU
= 1.233 si dL= 1.089
4. Vom construi graficul pentru reprezentarea zonelor critice:
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
n
i
i
n
i
i i
e
e e
D
1
2
2
2
1
) (
01 , 1
48195,7
48936,05
Asa cum reiese din grafic, la un prag de semnificatie de 0.01 vom respinge ipoteza nula si vom concluziona ca exista
evidenta a unei autocorelari pozitive.
Previziunea valorii variabilei Y daca variabila X creste cu 10% fata de ultima valoare nregistrata
In cazul in care variabila x cunoaste o crestere de 10% fata de ultima valoare inregistrata vom porni de la functia de
regresie simpla:
1 +
+
i prev
bx a Y
Unde:
1 + i
x =
27
x + 10% = 342,8
27
x = 311.7
1 +
+
i prev
bx a Y
= 22.18 + 0.891
1 + i
x = 327,68 (1000 mld EUR).
De asemenea determinarea unui interval de incredere este necesar. Acesta se poate afla prin urmatoarea formula de
calcul:
Putem concluziona ca nivelul importurilor in perioada t+1 la un nivel al exporturilor cu 10% mai mare decat perioada
imediat anterioara se va incadra in intervalul :
273,68 <
prev
Y
< 381(1000 mld EUR)
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
+ + t
n
i
i
i
e n prev
X X
X X
n
S t Y
1
2
2
1
2
) (
) ( 1
1 *
2 , 1199013
49 , 37752
27
1
1 91 . 43 * 38 . 2 + + t
prev
Y
BIBLIOGRAFIE
T. Andrei, Statistic i econometrie, Ed. Economic, 2003
Andrei Tudore, Stancu Stelian, Iacob Andrea, Erika Tusa, Introducere in econometrie utilizand
Eviews, Editura Economica, 2009
G. Keller and B. Warrack (2005) Statistics for Management and Economics, 5th Edition,
Duxbury Press.
A. ISAIC-MANIU, C. MITRU, V. VOINEAGU, STATISTIC, Ed. Universitar, Buc., 2004,
pag. 32-39
M. Korka, L.S. Begu, E. Tusa, Bazele statisticii pentru economicti, Ed Economica, 2006
Tusa Erika Statistics for Economists, Editura ASE, Bucuresti, 2005
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
ANEXE
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Anexa 1 - Prezentarea Funciile Excel utilizate mai frecvent n analize socio-
economice
FUNCIA REZULTAT DESCRIERE
AVERAGE (x1, x2,, xn)
Media aritmetic a numerelor
m = (x1+ x2 + + xn) / n
SUM(x1, x2,, xn)
Suma aritmetic a numerelor
s = x1+ x2 + + xn
PRODUCT(x1, x2,, xn) Produsul arimetic al numerelor p = x1 x2 x n
MIN (x1, x2,, xn) Minimul dintre numerele x1, x2,, xn
MAX (x1, x2,, xn) Maximul dintre numerele x1, x2,, xn
COUNT (val1, val2, , val n) Numrul elementelor ce conin valori numerice
COUNTA (val1, val2, , val n) Numrul elementelor nevide
ABS (x) Valoarea absolut (modulul) numrului x
INT(x) Partea ntreag inferior a numrului x
FLOOR (x,n) Partea ntreag inferioar sau superior a numrului x
SQRT(x) Radcina ptratic a numrului x
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
ROUND(x,n) Rotunjete valoarea numrului x la n zecimale
PI() Valoarea numrului = 3,14159265358979
RAND() Numr aleator uniform n intervalul (0,1)
VAR(x1, x2,, xn)
Dispersia estimat a valorilor x1, x2,, xn
D= ( xi m)
2
/(n-1), unde m este media aritmetic a
valorilor
STDEV(x1, x2,, xn)
Deviaia standard estimat a valorilor x1, x2,, xn (radcina
ptrat a dispersiei estimate)
VARP(x1, x2,, xn)
Dispersia calculat a valorilor x1, x2,, xn
D= ( xi m)
2
/n, unde m este media aritmetic a valorilor
STDEVP(x1, x2,, xn)
Deviaia standard calculat a valorilor x1, x2,, xn (radcina
ptrat a dispersiei calculate)
POWER(b,e) Puterea b
e
MOD(a,b) Modulo restul mpririi numerelor ntregi a : b
AND(exp1, exp2, , exp n)
Conjuncia expresiiloe logice exp1, exp2, , exp n .
Valoarea returnat este TRUE dac fiecare expresie este
TRUE, altfel este FALSE
OR(exp1, exp2, , exp n) Disjuncia expresiilor logice exp1, exp2, , exp n .
Valoarea returnat este TRUE dac cel puin o expresie este
TRUE, altfel este FALSE
NOT(exp)
Negaia expresiei exp. Valoarea returnat este TRUE dac
expresia este FALSE, altfel este FALSE
TRUE() Valoarea returnat este constanta logic TRUE
FALSE() Valoarea returnat este FALSE ; ntotdeauna
IF(exp, exp1, exp2)
Se evalueaz valoarea expresiei logice exp. Dac valoarea
expresiei exp este TRUE, atunci funcia IF returneaz
valoarea specificat prin exp1, altfel returneaz valoarea
specificat prin exp2
CHOOSE(i, x1, x2,, xn)
Instruciune de ramificaie multipl. Selectarea unei valori
dintr-o list de valori, pe baza valorii unui indice i.
TODAY() Data calendaristic curent
NOW() Data i ora calendaristic curent
VLOOKUP(val, reg, k) Cutare vertical. Se caut o valoare n prima coloan a unei
regiuni de date. Datele din aceast coloan sunt aezate n
ordine cresctoare. Se localizeaz primul element al coloanei
care este mai mare sau egal cu elementul cutat. Dac
elementul localizat este n linia i, valoarea returnat de
funcie este coninutul celulei din linia i i coloana k a
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
regiunii de date. Prima coloan are numrul de ordine 1.
HLOOKUP(val, reg, k)
Cutare orizontal. Se caut o valoare n prima linie a unei
regiuni de date. Datele din aceast linie sunt aezate n ordine
cresctoare. Se localizeaz primul element al liniei care este
mai mare sau egal cu elementul cutat. Dac elementul
localizat este n coloana i, valoarea returnat de funcie este
coninutul celulei din coloana i i linia k a regiunii de date.
Prima linie are numrul de ordine 1.
OFSET(baza, lin, col, i, l)
Obinerea unei referine la o celul sau la o regiune de celule
de dimensiune specificat (i=nlime, l=lime). Argumentul
baza reprezint o referin la o celul fa de care se
determin noua referin. Celula pentru care se genereaz
noua referin este deplasat fa de celula de baz cu lin linii
i col coloane
Funcii pentru date de tip TEXT
CODE(s)
Codul ASCII al primului caracter din irul de caractere s
(irul de caractere s va fi delimitat de ghilimele)
CHAR(n) Caracterul al carui cod ASCII este numrul ntreg n
VALUE(s) Valoarea numeric a irului de caractere s
LEN(s) Numarul de caractere din irul de caractere s
LEFT(s ,n) Primele n caractere din irul de caractere s
RIGHT(s,n) Ultimele n caractere din irul de caractere s
MID(s,n1,n2)
Returneaz n2 caractere din irul de caractere s ncepnd cu
poziia n1
REPT (s,n)
Un ir de caractere obinut prin repetarea de n ori a irului de
caractere s
TRIM(s)
Un ir de caractere obinut prin eliminarea tuturor spaiilor,
cu excepia spaiului care desparte cuvintele
LOWER(s) Transform toate literele mari din irul s n litere mici
UPPER(s) Transform toate literele mici din irul s n litere mari
PROPER(s)
Un ir de caractere n care prima liter a fiecrui cuvnt este
transformat n liter mare
CONCATENATE(s1,s2, , s n)
Un ir de caractere obinut prin concatenarea irurilor
s1,s2, , s n
REPLACE(s1,n1,s2,n2)
irul de caractere obinut prin nlocuirea n irul s1 a n2
caractere ncepnd din poziia n1 cu irul de caractere s2
Functii financiare n Excel
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
FV(rate, nper, pmt, pv, type)
Valoarea viitoare (Future value) a unui mprumut ntr-un
moment de timp viitor, dup efectuarea tuturor plilor, unde
rate = rata dobnzii, nper = numrul de perioade, pmt =
suma pltit ca rat la mprumut, pv = valoarea actual a
mprumutului, type = 1 sau 0 dup cum plata se face la
nceputul perioadei sau la sfritul peroadei
NPER(rate, pmt, pv, fv, type)
Number of periods - Numrul de luni, ani, zile sau alte uniti
de timp necesare pentru un mprumut
PMT(rate, nper, pv, fv, type) Payment-Suma pltit periodic ca rat la mprumut
PV(rate, nper, pmt, fv, type) Present value Valoarea actual a unui mprumut
RATE(nper, pmt, pv, fv,type, quess) Rate Rata dobnzii la un mprumut
Funcii pentru procesarea bazelor de date
DAVERAGE(db,col,crit)
Returneaz media aritmetic a valorilor din coloana col a
bazei de date db care verific criteriul crit, unde db =
referin la o regiune (domeniu) de celule care conine baza
de date, col = referin la un nume de cmp al bazei de date
( o celul din prima linie a bazei de date) prin care se
acceseaz coloana utilizat de funcie, crit = referin la o
regiune de celule care specific criteriul utilizat (tabelul de
condiii)
DCOUNT(db,col,crit)
Returneaz numrul celulelor cu valori numerice din coloana
col a bazei de date db care verific citeriul crit. Argumentul
col este opional. Dac acest argument este omis, funcia va
determina numrul tuturor celulelor bazei de date care
verific criteriul
DCOUNTA(db,col,crit)
Returneaz numrul celulelor nevide din coloana col a bazei
de date db care verific citeriul crit
DGET(db,col,crit)
Returneaz coninutul unei singure celule din baza de date
db. Celula este situat n coloana col i verific criteriul crit.
Dac nici un articol nu verific criteriul, se va returna
valoarea de eroare #VALUE !, iar dac mai multe articole
verific criteriul, se va returna #NUM !
DMAX(db,col,crit)
Returneaz valoarea maxim a numerelor din coloana col a
bazei de date db care verific criteriul crit
DMIN(db,col,crit)
Returneaz valoarea minim a numerelor din coloana col a
bazei de date db care verific criteriul crit
DPRODUCT(db,col,crit)
Returneaz produsul valorilor din coloana col a bazei de date
db care verific criteriul crit
DVAR(db,col,crit)
Returneaz dispersia estimat a valorilor din coloana col a
bazei de date db care verific criteriul crit. Dac x1, x2,, xn
sunt aceste valori, dispersia estimat a valorilor x1, x2,, xn
este
D= ( xi m)
2
/(n-1), unde m este media aritmetic a
valorilor
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
DVARP(db,col,crit)
Returneaz dispersia calculat a valorilor din coloana col a
bazei de date db care verific criteriul crit. Dac x1, x2,, xn
sunt aceste valori, dispersia calculata a valorilor x1, x2,, xn
este
D= ( xi m)
2
/n, unde m este media aritmetic a valorilor
DSTDEV(db,col,crit)
Returneaz deviaia standard estimat (rdcina ptrat a
dispersiei estimate) a valorilor din coloana col a bazei de
date db care verific criteriul crit
DSTDEVP(db,col,crit)
Returneaza deviatia standard calculata (radacina patrata a
dispersiei calculate) a valorilor din coloana col a bazei de
date db care verifica criteriul crit
DSUM(db,col,crit)
Returneaz suma volorilor din coloana col a bazei de date db
care verific citeriul crit
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Anexa 2 - Prezentarea componentelor Analysis Tool Pack, conform Microsoft
Help
Componenta inclus la cerere Analysis ToolPak Microsoft Excel furnizeaz un set de instrumente de analiz a datelor
denumit Analysis ToolPak (Pachet de instrumente de analiz) care se utilizeaz pentru a economisi etape atunci
cnd se dezvolt analize complexe, statistice sau de inginerie. Se furnizeaz datele i parametrii pentru fiecare dintre
analize; instrumentul de analiz utilizeaz macro-func iile statistice sau de inginerie corespunztoare i afi eaz
rezultatele ntr-un tabel de ie ire. Unele instrumente auxiliare genereaz i diagrame auxiliare tabelelor de ie ire.
Func ii relative la foaia de lucru. Excel furnizeaz multe alte func ii statistice, financiare i inginere ti pentru foile
de lucru. Unele dintre func iile statistice sunt predefinite iar altele devin disponibile dup instalarea Analysis ToolPak.
Accesarea instrumentelor de analizare a datelor. Analysis ToolPak include instrumentele descrise mai jos. Pentru a
accesa aceste instrumente, face i clic pe Analiz date din meniul Instrumente. n cazul n care comanda Analiz date
nu este disponibil, este necesar s ncrca i programul de completare Analysis ToolPak.
Anova
Instrumentele de analiz Anova furnizeaz diferite tipuri de analiz de varian . Instrumentul de utilizat depinde de
numrul factorilor i de numrul e antioanelor pe care le ave i din cadrul popula iilor pe care le testa i.
Anova: Single Factor Acest instrument efectueaz o analiz simpl de varian asupra datelor pentru dou sau mai
multe e antioane. Analiza furnizeaz o testare a ipotezei c fiecare e antion este derivat din aceea i distribu ie de
probabilitate de baz fa de ipoteza c distribu ia de probabilitate de baz nu este aceea i pentru toate e antioanele.
Dac sunt numai dou e antioane, se poate utiliza la fel de bine func ia foii de lucru, TTEST. Cnd sunt mai mult de
dou e antioane, nu este adecvat generalizarea func iei TTEST, ci poate fi utilizat numai modelul Single Factor
Anova: Two-Factor With Replication Acest instrument de analiz este util cnd datele pot fi clasificate dup dou
dimensiuni diferite. De exemplu, ntr-un experiment pentru msurarea nl imii plantelor, plantele pot fi tratate cu
diferi i fertilizatori (de exemplu: A, B, C) i pot fi inute la diferite temperaturi (de exemplu: joas, nalt). Pentru
fiecare dintre cele 6 posibile perechi de {fertilizator, temperatur} avem un numr egal de observa ii ale nl imii
plantelor. Utiliznd instrumentul Anova se poate testa:
1. Dac nl imea plantelor pentru diferite tipuri de fertilizatori deriv din aceea i popula ie de baz; temperatura
este ignorat n aceast analiz.
2. Dac nl imea plantelor pentru diferite niveluri de temperatur deriv din aceea i popula ie de baz; tipul de
fertilizator este ignorat n aceast analiz.
3. Dac, innd seama de efectele diferen elor dintre tipurile de fertilizatori aflate n prima etap i diferen ele
de temperatur aflate la etapa a doua, cele 6 e antioane reprezentnd toate perechile de valori {fertilizator,
temperatur} deriv din aceea i popula ie. Ipoteza alternativ este aceea c exist efecte datorate unei anumite
perechi {fertilizator, temperatur} n plus fa de diferen ele bazate numai pe fertilizator sau numai pe
temperatur.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Anova: Two-Factor Without Replication Acest instrument de analiz este util cnd datele sunt clasificate dup dou
dimensiuni diferite, ca n cazul instrumentului Two-Factor case With Replication. Pentru acest instrument, ns,
presupunem c exist o singur observa ie pentru fiecare pereche (de exemplu, fiecare pereche {fertilizator,
temperatur} din exemplul de mai sus. Utiliznd acest instrument, se pot aplica testele din prima i a doua etap a
cazului Anova: Two-Factor With Replication, dar nu avem suficiente date pentru a aplica testul din a treia etap.
Corela ie
Func iile foii de lucru CORREL i PEARSON calculeaz ambele coeficientul de corela ie dintre dou variabile de
msurare cnd msurarea fiecrei variabile este observat pentru fiecare dintre N subiec i. (Orice observa ie lips
pentru oricare dintre subiec i provoac ignorarea acelui subiect n analiz.) Instrumentul de analiz a corela iei este n
special util cnd exist mai mult de dou variabile de msurare pentru fiecare dintre N subiec i. Acesta furnizeaz un
tabel cu rezultate, o matrice de corela ii, artnd valoarea func iei CORREL (sau PEARSON) aplicat fiecrei perechi
posibile de variabile de msurare.
Coeficientul de corela ie, la fel ca cel de covarian , este o msur a gradului de varia ie comun al celor dou variabile
de msurare. Spre deosebire de covarian , coeficientul de corela ie este msurat pe o scar, astfel c valoarea sa este
independent de unitatea n care se exprim variabilele. (De exemplu, dac cele dou variabile de msurare sunt
greutatea i nl imea, valoarea coeficientului este neschimbat chiar dac greutatea se msoar n kilograme sau livre.)
Valoarea oricrui coeficient de corela ie trebuie s fie ntre -1 i +1 inclusiv.
Se poate utiliza instrumentul de Corela ie pentru a examina fiecare pereche de variabile de msurare i a determina
dac cele dou variabile de msurare tind s se mute mpreun aceasta nsemnnd, dac valorile mari ale unei
variabile tind s poat fi asociate cu valorile mari ale celeilalte variabile (corela ie pozitiv), dac valorile mici ale unei
variabile tind s poat fi asociate cu valorile mici ale celeilalte variabile (corela ie negativ) sau dac valorile celor
dou variabile tind s fie necorelate (corela ie aproape zero).
Covarian
Instrumentele Corela ie i Covarian pot fi utilizate ambele n acelea i condi ii, cnd ave i N diferite variabile de
msurare observate pe un set de indivizi. Instrumentele Corela ie i Covarian dau fiecare un tabel de rezultate, o
matrice, care arat coeficientul de corela ie sau, respectiv, de covarian dintre fiecare pereche de variabile de
msurare. Deosebirea const n aceea c n timp ce coeficientul de corela ie este msurat pe o scar de la -1 la +1
inclusiv, covarian a corespunztoare nu este msurat pe o scar. Att coeficientul de corela ie, ct i cel de covarian
sunt msuri ale gradului de varia ie comun pentru cele dou variabile.
Instrumentul Covarian calculeaz valoarea func iei COVAR a foii de calcul, pentru fiecare pereche de variabile de
msurare. (Utilizarea direct a func iei COVAR n locul instrumentului Covarian este o alternativ rezonabil cnd
exist numai dou variabile de msurare, adic N=2.) Intrarea pe diagonala tabelului cu rezultate al instrumentului
Covarian din rndul i, coloana i este covarian a variabilei de msurare i cu ea ns i; este exact varian a popula iei
pentru acea variabil, calculat cu func ia VARP a foii de lucru.
Se poate utiliza instrumentul Covarian pentru a examina fiecare pereche de variabile de msurare i a determina dac
cele dou variabile de msurare tind s se mute mpreun aceasta nsemnnd, dac valorile mari ale unei variabile
tind s poat fi asociate cu valorile mari ale celeilalte variabile (covarian pozitiv), dac valorile mici ale unei
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
variabile tind s poat fi asociate cu valorile mici ale celeilalte variabile (covarian negativ) sau dac valorile celor
dou variabile tind s fie necorelate (covarian aproape zero).
Statistici descriptive
Acest instrument de analiz genereaz un raport de statistici univariabile pentru datele din zona de intrare, furniznd
informa ii despre tendin a central i variabilitatea datelor.
Netezirea exponen ial
Acest instrument de analiz i formula aferent acestuia estimeaz o valoare bazat pe prognoza din perioada
anterioar, ajustat cu eroarea din acea prognoz anterioar. Instrumentul utilizeaz constanta de netezire a, mrimea ce
determin ct de puternic rspunde prognoza la erorile din prognoza anterioar.
NOT Valori de la 0,2 la 0,3 sunt constante de netezire rezonabile. Aceste valori indic faptul c prognoza curent ar
trebui ajustat cu 20 pn la 30 procente pentru eroarea din prognoza anterioar. Constante mai mari produc un rspuns
mai rapid, dar pot produce proiec ii nesigure. Constante mai mici pot determina o ntrziere mai mare a valorilor
prognozate.
Instrumentul de analiz Test F: Dublu-e antion pentru varian e
Instrumentul de analiz Test F Dou e antioane pentru varian e efectueaz un test F pe dou e antioane pentru a
compara varian ele a dou popula ii.
De exemplu, se poate utiliza instrumentul Test F pe e antioane de timpuri realizate de dou echipe ntr-un concurs de
not. Instrumentul furnizeaz rezultatul testrii cu ipotez nul conform creia cele dou e antioane provin din
distribu ii cu varian egal fa de ipoteza alternativ c varian ele nu sunt egale n distribu iile de baz.
Instrumentul calculeaz valoarea f a unei statistici F (sau propor ie F). O valoare f apropiat de 1 este dovad a
varian elor egale ale popula iilor de baz. n tabelul cu rezultate, dac f < 1 P(F <= f) unilateral d probabilitatea
observrii unei valori a statisticii F mai mic dect f cnd varian ele popula iilor sunt egale i F unilateral critic d
valoarea critic mai mic dect 1 pentru nivelul de semnifica ie ales, Alfa. Dac f > 1, P(F <= f) unilateral d
probabilitatea observrii unei valori a statisticii F mai mare dect f cnd varian ele popula iilor sunt egale i F
unilateral critic d valoarea critic mai mare dect 1 pentru Alfa.
Instrumentul Analiz Fourier
Instrumentul Analiz Fourier rezolv probleme n sisteme liniare i analizeaz periodic datele utiliznd metoda Fast
Fourier Transform (FFT) pentru transformarea datelor. Acest instrument suport de asemenea transformri inverse, n
care inversa datelor transformate returneaz datele ini iale.
Histogram
Instrumentul de analiz Histogram calculeaz frecven e individuale i cumulative pentru o zon de celule de date.
Acest instrument genereaz datele pentru numrul de apari ii ale unei valori n setul de date.
De exemplu, ntr-o clas de 20 de studen i, se poate determina distribu ia punctajelor n categorii notate cu litere. Un
tabel de tip histogram prezint limitele categoriilor i numrul de puncte ntre limita inferioar i limita curent.
Punctajul cel mai frecvent reprezint modul datelor.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Medie mobil
Instrumentul de analiz Medie mobil proiecteaz valorile n perioada de prognoz pe baza valorii medii a variabile
dup un anumit numr de perioade anterioare . O medie mobil furnizeaz informa ii de tendin pe care o simpl
medie a tuturor datelor istorice ar putea-o masca.. Utiliza i acest instrument pentru prognozarea vnzrilor, a
inventarului sau alte tendin e. Fiecare valoare prognozat se bazeaz pe formula urmtoare.
unde:
N este numrul de perioade anterioare pentru a le include n media mobil
Aj este valoarea actual la timpul j
Fj este valoarea prognozat la timpul j
Generator de numere aleatoare
Instrumentul de analiz Generator de numere aleatoare umple un interval cu numere independente aleatoare derivate din
una dintre mai multe distribu ii. Ave i posibilitatea s caracteriza i subiectele unei popula ii cu o distribu ie de
probabilitate.
De exemplu, se poate utiliza o distribu ie normal pentru a caracteriza popula ia nl imii indivizilor sau se poate
utiliza o distribu ie Bernoulli a dou posibile consecin e pentru a caracteriza popula ia rezultatelor experimentului cu
banul.
Rang i percentil
Instrumentul de analiz Rang i percentil produce un tabel care con ine rangul ordinal i procentual al fiecrei valori
dintr-un set de date. Ave i posibilitatea s analiza i pozi ia relativ a valorilor dintr-un set de date. Acest instrument
utilizeaz func iile foii de lucru RANK i PERCENTRANK. RANK nu ine seama de valorile legate. Dac dori i s
ine i seama de valori legate, utiliza i func ia foii de lucru, RANK, mpreun cu factorul de corec ie sugerat n fi ierul
de ajutor pentru RANK.
Regresie
Instrumentul de analiz Regresie execut analiza de regresie liniar prin utilizarea metodei ptratelor mici pentru a
gsi o linie care corespunde unui set de observa ii. Ave i posibilitatea analizrii modului n care o singur variabil
dependent este afectat de valorile uneia sau a mai multor variabile independente.
De exemplu, ave i posibilitatea s analiza i modul n care performan a unui atlet este afectat de factori precum vrsta,
nl imea i greutatea. Ave i posibilitatea s repartiza i pe por iuni ale indicatorului performan fiecruia dintre
ace ti trei factori pe baza unui set de date realizate, apoi de a utiliza rezultatele pentru a prevedea rezultatele unui atlet
nou, netestat.
Instrumentul Regresie utilizeaz func ia LINEST a foii de lucru.
E antionare
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Instrumentul de analiz E antionare creeaz un e antion dintr-o popula ie prin tratarea intervalului de intrare ca pe o
popula ie. Cnd popula ia este prea mare pentru a o procesa sau pentru a o nscrie ntr-o diagram, ave i posibilitatea
utilizrii unui e antion reprezentativ. Ave i de asemenea posibilitatea crerii unui e antion care s con in numai valori
dintr-o anumit parte a unui ciclu n cazul n care considera i c datele de intrare sunt periodice.
De exemplu, dac zona de intrare con ine cifre privind vnzri trimestriale, e antiona i cu o rat periodic valorile de
pe patru pozi ii din acela i trimestru n zona de intrare.
Test t
Instrumentele de analiz test t pentru dou e antioane testeaz egalitatea mediilor popula iilor de baz pentru fiecare
dintre e antioane. Cele trei instrumente folosesc ipoteze diferite: varian ele popula iilor sunt egale, varian ele
popula iilor nu sunt egale i cele dou e antioane reprezint observa iile nainte i dup tratament asupra acelora i
subiec i.
Pentru toate cele trei instrumente de mai jos, o valoare a statisticii t, t, este calculat i prezentat ca t Stat n tabelul
cu rezultate. n func ie de date, aceast valoare, t, poate fi negativ sau pozitiv. Presupunnd c mediile popula iilor
de baz sunt egale, dac t < 0, P(T <= t) unilateral d probabilitatea ca o valoare a statisticii t observat s fie mai
negativ dect t. Dac t >=0, P(T <= t) unilateral d probabilitatea ca o valoare a statisticii t observat s fie mai
pozitiv dect t. t unilateral critic d valoarea limit pentru care probabilitatea observrii unei unei valori a statisticii t
mai mare sau egal cu t unilateral critic s fie Alfa.
P(T <= t) bilateral d probabilitatea ca o valoare a statisticii t observat s fie mai mare n valoare absolut dect t. P
bilateral critic d valoarea limit pentru care probabilitatea unei statistici t observate mai mari n valoare absolut dect
P bilateral critic s fie Alfa.
Test t: Dou e antioane cu varian e egale. Acest instrument de analiz execut un test t pe dou e antioane de
studen i. Acest test t presupune c cele dou seturi de date provin din distribu ii cu acelea i varian e. I se spune test t
homoscedastic. Ave i posibilitatea s utiliza i acest test t pentru a determina dac este probabil ca cele dou e antioane
s provin din distribu ii cu medii egale ale popula iilor.
Test t: Dou e antioane cu varian e inegale. Acest instrument de analiz execut un test t al lui Student pe dou
e antioane. Acest test t presupune c cele dou seturi de date provin din distribu ii cu varian e inegale; I se spune test t
heteroscedastic . Ca i n cazul Varian elor egale de mai sus, ave i posibilitatea s utiliza i acest test t pentru a
determina dac este probabil ca cele dou e antioane s provin din distribu ii cu medii egale ale popula iilor. Utiliza i
acest test atunci cnd sunt subiec i distinc i n cele dou e antioane. Utiliza i testul Pereche, descris mai jos, atunci
cnd exist un singur set de subiec i i cele dou e antioane reprezint msurtori ale subiec ilor nainte i dup un
Urmtoarea formul este utilizat pentru a determina valoarea statistic a testului t.
Urmtoarea formul se utilizeaz pentru a calcula gradele de libertate, df. Deoarece rezultatul calculului nu este, n
general, un numr ntreg, valoarea lui df este rotunjit la cel mai apropiat ntreg pentru a ob ine o valoare critic din
tabelul t. Func ia Excel pentru foi de lucru, TTEST, utilizeaz valoarea calculat df fr a rotunji, fiind deci posibil
calcularea unei valori pentru TTEST fr ca valoarea lui df s fie n mod necesar un ntreg. Datorit acestor diferen e
de abordare pentru determinarea gradelor de libertate, rezultatele lui TTEST i ale acestui instrument test t vor diferi n
cazul varian elor inegale.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Test t: Dou e antioane pereche pentru medii. Utiliza i testul pereche atunci cnd exist o coresponden natural a
observa iilor din e antioane, cum ar fi atunci cnd un grup e antion este testat de dou ori nainte i dup un
experiment. Acest instrument de analiz i formula sa efectueaz un test t al lui Student cu dou e antioane pereche
pentru a determina dac este probabil ca observa iile fcute nainte i dup un experiment s provin din distribu ii cu
medii egale ale popula iilor. Aceast form de test t nu presupune c varian ele celor dou popula ii sunt egale.
NOT Printre rezultatele generate de acest instrument se afl varian a centralizat, o msur de acumulare a
mpr tierii datelor legate de medie, derivat din formula urmtoare.
Test z
Test z: Instrumentul de analiz Dou e antioane pentru medii execut un test z pe dou e antioane pentru medii cu
varian e cunoscute. Acest instrument este utilizat pentru a testa ipoteza nulului, c nu este nici o diferen ntre dou
medii ale unor popula ii, n compara ie cu ipotezele alternative, fie cea unilateral fie cea bilateral. Dac varian ele
nu sunt cunoscute, trebuie utilizat func ia foii de lucru, ZTEST, n locul acestui instrument.
Cnd se utilizeaz instrumentul Test z, trebuie mult aten ie pentru n elegerea rezultatelor. P(Z <= z) unilateral este
de fapt P(Z >= ABS(z)), probabilitatea unei valori z mai deprtate de 0 n aceea i direc ie ca valoarea z observat, cnd
nu sunt diferen e ntre mediile popula iilor. P(Z <= z) bilateral este de fapt P(Z >= ABS(z) sau Z <= -ABS(z)),
probabilitatea unei valori z mai deprtate de 0 n oricare direc ie fa de valoarea observat z, cnd nu sunt diferen e
ntre mediile popula iilor. Rezultatul bilateral este tocmai rezultatul unilateral multiplicat cu 2. Testul z poate s se
utilizeze, de asemenea, pentru cazul cnd ipoteza nul este c exist o valoare specific diferit de zero pentru diferen a
dintre mediile a dou popula ii.
De exemplu, se poate utiliza acest test pentru a determina diferen ele ntre performan ele a dou modele de ma ini.
Compararea mediilor
Softul statistic din excel, in procesul de testare, calculeaza direct valoarea p (p-value) a
ipotezei alternative, urmand ca analistul sa isi asume un nivel al riscului (nivelul de semnificatie ,) pentru a face
comparatia intre cele doua nivele de probabilitate si a accepta sau respinge ipoteza alternativa.
In Excel se utilizeaza functia TTEST.care returneaza direct valoarea p a ipotezei alternative.
Functia are urmatoarele argumente:
Array1 domeniu reprezintand setul de date corespunzatoare primului esantion;
Array2 reprezinta setul de date corespunzatoare celui de-al doilea esantion;
Tails parametru boolean cu valoarea egala cu 1 daca alternativa este unilaterala, respectiv 2 daca este
bilaterala;
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013
Type, parametru boolean cu valoarea egala cu 1 daca esantioanele sunt
pereche, 2 daca esantioanele nu sunt pereche dar sunt homoscedastice, si 3 daca se stie despre populatii ca sunt
heteroscedastice.
In practica sunt extrem de putine situatiile in care sa se cunoasca homoscedasticitatea populatiilor. Pentru esantioane
nepereche valoarea parametrului Type se recomanda a fi egal cu 3.
n contextul globalizrii afacerilor, supravieuirea i prosperitatea firmelor este condiionat de cunoaterea i
respectarea cerinelor mediului n care ele i desfoar activitatea. Lumea contemporan este caracterizat printr-un
dinanism (o mobilitate) fr precedent cauzat, pe de o parte, de progresul tehnologic, de ptrunderea digitalizrii n
quasi-totalitatea domeniilor activitii umane, iar pe de alt parte, de deschiderea tot mai net a pieelor naionale fa de
competiia internaional.
ntr-un astfel de mediu, ntreprinderile trebuie s cunoasc situaia actual, s sesizeze n timp real i cu costuri minime
oportunitile i riscurile de afaceri, s prevad tendinele i s-i ia msurile adecvate pentru a face fa schimbrilor
(modificrilor) care le vor (putea) afecta pieele de aprovizionare i de desfacere, precum i pentru a cunoate propria
lor poziie pe aceste piee.
Dezvoltare, inovare i extindere a accesului la
nvare n programe de master n
administrarea afacerilor
Contract nr.: POSDRU /86/1.2/S/61086
Proiect cofinanat din Fondul Social European prin Programul
Operaional Sectorial Dezvoltarea Resurselor Umane 2007-2013