Sunteți pe pagina 1din 30

Universitatea Alexandru Ioan Cuza Facultatea de Economie i Administrarea Afacerilor

Disciplina: Statistic pentru afaceri

Proiect semestrial SPSS

Coordonator: Prof.univ.dr. Elisabeta Jaba Student: Fotea Mihaela MC MRU, An I

Cuprins

Cuprins........................................................................................................................ 2 Cap.1 Prezentarea i descrierea statistic a unui eantion observant.......................3 1.1.Descrierea problemei de studiat i alegerea variabilelor analizate....................3 1.2 Realizarea bazei de date n SPSS i definirea variabilelor.................................3 1.1.1Descrierea statistic a variabilelor nominale................................................5 1.1.2 Descrierea statistic a valorilor numerice...................................................7 Cap. 2 Estimarea prin interval de ncredere a parametrilor distribuiilor considerate .................................................................................................................................. 14 2.1. Estimarea mediei prin interval de ncredere...................................................14 2.2.Estimarea proporiei......................................................................................... 16 Cap. 3 Testarea ipotezelor statistice.........................................................................17 3.1. Testarea egalitii unei medii cu o valoare specificat...................................17 3.2 Testarea diferenei dintre dou medii..............................................................20 3.3 Testarea egalitii dintre dou medii...............................................................21 Cap. 4 Analiza asocierii a dou variabile categoriale................................................23 4.1 Analiza de corelaie pentru dou variabile numerice.......................................24 4.2 Analiza de regresie simpla liniar....................................................................25 Cap. 5 Analiza grafic a trendului............................................................................. 27 5.1 Analiza variaiilor sezoniere............................................................................. 27 Bibliografie................................................................................................................ 30

Cap.1 Prezentarea i descrierea statistic a unui eantion observant

1.1.

Descrierea problemei de studiat i alegerea variabilelor analizate


Acest studiu are la baz opinia oamenilor n legtur cu o serie de aspecte din viaa lor

cum ar fi: nivelul de trai, modalitile de petrcere a timpului liber, preocupri, salariu etc. Prin intermediul acestui studiu am dorit s aflm cum apreciaz indivizii nivelul de trai prin prisma salariului raportat la o serie de factori : ocupaia, vrsta, vechimea, nivelul de educaie etc. Pentru a analiza acest subiect s-a aplicat un chestionar unui eantion de 1500 de persoane, din judeul Iai cu vrsta cuprins ntre 19 i 69 de ani. Chestionarul este format dintr-un set de ntrebri deschise i nchise referitoare la situaia financiar prezent raportat la cea din trecut. Pentru acest proiect am realizat o baz de date pentru un eantion de 33 de persoane, modificnd astfel i structura chestionarului deoarece acesta este un proiect didactic i nu este just s utilizez o baz de date prea complex la care am lucrat anterior. Variabilele men ionate mai sus vor constitui baza de date din SPSS, numit Date generale.

1.2 Realizarea bazei de date n SPSS i definirea variabilelor


Atributele acestor variabile sunt definite n fereastra Data Editor Variable View. Vor fi introduse, genul, ocupaia (director, profesor, medic, infirmier), educaia, salariul, vechimea statutul, timp liber, concediu, localitate. Mai departe, alegem tipul variabilelor: numerice ( vrsta, salariul, timpul, mediu,vechimea) i string ( genul, cheltuieli, ocupaie i venit).

Tabel nr. .1.1 Introducerea variabilelor n baza de date, realizat n SPSS

Iar baza de date va fi urmtoarea: Tabel nr. 1.2 Transformarea bazei de date n SPSS, folosind Data View

1.1.1 Descrierea statistic a variabilelor nominale


Vom analiza drept variabile nominale, ocupaia i genul persoanelor chestionate. Vom selecta meniul Analyze Descriptive Statistics Frequencies Statistics ( unde la Central Tendency vom bifa Mode) i Charts (unde la Chart Type vom bifa Pie, iar la Chart Value - Frequencies). Astfel, se obin urmtoarele rezultate: Tabelul nr 1.3 Sexul respondentului

Interpretare: n tabelul 1.3 putem observa c, dintr-un total de 33 de respondeni, 18 dintre acetia au fost brbai, n timp ce restul respondenilor, respectiv 15 au fost femei. Tabelul nr 1.4 Ocupaia persoanelor cuprinse n eantionul analizat

Interpretare: Att din tabelul nr. 1.4, ct i din graficul urmtor, putem observa c din totalul celor chestionai, cei mai muli au fost studeni, cu o pondere de 12.1%, urmnd profesorii, managerii, pensionarii, infirmierii i omerii cu un procent de 9.1% i cu un procentaj de 6.1% contabilii, medicii, zidarii etc. Figura nr. 1.5 Ponderea persoanelor cuprinse n eantion, n funcie de ocupaia acestora

Figura nr. 1.6 Ponderea persoanelor cuprinse n eantion, n funcie de sexul acestora

1.1.2 Descrierea statistic a valorilor numerice


Pentru a reda variabilele numerice (salariul i vrsta), din meniul Analyze alegem Descriptive Statistics Frequencies( la opiunea Dispersion selectm St.deviation, minimum i
7

maximum, iar la optiunea Central Tendency selectm Mean), iar la Chart optm pentru diagrama de tip Histogram cu curb normal. Astfel s-au obinut urmtoarele rezultate: Tabelul nr 1.7 Parametrii distribuiei, salariul i vrsta indivizilor

Din figura 1.7 putem observa o analiz a vrstei i a salariului lunar. Vrsta minim a persoanelor din eantion este de 18 ani, cea maxim de 69 ani. Avem afiat i o medie a vrstei, de 37,21 ani. Abaterea medie ptratic (std. deviation): n medie, vrsta fiecrei persoane se abate de la vrsta medie cu 12.754 n plus sau n minus. Avem i un salariu lunar minim de 299 lei i un salariu maxim de 6400 lei, iar salariul mediu este de 1799.30 lei. La fel ca i n cazul vrstei avem o abatere medie ptratic de 1764.324 +/-. Din bara de meniu utilizm comanda AnalyzeDescriptive Statistics Descriptives Options i selectm urmatorii parametri: valoarea medie (mean), abaterea medie patratic ( s t d . deviation), variana, coeficientul de asimetrie (skewness), de boltire (kurtosis) si variable list. Am fcut acest lucru pentru 3 variabile (vrsta indivizilor din eantion, salariul lunar i modaliti de petrecere a timpului liber). Se obin urmtoarele rezultate: Tabelul nr. 1.8 Corelaia existent ntre cele trei variabile

Utiliznd comanda Analyze Descriptive Statistics Frequencies Statistics i selectnd urmatorii parametri: valoarea medie (mean), mediana, modala, valorile quartile, abaterea medie patratic ( s t d . deviation), variana, coeficientul de asimetrie (skewness), de boltire (kurtosis). n fereastra Charts selectm i opiunea Histogram/With normal curve. Pentru realizarea acestui lucru am folosit aceleai variabile de la figura 1.8. Rezultatul a fost : Tabelul nr. 1.9 Parametrii repartiiei unidimensionale

Interpretare: Media(mean): vrsta medie a persoanelor din eantion este de 37,21 ani; venit lunar mediu de 1799,30 Ron; Modalitatea de petrecere a timpului liber n medie este de 2,21

Mediana(median): jumtate din cei chestionai au vrsta n medie de 37 de ani au un venit de pn la 1200 Ron; i petrec vacanele n straintate de 2 ori pe an

Modul (mode): Cei mai muli dintre cei chestionai au 45 ani


9

cei mai muli dintre cei chestionai au un venit de 1200 Ron cei mai muli prefer s-i petreac timpul liber 1 dat pe an

Abaterea medie ptratic (std. deviation): n medie, vrsta fiecrei persoane se abate de la vrsta medie cu 12.754, n plus sau n minus; venitul lunar al unei persoane se abate de la venitul lunar mediu, n plus sau n minus, cu 1764.324; durata timpului petrecut se abate de la cea medie cu 1,19 ori pe an. Skewness: n ceea ce privete parametrii formei, se observ c seria asimetric pozitiv, predomin persoanele de vrsta a doua (skewness >0); Kurtosis: n cazul nostru, distribuia are o boltire alungit.

Tabelul nr.1.10 Structura persoanelor cuprinse n eantion, n funcie de vrsta acestora

10

Tabelul nr.1.11 Structura persoanelor cuprinse n eantion, n funcie de salariul lunar al acestora

Tabelul nr.1.12 Modalitile respondenilor de petrecere a timpului liber

11

n tabelul de frecven pentru variabila Modaliti de petrecere a timpului liber se poate observa c 12 indivizi i petrec timpul liber plimbndu-se, 9 i petrec vacanele n strinatate, 8 indivizi merg n ar n vacane, iar ultimele 4 persoane i petrec timpul liber mergnd la teatru/oper (2) i participnd la diferite activiti extracurriculare. Grafic nr. 1.13 Distribuia salariului lunar al respondenilor, n jurul mediei

Grafic nr. 1.14 Distribuia respondenilor n funcie de vrst, n jurul mediei

12

Grafic nr. 1.15 Distribuia respondenilor n funcie de modalitile de petrecere a timpului liber, n jurul mediei

13

Cap. 2 Estimarea prin interval de ncredere a parametrilor distribuiilor considerate

2.1. Estimarea mediei prin interval de ncredere


Pentru estimarea mediei am ales variabila Salariul; selectm din meniul Analyse comanda Descriptives Statistics- opiunea Explore, iar din fereastra Explore, selectm variabila dorit i o mutm n zona Dependent List. Apoi activm butonul de comand Statistics, care deschide fereastra Explore Statistics i bifm caseta de validare Descriptives, preciznd n caseta Confidence Interval for Mean, nivelul de ncredere de 95%. Se obin urmtoarele date: Tabelele nr. 2.1 i 2.2 Estimarea mediei prin intervalul de ncredere

Interpretare: cu o probabilitate de 95% putem afirma c salariul mediu al unui angajat este ntre 1173.70 RON i 2424.91 RON.
14

Grafic nr. 2.3 Boxplot pentru variabila salariul lunar

15

2.2.Estimarea proporiei
Vom efectua o serie de pai pentru a determina intervalul de ncredere pentru o proporie. Pentru a calcula estimaia proporiei pentru categoria Student, din meniul Analyze, comanda Descriptive Statistics, opiunea Frequencies, aflm valoarea variabilei Z pentru un nivel de ncredere de 95% (Z=1,96), calculm abaterea standard dup relaia

este abaterea (deviaia) standard, iar n este volumul eantionului

i calculm limitele intervalului cu formula f

Tabelele nr. 2.4 i 2.5 Estimarea proporiei prin intervalul de ncredere

16

Se poate observa c proporia angajailor care ocup funcia de student este de 12.1%. Calculm pentru f = 12.1% : = =0,003

Calculm limitele I.C. pentru z = 1,96: = f 1,96 = 0,121 - 1,96 0,07 = -0,128

= f + 1,96

= 0,121 + 1,96 0,07 = 0,25

Interpretare: cu o probabilitate de 95%, putem afirma c ponderea persoanelor din categoria Student la nivelul populaiei este acoperit de intervalul [-0,128; 0,25] sau c ponderea acestora este cuprins ntre -12,8% i 25%.

Cap. 3 Testarea ipotezelor statistice 3.1. Testarea egalitii unei medii cu o valoare specificat
Pentru a testa egalitatea unei medii cu o variabil specificat am ales variabila Salariu. Se va analiza dac salariul curent al unui angajat difer sau nu de 700 RON . Testarea egalit ii salariului mediu la nivel de eantion cu o valoare fix se realizeaz cu opiunea One Sample T Test, care presupune parcurgerea urmtoarelor etape: din meniul Analyze, alegem comanda Compare Means i opiunea One-Sample T Test. Dup alegerea opiunii One Sample T Test, selectm din fereastr variabila Salariu i o mutm n zona Test Variable(s), specificm valoarea dorit, 700, n zona de editare Test Value; apoi activm butonul de comand Options i n zona Confidence Interval, alegem gradul de ncredere de 95%. Dup ce acionm butonul Continue i apoi OK obinem urmtoarele tabele: Tabelele nr. 3.1 i 3.2 Testatea egalitii unei medii cu o valoare specificat
17

Interpretare: Output-urile, One-Sample Statistics i One-Sample T Test pentru variabila salariu prezint valoarea medie observat egal cu 11799.30 ron; valoarea specificat egal cu 700 Ron; diferena dintre valoarea medie observat i valoarea ipotetic este de 1099.303 ron. Se poate observa c valoarea nivelului de semnificaie Sig. egal cu 0,001 este mai mic dect valoarea 0,05, considerat n Confidence Interval din Options, ceea ce evideniaz existena unei diferene semnificative ntre valoarea medie a salariului observat n eantion i cea specificat, de 700 RON . n exemplul dat deoarece valoarea Sig<0.01 nseamn c valoarea estimat a statisticii test T este semnificativ la un nivel de ncredere de 99%. Prin urmare, ipoteza nul se respinge, ntre salariul mediu observat i valoarea ipotetic 700 ron exist diferene semnificative . Testarea egalitii unei medii cu o valoare specificat se poate realiza i printr-un procedeu grafic: Error Bar. Diagrama Error Bar descrie intervalul de ncredere de 95% a mediei pentru variabila Salariu, adic intervalul care acoper valoarea medie, cu o probabilitate de 95%. Pentru a obine diagrama Error Bar, selectm din meniul Graphs comanda Error Bar, alegem tipul simple i butonul de opiuni Summaries of separate variables. Apoi din butonul

18

Define alegem Define Simple Error Bar,

selectm variabila Salariu i o mutam n zona Error Bars. Grafic nr.3.3 Diagrama Error Bar pentru variabila salariu

19

Interpretare: i prin procedeul Error Bar se poate observa c valoarea specificat (700 ron) nu este cuprins n intervalul de ncredere [1000; 2500]. Prin urmare putem spune cu o probabilitate de 95% c se respinge ipoteza nul, adic de egalitate a salariului mediu al persoanelor din eantion cu o valoare specificat (700);

3.2 Testarea diferenei dintre dou medii


Testarea se realizeaz cu ajutorul testului Independent-Samples T Test. Demersul este: Analyze Compare Means Independent-Samples T Test. Se va testa dac bugetul alocat nainte de criz este acelai pentru genul feminin i masculin. Ipoteza privind egalitatea mediilor se formuleaz astfel: H0: X 1= X 2 H1: X 1 X 2 Demersul testrii folosind SPSS este meniul Nnalyze- comnada Compare Means- Opiunea Independent Samples T Test. Tabelele nr. 3.4 i 3.5 Testarea diferenei dintre mediile: salariul i sexul respondenilor

20

Interpretare: Testul t este egal cu 0,99 respectiv cu 1,04 cu o probabilitate Sig. de 0,325 i 0,307>0,05, ceea ce arat c bugetul lunar pentru cele dou sexe (2079 Ron pentru masculin i 1463 pentru femenin) i c ntre cele dou medii exist diferene semnificative.

3.3 Testarea egalitii dintre dou medii


ANOVA este un procedeu de analiz a varianei unei variabile numerice sub influena unei variabile de grupare. Prin ANOVA se compar medii pentru 3 i mai multe subpopulaii definite de variabila de grupare, variab independent. Din meniul Analyze Compare Means One-way Anova introducem variabila cantitativ vrsta dependent de variabila modaliti de petrecere a timpului liber. H0: Vrsta persoanelor chestionate nu influeneaz modul de a-i petrece timpul liber. H1: Vrsta persoanelor chestionate influeneaz modul de a-i petrece timpul liber.

21

Tabelele nr. 3.6 i 3.7

Testarea egalitii dintre mediile: vrsta i modalitile de

petrecere a timpului liber ale respondenilor

n exenplul considerat, statistica test F este mare(5,532) cu o probabilitate asociat Sig(0.02) este mai mic dect 0,05, deci variabila independent explic variaia variabilei dependente. De aici rezult c vrsta persoanelor chestionate influeneaz modul n care i petrec timpul liber. Se poate lua decizia de a respinge ipoteza nul, cu un risc acceptat de 5%.

22

Cap. 4 Analiza asocierii a dou variabile categoriale


Pentru aceast analiz am realizat urmtorii pai: din meniul Analyze Descriptive Statistics Crosstabs. Aici, pe rnduri am ales variabila Surse de venit, iar pe coloane mediul din care face parte, bifnd de la Statistics opiunea Chi-square . Tabelele nr. 4.1 i 4.2 Influena mediului asupra surselor de venit

Tabelul Crosstab ne ajut s interpretm asocierea categoriilor celor dou variabile. Astfel, putem observa c sursele de venit provin n primul rnd din activitatea de baz, n numr de 10 n mediul urban, respectiv 8 n mediul rural.

23

Tabelele nr. 4.3 Asocierea variabilelor

Tabelul Chi Squarse folosete pentru a testa asocierii. Astfel spus, ipoteza presupus adevarat (H0) va confirma c variabilele sunt independente, pe cand ipoteza alternativ (H1) va confirma c variabilele sunt dependente sau asociate. Pentru decizie vom compara valoarea Sigului din tabel cu =0,05, de unde rezult c se respinge ipoteza H0 (Sig< ). Aadar, variabilele sursele de venit i mediul din care face parte, sunt dependente sau asociate, neavnd aceeai proporie.

4.1 Analiza de corelaie pentru dou variabile numerice


Acest tip de analiz am folosit-o pentru a studia intensitatea legturii dintre variabilele Varsta persoanei i Salariul curent. Corelaia o vom exprima prin coeficientul de corelaie Pearson astfel: Analyze Correlate Bivariate Bivariate Correlations, bifnd coeficientul Pearson. Tabel nr. 4.4 Corelarea variabilelor vrsta-salariu

24

Valorile sunt distribuite simetric de o parte si de alta a diagonalei coeficienilor egali cu 1, corespunztori corelaiei fiecarei variabile cu ea insasi. Valoarea coeficientului de corelaie Pearson de 0.74 tinde spre 1 (valoarea corespunztoare unei corelaii perfecte), ceea ce denot faptul c ntre cele dou variabile exist o legtur strns.

4.2 Analiza de regresie simpla liniar

Procesul de estimare a parametrilor unui model de regresie in SPSS presupune parcurgerea meniului meniul Analyze comanda Regression optiunea Linear, am ales cele dou variabile, la Statistics am bifat Estimates i Confidence intervals, iar la Save am bifat Unstandardizad att pentru Predicted Values ct i pentru Residuals. Pentru acest tip de analiz am utilizat dou variabile numerice, i anume: Statut matrimonial (independent), precum Nivel de trai perceput (dependent). Tabelele nr. 4.5 i 4.6 Analiza regresiei liniare simple

25

Interpretare: n interpretarea modelului, se foloseste coeficientul de determinatie R patrat. R [0;1], daca R ptrat este egal cu 0 sau are o valoare foarte mic atunci modelul de regresie ales nu explic legatura dintre variabile. Daca R patrat este egal cu 1, legtura dintre variabile este mai strns. n exemplul de mai sus a rezultat o valoare R=0,073, respective, R Square= 0.005 % , ceea ce ne arata ca intre statutul matrimonial si nivelul de trai perceput exista o diferenta semnificativa. Valoarea Sig=o.687 este mai mare decat 0.05, corespunde unei legaturi nesemnificative intre cele doua variabile.

26

Cap. 5 Analiza grafic a trendului


Dorind s evalum dac exist trend cresctor sau descresctor, am realizat iniial o analiz grafic din meniul Graphs -> Sequence, i astfel am observat c cifra de afaceri pentru S.C.Petrom a variat n timp, n cea mai mare parte acesta avnd o evoluie crescnd, cu toate c n anumii ani, a sczut. Grafic nr. 5.1 Evoluia cifrei de afaceri pe perioada 1999-2013

5.1 Analiza variaiilor sezoniere

27

Pentru aceast etap am definit iniial anul primei nregistrri din meniul Data -> Define Dates, dup care, din meniul Analyze -> Regression -> Curve estimation, am ales ca variabil dependent cifra de afaceri, iar ca variabil independent anii, bifnd csua Time, pentru a determina variaia medie anual a salariilor. De asemenea, modelul ales de noi este cel liniar. Tabel nr. 5.2 Analiza variaiilor sezoniere

Grafic nr. 5.3 Trendul cifrei de afaceri pe perioada analizat, 1999-2013

Att din tabelul nr.5.2 ct i din graficul nr.5.3 putem observa faptul c exist un trend cresctor. Notaia b1 din tabel reprezint variaia medie anual a cifrei de afaceri, iar aceasta

28

avnd o valoare pozitiv (b1>0), i anume 18,994 ,se confirm cele spuse anterior. Totodat, putem spune c n medie, salariile au variat anual cu 1.053.213.725,796 Ron. Prognoza cifrei de afaceri n timp am realizat-o din meniul Analyze -> Regression -> Curve Estimation. Variabila dependent este i cifra de afaceri, am bifat iar csua Time, iar la Save am ales opiunea Predicted values. La Predict through am introdus anul 2013, acesta fiind orizontul de prognoz pentru care am dorit s estimm valoare salariului. Astfel, ne ateptm ca n anul 2013, cifra de afaceri pentru compania SC.PETROM s fie de 18.619.754.703.8valoare calculat i luat din baza noastr de date. Tabel nr.5.4 Prognoza cifrei de afaceri

29

Bibliografie

1. Jaba Elisabeta, Statistic, ediia a III-a, Editura Economic, Bucureti, 2002; 2. Jaba Elisabeta, Grama, A., Analiza statistic cu SPSS sub Windows, Editura Polirom, 2004;

30