Sunteți pe pagina 1din 26

Universitatea Alexandru Ioan Cuza Facultatea de Economie i Administrarea Afacerilor

Disciplina: Statistic pentru afaceri

Proiect semestrial SPSS

Coordonator: Prof.univ.dr. Elisabeta Jaba

Student: Fotea Mihaela MC MRU, An I

Cuprins

Cuprins .........................................................................................................................................................2 Cap.1 Prezentarea i descrierea statistic a unui eantion observant ...........................................................3 1.1 Descrierea problemei de studiat i alegerea variabilelor analizate ......................................................3 1.2 Realizarea bazei de date n SPSS i definirea variabilelor ..................................................................3 1.1.1 Descrierea statistic a variabilelor nominale ............................................................................5 1.1.2 Descrierea statistic a valorilor numerice .................................................................................7 Cap. 2 Estimarea prin interval de ncredere a parametrilor distribuiilor considerate .................................13 2.1 Estimarea mediei prin interval de ncredere......................................................................................13 2.2 Estimarea proporiei .........................................................................................................................14 Cap. 3 Testarea ipotezelor statistice ...........................................................................................................16 3.1 Testarea egalitii unei medii cu o valoare specificat ......................................................................16 3.2 Testarea diferenei dintre dou medii ..............................................................................................18 3.3 Testarea egalitii dintre dou medii................................................................................................19 Cap. 4 Analiza asocierii a dou variabile categoriale .................................................................................20 4.1 Analiza de corelaie pentru dou variabile numerice ........................................................................21 4.2 Analiza de regresie simpla liniar .....................................................................................................22 Cap. 5 Analiza grafic a trendului ..............................................................................................................23 5.1 Analiza variaiilor sezoniere .............................................................................................................24 Bibliografie ................................................................................................................................................26

Cap.1 Prezentarea i descrierea statistic a unui eantion observant

1.1.

Descrierea problemei de studiat i alegerea variabilelor analizate


Acest studiu are la baz opinia oamenilor n legtur cu o serie de aspecte din viaa lor

cum ar fi: nivelul de trai, modalitile de petrcere a timpului liber, preocupri, salariu etc. Prin intermediul acestui studiu am dorit s aflm cum apreciaz indivizii nivelul de trai prin prisma salariului raportat la o serie de factori : ocupaia, vrsta, vechimea, nivelul de educaie etc. Pentru a analiza acest subiect s-a aplicat un chestionar unui eantion de 1500 de persoane, din judeul Iai cu vrsta cuprins ntre 19 i 69 de ani. Chestionarul este format dintr-un set de ntrebri deschise i nchise referitoare la situaia financiar prezent raportat la cea din trecut. Pentru acest proiect am realizat o baz de date pentru un eantion de 33 de persoane, modificnd astfel i structura chestionarului deoarece acesta este un proiect didactic i nu este just s utilizez o baz de date prea complex la care am lucrat anterior. Variabilele menionate mai sus vor constitui baza de date din SPSS, numit Date generale.

1.2 Realizarea bazei de date n SPSS i definirea variabilelor


Atributele acestor variabile sunt definite n fereastra Data Editor Variable View. Vor fi introduse, genul, ocupaia (director, profesor, medic, infirmier), educaia, salariul, vechimea statutul, timp liber, concediu, localitate. Mai departe, alegem tipul variabilelor: numerice ( vrsta, salariul, timpul, mediu,vechimea) i string ( genul, cheltuieli, ocupaie i venit).

Tabel nr. .1.1 Introducerea variabilelor n baza de date, realizat n SPSS

Iar baza de date va fi urmtoarea: Tabel nr. 1.2 Transformarea bazei de date n SPSS, folosind Data View

1.1.1 Descrierea statistic a variabilelor nominale


Vom analiza drept variabile nominale, ocupaia i genul persoanelor chestionate. Vom selecta meniul Analyze Descriptive Statistics Frequencies Statistics ( unde la Central Tendency vom bifa Mode) i Charts (unde la Chart Type vom bifa Pie, iar la Chart Value - Frequencies). Astfel, se obin urmtoarele rezultate: Tabelul nr 1.3 Sexul respondentului

Interpretare: n tabelul 1.3 putem observa c, dintr-un total de 33 de respondeni, 18 dintre acetia au fost brbai, n timp ce restul respondenilor, respectiv 15 au fost femei. Tabelul nr 1.4 Ocupaia persoanelor cuprinse n eantionul analizat

Interpretare: Att din tabelul nr. 1.4, ct i din graficul urmtor, putem observa c din totalul celor chestionai, cei mai muli au fost studeni, cu o pondere de 12.1%, urmnd profesorii,

managerii, pensionarii, infirmierii i omerii cu un procent de 9.1% i cu un procentaj de 6.1% contabilii, medicii, zidarii etc. Figura nr. 1.5 Ponderea persoanelor cuprinse n eantion, n funcie de ocupaia acestora

Figura nr. 1.6 Ponderea persoanelor cuprinse n eantion, n funcie de sexul acestora

1.1.2 Descrierea statistic a valorilor numerice


Pentru a reda variabilele numerice (salariul i vrsta), din meniul Analyze alegem Descriptive Statistics Frequencies( la opiunea Dispersion selectm St.deviation, minimum i maximum, iar la optiunea Central Tendency selectm Mean), iar la Chart optm pentru diagrama de tip Histogram cu curb normal. Astfel s-au obinut urmtoarele rezultate: Tabelul nr 1.7 Parametrii distribuiei, salariul i vrsta indivizilor

Din figura 1.7 putem observa o analiz a vrstei i a salariului lunar. Vrsta minim a persoanelor din eantion este de 18 ani, cea maxim de 69 ani. Avem afiat i o medie a vrstei, de 37,21 ani. Abaterea medie ptratic (std. deviation): n medie, vrsta fiecrei persoane se abate de la vrsta medie cu 12.754 n plus sau n minus. Avem i un salariu lunar minim de 299 lei i un salariu maxim de 6400 lei, iar salariul mediu este de 1799.30 lei. La fel ca i n cazul vrstei avem o abatere medie ptratic de 1764.324 +/-. Din bara de meniu utilizm comanda AnalyzeDescriptive Statistics Descriptives Options i selectm urmatorii parametri: valoarea medie (mean), abaterea medie patratic ( s t d . deviation), variana, coeficientul de asimetrie (skewness), de boltire (kurtosis) si variable list. Am fcut acest lucru pentru 3 variabile (vrsta indivizilor din eantion, salariul lunar i modaliti de petrecere a timpului liber). Se obin urmtoarele rezultate: Tabelul nr. 1.8 Corelaia existent ntre cele trei variabile

Utiliznd comanda Analyze Descriptive Statistics Frequencies Statistics i selectnd urmatorii parametri: valoarea medie (mean), mediana, modala, valorile quartile, abaterea medie patratic ( s t d . deviation), variana, coeficientul de asimetrie (skewness), de boltire (kurtosis). n fereastra Charts selectm i opiunea Histogram/With normal curve. Pentru realizarea acestui lucru am folosit aceleai variabile de la figura 1.8. Rezultatul a fost : Tabelul nr. 1.9 Parametrii repartiiei unidimensionale

Interpretare: Media(mean): vrsta medie a persoanelor din eantion este de 37,21 ani; venit lunar mediu de 1799,30 Ron; Modalitatea de petrecere a timpului liber n medie este de 2,21 jumtate din cei chestionai au vrsta n medie de 37 de ani au un venit de pn la 1200 Ron; i petrec vacanele n straintate de 2 ori pe an Cei mai muli dintre cei chestionai au 45 ani cei mai muli dintre cei chestionai au un venit de 1200 Ron
8

Mediana(median):

Modul (mode):

cei mai muli prefer s-i petreac timpul liber 1 dat pe an n medie, vrsta fiecrei persoane se abate de la vrsta medie cu 12.754, n plus sau n minus; venitul lunar al unei persoane se abate de la venitul lunar mediu, n plus sau n minus, cu 1764.324; durata timpului petrecut se abate de la cea medie cu 1,19 ori pe an. Skewness: n ceea ce privete parametrii formei, se observ c seria asimetric pozitiv, predomin persoanele de vrsta a doua (skewness >0); Kurtosis: n cazul nostru, distribuia are o boltire alungit.

Abaterea medie ptratic (std. deviation):

Tabelul nr.1.10 Structura persoanelor cuprinse n eantion, n funcie de vrsta acestora

Tabelul nr.1.11 Structura persoanelor cuprinse n eantion, n funcie de salariul lunar al acestora

Tabelul nr.1.12 Modalitile respondenilor de petrecere a timpului liber

10

n tabelul de frecven pentru variabila Modaliti de petrecere a timpului liber se poate observa c 12 indivizi i petrec timpul liber plimbndu-se, 9 i petrec vacanele n strinatate, 8 indivizi merg n ar n vacane, iar ultimele 4 persoane i petrec timpul liber mergnd la teatru/oper (2) i participnd la diferite activiti extracurriculare. Grafic nr. 1.13 Distribuia salariului lunar al respondenilor, n jurul mediei

Grafic nr. 1.14 Distribuia respondenilor n funcie de vrst, n jurul mediei

11

Grafic nr. 1.15 Distribuia respondenilor n funcie de modalitile de petrecere a timpului liber, n jurul mediei

12

Cap. 2 Estimarea prin interval de ncredere a parametrilor distribuiilor considerate

2.1.

Estimarea mediei prin interval de ncredere


Pentru estimarea mediei am ales variabila Salariul; selectm din meniul Analyse

comanda Descriptives Statistics- opiunea Explore, iar din fereastra Explore, selectm variabila dorit i o mutm n zona Dependent List. Apoi activm butonul de comand Statistics, care deschide fereastra Explore Statistics i bifm caseta de validare Descriptives, preciznd n caseta Confidence Interval for Mean, nivelul de ncredere de 95%. Se obin urmtoarele date: Tabelele nr. 2.1 i 2.2 Estimarea mediei prin intervalul de ncredere

Interpretare: cu o probabilitate de 95% putem afirma c salariul mediu al unui angajat este ntre 1173.70 RON i 2424.91 RON.
13

Grafic nr. 2.3 Boxplot pentru variabila salariul lunar

2.2.Estimarea proporiei
Vom efectua o serie de pai pentru a determina intervalul de ncredere pentru o proporie. Pentru a calcula estimaia proporiei pentru categoria Student, din meniul Analyze, comanda Descriptive Statistics, opiunea Frequencies, aflm valoarea variabilei Z pentru un nivel de ncredere de 95% (Z=1,96), calculm abaterea standard dup relaia

este abaterea (deviaia) standard, iar n este volumul eantionului i calculm limitele intervalului cu formula f .
14

Tabelele nr. 2.4 i 2.5 Estimarea proporiei prin intervalul de ncredere

Se poate observa c proporia angajailor care ocup funcia de student este de 12.1%. Calculm pentru f = 12.1% : = =0,003

Calculm limitele I.C. pentru z = 1,96: = f 1,96 = f + 1,96 = 0,121 - 1,96 0,07 = -0,128 = 0,121 + 1,96 0,07 = 0,25

Interpretare: cu o probabilitate de 95%, putem afirma c ponderea persoanelor din categoria Student la nivelul populaiei este acoperit de intervalul [-0,128; 0,25] sau c ponderea acestora este cuprins ntre -12,8% i 25%.

15

Cap. 3 Testarea ipotezelor statistice 3.1. Testarea egalitii unei medii cu o valoare specificat
Pentru a testa egalitatea unei medii cu o variabil specificat am ales variabila Salariu. Se va analiza dac salariul curent al unui angajat difer sau nu de 700 RON . Testarea egalitii salariului mediu la nivel de eantion cu o valoare fix se realizeaz cu opiunea One Sample T Test, care presupune parcurgerea urmtoarelor etape: din meniul Analyze, alegem comanda Compare Means i opiunea One-Sample T Test. Dup alegerea opiunii One Sample T Test, selectm din fereastr variabila Salariu i o mutm n zona Test Variable(s), specificm valoarea dorit, 700, n zona de editare Test Value; apoi activm butonul de comand Options i n zona Confidence Interval, alegem gradul de ncredere de 95%. Dup ce acionm butonul Continue i apoi OK obinem urmtoarele tabele: Tabelele nr. 3.1 i 3.2 Testatea egalitii unei medii cu o valoare specificat

Interpretare: se poate observa c valoarea nivelului de semnificaie Sig. egal cu 0,001 este mai mic dect valoarea 0,05, considerat n Confidence Interval din Options, ceea ce evideniaz existena unei diferene semnificative ntre valoarea medie a salariului observat n eantion i cea specificat, de 700 RON (ipoteza nul se respinge).

16

Testarea egalitii unei medii cu o valoare specificat se poate realiza i printr-un procedeu grafic: Error Bar. Diagrama Error Bar descrie intervalul de ncredere de 95% a mediei pentru variabila Salariu, adic intervalul care acoper valoarea medie, cu o probabilitate de 95%. Pentru a obine diagrama Error Bar, selectm din meniul Graphs comanda Error Bar, alegem tipul simple i butonul de opiuni Summaries of separate variables. Apoi din butonul Define alegem Define Simple Error Bar, selectm variabila Salariu i o mutam n zona Error Bars. Grafic nr.3.3 Diagrama Error Bar pentru variabila salariu

Interpretare: Se poate observa c i prin procedeul Error Bar, cu o probabilitate de 95% se respinge ipoteza nul, de egalitate a salariului mediu al persoanelor din eantion cu o valoare specificat (700); aceast valoare (700) nu este cuprins n intervalul de ncredere [1000; 2500].

17

3.2 Testarea diferenei dintre dou medii


Testarea se realizeaz cu ajutorul testului Independent-Samples T Test. Demersul este: Analyze Compare Means Independent-Samples T Test. Se va testa dac bugetul alocat nainte de criz este acelai pentru genul feminin i masculin. Ipoteza privind egalitatea mediilor se formuleaz astfel: H0: X 1= X 2 H1: X 1 X 2 Tabelele nr. 3.4 i 3.5 Testarea diferenei dintre mediile: salariul i sexul respondenilor

Interpretare: Testul t este egal cu 0,99 respectiv cu 1,04 cu o probabilitate Sig. de 0,325i 0,307>0,05, ceea ce arat c bugetul lunar pentru cele dou sexe (2079 Ron pentru masculin i 1463 pentru femenin) ceea ce arat c ntre cele dou medii exist diferene semnificative.

18

3.3 Testarea egalitii dintre dou medii


Din meniul Analyze Compare Means One-way Anova introducem variabila cantitativ vrsta dependent de variabila modaliti de petrecere a timpului liber. H0: Vrsta persoanelor chestionate nu influeneaz modul de a-i petrece timpul liber. H1: Vrsta persoanelor chestionate influeneaz modul de a-i petrece timpul liber. Tabelele nr. 3.6 i 3.7 Testarea egalitii dintre mediile: vrsta i modalitile de

petrecere a timpului liber ale respondenilor

Valoarea Sig = 0.02 pentru F este mai mic dect 0,05, deci variabila independent explic variaia variabilei dependente. De aici rezult c vrsta persoanelor chestionate influeneaz modul n care i petrec timpul liber. Se poate lua decizia de a respinge ipoteza nul, cu un risc acceptat de 5%.

19

Cap. 4 Analiza asocierii a dou variabile categoriale


Pentru aceast analiz am realizat urmtorii pai: din meniul Analyze Descriptive Statistics Crosstabs. Aici, pe rnduri am ales variabila Surse de venit, iar pe coloane mediul din care face parte, bifnd de la Statistics opiunea Chi-square . Tabelele nr. 4.1 i 4.2 Influena mediului asupra surselor de venit

Tabelul Crosstab ne ajut s interpretm asocierea categoriilor celor dou variabile. Astfel, putem observa c sursele de venit provin n primul rnd din activitatea de baz, n numr de 10 n mediul urban, respectiv 8 n mediul rural.

20

Tabelele nr. 4.3 Asocierea variabilelor

Tabelul Chi Squarse folosete pentru a testa asocierii. Astfel spus, ipoteza presupus adevarat (H0) va confirma c variabilele sunt independente, pe cand ipoteza alternativ (H1) va confirma c variabilele sunt dependente sau asociate. Pentru decizie vom compara valoarea Sigului din tabel cu =0,05, de unde rezult c se respinge ipoteza H0 (Sig< ). Aadar, variabilele sursele de venit i mediul din care face parte, sunt dependente sau asociate, neavnd aceeai proporie.

4.1 Analiza de corelaie pentru dou variabile numerice


Acest tip de analiz am folosit-o pentru a studia intensitatea legturii dintre variabilele Nivelul de educaie i Salariul curent. Corelaia o vom exprima prin coeficientul de corelaie Pearson astfel: Analyze Correlate Bivariate, bifnd coeficientul Pearson. Tabel nr. 4.4 Corelarea variabilelor vrsta-salariu

21

Valoarea coeficientului de corelaie Pearson de 0.74 tinde spre 1 (valoarea corespunztoare unei corelaii perfecte), ceea ce denot faptul c ntre cele dou variabile exist o legtur strns.

4.2 Analiza de regresie simpla liniar


Pentru acest tip de analiz am utilizat dou variabile numerice, i anume: Statut matrimonial (independent), precum Nivel de trai perceput (dependent). Astfel, din meniul Analyze Regression Linear, am ales cele dou variabile, la Statistics am bifat Estimates i Confidence intervals, iar la Save am bifat Unstandardizad att pentru Predicted Values ct i pentru Residuals. Tabelele nr. 4.5 i 4.6 Analiza regresiei liniare simple

Interpretare: 1. R [0;1], iar cu ct valoarea lui R este mai aproape de 0, cu att legtura este mai slab ntre cele dou variabile i cu ct este mai aproape de 1, legtura este mai strns. Astfel, R=0,73 arat o legtur strns ntre cele dou variabile analizate. 2. R Square ne atar c 0.005 % din variaia salariului este explicat de variaia nivelului de educaie.
22

Cap. 5 Analiza grafic a trendului


Dorind s evalum dac exist trend cresctor sau descresctor, am realizat iniial o analiz grafic din meniul Graphs -> Sequence, i astfel am observat c cifra de afaceri pentru S.C.Petrom a variat n timp, n cea mai mare parte acesta avnd o evoluie crescnd, cu toate c n anumii ani, a sczut. Grafic nr. 5.1 Evoluia cifrei de afaceri pe perioada 1999-2013

23

5.1 Analiza variaiilor sezoniere


Pentru aceast etap am definit iniial anul primei nregistrri din meniul Data -> Define Dates, dup care, din meniul Analyze -> Regression -> Curve estimation, am ales ca variabil dependent cifra de afaceri, iar ca variabil independent anii, bifnd csua Time, pentru a determina variaia medie anual a salariilor. De asemenea, modelul ales de noi este cel liniar. Tabel nr. 5.2 Analiza variaiilor sezoniere

Grafic nr. 5.3 Trendul cifrei de afaceri pe perioada analizat, 1999-2013

24

Att din tabelul nr.5.2 ct i din graficul nr.5.3 putem observa faptul c exist un trend cresctor. Notaia b1 din tabel reprezint variaia medie anual a cifrei de afaceri, iar aceasta avnd o valoare pozitiv (b1>0), i anume 18,994 ,se confirm cele spuse anterior. Totodat, putem spune c n medie, salariile au variat anual cu 1.053.213.725,796 Ron. Prognoza cifrei de afaceri n timp am realizat-o din meniul Analyze -> Regression -> Curve Estimation. Variabila dependent este i cifra de afaceri, am bifat iar csua Time, iar la Save am ales opiunea Predicted values. La Predict through am introdus anul 2013, acesta fiind orizontul de prognoz pentru care am dorit s estimm valoare salariului. Astfel, ne ateptm ca n anul 2013, cifra de afaceri pentru compania SC.PETROM s fie de 18.619.754.703.8valoare calculat i luat din baza noastr de date. Tabel nr.5.4 Prognoza cifrei de afaceri

25

Bibliografie

1. Jaba Elisabeta, Statistic, ediia a III-a, Editura Economic, Bucureti, 2002; 2. Jaba Elisabeta, Grama, A., Analiza statistic cu SPSS sub Windows, Editura Polirom, 2004;

26