Documente Academic
Documente Profesional
Documente Cultură
Cuprins
Cuprins .........................................................................................................................................................2 Cap.1 Prezentarea i descrierea statistic a unui eantion observant ...........................................................3 1.1 Descrierea problemei de studiat i alegerea variabilelor analizate ......................................................3 1.2 Realizarea bazei de date n SPSS i definirea variabilelor ..................................................................3 1.1.1 Descrierea statistic a variabilelor nominale ............................................................................5 1.1.2 Descrierea statistic a valorilor numerice .................................................................................7 Cap. 2 Estimarea prin interval de ncredere a parametrilor distribuiilor considerate .................................13 2.1 Estimarea mediei prin interval de ncredere......................................................................................13 2.2 Estimarea proporiei .........................................................................................................................14 Cap. 3 Testarea ipotezelor statistice ...........................................................................................................16 3.1 Testarea egalitii unei medii cu o valoare specificat ......................................................................16 3.2 Testarea diferenei dintre dou medii ..............................................................................................18 3.3 Testarea egalitii dintre dou medii................................................................................................19 Cap. 4 Analiza asocierii a dou variabile categoriale .................................................................................20 4.1 Analiza de corelaie pentru dou variabile numerice ........................................................................21 4.2 Analiza de regresie simpla liniar .....................................................................................................22 Cap. 5 Analiza grafic a trendului ..............................................................................................................23 5.1 Analiza variaiilor sezoniere .............................................................................................................24 Bibliografie ................................................................................................................................................26
1.1.
cum ar fi: nivelul de trai, modalitile de petrcere a timpului liber, preocupri, salariu etc. Prin intermediul acestui studiu am dorit s aflm cum apreciaz indivizii nivelul de trai prin prisma salariului raportat la o serie de factori : ocupaia, vrsta, vechimea, nivelul de educaie etc. Pentru a analiza acest subiect s-a aplicat un chestionar unui eantion de 1500 de persoane, din judeul Iai cu vrsta cuprins ntre 19 i 69 de ani. Chestionarul este format dintr-un set de ntrebri deschise i nchise referitoare la situaia financiar prezent raportat la cea din trecut. Pentru acest proiect am realizat o baz de date pentru un eantion de 33 de persoane, modificnd astfel i structura chestionarului deoarece acesta este un proiect didactic i nu este just s utilizez o baz de date prea complex la care am lucrat anterior. Variabilele menionate mai sus vor constitui baza de date din SPSS, numit Date generale.
Iar baza de date va fi urmtoarea: Tabel nr. 1.2 Transformarea bazei de date n SPSS, folosind Data View
Interpretare: n tabelul 1.3 putem observa c, dintr-un total de 33 de respondeni, 18 dintre acetia au fost brbai, n timp ce restul respondenilor, respectiv 15 au fost femei. Tabelul nr 1.4 Ocupaia persoanelor cuprinse n eantionul analizat
Interpretare: Att din tabelul nr. 1.4, ct i din graficul urmtor, putem observa c din totalul celor chestionai, cei mai muli au fost studeni, cu o pondere de 12.1%, urmnd profesorii,
managerii, pensionarii, infirmierii i omerii cu un procent de 9.1% i cu un procentaj de 6.1% contabilii, medicii, zidarii etc. Figura nr. 1.5 Ponderea persoanelor cuprinse n eantion, n funcie de ocupaia acestora
Figura nr. 1.6 Ponderea persoanelor cuprinse n eantion, n funcie de sexul acestora
Din figura 1.7 putem observa o analiz a vrstei i a salariului lunar. Vrsta minim a persoanelor din eantion este de 18 ani, cea maxim de 69 ani. Avem afiat i o medie a vrstei, de 37,21 ani. Abaterea medie ptratic (std. deviation): n medie, vrsta fiecrei persoane se abate de la vrsta medie cu 12.754 n plus sau n minus. Avem i un salariu lunar minim de 299 lei i un salariu maxim de 6400 lei, iar salariul mediu este de 1799.30 lei. La fel ca i n cazul vrstei avem o abatere medie ptratic de 1764.324 +/-. Din bara de meniu utilizm comanda AnalyzeDescriptive Statistics Descriptives Options i selectm urmatorii parametri: valoarea medie (mean), abaterea medie patratic ( s t d . deviation), variana, coeficientul de asimetrie (skewness), de boltire (kurtosis) si variable list. Am fcut acest lucru pentru 3 variabile (vrsta indivizilor din eantion, salariul lunar i modaliti de petrecere a timpului liber). Se obin urmtoarele rezultate: Tabelul nr. 1.8 Corelaia existent ntre cele trei variabile
Utiliznd comanda Analyze Descriptive Statistics Frequencies Statistics i selectnd urmatorii parametri: valoarea medie (mean), mediana, modala, valorile quartile, abaterea medie patratic ( s t d . deviation), variana, coeficientul de asimetrie (skewness), de boltire (kurtosis). n fereastra Charts selectm i opiunea Histogram/With normal curve. Pentru realizarea acestui lucru am folosit aceleai variabile de la figura 1.8. Rezultatul a fost : Tabelul nr. 1.9 Parametrii repartiiei unidimensionale
Interpretare: Media(mean): vrsta medie a persoanelor din eantion este de 37,21 ani; venit lunar mediu de 1799,30 Ron; Modalitatea de petrecere a timpului liber n medie este de 2,21 jumtate din cei chestionai au vrsta n medie de 37 de ani au un venit de pn la 1200 Ron; i petrec vacanele n straintate de 2 ori pe an Cei mai muli dintre cei chestionai au 45 ani cei mai muli dintre cei chestionai au un venit de 1200 Ron
8
Mediana(median):
Modul (mode):
cei mai muli prefer s-i petreac timpul liber 1 dat pe an n medie, vrsta fiecrei persoane se abate de la vrsta medie cu 12.754, n plus sau n minus; venitul lunar al unei persoane se abate de la venitul lunar mediu, n plus sau n minus, cu 1764.324; durata timpului petrecut se abate de la cea medie cu 1,19 ori pe an. Skewness: n ceea ce privete parametrii formei, se observ c seria asimetric pozitiv, predomin persoanele de vrsta a doua (skewness >0); Kurtosis: n cazul nostru, distribuia are o boltire alungit.
Tabelul nr.1.11 Structura persoanelor cuprinse n eantion, n funcie de salariul lunar al acestora
10
n tabelul de frecven pentru variabila Modaliti de petrecere a timpului liber se poate observa c 12 indivizi i petrec timpul liber plimbndu-se, 9 i petrec vacanele n strinatate, 8 indivizi merg n ar n vacane, iar ultimele 4 persoane i petrec timpul liber mergnd la teatru/oper (2) i participnd la diferite activiti extracurriculare. Grafic nr. 1.13 Distribuia salariului lunar al respondenilor, n jurul mediei
11
Grafic nr. 1.15 Distribuia respondenilor n funcie de modalitile de petrecere a timpului liber, n jurul mediei
12
2.1.
comanda Descriptives Statistics- opiunea Explore, iar din fereastra Explore, selectm variabila dorit i o mutm n zona Dependent List. Apoi activm butonul de comand Statistics, care deschide fereastra Explore Statistics i bifm caseta de validare Descriptives, preciznd n caseta Confidence Interval for Mean, nivelul de ncredere de 95%. Se obin urmtoarele date: Tabelele nr. 2.1 i 2.2 Estimarea mediei prin intervalul de ncredere
Interpretare: cu o probabilitate de 95% putem afirma c salariul mediu al unui angajat este ntre 1173.70 RON i 2424.91 RON.
13
2.2.Estimarea proporiei
Vom efectua o serie de pai pentru a determina intervalul de ncredere pentru o proporie. Pentru a calcula estimaia proporiei pentru categoria Student, din meniul Analyze, comanda Descriptive Statistics, opiunea Frequencies, aflm valoarea variabilei Z pentru un nivel de ncredere de 95% (Z=1,96), calculm abaterea standard dup relaia
este abaterea (deviaia) standard, iar n este volumul eantionului i calculm limitele intervalului cu formula f .
14
Se poate observa c proporia angajailor care ocup funcia de student este de 12.1%. Calculm pentru f = 12.1% : = =0,003
Calculm limitele I.C. pentru z = 1,96: = f 1,96 = f + 1,96 = 0,121 - 1,96 0,07 = -0,128 = 0,121 + 1,96 0,07 = 0,25
Interpretare: cu o probabilitate de 95%, putem afirma c ponderea persoanelor din categoria Student la nivelul populaiei este acoperit de intervalul [-0,128; 0,25] sau c ponderea acestora este cuprins ntre -12,8% i 25%.
15
Cap. 3 Testarea ipotezelor statistice 3.1. Testarea egalitii unei medii cu o valoare specificat
Pentru a testa egalitatea unei medii cu o variabil specificat am ales variabila Salariu. Se va analiza dac salariul curent al unui angajat difer sau nu de 700 RON . Testarea egalitii salariului mediu la nivel de eantion cu o valoare fix se realizeaz cu opiunea One Sample T Test, care presupune parcurgerea urmtoarelor etape: din meniul Analyze, alegem comanda Compare Means i opiunea One-Sample T Test. Dup alegerea opiunii One Sample T Test, selectm din fereastr variabila Salariu i o mutm n zona Test Variable(s), specificm valoarea dorit, 700, n zona de editare Test Value; apoi activm butonul de comand Options i n zona Confidence Interval, alegem gradul de ncredere de 95%. Dup ce acionm butonul Continue i apoi OK obinem urmtoarele tabele: Tabelele nr. 3.1 i 3.2 Testatea egalitii unei medii cu o valoare specificat
Interpretare: se poate observa c valoarea nivelului de semnificaie Sig. egal cu 0,001 este mai mic dect valoarea 0,05, considerat n Confidence Interval din Options, ceea ce evideniaz existena unei diferene semnificative ntre valoarea medie a salariului observat n eantion i cea specificat, de 700 RON (ipoteza nul se respinge).
16
Testarea egalitii unei medii cu o valoare specificat se poate realiza i printr-un procedeu grafic: Error Bar. Diagrama Error Bar descrie intervalul de ncredere de 95% a mediei pentru variabila Salariu, adic intervalul care acoper valoarea medie, cu o probabilitate de 95%. Pentru a obine diagrama Error Bar, selectm din meniul Graphs comanda Error Bar, alegem tipul simple i butonul de opiuni Summaries of separate variables. Apoi din butonul Define alegem Define Simple Error Bar, selectm variabila Salariu i o mutam n zona Error Bars. Grafic nr.3.3 Diagrama Error Bar pentru variabila salariu
Interpretare: Se poate observa c i prin procedeul Error Bar, cu o probabilitate de 95% se respinge ipoteza nul, de egalitate a salariului mediu al persoanelor din eantion cu o valoare specificat (700); aceast valoare (700) nu este cuprins n intervalul de ncredere [1000; 2500].
17
Interpretare: Testul t este egal cu 0,99 respectiv cu 1,04 cu o probabilitate Sig. de 0,325i 0,307>0,05, ceea ce arat c bugetul lunar pentru cele dou sexe (2079 Ron pentru masculin i 1463 pentru femenin) ceea ce arat c ntre cele dou medii exist diferene semnificative.
18
Valoarea Sig = 0.02 pentru F este mai mic dect 0,05, deci variabila independent explic variaia variabilei dependente. De aici rezult c vrsta persoanelor chestionate influeneaz modul n care i petrec timpul liber. Se poate lua decizia de a respinge ipoteza nul, cu un risc acceptat de 5%.
19
Tabelul Crosstab ne ajut s interpretm asocierea categoriilor celor dou variabile. Astfel, putem observa c sursele de venit provin n primul rnd din activitatea de baz, n numr de 10 n mediul urban, respectiv 8 n mediul rural.
20
Tabelul Chi Squarse folosete pentru a testa asocierii. Astfel spus, ipoteza presupus adevarat (H0) va confirma c variabilele sunt independente, pe cand ipoteza alternativ (H1) va confirma c variabilele sunt dependente sau asociate. Pentru decizie vom compara valoarea Sigului din tabel cu =0,05, de unde rezult c se respinge ipoteza H0 (Sig< ). Aadar, variabilele sursele de venit i mediul din care face parte, sunt dependente sau asociate, neavnd aceeai proporie.
21
Valoarea coeficientului de corelaie Pearson de 0.74 tinde spre 1 (valoarea corespunztoare unei corelaii perfecte), ceea ce denot faptul c ntre cele dou variabile exist o legtur strns.
Interpretare: 1. R [0;1], iar cu ct valoarea lui R este mai aproape de 0, cu att legtura este mai slab ntre cele dou variabile i cu ct este mai aproape de 1, legtura este mai strns. Astfel, R=0,73 arat o legtur strns ntre cele dou variabile analizate. 2. R Square ne atar c 0.005 % din variaia salariului este explicat de variaia nivelului de educaie.
22
23
24
Att din tabelul nr.5.2 ct i din graficul nr.5.3 putem observa faptul c exist un trend cresctor. Notaia b1 din tabel reprezint variaia medie anual a cifrei de afaceri, iar aceasta avnd o valoare pozitiv (b1>0), i anume 18,994 ,se confirm cele spuse anterior. Totodat, putem spune c n medie, salariile au variat anual cu 1.053.213.725,796 Ron. Prognoza cifrei de afaceri n timp am realizat-o din meniul Analyze -> Regression -> Curve Estimation. Variabila dependent este i cifra de afaceri, am bifat iar csua Time, iar la Save am ales opiunea Predicted values. La Predict through am introdus anul 2013, acesta fiind orizontul de prognoz pentru care am dorit s estimm valoare salariului. Astfel, ne ateptm ca n anul 2013, cifra de afaceri pentru compania SC.PETROM s fie de 18.619.754.703.8valoare calculat i luat din baza noastr de date. Tabel nr.5.4 Prognoza cifrei de afaceri
25
Bibliografie
1. Jaba Elisabeta, Statistic, ediia a III-a, Editura Economic, Bucureti, 2002; 2. Jaba Elisabeta, Grama, A., Analiza statistic cu SPSS sub Windows, Editura Polirom, 2004;
26