Sunteți pe pagina 1din 15

Universitatea Dunarea de Jos Galati

Facultatea de Economie si Administrarea Afacerilor

Instrumente software pentru prelucrarea statistica a datelor

Proiect semestrial
SPSS

SIMR II

Cuprins

1.

Descrierea problemei de studiat si alegerea variabilelor analizate.......................................................3

2.

Realizarea bazei de date in SPSS si definirea variabilelor...................................................................3

3.

Indicatorii tendintei centrale................................................................................................................4


3.1. Media aritmetica..............................................................................................................................4
3.2. Modulul............................................................................................................................................6
3.3. Mediana............................................................................................................................................6
3.4. Media geometrica.............................................................................................................................7

4.

Indicatorii variatiei..............................................................................................................................8
4.1. Dispersia...........................................................................................................................................8
4.2. Amplitudinea....................................................................................................................................8
4.3. Abaterea standard.............................................................................................................................9
4.4. Coeficientul de variatie.....................................................................................................................9

5.

Tabel de frecventa..............................................................................................................................10
5.1. Tabel de frecventa pentru o variabila calitativa...............................................................................10
5.2. Tabel de frecventa pentru o variabila cantitativa.............................................................................10

6.

Grafic de tip pie..............................................................................................................................11

7.

Coeficientul de corelatie Pearson.......................................................................................................11

8.

Testarea ipotezelor statistice..............................................................................................................12


8.1. Testarea egalitatii unei medii cu o valoare specificata....................................................................12
8.2. Testarea diferentei intre 2 medii......................................................................................................13

9.

Impartirea unei variabile cantitative in interval.................................................................................13

10. Ecuatia de regresie..............................................................................................................................14

1. Descrierea problemei de studiat si alegerea variabilelor


analizate
Scopul acestui studiu a fost aflarea opiniei oamenilor in legatura cu mai multe aspect din
viata lor, cum ar fi: modalitatile de petrecere a timpului liber, ocupatia, nivelul de trai, salariul.
Pe scurt, prin intermediul acestui studiu am dorit sa aflam cum apreciaza oamenii nivelul
lor de trai prin prisma salariului, raportat la o serie de factori: varsta, vechime, numarul
membrilor din familie, nivelul de educatie etc.
Pentru a analiza acest subiect si a obtine niste rezultate cat mai apropiate de adevar,
chestionarul ar trebui sa fie aplicat unui esantion mult mai mare insa pentru acest proiect am
realizat o baza de date cu un esantion de 30 de personae cu varsta cuprinsa intre 18 si 77 de ani.
Chestionarul este format dintr-un set de intrebari deschise dar si cateva confidential referitoare la
situatia financiara prezenta raportata la cea din trecut.

2. Realizarea bazei de date in SPSS si definirea variabilelor


Atributele variabilelor sunt definite in fereastra Data View Variable View.
Definirea variabilelor in baza de date, prin fereastra Variable View:

Popularea bazei de date, folosind fereastra Data View:

3. Indicatorii tendintei centrale


3.1. Media aritmetica
Am calculat media aritmetica a tuturor variabilelor de tip numeric (membri_familie, varsta,
educatie, trai, timp_liber,concediu si vechime)

Ca atare, pentru:
-

numarului membrilor din familie in medie cei 30 de intervievati au aproximativ cate 4


membri in familie.

varsta intervievatilor este in medie de 38 de ani.

au un salariu de aproximativ 1687 lei

in medie, nivelul de educatie se afla intre liceu si postliceala

nivelul de trai in medie, printre cei 30 de intervievati este aproximav la fel

ca modalitati de petrecere a timpului liber prefera vacantele in tara sau in strainatate

media zilelor de concediu se afla intre 10 si 15 zile

vechimea in munca aproximativ 5-10 ani.


Prin intermediul meniului Analyze ->Compare Means->Means am calculat:

media aritmetica a salariului in functie de varsta

media aritmetica a varstei in functie de sex

media aritmetica a numarului membrilor din familie in functie de mediul de provenienta

De unde rezulta ca, atat in mediul urban cat si in cel rural numarul membrilor din familie
este de aproximativ 4 persoane si ca din totul a 30 de intervievati, media varstei celor de sex
masculin este de aproximativ 38 de ani iar a sexului feminin este de aproximativ 34 de ani.

3.2. Modulul

Modulul ne indica acea valoare a variabilei care corespunde celui mai mare numar de
unitati sau aceea care are cea mai mare frecventa de aparitie.
In cazul nostru:
-

numarul membrilor de familie a celor mai multi dintre intervievati este 3

varsta a celor mai multi dintre intervievati este de 45

salariul lunar este de 1200

nivelul de educatie a celor mai multi este faculatea sau colegiul

nivelul de trai perceput de majoritatea intervievatilor este mai bun

majoritatea intervievatilor prefera plimbarile in aer liber, nu au avut zile de concediu iar
vechimea in munca este de 2-5 ani

3.3. Mediana
Mediana imparte numarul unitatilor investigate in 2 parti egale.

Astfel, valoarea numarului membrilor din familie ce imparte distributia aferenta celor 30
de intervievati in 2 parti de volum egal este de 4.
-

varsta este de aproximativ 36 de ani

salariul lunar este de 1275 lei

nivelul de educatii este postliceala

nivelul de trai este aproximativ la fel

modalitatea de petrecere a timpului liber sunt vacantele in tara

numarul de zile de concediu mai putin de 10 zile

vechimea in munca intre 2-5 ani

3.4. Media geometrica


Media geometrica reprezint acea valoare a caracteristicii observate care dac ar
nlocui fiecare valoare individual din serie produsul acestora nu s-ar modifica, calculata
de asemenea prin intermediul meniului Analyze ->Compare Means->Means->Geometric
Mean.
-

media geometrica a salariului in functie de ocupatie si de nivelul de educatie

mediageometrica a vechimii in functie de sex

4.Indicatorii variatiei
4.1. Dispersia

Dispersia este un indicator cu un character economic abstract, rezultatul obtinut exprimanduse in buc2, ceea ce din punct de vedere economic nu poate fi interpretat.

4.2. Amplitudinea

Este un indicator simplu al variatiei care ofera o imagine generala asupra dispersiei, fiind
distanta dintre nivelul maxim si minim al variabilei.
In cazul nostru, pentru variabila salariu, distanta dintre cel mai mic salariu in randul celor
intervievati de 299,99 lei si cel mai mare 6000 lei, este de 5700,01 lei.

4.3. Abaterea standard

Abaterea standard reprezinta media patratica a nivelurilor individuale ale caracteristicii fata
de media lor.
Deoarece salariul este o caracteristica statistica cu variatie discreta, se va rotunji rezultatul la
valoarea intreaga 1570 lei/persoana.
Putem concluziona ca fiecare persoana din cele 30 intervievate, s-a abatut de la salariul
mediu al esantionului selectat, in medie cu 1570 lei/persoana.

4.4. Coeficientul de variatie


Se calculeaza ca raport intre abaterea medie si nivelul mediu al variabilei, iar
pentru a se interpreta mai usor se exprima in procente.

In cazul varstei intervievatului, valorile determinate ale coeficientului de variatie


este mai mare de 35%, astfel concluzionam ca esantionul de 30 de persoane analizate este
unul eterogen din perspectiva variabilei varsta si, totodata, rezulta ca media varstei este
mai putin reprezentativa din punct de vedere static.

5. Tabel de frecventa
5.1. Tabel de frecventa pentru o variabila calitativa

Luand in considerarea variabila calitativa ocupatia intervievtului, observam ca


majoritatea de 13,3 % din totalul de 100% sunt asistent call center urmat apoi de un
procent de 10% de ocupatiile profesor si pensioner.
Cel mai mic procent il ocupa ocupatia de director, casnic si manager acestea
avand un procent de 3,3% din totalul de intervievati.

5.2. Tabel de frecventa pentru o variabila cantitativa

Pentru variabila cantitativa am luat in considerare numarul membrilor din familie


unde se poate observa ca frecventa cea mai mare si anume de 11 raspunsuri din 30 a fost
ca intervievatul face parte dintr-o familie cu 3 membri. Cea mai mica frecventa 3,3%
dintr-un singur raspuns rezulta ca o singura persoana din 30 are in familie 8 membri.

6. Grafic de tip pie

Ponderea persoanelor cuprinse in esantion, in functie de sexul acestora, respectiv


43,33% de sex feminin si majoritatea de 56,67% de sex masculin.

7. Coeficientul de corelatie Pearson

Pentru aceasta corelatie am folosit o variabila numerica salariu si o variabila


ordinala vechimea in munca. Astfel, dorim sa aflam daca intre cele 2 variabile exista vreo
legatura, asociere, corelatie.
Observam ca r Pearson = 0,031 foarte aproape de valoarea 0 ceea ce inseamna ca
exista o relatie foarte slaba intre cele 2 variabile.
Valoarea Sig. (2-tailed)= 0,872 > 0,5 intareste concluzia ca, statistic vorbind, nu
exista nici o legatura semnificativa intre cele 2 variabile, rezultand astfel ca descresterile
si cresterile intr-o variabila nu are o legatura semnificativa cu descresterile si cresterile in
cea de-a doua variabila.

8. Testarea ipotezelor statistice


8.1. Testarea egalitatii unei medii cu o valoare specificata
Pentru a testa egalitatea unei medii cu o valoare specificata am ales
variabila salariu. Se va analiza daca salariul curent al unei persoane difera sau nu
de 1400 RON. Testarea egalitatii salariului mediu la nivel de esantion cu valoare
fixa se realizeaza cu optiunea One Sample T test.

Output-ul ne spune ca avem un numar N=30 de observanti, ca avem o medie aritmetica a


salariului de 1686,72 RON, o abatere standard de 1570,47 si o eroare standard a mediei
aritmetice de 286,72.
Din cel de-al doilea tabel rezulta ca testul t privind media unui singur esantion este 1 iar
valoarea p este 0,326 care este mai mare decat 0,05 , considerate in Confidence Interval de unde
rezulta ca salariul intervievatilor nu este semnificativ diferita de valoarea 1400 RON. Testul t
pozitiv ne indica faptul ca salariul mediu al esantionului este mai mare de 1400 RON.

8.2. Testarea diferentei intre 2 medii

Testarea se realizeaza cu ajutorul testului Independent Samples T test. Demersul


este :
Analyze->Compare Means -> Independent Samples T test. Se va testa daca bugetul
inainte de criza este acelasi pentru sexul feminine si masculin. Ipoteza privind egalitatea
mediilor se formuleaza astfel:
H0: X1 = X2
H1: X1 X2
Testul t este egal cu 0,605 respectiv 0,626 cu o probabilitate Sig. de 0,55 si 0,536>
0,05, ceea ce arata ca intre cele 2 medii ale bugetului lunar pentru cele 2 sexe (1840 lei
pentru masculin si 1486 pentru feminine) exista diferente semnificative.

9. Impartirea unei variabile cantitative in interval


Rezolvarea a fost facuta in Excel, impartinf variabila cantitativa varsta in intervale egale
de 10 unitati.

Cu ajutorul functie Pivot Table am creat tabela pivot ce avea ca si continut


varstele celor 30 de intervievati. Cu ajutorul functie Group am impartit variabila in
intervale egale incepand de la 18 (varsta minima) pana la 69 (varsta maxima)

In dreptul coloanei Total se afla frecventa aparitiei varstelor cuprinse in intervalul indicat
din coloana din stanga.
In coloana Xi se calculeaza media aritmetica pe fiecare interval, media finala a
intervalelor fiind de 38,5 ani.

10. Ecuatia de regresie

A fost realizata deasemenea in Excel, unde pentru acest tip de analiza am utilizat
doua variabile numerice si anume, nivel de trai (variabila endogena)si salariul/ venitul
persoanei(variabila exogena) deoarece nivelul de trai depinde de salariul/ veniul
persoanei in cauza.

1. Coeficientul multiplu de corelatie R= 0,44517432 [0;1], iar cu cat valoarea lui R


este mai aproape de 0, cu atat legatura este mai slaba intre cele doua variabile si cu
cat e mai aproape de 1, legatura este mai stransa. In cazul nostru R= 0,44, arata o
legatura slaba intre cele 2 variabile.
2. Coeficientul de determinare R Square arata ca 19,81 % din variatia nivelului de trai este
explicata de variatia salariului
3. Adjusted R square este valoarea corecta a coeficientului de determinare R si anume 0,169

11.

Distributia statistica

11.1. Distributia statistica normala a unei variabile


cantitative continue
Pentru aceasta am folosit variabila numarul membrilor din familie iar prin intermediul
meniului Tranform - Compute Variable am ales la Function Group CDF & Non central CDF
- CDF. Normal. Noua coloana adaugata in baza de date am denumit-o Distributia_normala.
Formula de forma CDF.normal(quant, mean,stddev ) am inlocuit-o cu
Quant = valoarea variabilei Distributia_normala pentru care vrem sa aflam densitatea de
repartitie
Mean= media aritmetica a distributiei normale
Stddev= abaterea standard a distributiei normale
Acesta distributie avand forma CDF.normal(membri_familie, 4.1, 1.56) rezultatul fiind
urmatorul:

Interpretare: Returneaza probabilitatea cumulativa ca o valoare din distributia normala, cu


media si abaterea standard specificata va fi mai mica decat Distributia_normala