Sunteți pe pagina 1din 38

1

Proiect SPSS


Universitatea Vasile Alecsandri din Bacau
Facultatea de stiinte economice
Program de studii: marketing, anul III, grupa 531










Studenti: Vaschiu Adriana
Furnica Delian Bogdan
2

Avem urmatoarea baza de date ce contine numarul de spitale si numarul de medici pentru
fiecare judet din tara.



3

Grafice
1. Graficul prin bare (BAR) Se execut urmtoarea comand: Graphs->Legacy Dialogs-
> Bar ->fereastra Bar Charts: alegem opiunea Simple i n caseta Data in Chart Are
bifm Values of individual cases, click pe butonul Define ->fereastra Define Simple Bar -
Values of individual cases: se alege din list variabila pentru care dorim s construim
graficul i o mutm n caseta Bar Represent -> click pe butonul OK.


4




n fereastra Viewer se va obine graficul prin bare ce reprezint numarul de spitale pe judete.


5

Pentru a avea scrise n grafic i numarul propriu-zis de spiale se va executa comanda:
dublu click pe graficul din Viewer -> fereastra Chart Editor: click dreapta pe grafic i se alege
Show Data Labels .















6

2. Graficul prin linie (LINE)
Se execut urmtoarea comand: G raphs->Legacy Dialogs-> Line ->fereastra
Line Charts: alegem opiunea Simple i n caseta Data in Chart Are bifm Values of
individual cases click pe butonul Define->fereastra Define Simple Line - Values of
individual cases: se alege din list variabila pentru care dorim s construim graficul i se
mut n caseta Line Represent -> click pe butonul OK.


7


n fereastra Viewer se va obine graficul prin linie ce reprezint numarul de spitale
pentru fiecare judet.




8

3. Graficul Boxplot
Boxplot-ul se poate construi executnd comanda: Graphs -> Legacy Dialogs -> Boxplot-
> fereastra Boxplot: alegem opiunea Simple i n caseta Data in Chart Are bifm
Summaries of Separate Variables click pe butonul Define ->fereastra Define Simple
Boxplot: Summaries of Separate Variables: se alege din list variabila pentru care vrem
s construim Boxplot-ul i se trece n caseta Boxes Represent, click pe butonul OK.


9


n fereastra Viewer se va obine graficul boxplot ce reprezint distribuia ierarhic a spitalelor.

Interpretarea rezultatelor: distribuia spitalelor este relativ omogena cu o usoara inclinatie spre
stanga avand o inclinatie catre vlorile mai mici ale scorului.
10

4. Graficul Histogram Histograma se poate construi executnd urmtoarele
comenzi: comanda Graphs -> Legacy Dialogs -> Histogram -> fereastra Histogram:
alegem din list variabila pentru care dorim s construim histograma i o trecem n caseta
Variable i bifm opiunea Display normal curve dac se dorete construirea curbei
distribuiei normale -> click pe butonul OK.


n fereastra Viewer se va obine histograma ce reprezint distribuia spitalelor pe judete.
11


Se observ c SPSS a ales s distribuie spitalele pe 11 intervale egale iar mrimea intervalului
este de 5 puncte.














12

5. Graficul Scatterplot Acest grafic Scatterplot denumit nor de puncte sau corelogram
este utilizat n reprezentarea legturii statistice exprimate cantitativ dintre 2 fenomene .
Construirea graficului presupune comanda: G raph -> Legacy Dialogs -> Interactive ->
Scatterplot -> fereastra Create Scatterplot n care se fac urmtoarele operaiuni: -pagina
Assign Variables: se mut, prin tragere, n caseta de pe axa X variabila independent, iar
n caseta de pe axa Y variabila dependent, -pagina Fit alegem din caseta Method
opiunea Regression, click pe butonul OK.


13





Legatura dintre numarul de spitale si numarul de medici este directa, liniara si relativ puternica.
14

Analiza pe interval
1. Determinarea mrimilor medii i indicatorilor de poziie i variaie n SPSS
Determinarea n SPSS a mrimilor medii i a indicatorilor de poziie i variaie afereni unei
colectiviti simple se poate face executnd urmtoarea comand: Analyze -> Descriptives Statistics ->
Frequencies ->fereastra Frequencies: alegem din list variabila sau variabilele pentru care dorim s
calculm indicatorii i le trecem n caseta Variable(s), click pe butonul Statistics -> fereastra
Frequencies: Statistics: bifm n casetele de lng indicatorii pe care dorim s-i analizm i click pe
butonul Continue ->fereastra Frequencies: debifm opiunea Display frequency tables i click pe
butonul OK.

15


n fereastra Viewer se va obine un tabel Statistics n care sunt determinai indicatorii tendinei centrale
i variaie pentru variabilele medici si spitale.


16

- N Valid = 41 -> Analiza statistic se face avnd la baz 41 de judete
- Missing = 0 -> Nu exist valori lips
- Mean = 996,61 -> in medie, fiecare judet are 996,61 de medici
- Median = 668 -> jumtate din judete au un numar de medici mai mic de 668
- Std. Deviation = 809,624 ->
- Skewness= 2,021-> exist o asimetrie pozitiv foarte puternica
- Range = 3366-> diferena dintre cel mai mare numar de medici dintr-un judet si cel mai mic
numar ete de 3366
- Minimum= 299-> cel mai mi numar de medici intr-un judet este de 299
- Maximum= 3665 -> cel ma mare numar de medici intr-un judet este de 3665
- Percentiles 25 = 512 -> 25% dintre judete au un numar de medici de pna la 512
- 50 = 668 -> jumtate din judete au un numar de medici de pana la 668
- 75 = 9,61 -> 75% dintre judete au un numar de medici mai mic decat 1168,5




17




18

















19

2. Construirea tabelului cu dubla intrare (Crosstabs)

Tabelul cu dubl intrare se obine executnd comanda: Analyse ->Descriptive Statistics -
>Crosstabs-> fereastra Crosstabs: din list selectm variabilele pentru care dorim s
construim un tabel cu dubl intrare (aceste variabile trebuie s fie categoriale) i le
trecem n casetele Row(s) i Column(s), dup care click pe butonul OK.



20



Interpretare: cele mai multe judete, in cazul de fata 15, au pana la 6 spitale cu pana la
1000 de medici in timp ce sunt numai 2 judete ce au intre 18 si 24 de spitale cu un numar
cumulate de medici intre 3000 si 4000.
ntre cele dou variabile prezentate n tabel exist o relaie de cauzalitate pentru c
frecvenele pariale se afl pe diagonala tabelului cu dubl intrare i n aceste condiii putem
calcula indicatorii de variaie corespunztori.







21

3. Calcularea mediilor, dispersiilor i abaterilor medii ptratice pe fiecare interval de
grupare dup factorul determinant (Case summaries)
Pentru calcularea acestori indicatori se execut urmtoarea comand: Analyze -> Reports ->
Case Summaries ->fereastra Summarize Case: alegem din list variabilele pentru care dorim s calculm
indicatorii i le trecem n caseta Variable(s) respectiv Grouping Variables, se debifeaz opiunea
Display cases i click pe butonul Statistics -> fereastra Summary Reports: Statistics: selectm din caseta
Statistics indicatorii pe care dorim s-i analizm i i trecem n caseta Cell Statistics, click pe butonul
Continue ->fereastra Summarize Case: se apas pe butonul OK.









22




23



Interpretarea celor mai importante rezultate din output :
- N = 41 pe total
- Mean = 996,61 este media numarului de medici din fiecare judet
- Std. Deviation = 809,724 judetele au un numar de medici cu variatiea de 996,61 + sau 809,
724














24

Verificarea regulii adunrii dispersiilor folosind ANOVA
n SPSS pentru a verifica regula adunrii dispersiilor respectiv calcularea dispersiilor de grup i
dintre grupe se execut urmtoarea comand: Analyze -> Compare Means -> One-Way ANOVA -
>fereastra One-Way ANOVA: alegem din list variabilele pentru care dorim s calculm indicatorii i le
trecem n caseta Dependent List (variabila dependent) i n caseta Factor (variabila independent), click
pe butonul OK.




25



Interpretarea celor mai importante rezultate din output :
o Sum of Squares Between Groups ( suma ptratelor abaterilor ntre grupe ) =
20823069,11-> plecnd de la aceast valoare se poate calcula dispersia i
abaterea medie ptratic ntre grupe. Dispersia ntre grupe se calculez
mprind Sum of Squares Between Groups la numrul total al studenilor
analizai, iar abaterea medie ptratic ntre grupe scond radical din
dispersia ntre grupe ( =5,4 puncte)
o Sum of Squares Within Groups ( suma ptratelor abaterilor de grup ) =
7420833,333-> plecnd de la aceast valoare se poate calcula dispersia i abaterea
medie ptratic de grup. Dispersia de grup se calculez mprind Sum of
Squares Within Groups la numrul total al studenilor analizai, iar
abaterea medie ptratic din interiorul grupei scond radical din dispersie
de grup ( =2,3 puncte)
o Sum of Squares Total ( suma ptratelor abaterilor pe total ) = 28243902,44->
plecnd de la aceast valoare se poate calcula dispersia i abaterea medie
26

ptratic pe total. Dispersia pe total se calculez mprind Sum of Squares
Total la numrul total al studenilor analizai, iar abaterea medie ptratic
pe total scond radical din dispersie ( =5,9 puncte)
o testului F respectiv valoarea Sig. = 0,000->cu aceast valoare mai mic
dect 0,05, testul F este semnificativ.










27

Analiza regresiei folosind SPSS

1. Identificarea existenei legturii - construirea corelogramei
Construirea corelogramei sau a norului de puncte presupune construirea graficului de tip
Scatterplot. Construirea graficului presupune comanda: G raph -> Legacy Dialogs -> Interactive ->
Scatterplot -> fereastra Scatteplot, n pagina Assign Variables: se mut, prin tragere, pe axa X variabila
independent, iar pe axa Y variabila dependent, n pagina Fit alegem metoda Regression, iar n pagina
Spikes putem bifa Fit Line, dup care se apas pe butonul OK.





28




29


















30

Stabilirea sensului i formei legturii prin metode analitice de studiere a legturilor
(stabilirea celor mai potrivite modele de regresie)
Alegerea celui mai bun model de regresie, utiliznd SPSS, presupune executarea comenzii:
Analyze -> Regression -> Curve Estimation ->fereastra Curve Estimation unde -n caseta Models bifm
tipurile de modele pentru care dorim s calculm ecuaia de regresie (n cazul de fa am ales Liniar
funcia liniar , Logarithmic funcia logaritmic, Quadratic funcia de gradul 2 , Cubic funcia de
gradul 3 , Exponential funcia exponenial) -casetele Includ constant in equation i Plot models se
bifeaz, dar n general acestea sunt bifate implicit cnd se deschide fereastra, i au ca efect afiarea
coeficienilor din ecuaia de regresie i construirea graficului de aproximare a modelului. - se apas
butonul OK.



31



32



In urma analizei rezultatelor si a lui R square se poate observa c modelul liniar este cel
mai bun. R square= 0,709

Estimarea parametrilor modelelor de regresie i testarea semnificaiei acestora
n SPSS estimarea i testarea parametrilor unei ecuaie de regresie presupune executarea comenzii:
Analyze -> Regression -> Curve Estimation ->fereastra Curve Estimation unde executm
urmtoarele operaiuni : -alegem din lista surs variabila independent,variabila dependent i le
trecem cu ajutorul sgeii n casetele Independent Variable (variabila independent) i
Dependent(s) (variabila dependent) -n caseta Models bifm tipurile de modele pentru care
dorim s calculm ecuaia de regresie (n cazul de fa am ales Liniar funcia liniar ,
Logarithmic funcia logaritmic , Quadratic funcia de gradul 2 , Cubic funcia de gradul
3 , Exponential funcia exponenial) -casetele Display ANOVA table, Includ constant
equation, Plot models se bifeaz i au ca efect testarea modelului de regresie cu ANOVA,
33

afiarea coeficientului aferent variabilei independente din ecuaia de regresie, construirea
graficului de aproximare a modelului. -se apas butonul Save -> fereastra Curve Estimation:
Save: selectm opiunile dorite din caseta Save Variables, dup care se d click pe butonul -
>fereastra Curve Estimation: se apas pe butonul OK.

34



Odat cu crearea rezultatelor n output, n Data Editor, n foaia Data View, gsim noile variabilele create
de SPSS ca urmare a opiunilor exprimate n fereastra Curve Estimation: Save, care reprezint valorile
estimate ale variabilei dependete ( FIT), valorile reziduale respectiv diferena dintre valorile observate i
cele estimate( ERR) i limitele inferioare i superioare ale intervalului de ncredere ( LCL i UCL) pentru
fiecare model de regresie ales.

35



36



De pus cubic, quadratic, liniar!

37







Analiznd cele mai importante rezultate din output s e observ c pentru fiecare model de
regresie ales sunt prezentate trei tipuri de tabele :
- Model Summary prezint valoarea raportul de corelaie R, raportul de determinaie (R Square),
valoarea ajustat a lui R Square i eroarea standard a estimaiei.
- ANOVA prezint rezultatele analizei dispersiei variabilei dependente sub influena variabilei
factoriale i de estimare, adic prezint informaii asupra sumei ptratelor abaterilor variabilei dependente
datorate modelului de regresie i erorii de modelare ( Sum of Squares), gradele de libertate ( df), media
dispersiilor datorate celor dou surse de variaie ( Mean Square), raportul testului F i semnificaia
acestuia ( Sig. ). Dac valoarea Sig. corespunztoare testului F este mai mic dect 0,05, atunci variabila
independent explic variaia variabilei dependente drept urmare modelul de regresie corespunde unei
legturi ntre cele dou variabile
- Coefficients prezint coeficienii nestandardizai a modelului de regresie estimat (
Unstandardized Coefficients B), erorile standard ale acestora ( Unstandardized Coefficients Std. Error),
coeficienii de regresie standardizai (S tandardized Coefficients Beta), valorile statisticii testului t i
semnificaia acestuia ( Sig. ). Coeficienii standardizai sunt folosii atunci cnd ntr-un model de regresie
sunt mai multe variabile independente exprimate n uniti de msur diferite. Dac valoarea Sig.
corespunztoare testului t este mai mic dect 0,05, atunci parametrii modelului de regresie difer
semnificativ de valoarea zero i modelul de regresie corespunde unei legturi semnificative ntre cele
dou variabile.
In urma analizei rezultatelor si a lui R square se poate observa c modelul liniar este cel
mai bun. R square= 0,709

Tabelul Coefficients cu valorile prezentate n Unstandardized Coefficients B ne ajut s
scriem ecuaia de regresie pentru modelul nostru:
38

y= a+bx+cx2+dx3
unde: a = (Constant)
b = numrul de salariai
c = numrul de salariai **2
d = numrul de salariai **3
Deci ecuaia devine: Y=120,968X-168,818
Conform calculului ecuatiei de gregresie media doctorilor creste cu 121.