Sunteți pe pagina 1din 27

Proiect la Analiza informatiilor de marketing utilizand SPSS-UL Alegeti din Anuarul statistic al Romaniei sau din baza de date

TEMPO ONLINE- serii de timp I.N.S. de pe www.insse.ro, 2 variabile aflate intr-o oarecare dependenta una fata de alta pentru cele 41 de judete (fara municipiul Bucuresti). Folosind SPSS , introduceti datele si analizate: Indicatorii medii si ai variatiei pentru fiecare dintre cele 2 variabile, folosind metode diferite de analiza; Efectuati grafice specifice pentru cele 2 distributii si pentru indicatorii calculate; Efectuati o analiza bivariata a datelor selectate; Analizati legatura dintre cele 2 variabile si stabiliti care este cel mai potrivit model de regresie

Variabilele alese au fost preluate de pe www.insse.ro si sunt: Elevii inscrisi la postliceala in anul 2009 in cele 41 de judete (variabila independenta) Cadrele didactice care au profesat la postliceale in anul 2009 in cele 41 de judete. (variabila dependenta)

1.Creearea capului de tabel:

2. Introducerea datelor in SPSS:

A. Calculul indicatorilor medii si ai variatiei pentru cele doua variabile Metoda 1


Se foloseste comanda: Analyze-Descriptives Statistics-Frequencies- alegem variabila pentru care calculam indicatorii-Statistics-bifam indicatorii (Quartiles, Mean, Median, Mode, Std Deviation, Variance, Range, Minimum, Maximum)-Continue-OK 1.Indicatorii medii si ai variatiei pentru variabila independenta numarul de elevi :

Rezultatele din output


4

Interpretarea rezultatelor din output


5

N = 41 judete ; Mean = 1362 ; rezulta in cele 41 de judete sunt inscrisi in medie 1362 elevi Median = 1342; rezulta ca jumatate din judetele analizate au sub 1342 elevi inscrisi si jumatate peste acest numar Mode = 480; rezulta ca cele mai multe judete au 480 de elevi inscrisi (2 judete) Std deviation = 903; in medie fiecare judet se abate de la media calculate (1362) cu 9,3% 2.cadre didactice

Interpretarea rezultatelor din output: N = 41 de judete analizate; Mean = 15,05, rezulta ca din cele 41 de judete profeseaza in medie 15 profesori; Median = 11, jumatate din judetele analizate au sub 11 cadre didactice si jumatate peste. Mode = 7, cele mai multe din judetele analizate au 7 profesori (5 judete); Std deviation = 13 in medie fiecare judet se abate de la media calculate cu 0.13.

Metoda 2

Se foloseste comanda : Analyse-Descriptives Statistics-Descriptives (fereastra Descriptuves de unde se alege variabila pentru care se calculeaza indicatorii)- Options-Fereastra Descriptives Options se bifeaza indicatorii care sunt analizati -Continue-OK 1. Nr elevi 2. Nr personal didactic

Rezultatele din output

Metoda 3
Folosim comanda : Analyse-Reports-Case Summaries-se alege variabila- Fereastra Summarize Case se alege variabila-Statistics-Fereastra Summary Reports : Statistics se aleg indicatorii ce urmeaza a fi calculati si se trec cu sageata in Cell Statistics-Continue-OK

1. Nr elevi

Rezultatele din output

B. Realizarea graficelor specifice pentru cele doua distributii si pentru indicatorii calculati. 1. Histograma
Graphs-Legacy Dialogs-Histogram-se selecteaza variabila si se trece in caseta Variable : a).numar elevi

Rezultatul in output

2. Graficul Boxplot
Graphs-Legacy Dialogs-Box Plot-Summaries of Separate Variables-Define Simple Boxplot- se alege variabila care se construieste si se muta in Boxes Represent-OK

Rezulatatul din output

3. Graficul Line Graph-Legacy Dialogs-Line se selecteaza Value of individual cases-Definevariabila pentru care se face graficul se duce in Line represents, iar judetul in Variable-OK

10

b. numarul de cadre didactice:

1. Histograma
Graphs-Legacy Dialogs->Histogram->Interactive->Histogram ->se deschide fereastra Create Histogram unde se duce variabila dorita pe axa X-> Histogram->se bifeaza Normal Curve->se bifeaza Set interval size automatically->OK

Rezultatul din output

11

2. Graficul BOXPLOT Analyse->Descriptive Statistic->Explore->se alege variabila si se trece in Dependent List->Plots Explore:Plots-> se bifeaza optiunea Factor Levers Together->Continue->OK Rezultatul din output

12

3. Graficul Line
Graphs-Legacy Dialogs-Line-selectam Value of individual cases-Define-variabila pentru care se realizeaza graficul se duce in Line Represents, iar judetul in Variable-OK

Rezultatul din output

13

14

C. Analiza bivariata a datelor selectate


a. variabile numar elevi inscrisi 1. Se construiesc intervalele: (Xmax-Xmin)/4= (3931-108)/4= 3823/4= 955,75 ~ 956 Intervalele vor fi (0-956] ; (956-1912] ; (1912-2868] ; (2868-3824] . 2. Recodificarea variabileleor prin comanda : Transform->Recode->Into Different Variables >se selecteaza variabila ce urmeaza a fi recodificata si se denumeste in caseta Name>Change->Old and New Values-> se introduc datele-> Continue-> OK, dupa care se reia operatiunea de introducere a noilor date.

15

b. variabila numarul de cadre didactice 1. Se construiesc intervalele: (Xmax-Xmin)/4= 56-2/4= 54/4= 13,5~14 Intervalele vor fi : (0-14] : (14-28] : (28-42] : (42-56]. 3. Recodificarea variabileleor prin comanda : Transform->Recode->Into Different Variables >se selecteaza variabila ce urmeaza a fi recodificata si se denumeste in caseta Name>Change->Old and New Values-> se introduc datele-> Continue-> OK, dupa care se reia operatiunea de introducere a noilor date.

16

Construirea tabelului de asociere


Se realizeaza prin comanda : Analyze->Descriptiv Stattistics-> Crosstab-> se selecteaza variabilele si se trece pe Row(s) independenta, iar pe Column(s) dependenta->OK

17

Rezultatele din output

Calcularea indicatorilor medii si ai variatiei


Analyze->Reports->Case Summarise->fereastra Summarize Case-> se selecteaza variabilele si se trec in caseta Variable(s), respectiv Grouping Variables->Statistics->fereastra Summary Reports : Statistics-> se selecteaza indicatorii doriti si se trec in caseta Cell Statistics->Continue->OK

18

Calculul indicatorilor folosind ANOVA


Prin ANOVA se realizeaza calculul dispersiei de grupa si dintre grupe a unei distributii bivariate, prin comanda : Analyse Compare Means One Way Anova fereastra One Way ANOVA se aleg variabilele care se calculeaza si se trec in caseata Dependent List si in caseta Factor Options - One Way ANOVA:Options se bifeaza Descriptive si Means Plot Continue Ok

19

20

Interpretare:
Tabelul Descriptives ofera indicatorii tendintei centrale si ai dispersiei pentru o distributie bivariata (se observa ca sunt aproximativ aceleasi informatii obtinute prin comanda Analyze->Reports->Case Summaries prezentata anterior) Tabelul ANOVA ofera rezultatele analizei de variatie : Sum of Squares Between Groups (suma patratelor abaterilor intre grupe)= 4751,367->plecand de la aceasta valoare se poate calcula Dispersia si Abaterea medie patratica intre grupe. Dispersia intre grupe se calculeaza : Sum of Squares Between Groups/numarul total al judetelor ( 4751,367/41=115,887); iar abaterea medie patratica intre grupe scotand radical din dispersia intre grupe (=10.765082) Sum of Squares Within Groups (suma patratelor abaterilor de grupa) =1515,733-> plecand de la aceasta valoare se poate calcula Dispersia si Abaterea medie patratica de grupa. Dispersia se calculeaza: Sum of Squares Within Groups/numarul total al judetelor (1515,733/41=36,969); iar abaterea medie patratica scotand radical din dispersie (=6.080) Sum of Squares Total (suam patratelor abaterilor colectivitatii)= 6267,1-> plecand de la aceasta valoare se poate calcula Dispersia si Abaterea medie patratica pe total. Dispersia se calculeaza: Sum of Squares Total/ numarul total al judetelor (6267,1/41=152,856), iar abaterea medie patratica scotand radical din dispersie (=12,363) Testul F respective valoarea Sig=0->cu aceasta valoare mai mica decat 0,05, testul F este semnificativ, ceea ce inseamna ca exista o diferenta semnificativa intre cele patru grupe de numar de gradinite in raport cu numarul personalului didactic.

21

D. Analiza regresiei

Construirea corelogramei presupune construirea diagramei Scatterplot prin comanda : Graphs->Legacy Dialogs -> Interactive > Scatterplot > fereastra Scatterplot in care se muta pe axa absciselor independenta iar pe ordonata dependenta, in pagina Fit se alege Regression, iar in pagina Spikes se bifeaza Fit Line > OK

Diagrama Scatterplot ne arata o legatura simpla liniara.

Alegerea celui mai bun model de regresie Presupune aproximarea modelului de regresie prin metode tabelare, executand comanda : Analyze->Regression->Curve Estimation-> fereastra Curve Estimation unde se efectueaza comenzile :

22

-se trece variabila dependenta in caseta Dependent(s) iar cea independenta in Independent Variable; -in caseta Models se bifeaza tipul de model pentru care se calculeaza ecuatia de regresie; -se bifeaza Include constant in equation si Plot models;-Ok.

Rezultatele din output

23

24

25

Se observa ca in tabelul Model Summary and Parameter Estimates pentru fiecare model de regresie gasit in Model Summary raportul de determinatie ( R square) si testarea acestuia cu testul F , iar in Parameter Estimates coeficientii ecuatiei de regresie. Pe baza R square se va decide care este cel mai bun model de regresie. Cu cat valoarea acestuia se apropie de 1 cu atat acel model de regresie este mai potrivit. Din cele 3 modele de regresie rezulta ca modelul liniar a trecut testul.

26

27