Sunteți pe pagina 1din 34

PROIECT STATISTIC

ANALIZA CHESTIONARULUI

Coordonator tiinific Prof.univ.dr. Elisabeta Jaba

CUPRINS
1. Introducere 1.1 Definirea problemei 1.2 Obiectivul proiectului 2. Construirea bazei de date 2.1. Alegerea variabilelor analizate 2.2. Definirea variabilelor i introducerea datelor n SPSS 3. Verificarea bazei de date 3.1. Depistarea outlieri-lor 3.2. Verificarea normalitii distribuiilor 4. Analiza statistic univariat a datelor 4.1. Descrierea statistic a variabilelor nominale 4.2. Descrierea statistic a variabielor numerice 5. Analiza statistic bivariat a datelor 5.1. Analiza statistic a gradului de asociere ntre dou variabile 5.2. Analiza de regresie i corelaie 5.3. Analiza dispersional (ANOVA) 6. Estimarea i testarea statistic 6.1. Estimarea parametrilor prin interval de ncredere 6.1.1. Estimarea prin interval de ncredere a unei medii i unei proporii 6.1.2. Estimarea prin interval de ncredere a diferenei dintre dou medii i dou proporii 6.2. Testarea statistic 6.2.1. Testarea unei medii i unei proporii 6.2.1.1. 6.2.1.2. 6.2.2.1. 6.2.2.2. 7. Concluzii Testarea unei medii Testarea unei proporii Testarea diferenei dintre dou medii Testarea diferenei dintre dou proporii

6.2.2. Testarea diferenei dintre dou medii i dou proporii

CAPITOLUL 1 INTRODUCERE
1.1 Definirea problemei

Studenii anului 1, nvmnt la distan, specializarea Economie i Gestiune Financiar Bancar, nvmnt post-universitar FIBAS, au completat n cadrul cursului de Statistic un chestionar. Chestionarul cuprinde ntrebri privind profesia i domeniul de activitate ale studentului, venitul lunar obinut, judeul n care locuiete. Deoarece chestionarul a fost realizat n preajma alegerilor prezideniale, s-au regsit i ntrebri de interes pentru studeni, cum ar fi, dac activeaz n cadrul unui partid politic i care este acesta, care sunt primele trei preferine pentru viitorul preedinte al Romniei. Rspunsurile la ntrebrile din chestionar au fost introduse n programul SPSS i au format o baz de date pentru diferite analize.

1.2

Obiectivul proiectului

n cadrul acestui proiect am dorit s analizez cteva ntrebri din chestionar i mai precis, ntrebrile privind vrsta i venitul studenilor din anul 1 IDD, profesia i domeniul de activitate. Prin utilizarea programului SPSS am ncercat s obin informaii privind vrsta medie a studenilor, venitul mediu; repartiia studenilor pe sexe, judee, domenii de activitate. Totodat, mi-am propus s reprezint grafic aceste repartiii. Pentru a realiza o analiz mai complex, am considerat util aplicarea procedeului ANOVA pentru a studia influena domeniului de activitate asupra venitului obinut de studeni. Analiza de regresie i corelaie mi-a permis studierea legturii dintre vrsta i venitul studenilor. Am aplicat analiza asocierii pentru a identifica gradul de asociere ntre domeniul de activitate i profesia studenilor.

CAPITOLUL 2 CONSTRUIREA BAZEI DE DATE


2.1 Alegerea variabilelor analizate
Am analizat rspunsurile studenilor din anul 1 IDD la ntrebrile din chestionar cu ajutorul programului SPSS. Principalele ntrebri considerate se refer la: sexul persoanei, vrsta, profesia, domeniul de activitate, venitul, mediul, judeul, apartenena politic, partidul, participarea la alegeri, preferina pentru un candidat. Fiecare ntrebare reprezint o variabil ce a fost introdus n programul SPSS. Rspunsurile studenilor la aceste ntrebri constituie valori ale variabilelor definite anterior.

2.2

Definirea variabilelor i introducerea datelor n SPSS


Pentru a realiza analizele propuse n obiectivul acestui proiect, am nceput

prin a creea baza de date. Acest proces presupune prezentarea datelor ntr-o form care s permit organizarea i efectuare analizei lor i const n dou etape: definirea variabilelor i introducerea datelor.
Am definit variabilele n coloanele foii Variable View din fereastra Data Editor. Pentru fiecare variabil introdus trebuie s-I precizm atributele: numele variabilei; tipul variabilei (numeric, alfanumeric); lungimea (numrul de caractere, numrul de zecimale); eticheta i valorile etichetei; modalitatea de msurare a variabilei (scal, ordinal, nominal).

Variabilele definite, n numr de 13, sunt prezentate n figura de mai jos:

Figura 1. Foaia Variable View din fereastra Data Editor n cazul variabilelor categoriale (nominale) am precizat valorile luate de variabile i etichetele corespunztoare acestoran fereastra Value Label. Pentru sexul respondentului am scris: 1 masculin; 2 feminin. Pentru profesia respondentului am scris: 1 economist; 2 inginer; 3 jurist; Pentru domeniul de activitate am scris: 1 industrie; 2 comer; Pentru mediul de reziden am scris: 1 urban; 2 rural. Pentru apartenen politic am scris: 3 servicii; 4 altele. 4 medic; 5 profesor; 6 altele.

1 da; 0 nu. Pentru participare la alegeri am scris: 1 da; 0 nu. Pentru preferina 1 (preferina 2, preferina 3) privind candidaii la preedinie am scris: 1 Traian Bsescu; 2 Marko Belo; 3 Ciuhandru; 4 Adrian Nstase; 5 Corneliu Vadim Tudor; 6 Gigi Becali; 7 Milu; 8 Alt preferin.

Variabilele judeul i partidul au fost definite ca variabile alfanumerice (String). Pentru variabila venitul lunar milioane lei am scris intervalele oferite ca variante ajuttoare de rspuns: 1 <3 milioane lei; 2 3-5 milioane lei; 3 5-10 milioane lei; 4 10-20 milioane lei; 5 >20 milioane lei. Am introdus datele n celulele foii Data View din fereastra Data Editor. n fiecare coloan (variabil) am introdus rspunsul corespunztor. n total au fost 32 de subieci, deci am obinut 32 de rspunsuri.

CAPITOLUL 3 VERIFICAREA BAZEI DE DATE


Pentru a verifica dac distribuia valorilor unei variabile prezint asimetrie accentuat, dac sunt outlier-i sau alte anomalii se pot utiliza diagramele Boxplot create prin opiunea Explore a comenzii Descriptive Statistics din meniul Analyze, sau alte procedee de verificare a normalitii (procedee grafice: histograma, P-P plot, Q-Q plot i teste de normalitate).

3.1

Depistarea outlieri-lor
n output-ul opiunii Explore am obinut valorile extreme cele mai mari i cele mai mici

pentru cele dou variabile numerice: vrsta respondentului i venitul lunar mil. lei.
Extreme Values varsta respondentului Highest 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Case Number 10 9 30 6 17 28 27 19 32 16 10 9 25 3 8 28 11 31 7 13 Value 43.00 41.00 39.00 37.00 37.00 22.00 22.00 23.00 23.00 .a 25.00 25.00 15.00 15.00 .b 1.50 1.50 1.50 1.50 .c

Lowest

venitul lunar milioane lei Highest

Lowest

a. Only a partial list of cases with the value 23 are shown in the table of lower extremes. b. Only a partial list of cases with the value 15 are shown in the table of upper extremes. c. Only a partial list of cases with the value 2 are shown in the table of lower extremes.

Din figura 5 observm c diagrama Boxplot pentru variabila venitul lunar mil. lei indic dou valori outlier-e pentru respondenii cu nr. crt. 9 i 10 i anume valoarea egal cu 25 mil. lei.

3.2

Verificarea normalitii distribuiilor


Ca procedee numerice pentru testarea normalitii am folosit asimetria (Skewness) i

boltirea (Kurtosis). Valorile pentru asimetrie obinute pentru distribuiile dup variabilele vrsta respondentului i venitul respondentului sunt mai mari dect 0 (0,579 i respectiv 1,204) indicnd o asimetrie la dreapta (pozitiv). Valorile pentru boltire obinute difer pentru cele dou variabile. Pentru variabila vrsta respondentului valoarea coeficientului de boltire este negativ (-1,006) relevnd o distribuie platicurtic. Pentru variabila venitul respondentului valoarea coeficientului de boltire este pozitiv (1,283) relevnd o distribuie leptocurtic.

Descriptives varsta respondentului Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 29.4375 27.1777 31.6973 29.1389 27.0000 39.286 6.2679 22.00 43.00 21.00 11.0000 .579 -1.006 8.2500 5.9762 10.5238 7.6944 7.5000 39.774 6.3067 1.50 25.00 23.50 9.1250 1.204 1.283 Std. Error 1.1080

Lower Bound Upper Bound

venitul lunar milioane lei

.414 .809 1.1149

Lower Bound Upper Bound

.414 .809

Principiul verificrii normalitii unei distribuii pe baza testului Kolmogorov-SmirnovLilliefors (K-L-S) const n compararea frecvenelor reale cumulate cu frecvenele teoretice cumulate extrase din tabelul Gauss.
Tests of Normality Kolmogorov-Smirnov Statistic df Sig. .214 32 .001 .297 32 .000
a

varsta respondentului venitul lunar milioane lei

Statistic .882 .828

Shapiro-Wilk df 32 32

Sig. .010** .010**

**. This is an upper bound of the true significance. a. Lilliefors Significance Correction

Nivelul redus al gradului de semnificaie obinut pentru cele dou variabile (Sig. mai mic dect 0,05) arat c distribuiile dup vrsta respondentului i venitul respondentului difer semnificativ de forma distribuiei normale. Diagrama Q-Q pentru variabila vrsta respondentului prezint punctele Q-Q conturnd o linie care este apropiat de dreapta care reprezint distribuia teoretic. Aceast situaie indic o distribuie normal.

Normal Q-Q Plot of varsta respondentului


2

Expected Normal

-1

-2 10 20 30 40 50

Observed Value

Figura 2. Diagrama Q-Q plot pentru variabila vrsta respondentului

Diagrama Q-Q pentru variabila venitul respondentului arat c punctele sunt serios deviate de la dreapt ceea ce indic abateri de la normalitate, deci o distribuie care nu este normal.

Normal Q-Q Plot of venitul lunar milioane lei


2.0 1.5 1.0 .5

Expected Normal

0.0 -.5 -1.0 -1.5 0 10 20 30

Observed Value

Figura 3. Diagrama Q-Q plot pentru variabila venitul lunar milioane lei

Diagrama

Boxplot pentru variabila vrsta respondentului arat o distribuie

asimetric la dreapta.

10

50

40

30

20
N= 32

varsta respondentulu

Figura 4. Diagrama Boxplot pentru variabila vrsta respondentului

Diagrama Boxplot pentru variabila venitul respondentului indic prezena a doi outlier-i artnd astfel c distribuia nu este normal.

30

1 90
20

10

-10
N= 32

venitul lunar milioa

Figura 5. Diagrama Boxplot pentru variabila venitul lunar milioane lei

11

CAPITOLUL 4 ANALIZA STATISTIC UNIVARIAT A DATELOR


4.1

Descrierea statistic a variabilelor nominale


n urma analizei variabilelor nominale cu ajutorul opiunii Frequencies din comanda

Descriptive Statistics a meniului Analyze am obinut tabele de frecven pentru fiecare varibil n parte, n care sunt calculate, sub form procentual, proporiile diferitelor categorii de respondeni n totalul eantionului. Pentru reprezentarea grafic a variabilelor nominale i prezentarea vizual a acelorai rezultate privind proporiile diferitelor categorii de respondeni am ales opiunea Pie charts din fereastra de dialog Frequencies Charts. Informaiile obinute att din tabelele de frecven ct i din diagramele Pie privesc structura eantionului de respondeni pe sexe, profesii, domenii de activitate, medii, judee i apartenen politic.
sexul respondentului Frequency 10 22 32 Percent 31.3 68.8 100.0 Valid Percent 31.3 68.8 100.0 Cumulative Percent 31.3 100.0

Valid

masculin feminin Total

12

profesia respondentului Frequency 23 3 3 2 1 32 Percent 71.9 9.4 9.4 6.3 3.1 100.0 Valid Percent 71.9 9.4 9.4 6.3 3.1 100.0 Cumulative Percent 71.9 81.3 90.6 96.9 100.0

Valid

economist inginer jurist profesor altele Total

domeniul de activitate Frequency 5 19 8 32 Percent 15.6 59.4 25.0 100.0


mediul Frequency 31 1 32 Percent 96.9 3.1 100.0 judetul Frequency 1 5 1 20 2 3 32 Percent 3.1 15.6 3.1 62.5 6.3 9.4 100.0 Valid Percent 3.1 15.6 3.1 62.5 6.3 9.4 100.0 Cumulative Percent 3.1 18.8 21.9 84.4 90.6 100.0 Valid Percent 96.9 3.1 100.0 Cumulative Percent 96.9 100.0

Valid

comert servicii altele Total

Valid Percent 15.6 59.4 25.0 100.0

Cumulative Percent 15.6 75.0 100.0

Valid

urban rural Total

Valid

Bacau Botosani Harghita Iasi Neamt Vaslui Total

apartenenta politica Frequency 25 7 32 Percent 78.1 21.9 100.0 Valid Percent 78.1 21.9 100.0 Cumulative Percent 78.1 100.0

Valid

nu da Total

Din totalul celor 32 de respondeni, 31,3% sunt persoane de sex feminine iar 68,7% sunt personae de sex masculine.

13

Din cei 32 de studeni la Fibas din anul 1 IDD anchetai , 71,9% sunt de profesie economiti, 9,4% sunt ingineri, 9,4% sunt juriti, 6,3% sunt profesori i 3,1% alte profesii. Cei mai muli studeni i desfoar activitatea profesional n domeniul serviciilor (59,4%), doar 15,6% i desfoar activitatea n comer, iar 25% i desfoar activitatea n alte domenii. n ceea privete mediul de reziden, o singur persoan locuiete n mediul rural, n timp ce restul peroanelor, n proporie de 96,9%, locuiesc n mediul urban. Peste 50% dintre studenii anului 1 IDD sunt din judeul Iai (62,5%), 15,6% sunt din judeul Botoani, 9,4% sunt din judeul Vaslui, 6,3% sunt din judeul Neam, 3,1% sunt din judeul Bacu i tot 3,1% din judeul Harghita. Din totalul respondenilor, 78,1% nu aparin nici unui partid politic n timp ce 21,9% aparin unei formaiuni politice.

profesia respondentului
altele profesor jurist inginer
altele 25.0%

domeniul de activitate

comert 15.6%

economist

servicii 59.4%

mediul
rural 3.1%
Vaslui 9.4% Neamt 6.3%

judetul
Bacau 3.1% Botosani 15.6% Harghita 3.1%

Iasi

urban 96.9%

62.5%

14

apartenenta politica
da 21.9%

sexul respondentului

masculin 31.3%

feminin 68.8%

nu 78.1%

Figura 6. Diagramele Pie Am aflat categoria cea mai des ntlnit pentru fiecare variabil nominal calculnd modul. Astfel, din cei 32 de studeni din anul 1 IDD, predomin studenii de sex masculin, avnd profesia de economist, desfurndu-i activitatea n domeniul servciilor, din mediul urban i fr apartenen politic.
Statistics sexul respondentului 32 0 2.00 profesia respondentului 32 0 1.00 domeniul de activitate 32 0 3.00 mediul 32 0 1.00 apartenenta politica 32 0 .00

N Mode

Valid Missing

4.2

Descrierea statistic a variabielor numerice


Am caracterizat distribuiile statistice dup vrsta respondentului i venitul lunar

calculnd indicatorii tendinei centrale, dispersiei i formei prin selectarea opiunii Frequencies din comanda Descriptive Statistics a meniului Analyze.

15

Statistics varsta respondentului 32 0 29.4375 27.0000 35.00 6.2679 39.2863 .579 .414 -1.006 .809 21.00 22.00 43.00 942.00 venitul lunar milioane lei 32 0 8.2500 7.5000 7.50 6.3067 39.7742 1.204 .414 1.283 .809 23.50 1.50 25.00 264.00

N Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum

Valid Missing

Pentru variabila vrsta respondentului am obinut urmtoarele valori ale indicatorilor calculai: Mean (media) = 29,43 ani : Vrsta medie a studenilor din anul 1, IDD este de 29,34 ani. Median (mediana) = 27 ani : Jumtate dintre studenii din anul 1, IDD au vrsta pn la 27 ani i jumtate din studenii din anul 1, IDD au vrsta peste 27 ani. Mode (modul) = 35 ani : Vrsta purtat de cei mai muli dintre studenii anului 1, IDD este vrsta de 35 de ani. Std. Deviation (abaterea medie ptratic, numit i abaterea standard) = 6,26 ani : n medie, vrsta unui student se abate fa de vrsta medie a studenilor cu 6,26 ani, adic aproximativ 68% dintre studeni au vrsta cuprins ntr-un interval egal cu media plus sau minus valoarea abaterii medii ptratice, respectiv: 29,43 6,26 ani. Kurtosis (boltirea) = -1,006 : Valoarea negativ a coeficientului de boltire relev o distribuie platicurtic. Skewness (asimetria) = 0,579 : Valoarea pozitiv a coeficientului de asimetrie indic o asimetrie la dreapta (pozitiv).

Pentru a arta forma distribuiei studenilor dup vrst am folosit histograma i curba frecvneelor obinute cu ajutorul butoanelor de comand din fereastra Frequencies:Charts.

16

varsta respondentului
10

Frequency

Std. Dev = 6.27 Mean = 29.4 N = 32.00 22.5 25.0 27.5 30.0 32.5 35.0 37.5 40.0 42.5

varsta respondentului

Figura 7. Histograma i curba frecvenelor Distribuia dup vrst a studenilor din anul 1, IDD Din figura 7 observm c, pe ansamblu, eantionul are o distribuie dup vrst asimetric la dreapta predominnd vrsta tnr.

Pentru variabila venitul lunar milioane lei am obinut urmtoarele valori ale indicatorilor calculai: Mean (media) = 8,25 mil. lei : Oricare student din cei 32 de studeni din anul 1 IDD, realizeaz n medie un venit lunar de 8,25 mil. lei. Median (mediana) = 7,5 mil. lei : Jumtate dintre studenii din anul 1, IDD realizeaz un venit lunar pn la 7,5 mil. lei ani iar jumtate dintre studeni realizeaz un venit peste 7,5 mil. lei. Mode (modul) = 7,5 mil. lei : Venitul realizat de cei mai muli dintre studenii anului 1, IDD este de 7,5 mil. lei. Std. Deviation (abaterea medie ptratic, numit i abaterea standard) = 6,3 mil. lei : n medie, venitul lunar ctigat de un student se abate fa de venitul mediu lunar cu 6,3 mil. lei, adic aproximativ 68% dintre studeni realizeaz un venit mediu lunar cuprins ntr-un interval egal cu media plus sau minus valoarea abaterii medii ptratice, respectiv: 8,25 6,3 mil. lei. Kurtosis (boltirea) = 1,283 : Valoarea coeficientului de boltire este pozitiv relevnd o distribuie leptocurtic. Skewness (asimetria) = 1,204 : Valoarea pozitiv a coeficientului de asimetrie indic o asimetrie la dreapta (pozitiv). Sum (suma tuturor observaiilor) = 264 mil. lei : Cei 32 de studeni din anul 1 IDD au realizat un venit lunar de 264 mil. lei.

17

Din figura 8 observm c, pe ansamblu, eantionul are o distribuie dup venitul lunar asimetric la dreapta predominnd veniturile mici i medii. Curba frecvenelor este leptocurtic.

venitul lunar milioane lei


14 12 10 8 6 4

Frequency

2 0 0.0 5.0 10.0 15.0 20.0 25.0

Std. Dev = 6.31 Mean = 8.3 N = 32.00

venitul lunar milioane lei

Figura 8. Histograma i curba frecvenelor Distribuia dup venit a studenilor din anul 1, IDD

CAPITOLUL 5 ANALIZA STATISTIC BIVARIAT A DATELOR


5.1 Analiza statistic a gradului de asociere ntre dou variabile
Tratarea datelor n vederea analizei statistice a gradului de asociere presupune: construirea tabelelor de asociere i calculul frecvenelor condiionate; calculul i interpretarea lui hi-ptrat; calculul coeficienilor de asociere.

18

n acest subcapitol mi-am propus s studiez gradul de asociere dintre dou variabile nominale: domeniul de activitate i profesia respondentului. Distribuia eantionului de respondeni observai simultan dup cele dou variabile considerate poate fi obinut prin opiunea Crosstabs a comenzii Descriptive Statistics din meniul Analyze. Distribuia de frecven domeniul de activitate * profesia respondentului este obinut n crostabelul de mai jos. Tabelul ne arat cte personae ce activeaz ntr-un anumit domeniu de activitate au o anumit profesie.

Crosstab Count economist 4 16 3 23 profesia respondentului inginer jurist profesor 1 3 2 2 3 3 2 altele Total 5 19 8 32

domeniul de activitate Total

comert servicii altele

1 1

Dintre cei 5 respondeni care i desfoar activitatea n comer, 4 sunt de profesie economiti iar unul jurist. Dintre cei 19 respondeni care activeaz n domeniul serviciilor, 16 sunt economiti iar 3 ingineri. Dintre cei 8 respondeni care i desfoar activitatea n alte domenii 3 sunt economiti, 2 sunt juriti, 2 sunt profesori iar unul are alt profesie dect cele precizate n chestionar. Am reprezentat grafic, prin bare, distribuia respondentului. dup domeniul de activitate i profesia

20 18 16 14 12 10 8 6 4 profesia economist inginer jurist profesor altele comert servicii altele

Count

2 0

domeniul de activitate

Figura 9. Distribuia de frecven domeniul de activitate * profesia respondentului

19

(clustered bar charts)

Am analizat diferenele calitative prin calculul i interpretarea lui hi-ptrat (Pearson ChiSquare).
Chi-Square Tests Value 17.283a 18.906 7.173 32 df 8 8 1 Asymp. Sig. (2-sided) .027 .015 .007

Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases

a. 13 cells (86.7%) have expected count less than 5. The minimum expected count is .16.

Am citit din tabel valoarea testului hi-ptrat egal cu 17,283. Pentru 8 grade de libertate, valoarea semnificaiei (Asymp. Sig.) este egal cu 0,027 i deci este mai mic dect 0,05. n concluzie, se respinge ipoteza H0 i se accept ipoteza H1. Conform ipotezei H1, exist asociere ntre variabila domeniul de activitate i variabila profesia respondentului.

5.2

Analiza de regresie i corelaie


n acest subcapitol mi-am propus s analizez legtura dintre dou variabile, dintre care

una este efectul (rezultativa, dependenta) iar cealalt este cauza (factoriala, independenta). Am aplicat analiza de regresie pentru a evalua n ce msur variabila dependent venitul lunar milioane lei poate fi explicat prin variabila independent vrsta respondentului. Programul SPSS estimeaz parametrii modelului de regresie ales (am ales modelul de regresie simplu liniar). Pentru analiza modelului de regresie am parcurs urmtorii pai: estimarea parametrilor ecuaiei de regresie (pe baza metodei celor mai mici ptrate) i interpretarea regresiei n funcie de semnul i valoarea parametrilor modelului de regresie; testarea semnificaiei parametrilor de regresie.

Parametrii ecuaiei de regresie , ntr-un model liniar simplu, Y = + X + , sunt:


20

ordonata la origine (valoarea variabilei Y cnd X = 0);

panta dreptei, numit i coeficient de regresie;

Variabila independent (X) i variabila dependent (Y) sunt prezentate n tabelul Variables Entered.
b Variables Entered/Removed

Model 1

Variables Entered varsta responden a tului

Variables Removed .

Method Enter

a. All requested variables entered. b. Dependent Variable: venitul lunar milioane lei

n ecuaia de regresie, parametrii

i sunt necunoscui. n practic parametrii unui

model de regresie sunt estimai pe baza datelor la nivelul unui eantion observat: Y = a + bX , unde:

a i b sunt estimaii ale parametrilor


a Coefficients

i .

Model 1

(Constant) varsta respondentului

Unstandardized Coefficients B Std. Error -7.558 4.673 .537 .155

Standardi zed Coefficien ts Beta .534

t -1.618 3.457

Sig. .116 .002

a. Dependent Variable: venitul lunar milioane lei

Am obinut n tabelul Coefficients valorile estimaiilor parametrilor de regresie i anume valorile lui a i b (Unstandardized Coefficients). a (Constant) = -7,558 b (vrsta respondentului) = 0,537 Modelul de regresie estimat este: Y = 7,558 + 0,537 X

21

Deoarece am obinut o valoare pozitiv a coeficientului de regresie b, nseamn c exist o legtur direct ntre vrsta respondentului i cu 0,537 mil. lei. Am testat parametrii modelului de regresie folosind testul t. n tabelul Coefficients citim valoarea testului t i valoarea Sig. corespunztoare. Pentru coeficientul de regresie b, citim valoarea testului egal cu 3,457 i valoarea semnificaiei Sig. de 0,002. Deoarece Sig. este mai mic dect 0,05, atunci respingem ipoteza H0 ( nu difer semnificativ de 0) i acceptm ipoteza H1 ( difer semnificativ de 0). n conlcuzie, putem spune c exist legtur semnificativ ntre vrsta respondentului i venitul lunar obinut. venitul lunar obinut. Dac vrsta crete cu 1 an, atunci venitul lunar crete, n medie,

n continuare am studiat intensitatea legturii dintre variabilele vrsta respondentului i venitul lunar milioane lei. n acest sens am folosit analiza de corelaie i am obinut i interpretat indicatorii corelaiei. Valoarea R (valoarea coeficientului de corelaie) arat dac exist sau nu corelaie ntre variabila dependent (Y) i variabila independent (X). Valoarea lui R este egal cu 0,534, deci putem spune c exist o legtur strns (dar nu foarte strns) ntre cele dou variabile.
Model Summary Model 1 R R Square .534a .285 Adjusted R Square .261 Std. Error of the Estimate 5.4216

a. Predictors: (Constant), varsta respondentului

Putem calcula coeficientul de corelaie i cu ajutorul opiunii Bivariate a comenzii correlate din meniul Analyze. Tabelul Correlations prezint valorile coeficienilor de corelaie dintre variabilele vrsta respondentului i venitul lunar. Coeficientul de corelaie Pearson (Pearson Correlation) este

22

egal cu 0,534. Valoarea coeficientului este pozitiv deci, corelaia dintre variabile este direct i strns.
Correlations varsta responde venitul lunar ntului milioane lei varsta respondentului Pearson Correlation 1.000 .534** Sig. (2-tailed) . .002 N 32 32 venitul lunar milioane lei Pearson Correlation .534** 1.000 Sig. (2-tailed) .002 . N 32 32 **. Correlation is significant at the 0.01 level (2-tailed).

Testul t este aplicat pentru a verifica dac exist o corelaie semnificativ ntre cele dou variabile. Valoarea Sig. corespunztoare testului t este egal cu 0,002, deci putem concluziona c am obinut un coeficient de corelaie semnificativ.

5.3

Analiza dispersional (ANOVA)


n acest subcapitol mi-am propus s studiez influena domeniului n care i desfoar

activitatea studenii anului 1 IDD, asupra venitului lunar realizat. Pentru atingerea acestui obiectiv am aplicat procedeul de analiz ANOVA unifactorial (One-Way ANOVA) care analizeaz variana pentru o variabil cantitativ (venitul lunar) dependent de o singur variabil factor (domeniul de activitate). Prin ANOVA se compar venitul mediu pentru cele trei subpopulaii definite de variabila de grupare (respondenii care activeaz n comer, respondenii care activeaz n servicii i respondenii care activeaz n alte domenii). n SPSS, am ales opiunea One-Way ANOVA din comanda Compare Means a meniului Analyze. Pentru a verifica dac sunt ndeplinite restriciile cerute de ANOVA am bifat casetele de validare Descriptives, Homogeneity of variance i Means plot. Restriciile impuse unei analize ANOVA i verificarea lor constau n: restricia de normalitate (pentru a verifica normalitatea putem folosi: rezultatele din tabelul Descriptives, diagrama Boxplot vezi figura 5, diagrama Q-Q vezi figura 3, testul K-L-S); restricia de homoscedasticitate (pentru a verifica dac varianele grupelor sunt egale folosim testul Levene Test of Homogeneity of Variances);

23

restricia de independen;
Descriptives

venitul lunar milioane lei 95% Confidence Interval for Mean Lower Bound Upper Bound -.6317 6.0317 6.7187 12.8603 2.8299 13.2951 5.9762 10.5238

N comert servicii altele Total 5 19 8 32

Mean 2.7000 9.7895 8.0625 8.2500

Std. Deviation 2.6833 6.3712 6.2589 6.3067

Std. Error 1.2000 1.4617 2.2129 1.1149

Minimum 1.50 4.00 1.50 1.50

Maximum 7.50 25.00 15.00 25.00

Test of Homogeneity of Variances venitul lunar milioane lei Levene Statistic 1.627 df1 2 df2 29 Sig. .214

n tabelul ANOVA am obinut valoarea statisticii test Fisher, valoarea semnificaiei Sig. i elementele de calcul pentru statistica test F (Fisher).
ANOVA venitul lunar milioane lei Sum of Squares 199.323 1033.677 1233.000 df 2 29 31 Mean Square 99.662 35.644 F 2.796 Sig. .078

Between Groups Within Groups Total

Statistica test F se calculeaz dup relaia:

F=

2 SE 2 SR

SE2 reprezint estimatorul varianei intergrupe (Between-Groups); SR2 reprezint media varianelor de grup i arat variana din interiorul fiecrei grupe (Within Groups). Valoarea statisticii F este mic (2,796) iar semnificaia Sig. corespunztoare este egal cu 0,078. Deoarece Sig. este mai mare dect 0,05 nu se respinge ipoteza H0 (ipoteza de egalitate a mediilor), deci, nu exist diferene semnificative ntre domeniile de activitate cu privire la venitul mediu lunar realizat. Graficul corespunztor pentru mediile din cele trei domenii de activitate este prezentat n figura de mai jos:

24

12

10

Mean of venitul lunar milioane lei

2 comert servicii altele

domeniul de activitate

Figura 10. Venitul mediu lunar pe domenii de activitate

CAPITOLUL 6 ESTIMAREA I TESTAREA STATISTIC


6.1 Estimarea parametrilor prin interval de ncredere
Prin estimare se nelege un procedeu prin care se generalizeaz rezultatele observate pe un eantion la nivelul populaiei din care este extras, adic se afl valoarea unui parametru al unei populaii pe baza datelor nregistrate la nivelul unui eantion extras din aceasta. (Elisabeta Jaba, Ana Grama, pag. 176). Estimarea se poate efectua punctual sau prin interval de ncredere. Estimarea punctual presupune o estimaie calculat pe baza datelor nregistrate la nivelul unui eantion. Estimarea prin interval de ncredere presupune aflarea limitelor de ncredere ale unui interval care acoper valoarea adevrat a unui parametru al populaiei. 6.1.1 Estimarea prin interval de ncredere a unei medii i unei proporii Pentru a estima prin interval de ncredere vrsta medie, respectiv venitul mediu al tuturor studenilor din anul 1 IDD, studii post-universitare FIBAS, am selectat opiunea Explore din comanda Descriptive Statistics a meniului Analye. Caseta Descriptives permite calculul intervalului de ncredere 95%.

25

Descriptives varsta respondentului Mean 95% Confidence Interval for Mean Mean 95% Confidence Interval for Mean Statistic 29.4375 27.1777 31.6973 8.2500 5.9762 10.5238 1.1149 Std. Error 1.1080

Lower Bound Upper Bound

venitul lunar milioane lei

Lower Bound Upper Bound

Limita inferioar a intervalului de ncredere (Lower Bound) este: x z / 2 Lmita superioar a intervalului de ncredere (Upper Bound) este: x + z / 2

n n

n concluzie, vrsta medie a populaiei este cuprins, cu o ncredere de 95%, ntre 27,17 i 31,69 ani. Venitul mediu al populaiei este cuprins, cu o ncredere de 95%, ntre 5,97 i 10,52 milioane lei.

Pentru a estima prin interval de ncredere proporia studenilor din anul 1, IDD studii post-universitare FIBAS, care l prefer cel mai mult la preedinie pe Traian Bsescu (preferina 1) am efectuat urmtorul set de operaii: 1. Am calculat, la nivelul eantionului observat, proporia rspunsurilor pentru Traian Bsescu ca prima preferin.
preferinta 1 pentru candidatul la presedintie Frequency 21 8 2 1 32 Percent 65.6 25.0 6.3 3.1 100.0 Valid Percent 65.6 25.0 6.3 3.1 100.0 Cumulative Percent 65.6 90.6 96.9 100.0

Valid

basescu nastase becali alta preferinta Total

Din totalul celor 32 de respondeni, 65,6% l prefer cel mai mult pe Traian Bsescu pentru preedinie. 2. Am calculat eroarea standard Sp dup relaia:
Sp = s , unde n s = f(1 - f) este abaterea standard iar n este volumul esantionul ui

Aplicm formula de mai sus pentru f = 0.656 si n = 32 persoane


26

i obinem:

Sp =

0.656 (1 0.656 ) 32

0.656 0.344 32

0.225 32

0.475 = 0.084 5.656

3. Am calculat limitele I.C. (pentru z = 1,96 )


Limita inf. : L i = f 1,96 S p = 0,656 1.96 0.084 = 0.656 - 0.164 = 0.492 (49.2%) Lmita sup. : L s = f +1.96 S p = 0.656 +1.96 0.084 = 0.656 + 0.164 = 0.82 (82% )

Cu o ncredere de 95%, proporia studenilor din anul 1, IDD studii postuniversitare FIBAS, care l prefer cel mai mult la preedinie pe Traian Bsescu (preferina 1) este cuprins ntre 49,2% i 82%. Acest rezultat arat o pondere destul de ridicat a preferinei pentru Traian Bsescu.

6.1.2

Estimarea prin interval de ncredere a diferenei dintre dou medii i

dou proporii

Pentru a estima prin interval de ncredere diferena dintre venitul mediu realizat de persoanele ce i desfoar activitatea n comer ( 1 ) i venitul mediu realizat de persoanele ce i desfoar activitatea n domeniul serviciilor ( 2 ) am calculat limitele I.C. Limita inferioar (Lower) este: ( x 1 x 2 ) t /2
2 2 s1 s 2 + n1 n 2

2 2 s1 s 2 + Lmita superioar (Upper) este: ( x 1 x 2 ) + t /2 n1 n 2

Intervalul de ncredere pentru diferena dintre cele dou medii este calculat n SPSS cu ajutorul opiunii Independent Samples T Test (vezi output-ul de mai jos).

27

Independent Samples Test venitul lunar milioane lei Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Lower Upper -5.9294 -7.0628 -1.6706 -.5372

F Equal variances assumed Equal variances not assumed .901

Sig. .356

t -3.765 -2.974

df 17 5.112

Sig. (2-tailed) .002 .030

Mean Difference -3.8000 -3.8000

Std. Error Difference 1.0093 1.2776

Diferena dintre venitul mediu a respondenilor din cele dou domenii de activitate este acoperit de intervalul (-5,93 milioane lei; -1,67 milioane lei). Prin urmare, ne putem atepta, cu o ncredere de 95%, ca venitul mediu al persoanelor din comer s fie mai mic dect venitul mediu al persoanelor din domeniul serviciilor cu o valoare din intervalul (1,67 mil. lei; 5,93 mil. lei).

6.2

Testarea statistic
Demersul testrii unei ipoteze presupune parcurgerea mai multor etape: 1. Se formuleaz ipotezele, n funcie de problema pus; 2. Se alege un test n funcie de distribuia de selecie a statisticii considerate; 3. 4. Se alege un prag de semnificaie

pentru test;

Se definesc regiunile de acceptare i de respingere a ipotezei H0;

5. Se calculeaz valoarea statisticii test; 6. Se compar valoarea calculat a statisticii test cu valoarea teoretic; 7. Se ia decizia de a nu respinge sau de a respinge ipoteza admis. 6.2.1 Testarea unei medii i unei proporii Testarea egalitii unei medii cu o valoare specificat se realizeaz folosind

opiunea One-Sample T Test din comanda Compare Means a meniului Analyze. Am formulat ipoteza cu privire la vrsta respondenilor i anume, vrsta medie a respondenilor este egal cu o constant specificat (30 ani). Vrsta medie a respondenilor este egal cu 29,43 ani (vezi output-ul One-Sample Statistics). Valoarea specificat este egal cu 30 ani (vezi output-ul One-Sample Test). Diferena dintre vrsta medie observat i valoarea specificat este egal cu -0,5625 (vezi output-ul One-Sample Test).

28

One-Sample Statistics N varsta respondentului 32 Mean 29.4375 Std. Deviation 6.2679 Std. Error Mean 1.1080

One-Sample Test Test Value = 30 95% Confidence Interval of the Difference Lower Upper -2.8223 1.6973

varsta respondentului

t -.508

df 31

Sig. (2-tailed) .615

Mean Difference -.5625

Valoarea semnificaiei testului t (Sig.) este mai mare dect 0,05 i intervalul de ncredere conine valoarea 0 deci, putem concluziona c nu exist o diferen semnificativ ntre vrsta medie observat n eantion i valoarea specificat (30 ani).

32

31

30

95% CI varsta respondentului

29

28

27

26
N= 32

varsta respondentulu

Figura 10. Venitul mediu lunar pe domenii de activitate Prin preocedeul Error Bar se poate observa c valoarea specificat (30 ani) este cuprins n intervalul de ncredere. Ca urmare, se poate spune cu o ncredere de 95% c se accept ipoteza de nul, adic de egalitate a vrstei medii a persoanelor din eantion cu valoarea specificat (30 ani). Testarea proporiei cu o valoare specificat se realizeaz folosind testul

neparametric Binomial din meniul Analyze. Am formulat ipoteza c proporia uneia dintre dintre grupele definite prin variabila sexul respondentului nu difer semnificativ de proporia specificat de 50%.

29

Binomial Test Category feminin masculin N 22 10 32 Observed Prop. .69 .31 1.00 Test Prop. .50 Asymp. Sig. (2-tailed) .052a

sexul respondentului

Group 1 Group 2 Total

a. Based on Z Approximation.

Proporia observat n eantion pentru grupa 1 (feminin) este de 69% n timp ce proporia specificat este de 50%. Semnificaia corespunztoare testului Binomial (Asymp. Sig.) este mai mare dect 0,05, deci putem concluziona, cu o ncredere de 95%, c proporia respondenilor de sex feminin n eantion nu difer semnificativ de proporia specificat (50%). 6.2.2 Testarea diferenei dintre dou medii i dou proporii Testarea diferenei dintre dou medii se realizeaz folosind opiunea IndependentSamples T Test pentru dou populaii (grupe) independente din comanda Compare Means a meniului Analyze. Prin acest prodeceu, se testeaz dac mediile a dou grupe sunt egale. Prin acest demers mi-am propus s verific dac venitul mediu lunar difer pentru grupa respondenilor care i desfoar activitatea n comer i pentru grupa respondenilor care i desfoar activitatea n servicii. Venitul mediu lunar al persoanelor din comer este egal cu 2,7 milioane lei iar venitul mediu lunar al persoanelor din servicii este egal cu 6,5 milioane lei (vezi output-ul Group Statistics).
Group Statistics domeniul de activitate venitul lunar milioane lei comert servicii N 5 14 Mean 2.7000 6.5000 Std. Deviation 2.6833 1.6408 Std. Error Mean 1.2000 .4385

Calculul statisticii test t pentru compararea mediilor a dou populaii cere s se verifice dac deviaiile standard la nivelul celor dou grupe sunt semnificativ diferite. n acest scop se folosete testul Levene de egalitate a varianelor (Levenes Test for Equality of Variance). Nivelul de semnificaie observat pentru acest test este mare (Sig. este egal cu 0,356) deci se folosesc variane reunite (Equal variances assumed).

30

Independent Samples Test venitul lunar milioane lei Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Lower Upper -5.9294 -7.0628 -1.6706 -.5372

F Equal variances assumed Equal variances not assumed .901

Sig. .356

t -3.765 -2.974

df 17 5.112

Sig. (2-tailed) .002 .030

Mean Difference -3.8000 -3.8000

Std. Error Difference 1.0093 1.2776

innd cont de cele prezentate mai sus, testul t pentru egalitatea mediilor este egal cu -3,765 cu 17 grade de libertate i o probabilitate Sig. de 0,002 (mai mic dect 0,05) i ne arat c mediile celor dou grupe difer semnificativ. Intervalul de ncredere pentru diferena celor dou valori (95% Confidence Interval of the Difference) nu conine pe zero, ca urmare putem concluziona c venitul mediu lunar realizat de respondenii din comer difer semnificativ de venitul mediu lunar realizat n servicii. Testarea diferenei dintre dou proporii se realizeaz cu ajutorul testului neparametric hi-ptrat (Chi Square). Testul verific, pentru o variabil nominal, dac distribuia de frecven a variabilei concord cu distribuia teoretic a frecvenelor. n ipoteza de nul presupunem egalitatea proporiilor corespunztoare opiunilor pentru preferin 1 privind candidatul la preedinie. Frecvenele nregistrate pentru opiunile privind preferina 1 sunt: Bsescu = 21 Nstase = 8 Bsescu = 8 Nstase = 8 Becali = 2 Alte opiuni = 1 Becali = 8 Alte opiuni = 8

Frecvenele teoretice (conform ipotezei de nul) sunt:

Diferenele dintre frecvenele observate i frecvenele teoretice sunt prezentate n coloana Residual.
preferinta 1 pentru candidatul la presedintie basescu nastase becali altele Total Observed N 21 8 2 1 32 Expected N 8.0 8.0 8.0 8.0 Residual 13.0 .0 -6.0 -7.0

31

Test Statistics preferinta 1 pentru candidatul la presedintie a Chi-Square 31.750 df 3 Asymp. Sig. .000 a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 8.0.

Valoarea estimat a statisticii test hi-ptrat (31,750) este semnificativ la un nivel de ncredere de 99%, deoarece valoarea semnificaiei Asymp. Sig. este mai mic dect 0,01 i deci se respinge ipoteza H0. Putem trage concluzia c opiunile respondenilor privind preferina 1 pentru cei 4 candidai la preedinie (Bsescu, Nstase, Becali i alii) nu au aceeai proporie. distribuia nu este uniform.

32

CAPITOLUL 7 CONCLUZII
Analizele aplicate prin utilizarea programului SPSS au permis atingerea obiectivelor propuse prin acest proiect i anume caracterizarea studenilor din anul 1 IDD, FIBAS, dup vrst, venit, sex, jude, profesie, domeniul de activitate etc. Din eantionul observat (32 de respondeni), 31,3% sunt persoane de sex feminine iar 68,7% sunt personae de sex masculine. Din punct de vedere profesional, 71,9% sunt economiti, 9,4% ingineri, 9,4% juriti, 6,3% profesori i 3,1% au alte profesii. Cei mai muli studeni activeaz n domeniul serviciilor (59,4%), doar 15,6% n comer iar 25% i desfoar activitatea n alte domenii. Conform analizei gradului de asociere exist legtur semnificativ ntre variabila domeniul de activitate i variabila profesia respondentului. n ceea privete mediul de reziden, o singur persoan locuiete n mediul rural, n timp ce marea majoritate (96,9%) locuiesc n mediul urban. Peste 50% dintre studenii anului 1 IDD sunt din judeul Iai (62,5%), 15,6% sunt din judeul Botoani, 9,4% sunt din judeul Vaslui, 6,3% sunt din judeul Neam, 3,1% sunt din judeul Bacu i tot 3,1% din judeul Harghita. La nivelul eantionului, 78,1% dintre studeni nu aparin nici unui partid politic, n timp ce 21,9% aparin unei formaiuni politice. Vrsta medie a studenilor din anul 1, IDD observai n eantion este de 29,34 ani. La nivelul populaiei, vrsta medie este cuprins, cu o ncredere de 95%, ntre 27,17 i 31,69 ani. Conform testului t (One Sample T Test) putem concluziona c nu exist o diferen semnificativ ntre vrsta medie observat n eantion i valoarea specificat (30 ani). Oricare student din cei 32 de studeni din anul 1 IDD, realizeaz n medie un venit lunar de 8,25 mil. lei. Venitul mediu al populaiei este cuprins, cu o ncredere de 95%, ntre 5,97 i 10,52 milioane lei. Am aplicat analiza de regresie pentru a evalua n ce msur venitul lunar milioane lei poate fi explicat prin variabila vrsta respondentului. Conform modelului de regresie estimat, dac vrsta crete cu 1 an, atunci venitul lunar crete, n medie, cu 0,537 mil. lei. Legtura dintre cele dou variabile este strns (valoarea lui R este egal cu 0,534). Dac prin analiza varianei (ANOVA) am observat c domeniul de activitate (variabil care are patru categorii: industrie, comer, servicii i altele) nu influeneaz semnificativ venitul mediu lunar realizat, totui, testul t pentru eantioane independente arat c venitul mediu lunar realizat de respondenii din comer difer semnificativ de venitul mediu lunar realizat n servicii.

n ceea ce privete proporia studenilor din anul 1, IDD studii postuniversitare FIBAS, care l prefer cel mai mult la preedinie pe Traian Bsescu (preferina 1), ea este cuprins ntre 49,2% i 82%. Acest rezultat arat o pondere destul de ridicat a preferinei pentru Traian Bsescu.
33

n concluzie, studenii anului 1 IDD, FIBAS, sunt tineri (media aproximativ 30 de ani), obin venituri peste venitul mediu pe ar i sunt majoritatea de profesie economiti.

BIBLIOGRAFIE
JABA, E., STATISTICA, EDIIA A III-A, EDITURA ECONOMIC, BUCURETI, 2002; JABA, E., GRAMA, A., ANALIZA STATISTIC CU SPSS SUB WINDOWS, EDITURA POLIROM, IAI, 2004.

34