Sunteți pe pagina 1din 25

Academia de Studii Economice Bucureti

Facultatea de Cibernetic, Statistic i Informatic Economic

PROIECT SONDAJE I ANCHETE STATISTICE

Profesor coordonator: Conf.univ.dr. Ileana Niculescu-Aron


Student: Mazilu Oana Teodora, Grupa 1070

1. Prelucrarea variabilelor calitative


Pentru prelucrarea variabilelor calitative am ales ntrebarea numarul 4 din modulul C al
chestionarului, aceasta fiind:
4.Atunci cand mancati, obisnuiti:
a. sa nu-mi distraga nimic atentia (TV, radio, etc.)
b. sa fie un loc confortabil ( canapea, pat, etc.)
c. lucrez la un proiect, calculator, teme etc.
d. ascult muzica, stiri
e.alt situaie (precizai care)
Estimarea intervalului de ncredere:

Tratarea nonraspunsurilor:
2

Avem 3 nonraspunsuri si 2 raspunsuri cu 2 , respective 1 cu 3 care nu fac parte din raspunsurile


posibile. Inlocuim atat nonraspunsul cat si celelalte doua raspunsuri aberante cu valoarea 3, care
reprezinta valoarea mediei (lucrez la un proiect).
Datele dupa tratarea nonraspunsurilor:

Interval de incredere
Interpretare:
3

Media: 2,72
Lower Bound: 2.66
Upper Bound: 2.79
Pentru un nivel de semnificatie de 95%, intervalul de incredere este [2.66, 2.79] de unde rezulta
faptul ca raspunsul prefererat de respondent (valoarea reala a mediei) se afla in acest interval.

Interpretare grafic:
Analizand graficul de mai sus dar si din tabelul de frecvente de mai sus, se poate observa ca
37,01% dintre respondeti prefera sa asculte muzica, stiri, 27,8% prefer sa fie un loc confortabil,
20,8% prefer sa nu fie distrasi de nimic, 11,5% dintre acestia prefer sa lucreze la un proiect, iar
2,4% prefera alte situatii.

Pentru prelucrarea variabilelor calitative am ales ntrebarea numarul 3 din modulul C al


chestionarului, aceasta fiind:
3.Cand sunteti la domiciliu, unde preferati sa luati masa?
a. mananc intotdeauna in bucatarie
b. nu tin cont de camera in care ma aflu
c. mananc intotdeauna la televizor
d. cel mai des la birou, in fata calculatorului/ laptop-ului
e.alt situaie (precizai care)
Se observa ca nu avem nonraspunsuri.

Avem 2 raspunsuri cu 3, respective 1 cu 6 care nu fac parte din raspunsurile posibile. Inlocuim
cele doua raspunsuri aberante cu valoarea 2 corespunzatoare cu valoarea mediei 2.

Interval de incredere
Interpretare:
Media: 2,08
Lower Bound: 2.02
Upper Bound: 2.14
Pentru un nivel de semnificatie de 95%, intervalul de incredere este [2,02, 2,14] de unde rezulta
faptul ca raspunsul prefererat de respondent (valoarea reala a mediei) se afla in acest interval.

Interpretare grafic

Analizand graficul de mai sus dar si din tabelul de frecvente de mai sus, se poate observa ca
44,8% dintre respondeti prefera sa manance in bucatariei, 23,2%nu tin cont de camera, 18,6 %
dintre acestia manaca in birou, in fata calculatorului, 12,6% intotdeauna mananca in fata
televizorului, iar 1,1% prefera alte situatii.

2. Analiza variabilelor numerice


1.Dati o nota de la 1 la 10 in functie de cat de important este pentru dumneavoastra sa mancati
sanatos.
( 1=cel mai puin important, 10=cel mai important)

Estimare(intervalul de incredere), grafic , interpretare


Identificarea nonraspunsurilor

Inlocuim nonraspunsurile cu media seriei:

Noua variabila obtinuta in urma corectarii nonraspunsurilor.

Analiza statistica a variabilei numerice

Interval de incredere
Pentru un nivel de semnificatie de 95%, intervalul de incredere este [ 7,753 , 7,949 ] si semnifica
faptul ca raspunsul care apare cel mai frecvent se afla in acest interval.
Grafic (Histograma)

10

Interpretare
Analizand graficul de mai sus putem spune ca din totalul de raspunsuri(1490) , cel mai frecvent
raspuns corespunde valorii medii de 7.85 , de unde rezulta ca mancarea sanatoasa este importanta
pentru respondent

Teste pentru esantionare independente


Testul t

Interpretare Group Statistics


Factorul de grupare folosit este sexul iar in urma output-lui se observa ca persoanele de sex
feminine au raspuns cu o nota medie de 8.050 despre importanta mancatului sanatos, iar cei de
sex masculine au raspuns cu o nota medie de 7.705.
Statistica testului
Test bilateral, nivel de semnificartie 95%.
2

F = M
Sig. = 0.000 < 0,05 putem spune ca exista diferente intre diferente intre notele acordate de
respondent in functie de sexul acestora, cu o probabilitate de 100%.(1-0.000).
Testarea homoscedasticitatii
Ipoteze

H 0 : 2F = 2M

11

H1: F M
Testul F = 5,963 si Sig. F =0.015 > 0.05, deci acceptam ipoteza nula( H 0 ) si respingem ipoteza

H1 .

Rezulta homoscedasticitatea erorilor aleatoare.

Testul de normalitate

Interpetare output
Normalitatea distributiei datelor se poate analiza in functie de valorile Skewness si Kurtosis.
Se calculeaza z-scores pentru valorile Skewness astfel:
F:

- 1.640 / 0.084 = - 19.5238 [-1.96, 1.96]

M:

- 1.352 / 0.099 = - 13.6565 [-1.96, 1.96]

Concluzie: populatia statistica nu este normal distribuita.

12

Test pentru observatii perechi dependente

Primul table arata media care este 7.907, numarul de cazuri(1460) si abaterea standard pentru
cele doua grupuri.
Al doilea tablel arata gradul corelatiei dintre cele doua valori; aceasta este de 0,09.
Din al treilea table reiese ca nivelul semnificatiei este 0.

ANOVA

13

Interpretare output
Sig = 0.000 <0,05 se respinge ipoteza nula si se accepta ipoteza H1, conform careia mediile nu
sunt egale , de unde rezulta ca sexul respondentilor influenteaza nota acordata importantei
mancatului sanatos.

2. Considerai c stilul dumneavoastr de via este sntos? Evaluai pe o scal de la 1 la 10


(unde 1=cel mai puin sntos, 10=cel mai sntos).
Estimare(interval de incredere), grafic, interpretare

Pentru un nivel de semnificatie de 95%, intervalul de incredere este [7,072, 7,228] si semnifica
faptul ca raspunsul care apare cel mai frecvent se afla in acest interval.

14

Din histograma reiese ca dintr-un total de 1490 de persoane, cei mai multi considera ca au un stil
de viata sanatos.

Teste pt esantioane independente


Testul t pentru esantioane independente
Din primul table reiese ca respondentii din anul II de facultate acorda o nota de 7.031 pentru
stilul lor de viata din punct de vedere alimentar, pec and rezpondentii din anul I acorda o nota de
7.241.

15

Testu t pentru esantioane independente se utilizeaza pentru a putea compara nota medie acordata
stilului de viata de catre persoanele din anul II si din anul I.
Valoarea lui F(cea din tabel) este 1,15 care este mai mare decat 0.05, deci va trebui sa verificam
ramura aferenta variantelor inegael. Sig=0.284>0.05, inseamna ca mediile sunt egale. Rezullta ca
anul de studiu nu influenteaza nota acordata stilului de viata.

Testul de normalitate

Avand in vedere cele doua teste, se poate observa ca Sig< 0,05 de unde rezulta ca populatia nu
este normal distribuita.

Test pt observatii perechi dependente(testul t)

Primul table arata media care este 7.139, numarul de cazuri(1460) si abaterea standard pentru
cele doua grupuri.
Al doilea tablel arata gradul corelatiei dintre cele doua valori; aceasta este de -0.03.
16

Din al treilea table reiese ca nivelul semnificatiei este 0.

ANOVA

Interpretare output
Avand in vedere ca Sig>0.05, rezulta ca stilul de viata al unui om nu este influentat de sexul
acestuia. Sexul nu influenteaza stilurile de viata
Raportul F se calucleaza prin impartirea Mean Square1 la Mean Square2, rezultand 0.017.

3. Variabila ordinala
1.

Obisnuiti sa luai masa :


Zilnic
a. acas/cmin
b. in oras ( restaurant, loca,
cantina etc.)
c. gustare pe drum, intre 2
destinatii
d. la prieteni/ rude

2-3 ori/sapt

17

4-5 ori/luna

Mai rar

18

19

20

Analiza legaturilor dintre variante


Varianta numerica si varianta numerica

Legatura existenta intre cele doua variabile este directa, de intensitate redusa, cu semnificatie
statistica. Pearson Correlation=0,303

21

Varianta numerica si varinta ordinala

Pearson Corrlelation este -0,053 rezulta ca legatura intre cele doua variabile este inversa.

22

Testul Chi Square pentru variabile nominale


1.

Cand sunteti la domiciliu, unde preferati sa luati masa?

23

2.Atunci cand mancati, obisnuiti:

24

25