Sunteți pe pagina 1din 27

Prelucrarea unei variabile cantitative

A. Privim baza de date ca reprezentand un singur esantion.


Sondaj simplu aleator
Case Processing Summary

Cases
Valid Missing Total
N Percent N Percent N Percent
Scor obtinut 365 100,0% 0 ,0% 365 100,0%

max
Q3
Descriptives
Me
Statistic Std. Error
Scor obtinut Mean 1,77 ,136
95% Confidence Lower Bound 1,50
Q1
Interval for Mean Upper Bound
2,04

5% Trimmed Mean 1,82


Median 2,00 min
Variance 6,744
Std. Deviation 2,597
Minimum -5
Maximum 6
Range 11
Interquartile Range 4
Skewness -,343 ,128
Kurtosis -,594 ,255
B. Privim baza de date ca fiind formată din mai multe esantioane.
Sondaj stratificat Variabila
analizata

Criteriul de
stratificare
Descriptives

societ Statistic Std. Error


Scor obtinut SC1 Mean 3,28 ,180
Case Processing Summary
95% Confidence Lower Bound 2,92
Cases Interval for Mean Upper Bound
Valid Missing Total 3,63
societ N Percent N Percent N Percent
5% Trimmed Mean 3,33
Scor obtinut SC1 116 100,0% 0 ,0% 116 100,0%
SC2 160 100,0% 0 ,0% 160 100,0%
Median 3,00
SC3 89 100,0% 0 ,0% 89 100,0% Variance 3,767
Std. Deviation 1,941
Minimum -2
Maximum 6
Range 8
Interquartile Range 3
Skewness -,115 ,225
Kurtosis -,662 ,446
SC2 Mean ,45 ,204
95% Confidence Lower Bound ,05
Interval for Mean Upper Bound
,85

5% Trimmed Mean ,44


Median ,00
Variance 6,652
Std. Deviation 2,579
Minimum -5
Maximum 5
Range 10
Interquartile Range 5
Skewness -,019 ,192
Kurtosis -1,083 ,381
SC3 Mean 2,18 ,228
95% Confidence Lower Bound 1,73
Interval for Mean Upper Bound
2,63

5% Trimmed Mean 2,24


Median 3,00
Variance 4,626
Std. Deviation 2,151
Minimum -3
Maximum 6
Range 9
Interquartile Range 4
Skewness -,393 ,255
Kurtosis -,338 ,506
Teste statistice utilizate pentru verificarea ipotezelor privind mediile a două grupuri
A. Esantioane independente
Group Statistics

Sexul persoanei Std. Error


intervievate N Mean Std. Deviation Mean
Media masculin 269 7,8086 1,13852 ,06942
feminin 374 7,9278 1,06309 ,05497

Independent Samples Test

Levene's
Test for Eq.
of V. t-test for Equality of Means
95%
Std. Interval
Sig. Mean Error Diff.
F Sig. t df (2-tailed) Diff. Diff. Lo Up
Eq. V.
1,16 ,28 -1,36 641 ,17 -,12 ,09 -,29 ,05
assumed
Eq. V not
-1,35 553,2 ,18 -,12 ,09 -,29 ,05
assumed

Daca niv de semnificatie este mai mare de


0.05 se accepta ipoteza egalitatii dispersiilor
si se interppreteaza prima linie
Dacă testul efectuat este bilateral, putem lua decizia şi pornind de la
nivelul de semnificaţie. Valoarea din outputul SPSS se compară cu
0,05 (corespunzătoare unei probabilităţi de 0,95). Dacă este mai mare,
se acceptă ipoteza diferenţei nule, iar în caz contrar se acceptă
alternativa.
B. Esantioane dependente
Paired Samples Correlations

N Correlation Sig.
Pair Nota student-profesor
673 ,338 ,000
1 Nota student-personal adm.

Paired Samples Statistics

Std. Std. Error


Mean N Deviation Mean
Pair Nota student-profesor 6,36 673 2,306 ,089
1 Nota student-personal adm. 5,87 673 2,591 ,100

Paired Samples Test

Paired Differences

Std. 95% Interval


Std. Error Diff. Sig.
Mean Deviation Mean Lo Up t df (2-tailed)
Pair 1 Nota
student-profesor
Nota ,48 2,83 ,11 ,27 ,70 4,42 672 ,00001
student-personal
adm.

Dacă valoarea  este mică (uzual se


consideră 0,05), se respinge ipoteza
diferenţei nule între mediile variabilelor
pereche şi se acceptă alternativă.
Modelul de analiză dispersională unifactorială
One-Way ANOVA
Cu ajutorul testului parametric de analiză dispersională ANOVA se pot examina două
sau mai multe eşantioane independente, pentru a determina dacă mediile populaţiilor
din care provin ar putea fi egale, putându-se pune astfel în evidenţă influenţa
factorului considerat sau a tratamentului efectuat.

H0: X 1  X 2  ......  X i  .........  X k pentru i=1,…,k


H1: există i  j astfel încât X i  X j
Test of Homogeneity of Variances
Dacă valoarea acestuia este mai mare de 0,05,
Cuantificati cu o nota de la 1 la 10 utilitatea se poate accepta ipoteza egalităţii varianţelor.
cursurilor
Levene
În exemplul considerat, se poate afirma că
Statistic df1 df2 Sig. dispersiile grupelor sunt egale, deoarece nivelul
3,260 9 663
663 0,054
0.054 de semnificaţie  este 0,054
ANOVA

Cuantificati cu o nota de la 1 la 10 utilitatea cursurilor desfasurate de-a


lungul facultatii in formarea profesionala
Sum of Mean
Squares df Square F Sig.
Between Groups 732,377 9 81,375 19,391 ,000
Within Groups 2782,276 663 4,196
Total 3514,654 672

Primele coloane indică tipul variaţiei, variaţia, numărul de grade de


libertate şi media variaţie şi valoarea calculată a raportului F. Un nivel
de semnificaţie  <0,05 duce la respingerea ipotezei nule
Chiar dacă, în urma aplicării, se respinge ipoteza egalităţii mediilor, este
posibil să existe subseturi pentru care diferenţele dintre medii să nu fie
semnificative. Pentru a verifica această ipoteză, din fereastra de definire a
testului se activează meniul Post Hoc.
Prelucrarea unei variabile calitative
A. Un esantion. Sondaj simplu aleator

Deoarece variabila
nu este numerica
nu putewm calcula
decat eventual
valoarea modala
Acord cu evaluarea

Cumulative
Frequency Percent Valid Percent Percent
Valid Acord total 74 20,3 20,3 20,3
Acord 189 51,8 51,8 72,1 Erorile de reprezentativitate
Indiferent 55 15,1 15,1 87,1 si limitele intervalului de
Dezacord 31 8,5 8,5 95,6
Dezacord total 16 4,4 4,4 100,0
incredere se calculeaza
Total 365 100,0 100,0 manual
B. Mai multe esantioane. Sondaj stratificat
Acord cu evaluarea

Cumulative
societ Frequency Percent Valid Percent Percent
SC1 Valid Acord total 22 19,0 19,0 19,0
Acord 83 71,6 71,6 90,5
Indiferent 7 6,0 6,0 96,6
Dezacord 4 3,4 3,4 100,0
Total 116 100,0 100,0
SC2 Valid Acord total 36 22,5 22,5 22,5
Acord 76 47,5 47,5 70,0
Indiferent 33 20,6 20,6 90,6
Dezacord 11 6,9 6,9 97,5
Dezacord total 4 2,5 2,5 100,0
Total 160 100,0 100,0
SC3 Valid Acord total 16 18,0 18,0 18,0
Acord 30 33,7 33,7 51,7
Indiferent 15 16,9 16,9 68,5
Dezacord 16 18,0 18,0 86,5
Dezacord total 12 13,5 13,5 100,0
Total 89 100,0 100,0
Eşantioane independente

1 eşantion 2 eşantioane 2 sau mai multe eşantioane

DA DA DA
n30 ni30 ni(1-pi) 5
n(1-p)  5 ni(1-pi) 5
nipi 5
np 5 nipi 5

NU NU NU

Testul z Testul z Testul χ2


Relaţia 4.1 Relaţia 4.2 Relaţia 4.5

Construim regiunea critică Testul Testul Exact


utilizând repartiţia binomială Exact Fisher Fisher-Freeman-Halton

Eşantioane dependente

2 eşantioane 2 sau mai multe eşantioane

Testul Testul
Mc Nemar Cochran’s Q
relaţia 4.6
w p
z (4.1)
p  1  p 
n

Ipotezele testului bilateral sunt:


H 0 : p1  p 2 şi H 1 : p1  p 2
w1  w2
Statistica testului este: t  (4.2)
1 1 
w 1  w   
 n1 n2 

w1= proporţia observată în eşantionul 1; n1 = volumul eşantionului 1;


w2= proporţia observată în eşantionul 2; n2 = volumul eşantionului 2;
w = variaţia estimată pe baza proporţiilor selecţiilor după relaţia:
n w  n 2 w2
w 1 1 .
n1  n2
Eşantion Eşantion ...Eşantion... Eşantion Total
1 2 j k (ni.) Notăm cu w1 j  n1 j n. j proporţia celor care îndeplinesc
Îndeplinesc caracteristica în eşantionul (grupul) j. Aceasta reprezintă estimatorul
n11 n12 ...n1j... n1k n1. proporţiei celor care îndeplinesc caracteristica în populaţia j din care a fost
caracteristica
Nu îndeplinesc selectat eşantionul j, notată cu p1 j .
n21 n22 ...n2j... n2k n2.
caracteristica Ipotezele testului sunt:
Volum eşantion H 0 : pi  p j  i, j  1,...., k şi H 1 :  i, j pentru care pi  p j .
n.1 n.2 ...n.j... n.k n
(n.j)

ni.
eij  n. j (4.4)
n
Unde i=1,..,l (numărul de linii – care în cazul de faţă este 2) iar
j=1,..,k (numărul de coloane – reprezintă numărul de eşantioane (grupuri)
pentru care se compară proporţiile).

Statistica testului este:


l k nij  eij 2
 c 2   (4.5)
i 1 j 1 eij
Valoarea calculată se compară cu valoarea teoretică corespunzătoare
nivelului de semnificaţie ales şi numărului de grade de libertate calculat
după relaţia df = (l-1) * (k-1). În situaţia în care  c 2   2 ,df , se respinge
ipoteza egalităţii proporţiilor.
În SPSS nu există posibilitatea procesării testului Student pentru
testarea ipotezelor cu privire la două proporţii (calculate ca pondere a celor
care deţin o caracteristică în două eşantioane independente). În acest caz
vom apela la testul χ2 (acesta poate fi utilizat pentru compararea proporţiilor
din două sau mai multe eşantioane independente). Pentru aceasta este
necesar să construim tabelul de contingenţă urmând calea: Analyze/
Descriptive Statistics/ Crosstabs.
masculin şi de 15,9% în cazul sexului feminin.
Ipotezele testului bilateral sunt: H 0 : p1  p 2 şi H 1 : p1  p 2

Tabel 4.7

Corupt * Sex Crosstabulation

Sex
masculin feminin Total
Corupt da Count 43 11 54
Expected Count 43,8 10,2 54,0
% within Sex 14,5% 15,9% 14,8%
nu Count 253 58 311
Expected Count 252,2 58,8 311,0
% within Sex 85,5% 84,1% 85,2%
Total Count 296 69 365
Expected Count 296,0 69,0 365,0
% within Sex 100,0% 100,0% 100,0%

Chi-Square Tests

Asymp.
Sig. Exact Sig. Exact Sig.
Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square ,089b 1 ,766
Continuity Correctiona ,012 1 ,913
Likelihood Ratio ,087 1 ,767
Fisher's Exact Test ,711 ,445
N of Valid Cases 365
a. Computed only for a 2x2 table
b. 0 cells (,0%) have expected count less than 5. The minimum
expected count is 10,21.
Esantioane dependente
Val2
Val1
mulţumit nemulţumit Total
mulţumit n11 n12 n1.
nemulţumit n21 n22 n2.
Total n.1 n.2 n

Aplicarea testului Testul Mc Nemar porneşte de la ipotezele:


H0= p.1= p1. şi H1= p.1? p1.
Deoarece volumul eşantioanelor din cele două anchete este acelaşi
ipotezele se reduc la:
H0= n.1= n1. H1= n.1? n1.
Cum n.1= n11+ n21 iar n1.= n11+ n12 , H0 se reduce la a testa n12=n21
Se va utiliza testul χ2 , frecvenţa teoretică fiind (n12+n21)/2.
2 2
 n  n21   n  n 21 
 n12  12    n21  12 
 f e  f t 2 2 2
 c2      
ft n12  n21
2
n12  n21 2
 c2  (4.6)
n12  n 21
 Analyze/ Descriptive Statistics/ Crosstabs/ Statistics
Din submeniul Statistics se selectează testul Mc Nemar. În
această variantă putem obţine şi un tabel de contingenţă în care
sunt reprezentate frecvenţele observate în cifre absolute şi
relative.
 Analyze/ Nonparametric Tests / 2 Related Samples

Val1 * Val2 Crosstabulation

Val2
Da Nu Total
Val1 Da Count 11 20 31
Chi-Square Tests
% within Val1 35,5% 64,5% 100,0%
% within Val2 68,8% 58,8% 62,0% Exact Sig.
% of Total 22,0% 40,0% 62,0% Value (2-sided)
Nu Count 5 14 19 McNemar Test ,004a
% within Val1 26,3% 73,7% 100,0% N of Valid Cases 50
% within Val2 31,3% 41,2% 38,0% a. Binomial distribution used.
% of Total 10,0% 28,0% 38,0%
Total Count 16 34 50
% within Val1 32,0% 68,0% 100,0%
% within Val2 100,0% 100,0% 100,0%
% of Total 32,0% 68,0% 100,0% Valoarea p=0,004 (tabel 4.14) este mai mică decât
=0,05. În aceste condiţii se respinge ipoteza diferenţei
nule. Proporţia celor care prezintă simptome de angină s-
a ameliorat în urma aplicării tratamentului.

S-ar putea să vă placă și