Sunteți pe pagina 1din 43

Anlise de Dados

Maro/2011

Utilizao do SPSS
(Statistical Package for The Social Sciences)

Guia Prtico I

Prof. Carlos Reis

Programa Utilizao do SPSS


1. Introduo
2. Origem
3. Abordagem conceptual
4. reas de interesse
5. Ambiente de trabalho
6. Criao de ficheiro de dados
7. Importao de ficheiros
8. Anlise estatstica de dados
9. Anlise de grficos
10. Ajuda - Utilizao do tutorial
Bibliografia

PESTANA, M. H., GAGEIRO, J. N., Anlise de Dados para


Cincias Sociais a complementaridade do SPSS, Ed. Slabo,
1998

PEREIRA, Alexandre, SPSS Guia prtico de utilizao Anlise


de Dados para Cincias Sociais e Psicologia, Ed. Slabo, Lisboa,
1999

Prof. Carlos Reis

HILL MAGALHES, Manuela, Hill, ANDREW, Investigao por


Questionrio, Ed. Slabo, Lisboa, 2000.

Site:

www.spss.com

1. Introduo
O SPSS um package estatstico que integra diversas
funcionalidades que envolvem a recolha, validao e a
anlise de dados. A sua utilizao deve ser sempre
supervisionada por uma boa orientao em termos de
conhecimento e domnio das tcnicas estatsticas
envolvidas.

1.1 Objectivo:
Dotar os formandos de conhecimentos bsicos
para a utilizao de determinadas tcnicas para a
obteno e anlise de resultados estatsticos.

1.2 Requisitos bsicos:

Estatstica (ou que utilizem como apoio um livro


de estatstica).
Informtica (windows,..).

1.3 Resultados esperados:


Introduzir dados num novo ficheiro; gravar
ficheiros e abrir ficheiro criado anteriormente;
definir e transformar variveis;
Importar dados do Excel e de outras aplicaes;
Prof. Carlos Reis

Analisar dados (estatstica univariada e bivariada,


tabelas e grficos);
Executar alguns procedimentos de estatstica
inferencial.

Prof. Carlos Reis

2. Origem

Universidade de Londres nos anos 60. Tornou-se


muito popular no meio acadmico a partir da
dcada de 70;

Alm do SPSS, foram desenvolvidos na dcada de 60


vrios softwares estatsticos. Dentre esses, podem ser
citados:
SAS (Statistic Analysis System): foi desenvolvido na

Universidade da Carolina do Norte; semelhante ao


SPSS; contm vrios mdulos; muito popular nos
institutos de pesquisa;
"BMD"

(Biomedical
Computer
Programs):
desenvolvido na Universidade da Califrnia.

EPINFO: foi desenvolvido sob os auspcios da ONU,

para ser utilizado e popularizado na rea mdica;


possui diversos mdulos estatsticos; todavia,
tecnicamente constitui um software limitado,
principalmente quanto aos seus recursos grficos;

Prof. Carlos Reis

SPHINX:

originrio da Frana; possui


particularidades como a capacidade de realizar
anlises lexicais, factoriais e de correspondncias
mltiplas; ao contrrio dos softwares tradicionais,
possui uma viso dos dados que vai do particular ao
geral;

Alguns endereos estatsticos:


www.spss.com o site do SPSS com
alguns links interessantes.

www.statsoft.com o site de um
pacote
menos
Statistica.

conhecido,

chamado

www.statsoft.com/textbook/stathome.ht
ml

trochim.human.cornell.edu/selstat/ssstart
.htm um site para seleccionar
procedimentos estatsticos.

www.ats.ucla.edu/stat/ o site sobre


recursos acadmicos da Univiversidade
Califrnia Los Angeles (UCLA).

Prof. Carlos Reis

3. Abordagem conceptual
Segundo alguns especialistas, o SPSS :

uma poderosa ferramenta informtica que


permite realizar clculos estatsticos complexos,
e visualizar os seus resultados, em poucos
segundos, (Pereira, 1999).

uma das muitas aplicaes para o tratamento


estatstico de dados disponveis e das mais
divulgadas no mundo inteiro (Fonseca & Silva,
2003).

um software til para gerir e analisar


estatisticamente uma matriz de dados. Processa
em ambientes DOS e Windows e possui uma
viso que vai do geral para o particular.

um poderoso software estatstico especialmente


desenvolvido para a utilizao por profissionais
de cincias humanas. Diferentemente de outros
pacotes estatsticos existentes no mercado, o
SPSS apresenta uma interface bastante amigvel
ao usurio, facilitando em muito suas anlises
estatsticas
(Valentin,
Fernando,
2001:
fvalentin@ig.com.br)

Prof. Carlos Reis

4. reas de interesse
O SPSS pode ser utilizado nas mais diversas
reas do conhecimento e aplicaes:

Marketing
Psicologia
Administrao
Educao
Cincias Sociais
Servio Social
Economia
Governamental
Finanas
Sade Pblica
Pesquisa de Mercado
Pesquisa Social
Pesquisa Eleitoral
Pesquisa de Opinio
Pesquisa de Mdia

(Valentin, Fernando, 2001)

Prof. Carlos Reis

Investigao cientifica.

5. Ambiente de trabalho
5.1 Janelas

H oito tipos de janelas/windows no SPSS:

Figura 1 Lista de janelas do SPSS.

Prof. Carlos Reis

10

Data Editor

A janela que apresenta o contedo do ficheiro de

dados. Os dados podem ser criados ou modificados


atravs desta janela. S possvel ter uma destas
aberta num dado momento. a primeira janela que
abre quando inicia o SPSS.
Barra de menus

Barra de ferramentas

Barra
de
estado
Figura 2 Janela de edio de dados

Folha de edio de dados


Modo de visualizao de dados

Modo de visualizao e definio das variveis.

Prof. Carlos Reis

11

Viewer (Output)

Janela onde so apresentados todos os

resultados estatsticos, tabelas, grficos, ... Abre


automaticamente, sempre que um determinado
procedimento gera resultados. composto por duas subjanelas: esquerda est um organigrama do output:
direita esto os resultados propriamente ditos.

Figura 3 Janela de visualizao de resultados.

Draft Viewer os resultados podem ser apresentados em forma de


texto (instead of interactive pivot table) no Draft
Viewer.

Pivot Table Editor

permite editar e modificar tabelas (editor

da tabela dinmica). Pode editar-se o texto,


trocar os dados de linhas com colunas,
adicionar
cor,
criar
tabelas
multidimensionais, etc.

Prof. Carlos Reis

12

Chart Editor permite editar e modificar grficos. Podem alterarse as cores, seleccionar tipos e tamanhos de letras, trocar os eixos
vertical com horizontal, fazer rotaes, etc.

Figura 4 - Janela de edio de grficos.

Text Output Editor

permite alterar texto que no seja visvel

no Pivot Table Editor. Pode alterar-se


com o tipo, tamanho, cor e estilo das
letras.

Syntax Editor

Todos os comandos emitidos a partir dos menus

do SPSS podem ser apresentados numa janela de


sintaxe. Para isso, utiliza-se o comando Paste das
caixas de dilogo.

Script Editor Janela de programao que permite personalizar e


automatizar
programas).

Prof. Carlos Reis

tarefas

do

SPSS

(pequenos

13

5.2 Menus
File Edit View Data Transform Analyze Graphs Utilities Windows Help
Tabela 1 Menu da Janela de dados

Menu

Funcionalidades

File
Edit

Criar, abrir, ler, gravar ou imprimir ficheiros.

View
Data

Transform
Analyze

Graph
Utilities

Modificar, copiar ou colar textos das janelas


de output ou de sintaxe; pesquisa de dados
e parametrizao de opes diversas.
Activar
diversas
barras
de
ferramentas/botes, fontes, grelhas, barra
de status e mostrar os rtulos (labels)
definidos.
Alterar globalmente os dados tais como:
transpor
variveis
e
casos,
criar
subconjuntos de casos para anlise,
insero de dados.
Obs: Estas alteraes so temporrias e no
afectam o ficheiro, excepto se for efectuada
uma gravao com estas alteraes.
Produzir
alteraes
nas
variveis
seleccionadas e, calcular novas variveis a
partir de valores de outras j existentes.
Obs: Estas alteraes s sero efectivas se
forem gravadas.
Seleccionar
vrios
procedimentos
estatsticos como a anlise descritiva,
cruzamento de variveis, anlise da
varincia, correlaes, regresses, clusters,
sries, amostras, anlise multivariada,
estatsticas no paramtricas, etc.
Criar grficos de colunas, de sectores,
histogramas, diagramas de disperso, etc.
Obter informao acerca das variveis,
controlar lista de variveis que aparece nas
caixas de dilogos, correr scripts e alterar
menus.

Add-ons

Prof. Carlos Reis

14

Windows
Help

Comutar entre as vrias janelas do SPSS ou


minimiz-las.
Ajudar o funcionamento do SPSS.
Ligar Pgina do SPSS na Internet.

6. Criao de Ficheiro de dados


6.1 Introduo de dados
Aspectos a considerar:

Muitas das caractersticas da Janela do Data Editor do


SPSS so similares s de qualquer folha de calculo em
ambiente Windows, tal como o Excel.
As colunas correspondem s variveis (ou campos). E as
linhas aos casos (ou registos).
As clulas podem apenas conter valor (numricos e no
numricos); no possvel, tal como se faz nas folhas de
clculos, definir frmulas nas clulas.
Definio das variveis (Data Define Variable):

O primeiro caracter deve ser uma letra; os restantes


podem ser numricos ou no numricos; ou mesmo
incluir certos smbolos (@, #, _, ou $). No deve incluir
espaos em branco ou conter os smbolos: &, !,? ou *.
As palavras ALL, NE, EQ, TO, LE, LT, BY, OR, GT,
AND, NOT, GE, WITH no podem constituir nomes para
as variveis. Esto reservadas para a Syntax.
Deve indicar o tipo da varivel: numrico, textos/no
numricos (string), data (date), etc; descrever a varivel e

Prof. Carlos Reis

15

dos seus valores (rtulos/labels); e codificar os valores em


falta/sem informao (missing values).
Obs: recomendvel definir uma varivel qualitativa como numrica e
depois atribuir os rtulos ou labels. Por exemplo, a varivel sexo: digitar 1 para
sexo feminino e 2 para sexo masculino e nos labels colocar a equivalncia.

Exemplo 1 - Considere um exemplo prtico.


Nmero de linha

Nome da varivel

Editor de Clula

Clula activa

Figura 5 Introduo de dados

1. Guarde o ficheiro: File Save nomeficheiro (osvaldo.sav)


2. Produza: Tabela de frequncias para a varivel ano.
Analyze Descriptive Statistics Frequencies varivel
Prof. Carlos Reis

16

3. Repita a alnea 2) para as outras variveis.


4. Feche todas as janelas do SPSS. Abra de novo o SPSS.
5. Abra o ficheiro de dados introduzido anteriormente:
File Open nomeficheiro
6. Utilize no menu Edit as opes (copiar, apagar, paste, find, ...)
7. Introduza/Insira 5 novos casos: Data Insert Case
8. Insira 2 novas variveis: Data Insert variable

Depois de efectuar o exemplo anterior, faa o seguinte:


9. Seleccione as variveis sexo, idade, ano e turma e

construa as frequncias e os respectivos grficos de


barras.

Figura 6 Seleco de variveis

10. Cruze as variveis ano e sexo.

Prof. Carlos Reis

17

Analyze Descriptive Statistics Crosstabs


ANO * SEXO Crosstabulation
Count
SEXO
f
7
ANO

8
9

2
2

10
Total

Total

4
2
3
1
10

1
1
6

Obs: Este resultado foi obtido para 10 casos/indivduos.

11. Repita o procedimento utilizado em 10), separando os

resultados por turma.


Split

File:
permite
dividir
qualitativa/categrica por grupos.

uma

varivel

Data Split File Organize output by groups

Figura 7 Diviso de ficheiro

A seguir, cruze as variveis ano e sexo.

Prof. Carlos Reis

18

Para anular o Split File, deve fazer:


Data Split File Analyze all cases, do not create groups
12. Seleccione apenas os alunos do sexo feminino.

Select Cases: Selecciona determinados casos.


Data Select Cases if condition, is satisfied

Prof. Carlos Reis

19

6.2 Transformao de varivel (TRANSFORM)


Transform

Funo

Compute

Calcula uma nova


varivel a partir de
outras j existentes,
podendo usar todas
as funes
matemticas e
estatsticas

Random
Number Seed
Recode

Prof. Carlos Reis

Como acionar e os subcomandos

Colocar o nome da nova varivel


em target variable. Em numerical
expression colocar as variveis
existentes e as operaes entre
elas. Por exemplo:
soma=a1+a2+a3+a4.
Ainda, pode seleccionar casos
utilizando a condio if .
Serve para gerar um nmero aleatrio
Recodifica variveis Into the same variable: altera
os valores da varivel e guarda
as alteraes na mesma
varivel. Seleccionar a varivel
e entrar em Old and new
values, e a cada valor antigo
colocar o valor novo e
adicionar clicando add, no fim
dar continue.
Into the diferent variable: cria
uma nova varivel em funo
de uma j existente, seguir o
mesmo esquema do item

20

Rank cases

anterior.
Atribui postos na varivel segundo uma outra.

Automatic recodeCria uma nova varivel com o mesmo contedo da


varivel desejada
Run Pending Roda as transformaes pendentes
transforms
Create Time Cria sries temporais.
Series

7. Importao de ficheiros
O SPSS dispe de procedimentos de importao de ficheiros criados
noutras aplicaes designadamente folhas de clculo (Lotus 123, Excel),
bases de dados (dBase, Access), ficheiros ASCII (separados por
tabulaes, vrgula, espaos), etc.
IMPORTAO DE FICHEIROS DE EXCEL
File Open

Figura XX Tipos de ficheiros

Nesta janela deve:

Prof. Carlos Reis

21

procurar a pasta onde se encontra o ficheiro;


especificar Excel e seleccionar a opo (*.xls).

Aparece de seguida uma caixa de dilogo, onde se especifica se as


primeiras clulas contm os nomes das variveis (se sim activar Read
variable names ) e o intervalo (rectangular) de clulas (no exemplo,
A1:B11).
Por ltimo, o SPSS cria um ficheiro com tantas variveis quantas as
colunas e tantos casos quantas as linhas do bloco especificado. No se
esquea de guard-lo na sua pasta (extenso .sav).

8. Anlise de estatstica de dados (STATISTICS)

O SPSS apresenta um conjunto de funes e


procedimentos avanados para a anlise estatstica de
dados, os quais se encontram sob o comando Analyze
(Anlise de dados).

8.1 Tabelas de Frequncia


Antes de dar incio apresentao das diferentes funes
estatsticas, aconselha-se a interpretao das tabelas de
frequncia (frequency).
Considere o seguinte exemplo:
Ano de Escolaridade

7
8
Valid

9
10
Total

Frequency

Percent

Valid
Percent

Cumulative
Percent

18
14
11
7
50

36,0
28,0
22,0
14,0
100,0

36,0
28,0
22,0
14,0
100,0

36,0
64,0
86,0
100,0

Interpretao:

Prof. Carlos Reis

22

Dezoito (18) alunos frequentam o 7 ano de escolaridade. Ou

seja, 36% dos alunos esto a frequentar o 7 ano. ... 28% o 8


ano de estudo. ...
H 64% de inquiridos estudam o 1 ciclo do ensino

secundrio (7 e 8 anos de escolaridade). Por outro lado,


36% frequentam o 2 ciclo (9 e 10 anos de escolaridade).
...

8.2 Anlise de Relatrios (Reports)


O SPSS produz pequenos relatrios, contendo medidas
estatsticas. Por exemplo, para seleccionar uma ou mais
variveis (ou categorias de variveis), utiliza-se o seguinte
procedimento:
Analyze Reports OLAP Cubes...
OLAP: Online Analytical Processing.

Ainda, pode-se seleccionar diferentes medidas estatsticas,


clicando no Statistics.

Prof. Carlos Reis

23

8.3 Medidas Estatsticas (Statistics)


8.3.1 Descritivas (Descriptives statistics)
O SPSS apresenta as medidas:
Localizao
(Tendncia no Central)

Figura 12 Estatsticas Descritiva


Disperso
(ou variabilidade)
Prof. Carlos Reis

Localizao/Posio
(Tendncia Central)

Assimetria e
Achatamento/Curtose
24

Podem ser obtidas de 2 formas:


Analyze Descriptive Statistics Frequencies Statistics
Ou

Analyze Descriptive Statistics Descriptive Options

Medidas de Tendncia Central


Mean (Media) medida de tendncia central mais utilizada,
sendo definida como o resultado da diviso da
soma de todos os valores observados pelo nmero
total de observaes.
Median (Mediana) valor central (meio) de uma
distribuio; divide a distribuio em 2 partes
iguais, tendo assim, 50% dos dados sua direita
como sua esquerda.
Mode (Moda) - valor que ocorre com maior frequncia
numa distribuio. Ela pode no existir e, quando
existe, pode no ser nica.
Medidas de Tendncia no Central (ou de ordem)
Quartiles (Quartis) so 3 pontos (Q1, Q2 e Q3) que dividem
um conjunto de dados em 4 partes iguais: o Q1 (1
Quartil) precedido de 25% dos valores e sucedido
por 75%; o Q2 tem abaixo de si 50% dos valores e
acima de si tambm 50% e, por esta razo, coincide
com a Mediana; o Q3 antecedido de 75% dos valores
e seguido por 25% dos mesmos.
n
Prof. Carlos Reis

25

Cut points for


equal groups definem outros
separadores: Decis (dividem em 10 partes iguais: D1,
D2,...., D9), Percentis/centis (dividem em 100 partes
iguais: P1, P2 ,....,P99), ....
Percentile(s): permitem especificar o percentil pretendido,
(por exemplo, 67, 15, ....)
Medidas de Disperso (ou variabilidade)
Std deviation (Desvio Padro) mais importante medida de
disperso, sendo definida como a raiz quadrada da
varincia.
Variance (Varincia) mdia dos quadrados dos desvios de
cada valor em relao sua mdia. Contudo, a sua
utilizao como medida descritiva ocasiona alguma
dificuldade (sobretudo de interpretao) visto que se
trata, por definio, de uma mdia quadrtica, no
possuindo a mesma unidade de medida dos dados
originais.
Range (amplitude do intervalo de variao) diferena entre
os valores mximo e mnimo do conjunto de dados.
Mnino (Minimum) valor mnimo de uma distribuio.
Mximo (Maximum) Valor mximo de uma distribuio.
S.E. Mean (Estimativa do Erro amostral) quociente entre o
desvio padro e a raiz quadrada da dimenso da
amostra. Indica a variabilidade da mdia aritmtica
entre amostras tiradas da mesma populao. Esta
medida permite a construo dos intervalos de confiana
sobre o valor da mdia da populao.
Intervalo Interquartil (Interquartile Range): Q3 - Q1.
Medidas de Assimetria

Prof. Carlos Reis

26

A medida de assimetria utilizada pelo SPSS dada pelo


quociente entre o Skewness e o seu Std Error. O resultado
desse quociente deve ser analisado da seguinte forma:
Assimtrica
negativa

-2

No rejeitar a
simetria

-2

Assimetria
positiva

+2

+2

Medidas de Achatamento (ou curtose)


A diviso do Kurtosis pelo seu Std Error d o coeficiente de
achatamento (k). Quanto forma de achatamento, uma
distribuio pode ser Mesocrtica (k igual a 0), Platicurtica
(k menor que -2) e Leptocrtica (k maior que +2).
Exemplo 4. Considere o seguinte output.
Statistics
IDADE
N

Valid
Missing

Mean
Std. Error of Mean
Median
Mode
Std. Deviation
Variance
Sk ewness
Std. Error of Sk ewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Sum
25
Percentiles

50
75

Prof. Carlos Reis

50
0
12,78
,25
13,00
14
1,80
3,24
-,554
,337
-1,093
,662
5
10
15
639
10,75
13,00
14,00

27

IDADE

10
11
12
Valid

13
14
15
Total

Frequency

Percent

Valid
Percent

Cumulative
Percent

12
1
3
12
14
8
50

24,0
2,0
6,0
24,0
28,0
16,0
100,0

24,0
2,0
6,0
24,0
28,0
16,0
100,0

24,0
26,0
32,0
56,0
84,0
100,0

Interpretao:

A idade mdia dos inquiridos de 12,78 anos (Mean).


A mediana ou precentil 50 indica que metade dos alunos tem at 13
anos. Na tabela de frequncia, a mediana a idade que acumula at si
metade (50%) das observaes, isto , a idade que corresponde ao
Cumulative Percent imediatamente superior a 50 (13 Cumulative
Percent=56,0), (Median).
O quociente entre o desvio padro (1,80) e a raiz quadrada da
dimenso da amostra (n=50) 0,25. Significa que a variao entre a
mdia calculada (12,78) e a mdia de outras amostra aleatrias de
igual dimenso de 0,25 anos (Std Error Mean).
A maioria dos alunos tem 14 anos (Mode).
A varincia de 3,24. O desvio padro igual a 1,80 denota uma baixa
disperso (coef.variao, 1,80/12,78=14%). Quanto menos dispersos
estiverem os valores da varivel idade relativamente mdia, menor
ser o desvio padro, e vice versa (Variance e Std Deviation).

Prof. Carlos Reis

28

O coeficiente de skewness de 0.554 e o seu Std Error (estimativa do


erro) de 0.337. O quociente entre estes dois valores igual a 1.64.
Como o resultado negativo e menor que 2, pode-se concluir que a
distribuio assimtrica negativa. Na prtica, faz-se a diferena da
mdia e da moda e divide-se pelo desvio padro. Neste caso, esta
diferena negativa, - 0.68, e a concluso a mesma.
Kurtosis/Std Error Kurtosis=-1,65. Como menor que 2, diz-se que
a distribuio Platicrtica (mais achatada do que a normal).
As idades variam entre os 10 (Mnimo) e os 15 (Mximo), sendo a
amplitude do intervalo de variao de 5 anos (Range).
A soma de todas idades de 639 (Sum).
Percentil 75: Significa que 75% dos inquiridos tm at 14 anos.
Distribuio normal

O SPSS apresenta o histograma com a distribuio normal

sobreposta.
Recorda-se que a distribuio normal :
Terica, contnua, simtrica e mesocrtica;
Tem a forma de um sino e definida com base em dois
parmetros: mdia e desvio padro.
O ponto mximo da distribuio a mdia.
Analyze Descriptive Statistics Frequencies Chart

Prof. Carlos Reis

29

Figura 13 Histograma com normal sobreposta

Veja o Output:
IDADE
16
14
12
10
8

F req ue ncy

6
4
Std. Dev = 1,80

Mean = 12,8
N = 50,00

0
10,0

11,0

12,0

13,0

14,0

15,0

IDADE

O histograma acima com ajustamento distribuio normal tem o


aspecto onde sobressai o enviesamento da amostra para a direita em
relao distribuio terica, bem como um achatamento um
maior que o que seria de esperar.
Opo Explore - calcula as estatsticas, e elabora o grfico

caule-e-folhas e o grfico de extremos-e-quartis, muito til


para analisar a amostra em termos de concentrao ou
disperso dos valores por intervalos quartlicos, bem como a
sua simetria; alm disso, uma boa ferramenta de verificar
se h observaes outliers, isto , observaes extremas
que se afastam muito da mdia dos valores da amostra.
Analyze Descriptive Statistics Explore
Selecciona-se a varivel a analisar (idade), tal como descrito
atrs. De seguida, seleccionar o boto, Statistics.

Prof. Carlos Reis

30

Faa Continue para voltar ao Explore. Escolha, de seguida a


opo Plots. Seleccione histograma.

Faa Ok e analise o Output.


Faa Explore, utilizando o Factor List para a varivel Sexo.
Teste de Normalidade
Testa a hiptese de que os dados da amostra esto
normalmente distribudos.
Analyze Descriptives statistics Explore Plots

Prof. Carlos Reis

31

A tabela Teste de Normalidade (Tests of Normality) mostra os


resultados do Teste de Kolmogorov Smirnov (K-S). Se a
amostra tiver menos de 50 casos o SPSS tambm calcula o teste
de Shapiro-Wilk.

Tests of Normality
a

Kolmogorov-Smirnov
Statistic
df
Sig.
IDADE

,229

50

Shapiro-Wilk
Statistic
df

,000

,824

50

Sig.

,010**

**. This is an upper bound of the true significance.


a. Lilliefors Significance Correction

Um baixo valor de significncia ( geralmente considerado


baixo se Sig. < 0.05) indica que a distribuio dos dados difere
significativamente de uma distribuio normal.
Intervalos de Confiana sobre a mdia (IC )
Mdia: 12,78 com o Std Error = 0,25
Nveis: Confiana de 95% Significncia (risco) de 5%

Resultado: IC95% = ] 12,27 ; 13; 29[


Significado: Existe uma probabilidade de 95% para que o valor
desconhecido da mdia da populao pertena ao intervalo ]
12,27 ; 13; 29[. Ou seja, com 95% de confiana, a verdadeira
mdia da populao dever pertencer ao intervalo de 12,27 a
13,29.

Prof. Carlos Reis

32

Este intervalo de confiana s tem interesse se os valores em


causa so de uma amostra seleccionada aleatoriamente de uma
populao mais vasta.
Nveis: Confiana de 99% Significncia (risco) de 1%

Resultado: IC99% = ] 12,10 ; 13; 46[


Concluso: Diminuindo o nvel de significncia (risco)
implica um aumento do intervalo de confiana.

8.3.2 Anlise Inferencial


8.3.2.1 Anlise Bivariada: Cruzamentos e Medidas de
Associao (Crosstabs)
"p" (nvel de) significncia estatstica (Asymp. Sig.). Prob.
Geralmente, em cincias sociais, quando estas probabilidades
(Asymp. Sig.) so inferiores a 5%, ou seja, h menos de 5
possibilidades em 100 de suceder um determinado resultado,
considera-se que so estatisticamente significativas.
Varivel Qualitativa Nominal
Independncia Estatstica utiliza-se normalmente o Teste de
Qui-Quadrado de Pearson, 2.
As hipteses do Teste de Qui-Quadrado so:

Prof. Carlos Reis

33

H0 (Hip. Nula): As variveis turma e sexo so independentes.


Ha (Hip. Alternativa): As variveis turma e sexo so dependentes
(existe uma relao entre as 2 variveis).
Analyze Descriptive Statistics Crosstabs Statistics

Resultado:
Chi-Square Tests
Value

Pearson Chi-Square

36,883a

Continuity Correction
Lik elihood Ratio

40,291

Linear-by-Linear
Association
N of Valid Cases

df

Asymp. Sig.
(2-sided)

,000

,000

50

a. 2 cells (33,3%) have expected count less than 5. The


minimum expected count is 3,90.

Concluso:

Como o nvel de significncia do teste de Qui-Quadrado de 0,000,


valor inferior a 0,05 (5% de signficncia fixada), rejeita-se a
hiptese de serem independentes (H0), ou seja, h
evidncia/significncia estatstica para aceitar a hiptese alternativa
de que so dependentes (existe relao entre 2 variveis).
Portanto, pode-se inferir a relao de dependncia observada na
amostra para o universo/populao em estudo.
Prof. Carlos Reis

34

Medidas de Associao baseadas no Teste de Qui-Quadrado


Symmetric M easuresd
Value
Phi
Nominal by Nominal

Cramer's V
Contingency Coefficient
Kendall's tau-b

Ordinal by Ordinal

Kendall's tau-c
Gamma

Measure of Agreement

Kappa

N of Valid Cases

,859
,859
,652
-,117
-,122
-,162
,c
50

Asymp.
a
Std. Error

,132
,136
,179

Approx. T

Approx. Sig.

-,893
-,893
-,893

,000
,000
,000
,372
,372
,372

a. Not assuming the null hypothesis.


b. Using the asymptotic standard error assuming the null hypothesis.
c. Kappa statistics cannot be computed.They require a symmetric 2-way table in which the values
of the first variable match the values of the second variable.
d. Correlation statistics are available for numeric data only.

Significado: Todos esses testes indicam que existe uma


associao forte entre as duas variveis devido aos seus altos
valores. O teste Phi s se aplica para tabelas 2 x 2.
Variveis Quantitativas
Coeficiente de Correlao de Pearson aplica-se s variveis
quantitativas. Varia entre 1 (negativa) e 1 (positiva).
Quanto mais prximo estiver dos valores extremos maior e a
associao linear.
Associao ou Correlao Negativa: variao entre as variveis
for em sentido contrrio (aumento de uma
varivel est associada diminuio de outra).
Associao ou Correlao Positiva : variao entre as variveis
for no mesmo sentido.
Analyze Correlate Bivariate variveis

Prof. Carlos Reis

35

Variveis Ordinais
Coeficiente de Spearman utiliza-se para as variveis ordinais.

8.3.2.2 Regresso (Regression)


Modelo estatstico usado para prever o comportamento de uma
varivel contnua (varivel dependente ou Y) a partir de uma
ou mais variveis (var. independentes ou X).
Modelo de Regresso Linear Simples (MRLS): Quando existe
apenas uma varivel independente.
Modelo de Regresso Linear Mltipla (MRLS): Quando existe
mais do que uma varivel independente.
Modelo de Regresso Linear Simples (MRLS): permite encontrar a
recta que melhor representa a relao entre 2 variveis (X e Y).

Prof. Carlos Reis

36

Y = aX + b,
em que, Y: var. dependente/explicada
X: var. independente/explicativa
a: declive ou inclinao
b: ordenada na origem (CONSTANT)

Para proceder ao clculo da equao da recta de regresso


linear, deve executar o seguinte procedimento:
Analyze Regression Linear

Resultado da regresso linear


Coefficientsa

Unstandardized
Coefficients
B
Std. Error

Model
1

(Constant)
ALTURAP

,238
,858

,276
,154

Standardi
zed
Coefficient
s
Beta

Sig.

,892

,864
5,574

,413
,001

a. Dependent Variable: ALTURAF

Declive

Prof. Carlos Reis

Ordenada na origem
0.01<0.05 ....
H0 rejeitada para o nvel
de significncia de 5%
37

Equao da recta ALTURAF = 0.858ALTURAP + 0,238


Interpretao:
a = 0,858 - Por cada aumento de uma unidade na
altura dos Pas (X) implica um aumento de 0.858 na
altura dos Filhos (Y). O valor positivo indica de que a
recta cresce da esquerda para a direita. Se o declive
fosse negativo, a recta decresceria da esquerda para a
direita.
b = 0,238 Para ALTURAP=0 ALTURAF=0,238.

Mtodo utilizado: Mnimos Quadrados (MMQ).


Exerccio:
Se um Pai tiver 1,95 m de altura, a altura do Filho
ser 1,91, aproximadamente.
Coeficiente de determinao (R2 e R2 Ajustado) indica a
qualidade do ajustamento da recta estimada aos dados.
Model Summaryb

Model
1

,892a

R Square

Adjusted
R Square

Std. Error
of the
Estimate

,795

,770

4,638E-02

a. Predictors: (Constant), ALTURAP


b. Dependent Variable: ALTURAF

Coeficiente de correlao
Coeficiente de determinao

Prof. Carlos Reis

38

Cerca de 80% (79,5%) da variao da varivel dependente


(ALTURAF) em torno da sua mdia explicada pela regresso,
ou seja, o modelo explica 80%. Portanto, considera-se um bom
ajustamento.
Teste T testa a hiptese dos parmetros, individualmente,
serem nulos.
Como o Sig.do Teste T de 0,01, valor inferior a 0.05 (5%), pode-se
concluir que a varivel ALTURAP diferente de zero, isto , esta
varivel estatisticamente significativa. Entretanto, a concluso no
a mesma para a CONSTANT.

Teste F valida, em termos globais o modelo, e no cada um


dos parmetros isoladamente.
ANOVAb
Sum of
Squares

Model

Regression 6,683E-02
Residual
1,721E-02

Total

8,404E-02

df

1
8
9

Mean
Square

6,683E-02
2,151E-03

31,072

Sig.

,001a

a. Predictors: (Constant), ALTURAP


b. Dependent Variable: ALTURAF

Como o Sig.do Teste F de 0,01, valor inferior a 5%, pode-se


concluir que o modelo adequado para descreve esta relao, ou
seja, o modelo estatisticamente significativo.

Diagrama de Disperso (ou de pontos)


I.

Graphs Scatter Simple Define

II. Escolha as variveis dependente e independentes


III.

Label Cases by colocar o nome da varivel que


identifique os pontos nos grficos. Seleccione Options e
active Display chart with case labels.

Prof. Carlos Reis

39

Resultado: Utilizando o ajustamento da recta.


2,0
Elmano, Pedro

1,9
Antonio, Joao
El ton, Elio
Mapa, Melo

1,8

Leao, Santos
Pedr o, Jorge
Tavares, Silva

ALT URAF

1,7

Li to, Silva
Montei ro, Pina
Borges, Elzo

1,6
1,6

1,7

1,8

1,9

2,0

ALTURAP

Tabela 2 - Procedimentos de estatstica: descritiva, inferencial e


multivariada disponveis pelo SPSS.
Analyze
Summarize
Descriptives
statistics

Prof. Carlos Reis

Sub-comandos

Frequencies

Funo

Calcula a tabela de distribuio de


frequncias.

40

Descriptives

Compare
means

ANOVA
models

Correlate

Regression

Prof. Carlos Reis

Calcula as principais estatsticas


descritivas.
Explore
Faz uma anlise completa das
variveis, podendo ainda repetir
essas anlises por outra varivel.
Crosstabs
Calcula a tabela de distribuio de
frequncias cruzadas, calcula o
teste Qui-quadrado e o Coeficiente
de Pearson para associao de
variveis e outros testes.
List cases
Lista
casos
escolhendo
as
variveis desejadas
Report Summaries Organiza relatrios em linhas,
in Rows
segundo uma varivel
Means
Calcula a mdia, o desvio padro,
soma, etc. das variveis desejadas.
Independent
Calcula o teste de diferena de
sampled T-test
duas
mdias
de
populaes
independentes
Paired-sampled T- Calcula o teste de diferena de
test
duas
mdias
de
populaes
emparelhadas.
One-Way ANOVA Testa a diferena de mdias de
mais de duas amostras
Simple factorial
Testa a diferena de mdias do
modelo fatorial
General factorial
Testa a diferena de mdias do
modelo geral
Multivariate
Calcula o teste de anlise de
varincia multivariada
Bivariate
Calcula a matriz de correlao,
tomando as variveis de duas em
Partial
duas.
Distances
Calcula o coeficiente de correlao
parcial.
Calcula a distncia euclidiana entre
os casos.
Linear
Ajusta o modelo de regresso
Logistic
linear
Probit
Ajusta o modelo de regresso
Nonlinear
logstica
Ajusta o modelo Probit

41

Ajusta um modelo no linear


Loglinear
Classify

Data
Reduction
Scale
Non
Parametric
Test

Survival
Multiple
response

General
Hierarchical
Logit
K-means cluster
Hierarchical
clusters
Discriminant
Factor

Anlise de clusters
Anlise de clusters hierrquicos
Anlise discriminante
Anlise factorial

Reliabity analysis Anlise de confiabilidade


Multidimensional
Scaling
Chi-square
Testes no paramtricos ou de
Binomial
distribuio livre
Runs
1-Sample K-S
2-Independent
Samples
k-Independent
Samples
2-Related Samples
K-Related Samples
Anlise de sobrevivncia
Anlise de respostas mltiplas

Obs: As verses mais recentes do SPSS (11.0) apresentam mais


procedimentos estatsticos.

9. Anlise de grficos (GRAPHS)


A representao grfica uma das possibilidades de anlise de dados
sob uma forma ilustrada, produzindo uma viso mais clara e imediata
dos resultados.
SPSS oferece vrios tipos de grficos:
Graphs
Prof. Carlos Reis

Funo

Tipo de variveis
42

Bar

Grfico de barra

Line
Area
Pie
Boxplot
Scatter

De linha
De rea
Circular
Da caixa
De disperso

Histogram

Histograma

Prof. Carlos Reis

Qualitativas, discretas de poucos


valores
Sries de tempo
Srie de tempo
Qualitativas
Quantitativas
Relao entre duas variveis
quantitativas, podendo colorir
segundo outra varivel
Quantitativa (de preferncia
contnua). Tem a opo de
desenhar
a
curva
normal
superposta ao histograma

43

S-ar putea să vă placă și