Documente Academic
Documente Profesional
Documente Cultură
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
Paulo R. Margotto
www.paulomargotto.com.br
pmargotto@gmail.com
Professor do Curso de Medicina da Escola Superior de Cincias da Sade
(ESCS)/SES/DF
I- INTRODUO
II- COMO CRIAR UM COMANDO DE DADOS
III- ESTATSTICAS DESCRITIVAS
-tipo de variveis
IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS
V- ESTATSTICA ANALTICA
-teste de hipteses
-tamanho da amostra
V-1-Teste t de Student
V-2- Anlise de Varincia
V-3- Qui-quadrado
V-4- Risco Relativo e Odds Ratio
VI- CORRELAO E REGRESO LINEAR SIMPLES
VII- REGRESSO LOGSTICA BINRIA
VIII-TESTES NO PARAMTRICOS
-teste de Kolmogorov-Smirnov e Shapiro-Wilk para testar normalidade
VIII-1-Teste Binomial
VIII-2-Teste U de Mann- Whitney
VIII-3-Teste T de Wilcoxon
VIII-4- Teste de Kruskal-Wallis
VIII-5-Teste de Friedman
VIII-6-Coeficiente de correlao de Spearman
VIII-7-Teste de McNemar
IX-CURVA DE KAPLAN-MEIER
X-CURVA ROC
XI-ESTATSTICA k:
XII-REFERNCIAS BIBILIOGRFICAS
Braslia, 01 janeiro de 2012
ESTATSTICA COMPUTACIONAL
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
(utilizamos os conceitos de Wagner MB, Motta VT e Dornelles C em SPSS-Passo a Passo, Editora
da Universidade de Caxias do Sul, 2004., com exemplo na base de dados do estudo de Margotto PR e cl,
ainda no publcado sobre Uso do Corticosteride Pr-natal na Maternidade do Hospital Regional da
Asa Sul)
I- INTRODUO
Como iniciar o SPSS
Ao clicar no programa (SPSS for Windows) ser aberta a janela SPSS for Windows,
contendo no centro, a Caixa de Dilogo (Fig.1)
A partir desta caixa de dilogos, escolha o que voc deseja fazer e clicar em [OK].
-run the tutorial: iniciar o tutorial
-type in data: digitar os dados, criando assim um novo arquivo de dados
-run na existing query: importar dados a partir de uma base de dados
-open an existing data source: abrir um arquivo de dados j existentes
-open another type of file: abrir outro tipo de arquivo
Com o melhor conhecimento do programa podemos usar um maior nmero de opes que
esto disponveis por meio de acesso s janelas e aos menus do SPSS. Na barra de tarefas do SPSS
encontram-se os seguintes menus:
File: comanda todo o gerenciamento de arquivos (criar, abrir, ler, salvar e imprimir arquivos)
Edit: utilizado para copiar ou colar informaes, bem como apagar as informaes das clulas; a
opo option permite configurar as sadas do output (tamanho da fonte, bordas das tabelas,
definio do padro dos tipos de variveis)
View: possibilita a visualizao ou no de barras de ferramentas (Toolbars) e barra de estado
(Status Bar) nas janelas; ativa e desativa linhas de grade; mostra os tipos de fontes utilizadas;
estabelece a apresentao de rtulos de variveis e valores (variable and value labels)
Data: permite a definio de variveis, ordenar os dados segundo algum critrio escolhido, inserir
ou retirar observaes ou variveis, unir arquivos (merge files), criar subgrupos para anlise (split
file), selecionar casos especficos (select cases). As mudanas so temporrias, a no ser que sejam
salvas
Transform: cria novas variveis a partir das existentes, modifica dados e variveis por meio de
clculos. As mudanas so temporrias a no ser que sejam salvas.
Analyze: aqui encontramos os diversos procedimentos estatsticos realizados pelo SPSS
(regresso, anlises descritivas, testes de comparao). A cada nova verso do SPSS novos testes
so agregados, aumentando o alcance do SPSS.
Graphs: usado para criar e modificar grficos; h vrias opes de grficos, como barra, linha,
coluna, torta, histograma, disperso, etc, devendo ser escolhido aquele que melhor representa os
dados e as variveis em estudo. Um duplo clique no mouse sobre o objeto abrir a janela Chart
Editor, onde possvel modificar as fontes, cores, escalas e tamanho dos diversos elementos do
grfico.
Utilities: permite a obteno de informaes sobre as variveis e o banco de dados (opo
variables)
Window: mostra as janelas que esto em execuo no SPSS
Help: contem uma janela de ajuda que contem informaes como usar o SPSS
Mostra denominaes
atribudas aos valores
de uma varivel
Vai at o caso
Insere dados
Descreve variveis
Insere casos
Seja o exemplo: digitar na primeira coluna o nome das variveis que esto apresentadas na Tabela
2
Sexo: (1)feminino; (2) masculino; peso em kg; altura em cm; glicemia em mg%
Tabela 2.Dados de cinco sujeitos de um estudo (Wagner MB e cl, 2004
Aps digitar cada varivel, pressionar Enter e o SPSS automaticamente assume o tipo de
varivel. No final, a tela Data Editor na opo Variable View, dever ficar como na Figura 3.
Figura 3. Visualizao da tela do Data Editor na opo Variable View para as variveis do
Exemplo 1 (Tabela 1)
A seguir, ir para o Data Editor na opo Data View para inserir os dados da Tabela 2. As
informaes devem ser digitadas conforme apresentadas na Figura 4.
Fig. 4.Opo Data View da janela Data Editor com os nomes das variveis no cabealho e os
dados do exemplo da Tabela 2
possvel corrigir os dados depois de inseridos na tabela, assim como apagar clulas.
possvel tambm inserir novos casos: escolher Data>Insert Cases, assim como inserir novas
variveis: escolher Data>Insert Variable.
Dependendo do interesse do pesquisador, novas variveis podem ser criadas a partir das j
existentes.Para isto, basta ir ao menu Transform e escolha o comando compute. Suponhamos que
queiramos inserir presso arterial (PA)(Figura 5);
Varivel qualitativa:
-nominal: diferentes categorias sem valores numricos. Os dados podem ser
distribudos em categorias mutuamente exclusivas. Exemplo: Sexo - permite distinguir
duas categorias, masculina e feminina; cor, causa de morte, grupo sangneo.
-ordinal: os dados podem ser distribudos em categorias mutuamente exclusivas que
tm ordenao natural. Exemplo: grau de instruo (as pessoas podem ser distribudas
em categorias mutuamente exclusivas, na seguinte ordem: primrio, 2 ano e superior),
aparncia, status social, estgio da doena
Varivel quantitativa ou contnua: os dados so expressos por nmeros. Exemplo:
idade, estatura, peso corporal.
-Discretas( associao entre valores e nmeros inteiros): idade em anos completos
-Contnua (pode assumir qualquer valor no subconjunto de nmeros reais): peso
A Estatstica Descritiva encarrega-se do levantamento, organizao, classificao e
descrio dos dados em tabelas, grficos ou outros recursos visuais, alm de parmetros
representativos destes dados.
Uma vez criada a base de dados, passamos agora a utilizar os procedimentos estatsticos.
Nestes exerccios vamos usar o arquivo corticosteride pre-natal.sav. Na janela SPSS DATA
Editor. Selecionar File>Open>Data. Aps localizar o arquivo, clicar em [Abrir].
No menu Analyze>Descriptive Statistics, encontram-se os comandos Frequencies,
Descriptive, Explores e Crosstabs.
III-1- Comando Frequencies
Este comando serve para obter tabelas de freqncias, tanto para variveis categricas
quanto quantitativas. Tambm podem ser obtidas estatsticas descritivas clssicas, como mdia,
desvio-padro, mnimo, mximo e outras.
No menu, escolha Analyze>Descriptive Statistics>Frequencies e teremos (Figura 7):
Frequency Table
10
11
12
Prosseguindo, pressionar o boto [Continue] para voltar caixa Explore. Nesta caixa, clicar
no boto [Continue]. Os resultados da anlise surgiro na janela Output Viewer (Figuras 19). O
comando Explorer produz uma tabela chamada Case Processem Somar que contm os casos
vlidos e omissos includos na anlise para a varivel Apgar trs no 5 minuto estratificada por uso
de corticosteride.
13
Tambm podemos obter o Extreme Value (valores extremos) para cada grupo (os 5
maiores e os 5 menores)
A tabela Test of Normality mostra o resultado de dois testes de normalidade: KolmogorovSmirnov e o Shapiro-Wilk. Os dois testes testam a hiptese de que os dados apresentam uma
distribuio normal. No caso de amostras menores (<50 casos), o teste Shapiro-Wilk mais
poderoso. Um valor abaixo da significncia indica um desvio na distribuio dos dados em relao
Curva Normal (de preferncia deve estar abaixo de 0,05 ou mesmo 0,01) (Figura 21)
grupo (os 5
O comando Explore produz ainda uma sequncia de grficos, como o histograma (equivale
representao grfica de uma tabela de freqncias) e o boxplot (caixa de bigodes). Quanto ao
boxplot: a representao em forma de grficos dos quartis da distribuio; apresenta, de forma
compacta, diversas informaes sobre um conjunto de dados. A caixa formada pela mediana
(linha central) e pelos quartis inferior e superior (percentis 25 e 75), que so obtidos pelos mtodos
Tukeys Hinges. A mediana d uma estimativa de tendncia central; a altura das caixas (percentil
75percentil 25 a amplitude interquartil (interquatile range) e estima a variabilidade dos dados. A
presena ou no de simetria dada pela posio da mediana (central ou mais prxima dos quartis).
As linhas verticais que saem da caixa so conhecidas como whiskers (bigodes de gato em ingls).
Nas sries assimtricas, os dados mximos e mnimos distanciam-se das hinges de Tukey (percentil
75-percentil 25), sendo os seus valores assinalados separadamente no boxplot com um pequeno
crculo (outlines) e os valores que se distanciam substancialmente so considerados extremos
(extremes) e so assinalados com um asterisco (Figura 22).
14
15
COMANDO COMPUTE|:
Vamos criar uma varivel a partir da existente, como: Calcular o ndice ponderal (IP=
peso/altura3).
-Na janela Data Editor, escolha: Transform> Compute e surgir( Figura 24):
16
No campo Target Variable (Varivel destino), escrever o nome da varivel que ser
transformada. No exemplo ser criada a varivel IP (ndice ponderal). Digitar IP no campo Target
Variable; clicar a seguir na opo Type&Label e adicionar o rtulo (label) ndice ponderal.
Observe que o SPSS assume tratar-se de uma varivel numrica com duas casas decimais. A
seguir, desloque para o campo Numeric Expression as variveis envolvidas, usando [],
adicionando as operaes matemticas necessrias.; para a exponenciao use asterisco duplo
multiplicado 3 vezes por ela mesma, como na Figura 25.
Pressione [OK] e o resultado aparece imediatamente na janela Data Editor, como mostrado
na Figura 26:
17
Voc tambm pode manipular tabelas, como por exemplo, traduz-las. Para isto, basta
ativar o Pivot Table Editor, clicando o boto direito do mouse na tabela e assim, a tabela fica
pronta para ser editada na prpria janela Pivot Table Editor. Possibilita tambm uma viso e
edio de uma tabela larga e longa (Figura 27). Veja o exemplo a seguir:
18
Comando Split
-Split: vejamos a estratificao da anlise usando uma varivel categrica, por exemplo,
sexo. Selecionar Data>Split>File (Figura 29).
19
20
21
Comando Select
Este comando seleciona apenas uma categoria especfica dos casos de um arquivo
de dados. Escolher Data Select Cases, selecione a categoria a ser analisada, por
exemplo, da varivel categrica sexo, sero selecionados somente os casos do sexo
masculino (Figura 36)
Agora, selecione a varivel sexo e usando os sinais no centro da caixa de dilogo, digite
a expresso condicional, clicando no centro da caixa de dilogo (Figura 38)
23
Para restaurar os dados do arquivo, escolher Data>Select Case... All cases e clicar
[OK] (Figura 40).
V-ESTATSTICA ANALTICA
A Estatstica Analtica trabalha com os dados de forma a estabelecer hipteses,
procede a sua comprovao e no final, elabora concluses cientficas
Teste de Hiptese e Tamanho da Amostra para melhor compreenso da significncia
estatstica
Teste de Hipteses
Na maioria das vezes, o pesquisador toma deciso para toda populao, tendo
examinado apenas parte desta populao (amostra). Este processo chama-se de
inferncia. Na pesquisa cientfica, a inferncia feita com a ajuda de testes estatsticos.
Para a compreenso de um teste estatstico preciso que entendamos o que vem
a ser Hiptese Nula (H0) e Hiptese Alternativa (H1).
Hiptese uma conjectura, uma resposta presumida e provisria que, de acordo
com certos critrios, ser ou no rejeitada.
Hiptese Nula (H0): aquela que simplesmente afirma que no h diferena
entre os grupos estudados; trata-se de uma hiptese que atribui ao acaso a ocorrncia do
fenmeno ou resultado observado.
Hiptese Alternativa ou experimental (H1): aquela que afirma que h
diferena entre os grupos estudados.
O principal objetivo de testar uma hiptese responder seguinte questo:
dadas duas amostras, so elas realmente diferentes ou pertencem a uma mesma
24
Estabelecer a H1 ( se l ag 1)
Estabelecer a H0 ( se l ag zero)
Determinar o tamanho da amostra
Colher os dados
Realizar teste estatstico para verificar a probabilidade
de que a H0 seja verdadeira
6.
Rejeitar ou no a H0
Erro tipo I: rejeita a H0 sendo verdadeira (fato obtido por azar: rara
ocorrncia estatstica): erro alfa
Erro tipo II : aceita a H0 sendo falsa (erro mais freqente):erro beta
25
Erro tipo I: amostras pequenas (h uma maior chance de serem diferentes quanto
menores forem; numa amostra maior, estas diferenas se diluiriam).
Erro tipo II: amostras pequenas
grande quantidade de amostras
Algum erro sempre ocorre, sendo til admitir que para o Erro tipo I ou alfa,
considera-se que 5% aceitvel e para o tipo II ou beta, aceita-se geralmente
10 20%.
Tamanho da Amostra
conveniente planejar o tamanho da amostra para que se possa ter amostras
grandes o suficiente para detectar diferenas importantes. Por outro lado, amostras
exageradamente grande alm de elevar o custo do estudo, podem tornar diferenas
irrelevantes em estatisticamente significativas.
Para determinar o tamanho da amostra preciso estabelecer qual a diferena
deve ser considerada significativa. Esta uma deciso arbitrria do pesquisador,
baseada na experincia, na literatura e/ou na relevncia clnica.
Para determinar o tamanho da amostra, deve-se considerar o nvel de
significncia adequado: quanto de probabilidade aceitvel para que H0 seja verdadeira.
26
27
28
Explicaes:
Proporo de casos entre os expostos: equivale proporo de pessoas expostas ao fator de
risco que desenvolveram a doena
30
V-1-Teste t de Student
Este teste usado para avaliar a hiptese de que duas mdias so iguais ou no.
O valor do t calculado (tc) tanto maior quanto maior for a diferenas entre as mdias. O
nome deste teste refere-o ao pseudnimo usado por W.L. Gosset, uma vez que a
companhia na qual trabalhava (Guinnes Brewing Company) no permitiu publicar sua
pesquisa usando seu prprio nome e assim publicou com o nome Student.
importante para a aplicao do Teste t que a varivel em estudo tenha
distribuio normal ou aproximadamente normal.
O SPSS pode executar trs aplicaes do teste t em mdias: para uma amostra,
amostras independentes e amostras emparelhadas.
-para uma amostra: o objetivo verificar se a diferena entre o valor mdio,
que representamos por X obtido em uma amostra difere ou no significativamente da
populao referncia. Ou seja, testar se Ho: o = X onde o a mdia da populao
onde a amostra foi retirada. No se conhece o desvio padro ()) da populao.
No menu SPSS, abrir os comandos File>Open>Data... e na e na caixa de
dilogo selecionar o arquivo corticosteride pr-natal.sav. importante verificar se a
distribuio dos dados segue uma distribuio normal (teste de Kolmogorov-Smirnov e
31
32
33
34
35
36
37
38
df1
df2
1,390
209
Sig.
,203
39
Como o valor de sig. >0,05, aceita-se Ho, que mostra a igualdade de varincias
entre os 10 grupos.
A ltima tabela corresponde tpica tabela de apresentao do teste de ANOVA (Figura
58).
ANOVA
Idade Gestacional
Sum
of
Squares
df
Mean Square
Sig.
Between Groups
211,110
26,389
5,908
,000
Within Groups
933,501
209
4,467
Total
1144,612
217
40
41
Alm das tabelas anteriores, surgira a tabela Post Hoc Multiple comparisons, onde se
encontram as comparaes entre as mdias dos dois grupos (Figura 62).
42
V-3.Qui-quadrado
A estatstica do qui-quadrado (Chi-square) adequada para variveis
qualitativas, com duas ou mais categorias, ou seja dados nominais (aqueles
distribudos em categorias nominais sem qualquer ordem, como sexo, raa, via de
43
44
45
46
Clicar [OK]
No Output Viewer sero mostradas a seguintes tabelas (Figura 71).
47
48
Clicar [Continue]
49
Fig.74.Resultados do X2
50
51
Ateno:
Gr.Estudo
Gr.Controle
sim
150
130
no
122
180
280
302
272
310
582
IC 95%
Taxa de eventos no G. Estudo (EER) = a/(a+b)
55,1 %
49,2
61,1
41,9 %
1,32
0,32
36,4
1,11
0,56
47,4
1,56
0,11
13,2 %
8
21,3
19
5,1
5
Digite APENAS nas caselas de cor laranja e NUNCA nas caselas azuis.
52
Ateno:
Teste
diagnstico
+
-
30
21
51
44
74
30
51
74
125
IC 95%
40,5
58,8
59,2
58,8
40,5
48,0
1,451
1,0
1,0
-0,01
% Sensibilidade = a/(a+c)
% Especificidade = d/(b+d)
% Probabilidade pr-teste = (a+c)/(a+b+c+d)
% Valor preditivo positivo = a/(a+b)
% Valor preditivo negativo =d/(c+d)
% Acurcia = (a+d)/(a+b+c+d)
ODDS pr-teste= prob prteste/(1-prob prteste)
Likelihood ratio para teste posit=sensib/(100-especif)
Likelihood ratio para teste negat=(100-sensib)/especif
Estatstica Kappa (grau de concordncia corrigido)
29,4
51,7
45,3
72,3
50,6
67,8
45,3
72,3
29,4
51,7
39,2
56,8
-0,18
0,16
53
54
55
Dando um clik duplo com o mouse sobre o grfico, ser aberta a janela Chart
Editor, podendo assim ser editado o grfico. Selecionar Elements e Ft Line at total
(Figura 79).
Reta de Regresso
r2
r2
56
que
57
Fig.84.Menu Analyze>Corelate>Partial
Na caixa de dilogo Partial Correlations, escolhemos controlar (Controlling for)
a idade gestacional. Clicar em [OK] (Figura 84).
58
59
60
61
como s h uma varivel no modelo, podemos inferior que esta varivel um bom
previsor).
Vamos agora interpretar a tabela Coeficients (os parmetros bo e b1 so
conhecidos como coeficientes de regresso): na equao de regresso bo representa o
intercepto y, ou seja, ponto onde a linha corta o eixo Y (Consulte Margotto
PR:Correlao em Entendendo Bioestatstica Bsica www.paulomargotto.com.br ) e
este o valor B na tabela. Podemos tambm ver o valor b1 da tabela e este valor
representa o gradiente (inclinao) da linha de regresso. O seu valor 38,572. Este
valor representa a mudana da varivel de sada para cada alterao de uma
unidade no previsor. Assim, se a varivel previsora (estatura) aumentada em uma
unidade , o modelo prev um aumento de 38,572g no peso. Para que a varivel
previsora tenha um impacto significativo na habilidade de prever o resultado, este b
deve ser diferente de zero e grande,quando comparado ao erro padro. Para estes dois
valores, as probabilidade (teste t) so de 0,000 e assim podemos afirmar que a estatura
tem uma contribuio significativa (p<0.001) para prever o peso ao nascer.
Portanto, a Equao da reta fica:
Peso ao nascer = bo (-251,117) +b1(38,572) x Estatura ao nascer
Exemplo:RN com estatura de 38,52cm,a previso do peso :1235g
REGRESSO MLTIPLA
Havendo vrios previsores, estaremos realizando uma Regresso Mltipla (esta
uma extenso lgica dos princpios da regresso linear simples quando h vrios
previsores). Os princpios bsicos so os mesmos da regresso simples, isto , procurase encontrar uma combinao linear de previsores que se correlacionam de forma
mxima com a varivel de sada. Para maiores informaes, sugiro consultar Andy
Field-Descobrindo a Estatstica usando o SPSS, 2009.
J a Regresso Logstica, que veremos a seguir, uma regresso mltipla, mas
com uma varivel de sada categrica dicotmica (dependente) e variveis previsoras
(explicativas ou independentes) contnuas ou categricas. Assim podemos prever a qual
de duas categorias provvel que esta varivel pertena, dada certas informaes.
Quando a varivel de sada dicotmica (como sim/no), no podemos usar a regresso
linear a despeito da semelhana entre a regresso linear e a logstica. Para uma
regresso linear ser vlida, os dados observados devem ter uma relacionamento linear.
Quando a varivel de sada dicotmica, esta hiptese normalmente violada. Atravs
de uma transformao logartmica voc pode contornar este problema, mantendo a
forma do relacionamento linear enquanto o prprio relacionamento em si no linear.
62
Uma varivel binria aquela que aceita apenas dois nveis de resposta, como
sim ou no. J uma varivel ordinria segue uma ordenao natural das coisas, como
pequeno, mdio e grande ou classificao como ruim, bom ou excelente. A varivel
nominal tem mais de trs nveis sem nenhuma ordenao (objeto azul, preto, amarelo e
vermelho ou na previso do tempo, ensolarado, nublado, chuvoso).
Em resumo, a regresso logstica uma regresso mltipla, mas com uma
varivel de sada categrica dicotmica e variveis previsoras contnuas ou categricas.
No exemplo a seguir vamos realizar uma Regresso Logstica Binria
utilizando o SPSS. No exemplo, a varivel resposta ser a ocorrncia de Apgar<= 3 no
5 minuto (sim ou no), caracterizando uma varivel binria. As variveis independentes
escolhidas foram aquelas que se associaram individualmente ao Apgar <=3 no 5
minuto: corticide, hipertenso materna, tipo de parto e pr-natal.
Analyze>Regression>Binary Logistic (Figura 89)
63
64
65
66
Uma estatstica importante a estatstica de Wald que tem uma distribuio quiquadrado e nos informa se o coeficiente b para um dado previsor difere
significativamente de zero. Se isto ocorrer, podemos dizer que o previsor est
contribuindo de modo significativo para a previso da sada. Assim , com relao a
estes dados, podemos dizer que o uso do corticosteride pr-natal um previsor
significativo para a no ocorrncia de Apgar <= 3 e que a hipertenso materna
representa um fator de risco. A exp b(Exp (b) interpretada como uma mudana nas
chances: se o valor for maior que 1, ele indica que medida que o previsor aumenta,
aumentam as chances de uma sada ocorrer; j um valor menor que 1, indica que
medida que o previsor aumenta, as chances de uma sada ocorrer diminuem. Neste
exemplo, podemos afirmar que as chances do RN cuja me recebeu esteride pr-natal
de apresentar um Apgar < =3 reduziu em 57,3% (Exp (B) de 0,427: 1- 0,427=0,573 x
100= 57,3%) em relao ao RN no exposto ao esteride pr-natal. J a hipertenso
materna constituiu um fator de risco, aumentando em 2,3 vezes mais o risco de do RN
cuja me teve hipertenso de apresentar um Apgar <= 3 em relao ao RN cuja me
no teve hipertenso. Observe que no intervalo de confiana de ambas variveis
previsora includas no modelo NO contm a unidade).
Vejamos a interpretao de outro exemplo: Regresso logstica para a Sepse.
As variveis individualmente associadas significativamente com a sepse (corticoide,
Apgar no 1 minuto, Apgar no 5 minuto, reanimao, uso do CFR, necessidade de
intubao, uso de drogas para a reanimao, Apgar <=3 no 5 minuto) entraram no
modelo de regresso logstica. Aps realizar os passos anteriormente explicados,
obtemos as estimativas dos coeficientes dos previsores includos no modelo (Figura 97)
Fig.97. Output viewer da regresso logstica: estimativa dos coeficientes dos previsores
68
Fig. 98: Caixa de dilogo para a regresso linear para os dados de bito
Fig. 99: Caixa de dilogo para a Statistics da regresso linear selecionando Colinearity diagnostics
69
70
VIII-1-Teste Binomial
Este teste usado para testar propores em uma varivel dicotmica (sim/no,
doente/no doente/parto normal/sexo masculino, etc). Testa se a proporo de uma das
respostas igual ou diferente a uma determinada proporo ou para testar se as
propores das duas categorias de resposta so iguais ou diferentes (por
exemplo,percentual de uso de corticosteride pr-natal= percentual de no uso, ou
percentual de parto normal igual ao percentual de cesariana).
No exemplo a seguir, usando a base de dados Uso de Corticosteride Pr-Natal na
Maternidade do Hospital Regional da Asa Sul, vamos testar se o percentual de parto
normal igual a 50% (hiptese nula) ou diferente de 50% (hiptese alternativa).
Selecionar Analyze>NonparametricTest>Legacy >Legacy Dialogs(SPSS 18).Veja
na figura 104.
71
VIII-2-Teste U de Mann-Whitney
Usado para a comparao de variveis ordinais ou quantitativas entre dois
grupos independentes,quando a distribuio no simtrica (normal), ou seja quando h
ruptura dos pressupostos paramtricos; corresponde ao teste t de Student para amostras
independentes.
Quando a amostra tiver mais de 20 observaes, a estatstica U tende a uma
distribuio normal; no Output Viewer ser apresentado o resultado da estatstica z,
alm do resultado do teste U, mas a significncia pelo valor p, ser a mesma.
Selecionar Analyze>Nomparametric Test>2 Independent Samples (Figura 107)
72
73
74
Fig.111. Caixa de dilogo Two-Related-Samples Test, de onde pode ser obtido o teste
de Wilcoxon
Clicar em [OK] e o Output viewer mostrar (Figura 112).
VIII-4-Teste H de Kruskal-Wallis
Este teste uma alternativa no paramtrica para a anlise de varincia de um
critrio de classificao (One-Way ANOVA). Pode ser usado para comparar vrias
amostras independentes. Ao ser usado 2 grupos para comparao, os resultados so os
mesmos dos teste de U de Mann-Whitney. Como ocorre no teste F de uma NOVA
paramtrica, um valor significativo de F no indica onde se encontra a diferena,
devendo ser realizado o teste de Tukey. J no teste H de Kruskal-Wallis, para identificar
a diferena, deve ser realizado o teste de Dunn, no disponvel no SPSS.
Selecionar Analyze>Nonparametrics Test>K Independent Samples (Figura 113)
76
Fig. 114. Caixa de dilogo Test for Several Independent Samples de onde se obtm o
teste H de Kruskal-Wallis
Na janela do Output Viewer, vamos ter (Figura 115):
77
Fig.117. Caixa de dilogo Test for several Related Samples, de onde se obtm o teste
de Friedman
Clicar em [OK] e a janela do Output Viewer mostrar (Figura 118)
78
79
80
81
82
resultados, temos o nmero total de casos pesquisados (N), o valor calculado do teste,
que baseado na distribuio do Qui-quadrado (Chi-Square=16,447) e a significncia
do valor-p (p<0.001). Assim, afastamos a hiptese nula e aceitamos a hiptese
alternativa, que nos mostra que o programa de incentivo adoo de medidas de
controle ambiental aumentou o percentual dos pais com o conhecimento destas
medidas. Este percentual que era de 33% (33/92) antes do programa, passou para 64%
(59/92) depois do programa.
O Teste de McNemar tambm pode ser realizado de outra forma: Analyze>Descriptive
Statistics>Crosstab>Statistics, marcando a opo McNemar.
IX- CURVA DE KAPLAN-MEIER
Muitos estudos, em medicina, so planejados para determinar se uma droga,
tratamento ou procedimento novo tem melhor desempenho do que outro normalmente
usado, ou seja, so feitas avaliaes dos efeitos de curto prazo. No entanto tambm
importante a avaliao dos resultados a longo prazo, incluindo a morbimortalidade.
Nos estudos de avaliao das taxas de sobrevivncia entre pacientes submetidos
a certos tratamentos ou a certos procedimentos, o resultado ser binrio-sobrevivncia
ou morte do paciente e o objetivo ser estimar o intervalo de tempo que os pacientes
sobrevivem com tipos especficos de tratamento ou em condies especficas.
Na anlise de sobrevivncia, a varivel dependente (resultado) sempre o
tempo at a ocorrncia de determinado evento (j na anlise estatstica clssica, a
varivel dependente a ocorrncia de determinado evento, como cura, desenvolvimento
da doena, efeito colateral).
Vejam assim que na anlise de sobrevivncia compara-se a rapidez com que os
participantes desenvolvem determinado evento, ao contrrio de comparar as
percentagens de doentes que desenvolvem o evento, ao fim de um determinado perodo
de tempo. O evento final da anlise de sobrevivncia pode no ser somente a morte,
podendo ser outro evento, como recidiva, progresso da doena, efeito colateral.
Quando se fala em tempo de sobrevida na anlise de sobrevivncia no significa que
seja necessariamente o tempo at a morte e sim o tempo at a ocorrncia de
determinado evento. Assim, devido diferena do tipo de varivel dependente usada,
todos os mtodos estatsticos que usamos normalmente na anlise clssica, no podem
ser usados quando realizamos anlise de sobrevivncia, devido diferena do tipo de
varivel dependente que utilizada. A anlise clssica e a de sobrevivncia tem
mtodos prprios (consulte a tabela 4)
83
84
86
87
88
89
90
91
92
sobrevivncia. Este grfico pode ser editado clicando sobre ele com o boto esquerdo
do mouse (Editar). Assim, podemos responder a seguinte pergunta: quantos pacientes
com cncer coloretal sobrevivem mais de dois anos?. Traando uma linha vertical no
tempo de 25 meses, vamos observar que a sobrevivncia seriam aproximadamente 75%
(Figura 136)
93
94
95
X- CURVA ROC
Muitos exames dos nossos pacientes tem valores medidos numa escala numrica
e assim a sensibilidade e a especificidade dependem de onde se coloca o ponto de corte
(cut off) entre os resultados positivos e negativos.
Uma forma mais eficiente de demonstrar a relao normalmente antagnica
entre a sensibilidade e a especificidade dos exames que apresentam resultados
contnuos so as Curvas de Caractersticas de Operao do Receptor (Curvas ROCReceiver Operating Characteristic). A Curva ROC uma ferramenta poderosa para
medir e especificar problemas no desempenho do diagnstico em medicina por permitir
estudar a variao da sensibilidade e especificidade para diferentes valores de corte.
A Curvas ROC foram desenvolvidas no campo das comunicaes como
uma forma de demonstrar as relaes entre sinal-rudo. Interpretando o sinal como os
verdadeiros positivos (sensibilidade) e o rudo, os falsos positivos (1-especificidade),
podemos entender como este conceito pode ser aplicado em medicina.
A Curva ROC um grfico de sensibilidade (ou taxa de verdadeiros
positivos) versus taxa de falsos positivos (Figura 141)
96
97
98
S
e
n
s
i
b
i
l
i
d
a
100
101
A seguir, clicar em [ OK] e teremos a Curva ROC, que um ndice visual da preciso
do ensaio (Figura 147)
102
Asymptotic 95%
Confidence Interval
Std. Error
,996
Asymptotic
Sig.b
,001
Lower
Bound
,000
Upper Bound
,994
,999
1Specificity
,00
1,000
1,000
1,50
,997
,058
2,50
,995
,040
3,50
,993
,024
4,50
,988
,017
5,50
,978
,015
6,50
,973
,012
7,50
,965
,003
9,00
,000
,000
103
104
Fig. 150. Curva ROC para o CRIB, CRIB II e SNAPPE-PE. A rea sob a
curva foi: CRIB, 0,903; CRIB-II, 0,907; SNAPPE-II, 0,837.
Observem que as Curva do CRIB e CRIB-II esto mais prximas do canto
superior esquerdo do diagrama, o que confere maior rea sob a curva e, portanto, maior
poder de discriminao em relao ao SNAPPE-II.
XI NDICE DE CONCORDNCIA INTRA E ENTRE-OBSERVADORES
Estatstica k / Coeficiente (tau) de Kendall
O ndice de concordncia intra e entre-observadores constitui uma medida
utilizada para analisar o acordo entre dois intervalos de observao (intraobservadores)
e entre avaliadores (entre-observadores) na atribuio de categorias de uma varivel
categrica. Em ingls este procedimento geralmente designado por interjudge
reliability ou interobserver reliability. uma importante medida para determinar o quo
bem funciona uma aplicao de alguma medio.
A medida estatstica de confiabilidade o kappa de Cohen, descrito em 1960.
O kappa uma medida de concordncia intra e entre-observador e mede o grau de
concordncia alm do que seria esperado to somente pelo acaso e varia geralmente de
0-1 (embora os nmeros negativos sejam possveis) onde um grande nmero significa
maior confiabilidade, valores prximos ou menores que zero sugerem que o acrdo
atribuvel ao acaso.
Como interpetar o kappa:
O Kappa varia de +1 a -1
105
pacientes vtimas de traumatismos faciais. Na figura 151, esto os valores dos ndices
kappa para cada observador, com uma mdia geral de 0,472 (concordncia moderada).
Analisando a concordncia em diferentes regies, os autores relataram que as fraturas
observadas nas regies de etmide, corpo mandibular, parede anterior de seio frontal e
esfenide, apresentaram ndice de concordncia excelente; as regies de maxila, cndilo
mandibular e pirmide nasal, ndice de concordncia substancial; para as regies de
parede medial de rbita, parassnfise e ngulo mandibular, soalho e parede lateral de
rbitas, ndice de concordncia moderada; para a regio de arco zigomtico, ndice de
concordncia considervel; para regio fronto-zigomtica, ndice de concordncia
ligeira; para as regies de palato duro, snfise, ramo e processo coronide de mandbula,
ndice de concordncia pobre.
109
Fig.153.Crosstabs
110
111
112
REFERNCIAS
1- Wagner MB, Mota VT, Dornelles CC. SPSS Passo a Passo, Educs, Caxias do Sul,
2004
2- Field A. Descobrindo a Estatstica usando o SPSS, Artmed,2 Edio Porto Alegre,
2009
3-Filho Doria U. Introduo a Bioestatstica (Para simples mortais), Negcio Editora,
So Paulo, 2 Edio,1999
4-Arango HG.Bioestatstica Terica e Computacional, Guanabara Koogan, Rio de
Janeiro,2001
5- Vieira S. Introduo Bioestatstica, Editora Campus, 2 Edio, Rio de Janeiro,
1991
6-Sounis E. Bioestatstica.Princpios fundamentais, metodologia estatstica, Aplicao
s Cincias Biolgicas,Livraria Atheneu
7-Bisquerra R, Sarriera JC, Martinez G. Introduo Estatstica. Enfoque Informtico
com o Pacote Estatstico SPSS, Artmed, Porto Alegre, 2004
8. Margotto PR. Entendendo Bioestatstica Bsica. Boletim Informativo Peditrico
(Enfoque Perinatal), No65, Ano 22, Braslia, p.6-108, 2002. Disponvel em
www.paulomargotto.com.br, em Entendendo Bioestatstica Bsica (Acessado em 30 de
outubro de 2009)
9-Margotto PR. Como exercer a Medicina/Neonatologia baseado em evidncias. In.
Margotto PR. Assistncia ao Recm-Nascido de Risco, Hospital Anchieta, 3 Edio,
Braslia, no prelo. Disponvel em www.paulomargotto.com.br em Exerccio da
Medicina Baseado em Evidncia (Acessado em 20 de outubro de 2009)
10-Penha RN. Um estudo sobre regresso logstica binria. Universidade de Itajub,
Instituto de Engenharia Mecnica, Departamento de Produo. Disponvel em UM
ESTUDO SOBRE REGRESSO LOGSTICA BINRIA Renata Neves Penha ...
(Acessado em 30 de novembro de 2009)
11.Batistela G C, Rodrigues AS, Bononi JTCM. Estudo sobre a evaso escolar usando
regresso logstica: anlise dos alunos do Curso de Administrao da Fundao
Educacional de Ituverava. Tkhne Lgos, Botucatu, SP, v.1, n.1, p.53-66, out.2009.
Disponvel em ESTUDO SOBRE A EVASO ESCOLAR USANDO REGRESSO
LOGSTICA: ANLISE ...
12- Programas desenvolvidos na Braile Biomdica S/A. Disponvel em Estatistica
(Acessado em 30 de dezembro de 2009)
13-NRM Consultoria Estatstica Ltda. Curso de Estatstica com a Utilizao do SPSS,
ESCS, 2009
14.Whelan B, Bennett K et al. Serum sodium as a risk factor for in-hospital mortality in
acute unselected general medical patients. QJ Med 2009;102:175-182
15-Silva AP. Curso Bsico de Estatstica utilizando o SPSS. ESCS, julho de 2006
16-Laboratrio de Epidemiologia e Estatstica. Lee - Laboratrio de Epidemiologia e
Estatstica (Acessado em 21 de abril de 2010)
17-Botelho F, Silva C, Cruz F. Epidemiologia explicada-anlise de sobrevivncia. Acta
Urolgica 2009;26:4:33-38. Disponvel em Epidemiologia explicada Anlise de
Sobrevivncia (acessado em 14 de maio de 2010)
113
114
Disponvel em www.paulomargotto.com.br
em Monografias-2011. Acesso em
24/11/2011
31-Fescina. H. Tecnologias perinatales. Centro Latinoamericano de Perinatologia y
Desarrollo Humano (CLAP). Pub Cient CLAP No 1166, 1988
10- Laboratrio de Epidemiologia e Estatstica. Lee - Anlise de Concordncia Kappa.
Acesso em 20/11/2011
32-Braband M, Hosbond S, Folkestad L. Capillary refill time: a study of interobserver
reliability among nurses and nurse assistants. Eur J Emerg Med 2010, May 27
33- Ajuda do BioEstat 3.0 Ayres , Jr.Aires M, Ayres DL, dos Santos AAS. BioEstat, Belm,
Par, 2007. Acesso em 18/12/2011
34- [PDF] Tema 3 Tablas lvarez MMR. UNIVERSIDAD DE JAN. Material del
curso Anlisis de datos procedentes de investigaciones mediante programas
informticos. Acesso em 15/12/2011
35- Anlise da Concordncia Interobservadores em Exames de ...Corte MD, Gonalves
JC, Silva CS et al. Anlise da concordncia interobservadores em exames de
Papanicolaou.NewLab, Edio 80, 2007
36.NRM Consultoria Estatstica Ltda. Curso de Estatstica com a utilizao do
SPSS,Porto Alegre, 2010
37.Motta VT Oliveira FPF. SPSS-Anlise de dados biomdicos, Editora Cientfica Ltda,
2009 (arquivos retirados do site www.medbooeditora.com.br). Acesso em, 31/12/2011
Torture os nmeros e eles admitiro qualquer coisa
Nota: este texto ser continuamente revisado e ampliado medida quer for sendo
discutido com os estudantes do 6 Ano da Escola Superior de Cincias da Sade
(ESCS) /SES/DF (Faculdade de Medicina da Secretaria de Estado de Sade do
Distrito Federal).
Pesquisado, digitado, revisado por Paulo R. Margotto
www.paulomargotto.com.br
pmargotto@gmail.com.br
Braslia, 01 de janeiro de 2012
115