Sunteți pe pagina 1din 162

I -

,
E5TA TISTICA
APLICADA
""
' .. A CIENCIAS
HU!,IMANAS
I

Tradurio:
I

' Srgio Francisco '. Costa


Ti!L.'Hr lk btat~ tca
Fftc:uiJ:,Je de Fk)sofia, Cincias e Letras
So Cuc tano do ~nl (SP).

i .
LA. G li'I
.L .!

I
\ II
!
!.
\:
! ', U IBLl()TI:.iA CEN"I i~ A L
\.
HARBRA
EDITORA HARPER & ROW DOBRA TL LTDA.
Si.1 Paulo - Bogot- Mxico- Nova Iorque - . Londres
Sid.m.y - So Francisco -Tquio- Nqva Deli 1

:I
r:
Este livro deve ser devolvido na Tombo :__________J __________ ../

llim~ data carimbada

. '

A Flea, Michael,
Bonnie e -Audrea.

'i ' ...' ' "'!.. ~- . . '


! '

. ,,
:f .~
~; .
,..
. ' . ...
~ .' '
\( .. \:

;.;C

I
''I
Supen isa .!
~ ' .... I ,
:I
',_.j
Relisti'o : Mar ia Lcia G. Leite
Pro1as l
., ! - : Maria Elizab th Santo

Produa Grf ica


Capa
: Maria Pia Ca tigJia
Mar ia Hraga c e I esus I
: Progr.rna Pr<dues G:ficas Ltda.
.i

: Lourdes Mar Jns :


r
CI~NCIAS HlJ
impresso : GR FICA EDI'rO A H,IJ11HURG LTDA.
, I
CLASS. J ESLH ISTICA .1\PlJGA DA A ANAS '
Cop,n ig ht 19 78, pela EtLtora Hi! rpcr & Ro do Hrasii Ltda. 1
R ua l uaqlli.J!J T:vora. 66 3. Vila Mariana, S.P. Telefone: 70-3572,70-489 1
R"' ""'w" "' 13 1,4 " " '" U b' ""'' S P, - TeJeJoneo 278-7!09
Tra d ul_-;io d e Elementa r\' Statistics in Social Ae~earch, 21! edio "'\>
Copnight i 977 . por lack Levin. r

Pub licad o 0rigin:J lmentc nos EsUt dos Unidos po~ Harpcr & Ro w PubJisl1ers, l11c. I

I
lo<mln'"''"''"'' P<olbido <Oprod"';, ~~" ob,
II . .

p~rci;lflllc'llk,
f odo < " ' dh,l<o, ''''"'""'
sc lll :J UfH F;,.,
"' c:-q.Jrtssa
iz.:1;fio elos Edit!ores. , '" '"' "" ''---
Impresso no Bmsil I
I'
Priiit ed in l?m<i!
,,,
'.
! .
Conte\ O

Prefcip
Prefci~l Edio Brasileira

J>o\ que o Pesquisador usa Estatstica?


A nat urcza ela pesquisa 1
Por que testar h.ipteses? 2
Os 'estgios ela pesquisa 2
\I. O 1lso de sries numricas em pesquisa 3
Fu111<ics da est <Jtfsti 6
t{d umo 12
I ,
PA:R TE I DESCAlAo 13
i
2 Orgbniza.o de Dados 15
Ois r ib11ies de freqncia de~dosnominai 15 .
Comp :u ao das distribuies 16 . - B
1:
i . I' Di::t,t ib u ic3 de freqncias sirnt es rel ativas a dadf~~dinais e intervala rcs l!_!
~
I li~t ribuics de freqncias com dados agrupados t:J~')(
( Di:;tribuies cumulativas ~ /'
Postp p ercen til 2 7 V
Resumo @\ ;::;_
Rcpt:esentlttfu; G~ - - as (35)
I
\ . 3
.'1 Gri'ico:. heto riais 3 ----
(; rjficos de barras 36 \~
Pol gbnos de fre qencias 37 .
Con ~t nH;o de grficos de ras e de l\9]{gonos de freqncias 39 .
Fo rn1a de uma distribui o de freqncias 401
Rest111no 41

42
' 'Moda. 42
'Mcd i; a 43
' M di:l ali tmtka 45 ,
! Cfl:liptr;,co e ro trc moda, mediana e mdia 47
Cj Jculu ola moda, da rnediana e da mdia numa distribuio de freqncias co m
rlados agm pados 52
R.;:,lln\o 55

j 5 ftiedii.las 1e Vara bilidade 59


Amj,li ::Ulk: h>t,;i 60
l ks" rndit> !
Desvio padro 63
\d . 'd' .\ . l.-
. ai , , esv10 me 10 e CSVIO pac rao 71 1
'o mpu uJo cu tre amplitu e tot
/
Clcu h) da amplitude total do desv:\o mdio e do desvio padril'o de dad9s
,1grupados 72
Resumo 75 I 1

PARTE 11 DA DESCRIO A TOMADA DE DECISES


I
7p
6 A Curv:J Normal 81 I
\ 'I

Caractersticns da curva normal 82 I I


Curvas normais : o modelo e o mundo real 82 I
A rea sob a curva normal 84
\
lornaJ1do a no<Io de desvio 'p adro mais clara: uma ilustrao 86
Uso da tubela l3 88 '. \
I
Escores padronizados e a cu~a nonnal 89 I

l'rohabil idade e curva normal 91 \


Resumo 98

Amostras e Populaes 100


!'vltodos de amostragem 101
Erro amostrai 106
Distribu io amostrai de mdias
I
'1 07
Erro pad1o da mdia 11 2 \ J

In tervalos de confiana 114 1 !'


Esti mativa de propores 11 9~
l:Zesu mo 121

PARTE 111 TOMADA DE DECIS ES 125

Ttstes de Diferenas entre Mdias 127


lliptesc nula: uo h diferena entre as mdias 127
!li p tese ex perimental: h diferena entre as mdias 128
Distribuio amostrai de d.iferenas entre mdias 129
Testes de !li pttses relacionados com a distribuio de diferenas 133
Nheis de signif1cncia 136
Erro padro de diferena 138
Comparaes entre amostras pequenas 142
Comparaes entre amostras de tamanhos diferentes 146 1

C'ompara;io de dados resultantes de duas mensurac,:es temporalmente dislint~s


da mcsllla amos! ra 148 I
Requisitos p:~ra o uso do escore z e Ja raz'o t 151
Resumo 151

9 Anlise de Vari<incia 156


A lgica da anlise de varincia
Somas de quadrados 158
Quadrado mdio 163
A estatstica F( razo F) 165
Comparao mltipla de mdias 170
Exigncias para o uso da estatstica F( razo F) 172
Resumo 172

1O Qui-quadrado e outros Testes No-paramtricas 17 5


Qui-quadrado : um teste de significncia 176
Clculo do qui-quadrado 1 77
Clculo das freqncias esperadas (tericas) 180
Frmula para o clculo do qui-quadrado de uma tabela 2 X 2 184
Correo de freqncias esperadas pequenas 185
Comparao de vJjos grupos 187
Requisitos para o uso do qui-quadrado 192
O teste da mediana1 194
Dupla anlise da varincia por postos: x2 de Friedman 197
Anlise da varincia por postos: H de Kruskal-Wallis 200
Resumo 203

11 Correlao 208
Fora da correlao 208
Sentido da correlao 209
Correlao curvilnea 21 O " .
Coeficiente de correlao (~U'
Coeficiente de correlao para dados intervalares 212
Frmula para o clculo do r de PearsoR 215
Anlise de regresso 220
Coeficiente de correlao para dados ordinais 226
Gama de Goodman e Kruskal 232
Coeficiente de correlao de dados nominais dispostos numa tabela 2 X 2 239
Coeficientes de correlao de dados nominais dispostos em-tabelas de ordem
superior a2 X 2 241
Resumo 244

12 Aplicao de Procedimentos Estatsticos a Problemas de Pesquisa 249


Situaes de pesquisa 250
Solues das pesquisas propostas 257

APNDICES 261
Apndice A Reviso de Fundamentos de Matemtica 262
Nmeros decimais 262
Nmeros negativos 265
Clculo de razes quadradas mediante o uso da tabela A 266
Apndice B Tabelas 268
Apndice C Lista de Frmulas 298
Apndice D Classificao de Classes Scio-Econmicas no Brasil 303
Referncias 306
Respostas aos Problemas Pares 30.4
fudice 308
Prefcio
,..

O objetivo de Estatz'stica Aplicada a Cincias Humanas, segunda edio, igual ao


da primeira edio: oferecer uma introduo Estatstica para alunos da rea de Cin-
cias Humanas (o que engloba campos tais como Sociologia, Poltica, Servio Social,
Psicologia, Administrao, Educao) que no tenham tido a oportunidade de receber
treinamento aprofundado em Matemtica, e que estejam enfrentando seu primeiro curso
de Estatstica. Como antes, este livro no tem a inteno de ser um material de referncia
exaustivo; no deve tambm ser tomado como um texto adequado a cursos avanados
de Mtodos Estatsticos. Ao contrrio, foi escrito e revisado com vistas a preencher a
sentida necessidade de um enfoque significativo e compreensvel daquilo que bsico
em Estatstica. Mais uma vez, as ilustraes "passo a passo" dos procedimentos estats-
ticos foram localizadas em pontos estratgicos do texto, alm de terem sido apresen-
tados numerosos problemas, tirados de pesquisas reais.
Como na edio anterior, este volume foi organizado em trs partes: a Parte I
(Captulos 2 a 5) leva o estudante a compreender e a manejar alguns mtodos teis para
a descrio e comparao de dados brutos. A Parte li (Captulos 6 e 7) tem o propsito
de servir de transio, uma vez que leva o leitor do tpico relacionado com a curva
normal - importante instrumento descritivo- ao primeiro captulo em que essa mesma
. curva usada como fundamento para generalizaes (partindo de amostras para popu-
laes). Ainda com o enfoque centrado na tomada de decises, a Parte III (Captulo 8
a 12) contm vrios testes de significncia bem conhecidos, alm de procedimentos para
a obteno de coeficientes de correlao e uma introduo anlise de regresso.
Esta edio apresenta algumas mudanas dignas de nota. Por insistncia de colegas
professores, o Captulo 10 foi substancialmente aumentado para permitir um trata-
mento mais extensivo da(s) estatstica(s) no-paramtrica(s). Alm disso, foram aumen-
tados, esmiuados ou acrescentados os seguintes tpicos: posto percentil, probabilidade,
comparao mltipla de mdias aritmticas, depois anlise de varinda, coeficiente
gama e r de Pearson. Tendo em mente salientar a aplicao da Estatstica em pes-
quisa, um novo captulo ( 12) foi acrescentado; quanto s vrias situaes de pesquisa
nele apresentadas, o aluno deve tenta,r selecionar o procedimento estatstico mais ade-
quado a cada situao. O nmero de exerccios no fim de cada captulo tambm foi
aumentado. Finalmente, os apndices foram ampliados com vistas a incluir uma reviso
dos fundamentos de Matemtica e uma lista de frmulas.
vii
I Muitas pessoas contriburam de difere~tes formas para o desenvolvimento da se-
gunda 'edio deste livro. A reviso aguada de Kenneth Pollinger e~ Contem~orary
Sociology serviu-de base para vrias melhorias e adies. Agradeo a Richard Spnnthall
UNtVERSlDADI: F't:DERAL DO PARA
BIBLIOTECA CENTRAL

e seus alunos do American /nternational College (particularmente a Lynn An:old,_ C~er~l


Janes, Jim Lynch, Claire Nolen e Gary Zera) por terem-me alertado quanto a extstenct~
de alguns erros ou fontes de interpretao errnea na edio anterior. Meu~ agradec~
Prefcio
mentos especiais s seguintes pessoas pelas leituras crticas que fizeram das mmhas reVI-
ses: George Bowlby, James Elliot, Roy Hansen, C. Lincoln Johnson, Carol Owen,
Lawrence Rosen, Norman Roth, Ellen Bouchard Ryan e Larry Siegel. Tambm agrade?
Edio Brasileira
a Suzanne Johnson e Michael Weissbuch pelos comentrios e sugestes espontneas. FI-
nalmente, uma palavra de agradecimento ao responsvel pelo ~atrimnio Lite~rio do
falecido Sir. Ronald A. Fisher, F .R.S., a Frank Yates, F .R.S e a Obver & Boyd, Edmburgh,
pela permisso para reimprimir as Tabelas III, IV, V e VI do seu livro Statistical Tables
for Biological, Agricultura/ and Medicai Research.

Jack Levin Estatistica Aplicada a Cincias Humanas um livro comparvel a "corao de


me": d muito e exige pouco!
Mais do que lucidez e experincia - detectveis no s a partir das explicaes no
texto como tambm da escolha bibliogrfica criteriosa que embasou seu trabalho - o
Pro f. J ack Levin teve a coragem de escrever um livro supersimplificado - como se sua
clientela consumidora tivesse parcos conhecimentos de Matemtica. Sua coragem, repita-
. e, est muito mais em fazer algo, tomar a iniciativa de escrever este livro, do que na
simples admisso dessa hiptese, que , quando mais no seja, deve dizer-lhe a longa pr-
tica, verdadeira numa proporo alarmante!
Escrito numa linguagem amena e quase despojado do jargo matemtico, Estats-
tica Aplicada a Cincias Humanas destina-se a um pblico muito especfico: estudantes
de Cincias Humanas, refgio errneo dos que fogem das equaes e dos clculos, pois
que, embora "humanas" - e talvez por isso mesmo - no podem prescindir das to
diadas quantificaes! Com a traduo que ora vai a pblico, procurou-se, sem perder
de vista o carter elementar que o livro deve manter, enriquec-lo um pouco, custa de
notas de rodap, talvez desnecessrias num primeiro contato com a Estatstica, mas sem
dvida proveitosas em revises posteriores.
No original, o Autor grifou muito menos palavras ou sentenas: a abundncia de
grifos, na traduo, foi uma tentativa visual de chamar a ateno do leitor para aspectos
relevantes do texto.
O temor de que possa pairar a mais leve dvida sobre o discernimento e saber do
Prof. Levin obriga a que se diga o seguinte: transpira, evidente, em todo o livro, a inten-
o clara de levar o aluno ao raciocnio estatstico atravs de exemplos tirados do dia-a-
-dia, por isso, talvez, menos refinados, mas seguramente mais prximos de seu universo
cognitivo.
Que o nome de Levin possa, atravs desta contribuio, ganhar lugar de destaque
entre os estudiosos brasileiros.

So Paulo, julho de 1978


Srgio Francisco Costa
\
1
Por que oPesquisador
usa Estatstica?
Todos ns temos um pouco de cientista. Quase que diariamente, temos "palpites"
com relao a acontecimentos futuros em nossas vidas, a fim de prever o que acon-
tecer em novas situaes ou experincias. medida que essas situaes ocorrem,
podemos, s vezes, confirmar ou sustentar nossas idias; outras vezes, entretanto, no
temos tanta sorte e, por isso, acabamos experimentando conseqncias desagradveis.
Tomemos alguns exemplos familiares: poderamos investir na bolsa de valores,
votar em algum candidato que prometesse resolver os problemas nacionais, jogar nos
cavalos, tomar um remdio para reduzir os incmodos de um resfriado, jogar dados
num cassino, tentar "adivinhar" o que nossos examinadores iro perguntar nos exames
ou acertar ~s cegas) um encontro com uma garota desconhecida, marcado atravs de
um amigo.
s vezes, ganhamos; s vezes, perdemos. Desse modo, poderamos fazer um -belo
investimento na bolsa, mas reconhecer que no fizemos a escolha do melhor candida-
to; poderamos ganhar no cassino, mas descobrir que tomamos o remdio errado para
nossa doena; conseguir aprovao nos exames, mas penar na companhia arranjada pelo
amigo; e assim por diante. A verdade que, infelizmente, nem to.das..as_nQ~~
aca -se t ando realidade.

A NATUREZA DA PESQUISA
De modo mais ou menos semelhante, o cientista tem idias. sobre aJ!.atureza da reali-
dade....,(idias que ele denomina hip~) e freqentemente J__eJta suas idias atravs
q pesquisa_sistemtica. Por exemplo, ele poderia levantar a hiptese de que crian-
as socialmente isoladas assistem mais televiso do que crianas bem integradas
om seus grupos-e, a partir da, fazer um levantamento em que fossem feitas perguntas
tanto s crianas socialmente isoladas, quanto s crianas bem integradas com relao
no nmero de horas que elas passam d!ilfite do vJ.~. Ou, ele poderia levantar a hiptese
de que a famlia constituda por um s genitor (me ou pai ausente) gera maior delin-
2 Por que o Pesquisador usa Estatz'stica? Por que o Pesquisador usa Estatfstica? 3

qncia do que a famli constituda por ambos os genitores (me e pai presentes) ; 1. ~ prob_lema a ser estu~ado reduzido a uma hiptese testvel * (por exemplo:
ento, o pesquisador poderia entrevistar amostras de delinqentes e no-delinqentes faml11as de um gemtor produzem mais delinqncia que famllias de dois
que procedessem de famlias de ambos os tipos. genitores");
Desse modo; semelhana do que ocorre nas _2_incias f' ias, o cientista social 2. um conjunto de instrumentos adequado desenvolvido (por exemplo, so ela-
freqentemente faz pesquisas _para a~men.!_a~ seu cabedal dos roblemas e suas conse- borados um questionrio ou esquema de uma entrevista) ; .
q~ eiP:_ seu _k_amno de~A pesquisa assume muitas .formas e pOde ser 3. dados so coletados (isto , o pesquisador pode ir a campo e fazer uma conta-
usada para investigar uma srie eno~e de problemas. O pesquisador pode, na qualidade gem ou um inqurito);
de observador participante, trabalhar com grupos de delinqentes; pode tambm traba- 4. os dados so analisados em cotejo com as hipteses iniciais; e
lhar num levantamento amostrai de suas tendncias polticas, ou fazer uma anlise de 5 os resultad~s da anlise so interpretados e comunicados ao pblico, por exem-
valores em folhetos polticos; ou, ainda, realizar um experimento a fim de determinar os plo, por mew de conferncia ou publicao.
efeitos do remanejamento de moradias em indivduos atingidos por~propriaes_
Como veremos nos captulos subseqentes, o material apresentado neste livro
trata com maior profundidade daqueles aspectos da pesquisa relacionados com a anlise
POR QUE TESTAR HIPTESES? de da~os (ve_r 4, acima), os quais, depois de colecionados ou recolhidos pelo pesquisa-
, de modo geral, desejvel- para no dizer l}.eCl<.~o-testar sistematicamente nossas dor, sao _:ma11sados luz das hipteses iniciais. nesse eggio da pesquisa que os dados
hipteses sobre a natureza da -realidade, mesmo aquelas que parecem verdadci.ras, brutos ao tabuladot_ calculados, cQntados, r~sumidos, re_f!assificados, com arados ou
~~.lli.d.enies. Os nossos "testes" de bom senso dirio geralmente baseiam-se em numa palavra, Q!g!!_nizados, a fim de que a ~ ou validadede ;ossas hiptes~
idias r-concebidas muito estreitas, se no tendenciosas, e em e~erincias nessoais, o possam ser testadas.\
q~~ pode..J.exar=U.os_ ceitar concluses nQ vi.i_gas a respeito -da natureza dos fenme-
I!Q.,. Para demonstrar esse ponto, vamos examinar as seguintes hip.teses, que fo-
ram testadas com um grande nmero de soldados durante a Segunda Guerra Mundial. O USO DE SRIES NUMRICAS EM PESQUISA
Voc teria sido capaz de prever estes resultados com base em suas experincias dirias? . ?_ualquer pessoa que j tenha feito pesquisa sabe que os problemas que surgem
Voc acha que valeu a pena test-las? Ou ser que elas parecem to bvias e-evidentes na an~1se dos dados devem ser seriamente confrontados na fase de planejamento (da
que dispensam pesquisas sistemticas? pesqmsa), uma vez que de seu significado depende a natureza de decises em fases
1. Homens de nvel educacional mais alto apresentaram maior quantidade de po~te'~~~res. Tais pr~blemas amide a~etam n~o s aspectos do delineamento da pes-
sintomas psiconeurticos do que aqueles-que haviam recebido menos instruo. qmsa como tambem a escolha dos tipos de Instrumentos utilizveis na coleta de da-
2. Homens procedentes do meio rural mantiveram-se mais bern:b.!lmOI:ados.. du- dos. Por esta razo, buscamos constantemente tcnicas e mtodos que permitam melho-
rante o perodo de guerra do que os soldados recrutados nos meios urbanos. rar a qualidade da anlise dos dados.
3. A capacidade dos soldados procedentes do Sul para suportar o clima quente . . Muit?s pesquisado~~s acham que essencial fazer mensuraa ou empregar uma
das Ilhas dos . Mares do Sul era maior que a dos soldados vindos do Norte. sene de numeras na analise dos dados. Por isso, os pesquisadores desenvolveram me-
4. medida que a guerra prosseguia, os homens sentiam-se mais ansiosos para di?as*** par~ _uma gran~e ~ariedade de fenmenos, tais como: prestgio ocupacional,
retornar aos Estados Unidos do que aps a derrocada dos alemes. atltud~s pohtlca~, autont~ns~o, alienao, anomia, delinqncia, classe social, pre-
Se voc acredita que essas relaes eram to bvias que qualquer teste sistemtico con~elto, do~~tlsmo, reahzaao, etnocentrismo, vizinhana, religiosidade, ajustamento
teria sido dispensvel, saiba que cada item "representa a concluso oposta ao que real- conJugal, mobilidade ocupacional, urbanizao, status sociomtrico, fertilidade etc.
mente se verificou._Soldados parcamente educados neurotizaram-se mais do que os Os nn;teros tm pelo menos trs funes importantes para o pesquisador, de~en
que receberam boa educao; os sulistas no demonstraram maior habilidade que os d:~do do nzvel de mensurao especfico que ele empregue. Especificamente, uma
nortistas em adaptar-se a um clima tropical; ... e assim por diante." 1 Ficar apenas na sene de valores pode ser usada
dependncia do bom senso ou da experincia do dia-a-dia tem seus limites! 1. para categorizar ao nvel de mensurao denominado nominal,

OS ESTGIOS DA PESQUISA * N. T. : Reduzir um problema a um': hiptese testvel significa definir o problema e a(s) hiptese(s)
Testar sistematicamente nossas idias sobre a natureza da realidade muitas vezes requer em termos operaczonazs. Uma defimao operaciOnal explicita comportamentos observveis (direta ou
mduetamente ).
uma pesquisa cuidadosamente planejada e executada, onde: "'* N.T.: O ideal teria sido conservar a palavra " design". H quem prefira "modelo" ou mesmo
1 "desenho".
Paul Lazarsfeld, "The Ame;ican Soldier-An Expository Review", Public Opinion Quarterly,
outono de 1949, pg. 380. '"** N.T.: Na verdade, desenvolveram " processos de mensurao".
1
Por que o Pesquisador usa Estat(stica? S
4 Por que o Pesquisador usa Estatz'stica?
propsito de agrupar os sujeitos em categorias separadas para indicar similitude ou
2. para atribuir postos ou ordem ao nvel de mensurao denominado ordinal e diferena com referncia a uma dada qualidade ou caracterstica.
3. para avaliar ao nvel de mensurao denominado intervalar.
Antes de prosseguir com a discusso do papel da Estatstica na pesquisa vamps TABELA 1.1 Atitudes de Dez Estudantes Universitrios com Relao a "Neutralianos": Dados
Nominais -- -
parar aqui para examinar algumas caractersticas mais importantes desses nveis de
mensurao, car~ctersticas que, mais adiante, assumiro grande importncia ao tentar- Atitude com Relao aos "Neutralianos" Freqncia
mos aplicar tcnicas estatsticas a determinadas situaes de pesquisa.
I . = Preconceituosos 5
Nvel Nominal 2 = No-preconceituosos 5
O nvel nominal de mensurao envolve simplesmente o ato de nom!l~jQ.1Ylar.; em Total 10
outras palavras, consiste em colocar indivduos* em categorias e contar a freqncia '.
com que ocorrem. Para ilustrar, poderamos usar uma medida de nvel nominal para ~
indicar se cada respondente tem ou no preconceito com relao a determinado grupo - Nvel Ordinal
social ("Neutrlia"). Como demonstra a Tabela 1.1, poderamos submeter 10 alunos de Quando o pesquisador vai alm desse nvel de mensurao e procura ordenar seus
determinada classe a um questionrio e verificar que 5 podem ser considerados "precon- sujeitos em funo do grau que apresentam de determinada caracterstica, ele._e_ru
ceituosos"(= 1) enquanto que 5, "no-preconceituosos"(= 2). ttabahando no nvel ordfnal de mensurao. A natureza da relao entre categorias
Outras medidas de nvel nominal em pesquisa so: sexo (masculino versus ordinais Q_e~nJ!~da a~~cter~tica que o pesquisador procura medir. Para citar um
feminino); classe scio-econmica (alta e baixa), partido poltico (ARENA e ~DB), exemplo familiar, ele poderia classificar indivduos com referncia a status scio-eco-
carter social (voltado "para dentro" e tradicional), modo de adaptao (confonmsmo, nmico e disp-los em "classe baixa", "classe mdia" e "classe alta". Ou, em lugar
inovao, ritualismo, fuga, rebeldia), orientao no tempo (presente, passado e futuro), de categorizar os alunos de uma dada classe em preconceituosos ou no-preconceituosos,
urbanizao (urbano, rural e suburbano)-para mencionar algumas. ele poderia classific-los de acordo com o grau de preconceito contra os "neutralianos",
Ao trabalhar com dados nominais, devemos ter em mente q\le cada sujeito deve semelhana do que vai indicado na Tabela 1.2.
ser colocado em uma-e somente uma-:::cat.cggria. Este requisito indica que as categorias O nvel ordinal de Il)ensur-o fornece informaes sobre a ordenao das cate-
no devem sobrepor-se, isto , devem ser mutuamente excludentes.** Desse modo, a gorias, mas no indica a._n/'f1tU(ie5Jas diferen as @tre-os_valor~s. Por exemplo, o
raa de um respondente no pode ser simultaneamente classificada em "branca" e pesquisador que emprega uma medida de nvel ordinal para . estudar a varivel pre-
"preta" ; qualquer respondente que seja classificado como "macho" no pode ser tam- conceito no sabe quanto um respondente mais (ou menos) preconceituoso que
bm classificado como "fmeo". O requisito implica tambm o fato de que as catego- outro. No exemplo dado acima, no possvel determinar quanto Adri_an mais
rias devem ser exaustivas-ou seja, deve haver um !!!gru:__espedfico para cad su'eit preconceituosa do que Maria ou quo menos preconceituosa Roberta com relao a
experimentaLque ap_ar.e.a. A ttulo de ilustrao, imagine um estudo em que todos os Patrcia ou Pedro. Isto ocorre porque os intervalos entre os pontos ou postos numa
respondentes sejam entrevistados e categorizados por raa, como brancos ou negros. escala ordinal no so conhecidos ou, melhor dizendo, dotados de significado. Portanto,
Onde que colocaramos um respondente chins na hiptese de surgir um? Neste caso, no possvel atribuir valores a sujeitos localizados em diferentes pontos da escala.
poderia tornar-se necessrio ampliar as categorias originais e incluir "orientais" ou, TABELA 1.2 Atitudes de Dez Estudantes Universitrios com Relao a "Neutralianos": Dados
ento, admitindo-se que a maioria dos respondentes ser de raa branca (ou de raa Ordinais
negra), incluir a categoria "outros", onde tais excees possam ser colocadas.
O leitor deve observar que os dados nominais no so graduveis, ordenveis ou Aluno Posto
escalonveis relativamente a qualidades tais como melhor ou pior, mais alto ou mais
baixo, mais ou menos. Obviamente, ento, uma medida nominal de sexo no significa Adriana 1 - mais preconceituosa (primeiro posto)
Maria 2- segundo
que os machos sejam "superiores" ou "inferiores" s fmeas. ?s dados nomi~ais so Benito 3 -terceiro
simplesmente rotulados, s vezes por nome (macho versus femea, preconceituosos Jos 4- quarto
versus no-preconceituosos), outras vezes por nmero (1 versus 2), mas sempre com o Ctia 5- quinto
Geraldo 6- sexto
Filipe 7 - stimo
* N.T.: comum usarem-se em pesquisa os termos "sujeito", "indivduo", "caso" sin?,nim~m~nte. . Pedro 8- oitavo
Alm disso no h necessariamente aluso a "pessoas" quando se usam os ten.1os sujeito ou Patrcia 9 - nono
"indivduo';. A idia bsica suj~ito experimental. Roberta 10- menos preconceituosa
** N.T.: comum a expresso "mutuamente exclusivo".
......
~-------~-------.- .,
6 Por que o Pesquisador usa Estatfstica? Por que o Pesquisador usa Estatistica? 7

~vel Intervalar escrio


Em contraposio, _Q__!lvel i~te"!'a/ar d~e?s~ra?o _grj~nta-nos ~ @lativament~dem Para chegar a concluses ou obter resultados, o pesquisador geralmente . estuda cen-
das categorias, ~em como mdtca-nos a dzst_Encza exata entre elas. Escalas::-)l'lfenrala- tenas, milhares ou mesmo quantidades ainda maiores de pessoas ou grupos. Como
~es J!lplicam unidades constantes dg_n:.zedida (por exemplo: cruzeiros-QJl centavos, um caso extremo, consideremos o trabalho do "United States Bureau of the Census"
~s Fahrenheit ou centgradqs,_metros ou centmetros, minutos ou segundos), as (Servio ~arte-americano de Recenseamento) na enumerao exaustiva de toda a
qUais comportam intervalos iguais entre os vrios pontos da escala. populao dos Estados Unidos, para o que mais de 200 milhes de sujeitos foram
~ Desse modo, uma medida intervalar de preconceito contra os "neutralianos"-por entrevistados. Apesar da ajuda de numerosos procedimentos sofisticados idealizados
exemplo, as respostas a uma srie de perguntas sobre esses sujeitos avaliadas numa escala . para a tarefa, descrever e resumir a enorme quantidade de dados que se originam de
de O a 100 (o mximo de preconceito correspondendo a 100)-poderia fornecer dados projetos de pesquisa social sempre um trabalho de propores astronmicas.
como os que constam da Tabela 1.3 sobre os dez estudantes numa dada sala de aula. Para dar um exemplo familiar, as notas de exame de uma classe de apenas 80
Como bem demonstra a Tabela 1.3, agora podemos ordenar os alunos em termos de alunos foram catalogadas na Tabela 1.4. Percebe-se algum padro nessas notas?
seus preconceitos e, alm disso, indicar as distncias que separam uns dos outros. Por Poder-se-ia descrev-las em poucas palavras? Ou em poucas sentenas? De modo geral,
exemplo, possvel dize~ quf Roberta a menos preconceituosa da classe, uma v~z ~ue ' seriam elas particularmente altas ou baixas?
ela recebeu o escore >t"/rtrus baixo. Podemos dizer tambm que Roberta apenas hgeua-
mente me~ preconceituosa que Patrcia ou Osvaldo, mas muito menos preconceituosa TABELA 1.4 Notas de Exame de 80 Alunos ~
do que Adriana, Maria, Benito ou Jos, os 9-uais receberam valores (escores) extrema- ~1>.
mente altos. Dependendo do propsito para o qual o estudo foi concebido, seria impor- d>~
tante determinar tais informaes, as quais, entretanto, no estariam disponveis no
72
38
.83
89
91
49
29
36
~'?a
""o '
nvel ordinal de mensurao. 43 60 67 49
~~
81
79
52
62
76
72
62
31
0'1%
TABELA 1.3 Atitudes de Dez Estudantes Universtri.F.oom- Relao a "Neutralianos": Escala 71 32 60 73 ~~
Intervalar 65 28 40 40
<t-. a
.p-1 c::>
59 39 58 38 .(" ...0
90 49

"
Escore a 52 59
Aluno
83 48 68 60
39 65 54 75
Adriana 98 42 72 52 93
Maria 96 58 81 58 53
Benito 95 56 58 77 57
Jos 94 72 45 88 61
Ctia 22 ~3 52 70 65
Geraldo 21 49 63 61 70
Filipe 20 81 73 39 79
Osvaldo 15 56 69 74 37
Patrcia 11 60 75 68 46
Roberta 6

a Escores mais altos indicam maior preconceito.


Ainda que se usem os mais rudimentares princpios de estatstica descritiva- da
maneira como so apresentados nos captulos subseqentes deste livro- possvel
~FUNES DA ESTATISTICA caracterizar a distribuio de notas de exame da Tabela 1.4 com bastante clareza e
quando o pesquisador usa nmeros- quando ele . quantifica seus dados no nvel preciso, de sorte que as tendncias gerais ou as caractersticas grupais possam ser mais
de mensurao nominal, ordinal ou intervalar- que ele muito provave'lmente emprega rapidamente descobertas e~ mais facilmente comunicadas a quase todas as pessoas.
a Estatstica como um instrumento de (1) descrio ou de (2) deciso. Vamos agora Primeiro, poderamos reagrupar as notas em ordem decrescente (da mais alta para a
examinar mais de perto essas importantes fun~es da J?statstica\ . mais baixa), a fim de reuni-las num nmero bem menor de categorias. Essa distribuio
agrupada (condensada) de freqncias, tal como figura na Tabela 1.5 (e que ser discuti-
* N.T.: Escore significa "nota", "valor", "medida", conforme o caso. da minuciosamente no Captulo 2), apresentaria as notas "encaixadas" em categorias

I
/
8 Por que o Pesquisador usa Estatfstica? Por que o Pesquisador usa Estatfstica? 9

(classes) mais abrangentes, juntamente com o nmero ou a freqncia (f) de alunos tua-se entre 50 e 80, enquanto que as notas muito mais altas ou baixas so relativamente
cujas notas cassem nessas categorias. 1
poucas.
Pode-se prontamente observar, por exemplo, que 17 alunos receberam notas entre No Captulo 4 ser apresentado um mtodo estatstico que particularmente
60 e 69, enquanto qtie somente 2 alunos receberam notas entre 20 e 29. conveniente e til. Trata-se de algo com que j estamos mais ou menos familiarizados
Outro procedimento til (explicado no Captulo 3) seria reagrupar os dados grafi- e que consiste em perguntar: Qual a nota mdia desse grupo de 80 estudantes? A mdia
camente. Tal como ilustra a Figura 1.1, poderamos localizar as categorias (classes) de aritmtica (ou simplesmente mdia), que se obtm pela diviso da soma de todas as
notas (de 20-29 a 90-99) ao longo de um dos eixos do grfico (isto , a linha de base, notas pelo nmero de alunos, d-nos uma idia mais clara da tendncia geral do grupo.
horizonta{) e o nmero delas (categorias), ou seja, as freqncias, ao longo do outro A mdia aritmtica do exemplo em questo de 60,5, nota bastante baixa se comparada
eixo (vale dizer: o eixo vertical). com outras mdias de classe com as quais a maioria dos alunos j est familiarizada.
Aparentemente, esse grupo de 80 alunos saiu-se relativamente mal como um todo.
TABELA 1.5 Notas de Exame de 80 Alunos: Distribuio Agrupada de Freqncias
Assim, com o auxi1io de recursos estatsticos, tais como distribuies condensadas
.;
Notas de freqncias, grficos e mdias aritmticas, possvel detectar e descrever modelos ou
f
tendncias em distribuies de valores (por exemplo, as notas da Tabela 1.4), o que
90-99 3
poderia ter passado despercebido pelo observador no preparado. Neste contexto, ento,
80-89 7 a Estatstica pode ser definida como um conjunto de tcnicas para a reduo de dados
70-79 16 quantitativos (ou seja, uma srie de nmeros) a um nmero menor de termos descritivos
60-69 17 que sejam mais convenientes, e facilmente comunicveis.
50-59. 15
4049 11
30-39
Tornada de Decises
9
20-29 2 Quando o propsito testar hipteses, muitas vezes 'necessrio ir alm da mera descri-
o. tambm geralmente necessrio fazer inferncias, isto , tomar decises com base
em dados colhidos de uma amostra, o que quer dizer: estudar apenas uma pequena
poro de um grupo maior-que, por seu turno, representa o centro de interesse para
estudo. Custo, tempo e necessidade de superviso adequada so fatores que muitas vezes
impedem uma enumerao completa ou rol do grupo todo (grupo que os pesquisadores
chamam populao ou universo).
Como veremos no Captulo 7, todas as vezes que o pesquisador testa suas
hipteses numa amostra, ele precisa decidir se de fato acertado generalizar suas desco-
bertas para toda a populao da qual a amostra foi tirada. Inevitavelmente surgem erros
de amostragem, mesmo quando esta tenha sido convenientemente planejada e executa-
da. Este o problema da generalizao ou inferncia da amostra para a populao. 2
2
Observao para o leitor. O conceito de "erro amostra!" (de amostragem) vai ser discutido com
maior profundidade no Captulo 7. Todavia, a fim de entender melhor o problema da inevitabilidade
de erro ao amostrar* de um grupo maior, o leitor pode querer desenvolver o seguinte experimento.
Use a Tabela 1.4 (como fonte de referncia) a qual contm as notas de uma populao de 80 alunos.
OL---~--~---L--~----L---~--~---L- Aleatoriamente (por exemplo, feche os olhos e escolha com o dedo), selecione uma amostra de
20- 29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 algumas notas (por exemplo, 5) da lista toda. Procure a nota mdia somando os valores sorteados e
Classes (Categorias) de Notas dividindo o resultado por 5, que equivale ao nmero total de mdias. J foi mencionado que a nota
mdia para toda a classe (80 alunos) era 60,5. Em que medida a mdia da sua amostra difere da
mdia da classe toda (60,5)? Faa este experimento usando vrias outras amostras de notas selecio-
FIGURA 1.1 Notas de Exame de 80 Alunos Dispostas num Grfico de Barras nadas ao acaso - e sempre sorteadas do mesmo grupo (de 80 alunos). Com significativa perseverana
voc verificar que a sua mdia amostrai vai diferir quase sempre, pelo menos um pouco, da mdia
obtida para o grupo todo. essa diferena, isto , a diferena entre a mdia da populao (80 alunos)
Essa disposio tem como resultado uma representao grfica facilmente visuali- e cada uma das mdias amostrais encontradas que se chama "erro amostrai".
zada (por exemplo, o grfico de barras), onde podemos ver que a maioria das notas si- * N.T.: "Amostrar" um neologismo empregado em Estatstica para significar "colher uma amostra".
'<"

lO Por que o Pesquisador usa Estatfstica? , Por que o Pesquisador usa Estattstica? 11

A Estatstica pode ser muito til quando o propsito do pesquisador generalizar verdadeiras? Ou ser que obtivemos diferenas casuais entre alunos e alunas em virtu-
suas descobertas a partir de amostras pequenas para populaes maiores- com um alto de-estritamente-de erro amostrai, ou seja, do erro que ocorre todas as vezes que
grau de segurana. Para ficar mais bem entendido o propsito da Estatstica como retiramos de um grupo maior um grupo menor (amostra)?
instrumento de tomada de deciso e ainda o conceito de generalizao de amostras para Para ilustrar o problema da generalizao de resultados amostrais em funo das
populaes, vamos examinar os resultados de um estudo hipottico que foi realizado respectivas populaes, vamos imaginar que os pesquisadores tivessem obtido os resul~
para testar a seguinte hiptese: tados da Tabela 1. 7. Observe que tais resultados mantm-se na direo prevista: 55
Hiptese: A probabilidade de estudantes universitrios do sexo masculino terem expe- alunos em oposio a apenas 45 alunas j experimentaram maconha. Ora, o nosso
.I
rimentado maconha maior que a probabilidade de estudantes do sexo problema no ainda o de generalizar esses resultados para o giupo maior, vale dizer,
feminino terem feito o mesmo. a populao universitria? No ser possvel que uma diferena dessa magnitude (10
alunos mais que alunas) tenha ocorrido simplesmente por acaso? Ou ser que podemos
Os pesquisadores decidiram, neste estudo, testar sua hiptese numa universidade dizer com confiana que tais diferenas "pequenas" refletem uma diferena real entre
urbana na qual cerca de 20.000 estudantes estavam matriculados (10.000 do sexo alunos e alunas daquela determinada universidade?
masculino e 10.000 do sexo feminino). Em virtude do custo e de fatores ligados a .
tempo, eles no puderam entrevistar todos 'os estudantes da universidade, mas obtive- TABELA 1. 7 Uso de Maconha em Funo do Sexo do Respondente. Caso 11
ram da secretaria uma lista completa de todos os alunos. Dessa lista, cada centsimo
aluno (metade do sexo masculino, metade do sexo feminino) foi selecionado para Sexo dos Respondentes
fazr parte da amostra, sendo subseqentemente entrevistado por membros da equipe Uso de Maconha Alunos Alunas
de pesquisa que tinham sido treinados para este propsito. Os entrevistadores pergun-
taram a cada um dos 200 sujeitos da amostra se ele ou ela tinha alguma vez experi-
Nmero de estudantes
mentado maconh<l, anotando em seguida o sexo do respondente. Depois de terem que experimentaram 55 45
sido completadas todas as entrevistas e remetidas para o escritrio central, Os resul- Nmero de estudantes
tados do estudo foram tabulados por sexo e apresentados conforme a Tabela 1.6. que no experimentaram 45 55
Observe que os resultados obtidos nesta amostra de 200 estudantes, tal como -
Total 100 100
figura na Tabela 1.6, tm a seguinte direo hipottica: de cada 100 alunos, 60 decla-
raram que experimentaram maconha, enquanto que, com relao s alunas, esse nmero
cai para 40 em cada 100. Obviamente, nessa pequena amostra, havia maior probabili- Vamos levar este exemplo um passo mais adiante. Suponham que os pesquisa'
dade de os sujeitos do sexo masculino terem experimentado maconha do que os de dores tivessem obtido os dados constantes da Tabela 1.8. A as diferenas entre rapazes
e moas no poderiam ser muito menores e prevaleceria ainda a direo estabelecida na
TABELA 1.6 Uso de Maconha em Funo do Sexo do Respondente. Caso I hiptese: 51 rapazes em contraste com 49 moas experimentaram maconha~o que
implica uma diferena de apenas 2 sujeitos a mais do sexo masculino. Quantos de ns
Sexo dos Respondentes estaramos dispostos a chamar esta descoberta de diferena populacional verdadeira, em
Uso de Maconha Alunos A lunas lugar de produto do acaso ou erro amostrai?

Nmero de estudantes TABELA 1.8 Uso de Maconha em Funo do Sexo do Respondente. Caso 111
que experimentaram 60 40
Nmero de estudantes Sexo dos Respondentes
que no experimentaram 40 60
Uso de Maconha Alunos Alunas
Total 100 100

Nmero de estudantes
sexo feminino. Para os nossos propsitos, entretanto, a questo mais importante que experimentaram 51 49
saber se essas diferenas de sexo ligadas ao uso de maconha so grandes o suficiente para Nmero de estudantes
que no experimentaram 49 51
que possamos, com confiana, generaliz-las para uma populao universitria muito
maior de 20.000 alunos. Ser' que tais resultados representam diferenas populacionais Total 100 100
12 Por que o Pesquisador usa Estattstica?

Ento, onde se situa a linha divisria? Em que ponto (ou em que momento) uma
diferena amostrai torna-se suficientemente grande pura or tratada como significante
ou real? Com o auxllio da Estatstica podemos de pront e com alto grau de confiana, UNIVERStDAOE FEOE J.\l 'DO ~A. '
tomar tais decises sobre as relaes existentes entr amostras e populaes. Para BmLIOTECA Cf.! TRAL
ilustrar: se tivssemos usado um dos testes de sign1 o4ncia discutidos mais adiante
(por exemplo, qui-quadrado- ver Captulo 10), t r(om s sabido que somente aqueles
resultados que aparecem na Tabela 1.6 poderiam r generalizados para a populao
de 20.000 estudantes universitrios, o que equivaJ n dizer que se de cada 100 alunos
60 j usaram maconha, e se de cada 100 aluna 40 fizeram o mesmo, tal descoberta
substancial o suficiente para ser extrapolndn p tra a populao toda com um alto
grau de confiana. O nosso teste estatstico dizn que h somente 5 possibilidades
em 100 de estarmos errados! Em contraparU~u, o resultados apresentados nas Tabelas
1. 7 e 1.8 so estatisticamente nd'o-significant s, d sorte que resultam muito mais de
erro amostrai do que de diferenas de sexo n u dessa substncia. Usando um critrio
estatstico mais uma vez, podemos concluir qu s os resultados no refletem diferenas
populacionais verdadeiras, e sim, meros erros amostrais.*
No presente contexto, portanto, Estat(stlca um conjunto de tcnicas para a
tomada de decises que auxiliam os pesquisadores na tarefa de fazerem inferncias de
amostras para popullles e, a partir da(, nos testes das hipteses levantadas sobre a
natureza da realidade.
PARTE I
RESUMO
Este captulo "juntou" nossas previses dirias sobre acontecimentos futuros com as
experincias do pesquisador, que usa a Estatstica como um recurso para teStar suas
Descrio
hipteses a respeito da natureza da realidade. A mensurao foi discutida em termos
de dados nominais, ordinais e intervalares. Foram identificadas, com a anlise de dados
(e resumidamente discutidas e ilustradas), as duas seguintes funes bsicas da Esta-
tstica:
1. descrio (isto , reduo de dados quantitativos a termos descritivos mais I
convenientes e em menor nmero) e I
2. tomada de decises (ou seja, inferncias de amostras para populaes).

* N.T.: No confundir ideal com real. O ideal seria no cometer e"os; na realidade, por maiores que
sejam os controles, e"os casuais sempre oco"em. praticamente impossvel evitar erros amostrais.
..

I
A coleta de dados envolve um srio esforo da parte do pesquisador interessado en1
aumentar seu conhecimento do comportamento humano. Para entrevistar ou, por ou~.ra.,
eliciai: informaes de um grupo de beneficirios da previdncia, de estudantes univl'r-
sitrios, de viciados em drogas, de moradores de penses, de homossexuais, de norte-
. -americanos da classe mdia ou de respondentes de outras categorias, tornam-se neces-
srios certo grau de previso, planejamento cuidadoso, controle, alm do tempo despen-
dido em campo.
Completar a coleta de dados, entretanto, somente o comeo daquilo que cons-
titui a anlise estatstica. A coleta de dados o passo inicial, a matria-prima com que
o pesquisador deve trabalhar se o seu objetivo analisar os dados, obter resultados e
testar hipteses acerca da natureza da realidade.

DISTRIBUIES DE FREQENCIA DE DADOS NOMINAIS


O ,marceneiro transforma madeira bruta em mobilirio; o mestre-cuca d aos alimentos
bsicos aquele toque de sabor que enriquece as mesas. Por processo anlogo, o pesqui-
sador- auxiliado por "receitas" denominadas frmulas e tcnicas- procura transformar
seus dados brutos num conjunto de mensuraes, organizadas e dotadas de sentido, que
possam ser usadas para testar suas hipteses iniciais.

TABELA 2.1 Estudantes de Ambos os Sexos Presentes a uma Exposio de Pintura

Sexo Freqncia (f)

Masculino 80
Feminino 20
Total 100
Organizao de Dados 17
16 DESCRIO

dizer tambm que nas ocas10es em que as moas compareceram, elas mostraram-se,
O que o pesquisador pode fazer para organizar a avalancha de dados brutos que
'de certa forma, mais inclinadas para a ala de pintura clssica que para a de moderna.
ele recolhe de seus respondentes? Que que ele faz para transformar essa massa de
dados brutos num conjunto-resumo fcil de entender? O primeiro passo poderia ser
construir uma distribuio de freqncias sob a forma de tabela. TABELA 2.2 Comparecimento de Alunos de Ambos os Sexos a uma Exposio de Pintura (Arte
Examinaremos a distribuio de freqncias da Tabela 2.1. Observem, em pri- Clssica e Arte Moderna)
meiro lugar, que a tabela encabeada por um nmero (2.1) e por um t(tulo que d ao
leitor uma. idia da natureza dos dados apresentados-"Estudantes de ambos os sexos Comparecimento s Exposies
presentes a uma exposio de pintura". Esse o procedimento padro; todas as tabelas
Arte Moderna Arte Clssica
devem ser claramente tituladas e, quando forem apresentadas em seqncia, devem
Sexo f f
conter tambm um nmero.
As distribuies de freqncia de dados nominais consistem em duas colunas.
Masculino 80 70
Na Tabela 2.1 , por exemplo, a coluna da esquerda indica a caracterstica de interesse*
Feminino 20 30
(sexo) e contm as categorias de anlise (homens e mulheres). Uma coluna adjacente
titulada "Freqncia" ou "f" indica o nmero de sujeitos em cada categoria (80 e 20, Total 100 100
respectivamente), bem como o nmero total de sujeitos (N = 100).
Uma rpida inspeo da distribuio de freqncia constante da Tabela 2.1
revela perfeitamente que muito mais alunos do que alunas compareceram exposio: Propores e Porcentagens
dos 100 alunos presentes 80 eram do sexo masculino. Quando o pesquisador estuda distribuies de tamanho igual (isto , amostras de mesmo
tamanho), os dados freqenciais podem ser usads no estabelecimento de comparaes
entre os grupos. Assim, o nmero de rapazes presentes exposio de pintura clssica .
COMPARAO DAS DISTRffiUIES pode ser diretamente comparado com o nmero de rapazes presentes de pintura
Suponham, entretanto, que desejemos comparar a presena de estudantes na ala de moderna, uma vez que sabemos terem visitado cada ala da exposio exatamente 100
arte moderna com a presena de estudantes na ala de arte clssica. Fazer comparaes estudantes. Em geral no possvel, entretanto, estudar distribuies com exatamente
entre distribuies de freqncias constitui um procedimento usado amide para tornar o mesmo nmero de sujeitos. Por exemplo, como podemos estar certos ("a priori") de
os resultados mais claros e a informao mais ampla. A comparao especfica que o que precisamente 100 alunos comparecero a ambas as exposies?* .
pesquisador faz determinada pela questo a que ele procura responder. A fim de tornar tais resultados mais claros (mais "legveis"), necessitamos de 'um
Voltando ao nosso exemplo hipottico, poderamos perguntar: ser que os rapa- mtodo que permita padronizar distribuies de freqncias quanto ao tamanho, ou
zes so mais propensos a comparecer a exposies de pintura moderna e clssica do seja, uma forma de comparar grupos a despeito de diferenas nas freqncias totais.
que as moas, ou ser que eles se distribuem casualmente? Para responder, poderamos Dois dos mais teis e populares mtodos de padronizar tamanho e comparar distribui-
comparar a distribuio de 100 alunos** presentes ala de pintura moderna com a es so o mtodo da proporo e o mtodo da porcentagem.
distribuio de outros 100-da mesma universidade-presentes ala de pintura clssica. No mtodo da proporo, compara-se o nmero de sujeit os de uma dada categoria
Vamos imaginar que os resultados obtidos sejam os constantes da Tabela 2.2. com o total de sujeitos que compe a distribuio (e na qual a dada categoria se inclui).
Tal como demonstra a tabela, de 100 estudantes presentes na ala de pintura Podemos transformar qualquer freqncia nurfla proporo P, atravs da diviso do
moderna, 30 eram do sexo feminino; j na ala de pintura clssica, de 100 apenas 20 nmero de sujeitos de uma dada categoria/ pelo nmero total de sujeitos da distribuio
eram do sexo feminino. Isto j nos d muito mais informaes do que a simples distri- (N). Em smbolos:
buio de freqncia apresentada na Tabela 2.1. Assim, podemos agora dizer que os
rapazes tiveram uma participao maior do que suas colegilS de universidade. Podemos
p !_ **
N
* N.T.: A caracterstica de interesse habitualmente designada por varivel observacional, varivel
de observaa, vari verde anlise. * N.T.: Veja-se, a propsito, o que ficou dito na nota de rodap anterior sobre a arbitrariedade desse
** N.T. : Obviamente, o exemplo forado, s se admitindo por motivos de ordem didtica. Por procedimento.
outras palavras, ele chega a ser claro, ainda que no rigorosamente correto. No Captulo 7, o leitor ** N.T.: Como se ver no Captulo 6, intitulado "A Curva Normal", a probabilidade de um evento
encontrar algumas noes de, Tcnica de Amostragem que muito o auxiliaro a entender as liplita- um quociente em que o numerador representa o nmero de casos favorveis ocorrncia desse
es do exemplo acima. '
18 DESCRIO
Organizao de Dados 19

Portanto,
, 1Oprapazes num grupo de 40 estudantes presentes a uma exposio do .origem
lO Razes
a proporo = 4 = 0,25.
Um mtodo menos usado na padronizao de tamanho denomina-se razo. Ta1 mtodo
Apesar da utilidade do mtodo das propores, muitas pessoas preferem indicar compara diretamente o nmero de sujeitos que se enquadram numa categoria (por
o tamanho relativo de um conjunto de valores em termos de porcentagem, que, ao cabo, exemplo, homens) com o nmero de sujeitos que se enquadram noutra categoria (por
ve_m a ser a prpria freqncia om que determinada categoria ocorre em relao ao exempo, mulheres) . Assim, pode-se obter uma razo mediante a frmula
numero 100. Para calcular a porcentagem, simplesmente multiplicamos uma dada
proporo por 100, donde a frmula
fi
razo=
I % = (1 00) 1._
N
onde f 1 = freqncia de sujeitos de uma categoria e f 2 = freqncia de sujeitos de outra
categoria.
Por~anto, a proporo P = ~~ do exemplo anterior transforma-se em (100) ~~ = 25%. Se estivssemos interessados, por exemplo, na determinao da razo existente
Assim, 25% desse grupo de 40 estudantes compe-se de rapazes. Para ilustrar a utilidade entre torcedores de futebol, poderamos comparar o nmero de simpatizantes do
das porcentagens nas comparaes entre distribuies, vamos examinar o compareci- time A (f = 150) com o nmero de simpatizantes do time B (f= 100), o que daria
mento de estudantes a exposies de pintura realizadas num "campus" universitrio em :~. Simplificando a frao, isto , cancelando os fatores comuns do numerador e de-
que a arte moderna considerada de importncia fundamental. Suponhamos, ento, que nominador, resulta: :: = }. (Em termos concretos, isto significa que para cada 3 tor-
agaleria de arte moderna atraiu um bom nmero de estudantes, digamos 1.352, enquanto cedores do time A existem 2 torcedores do time B.)
que a galeria de pintura clssica conseguiu atrair um nmero bem menor, digamos 183. O pesquisador poderia aumentar a clareza dessa razo se desse ao denominador
A Tabela 2.3 indica, ao mesmo tempo, as freqncias e as porcentagens de visita- uma forma que fosse mais inteligvel. Por exemplo, a chamada razo de sexo comumen-
o a ambas as galerias. Note o leitor a dificuldade que. surge ao tentar-se estabelecer te empregada por d,emgrafos, relaciona o nmero de homens em funo de grupos de
rapidamente diferenas ligadas a sexo em termos de comparecimento, se o quadro de 100 mulheres. Com isso, esses pesquisadores procuram comparar a quantidade de homens
referncia ficar restrito apenas s freqncias. Em contrapartida, as porcentagens reve- com a quantidade de mulheres existentes num ncleo populacional determinado.
. IW ~
lam de forma clara que em ambas as galerias o elemento feminino foi igualmente repre- Ilustrando: se a razo de homens para mulheres for 50, haver 150 humens para
sentado. Especificamente, 20% dos estudantes presentes a ambas as galerias eram do 50 mulheres, . ou, simplificando, 3 homens para cada mulher. Para obter a verso con-
sexo feminino. vencional da razo de sexo, basta multiplicar o resultado acima por 100, donde:

f de homens (100) ISO = _


razo de sexo (100) - -- - 300
evento, e o denominador, o nmero de casos poss(veis de realizao desse mesmo evento. Por exem- f de mulheres 50
plo, se numa ~rna h 10 bolas amarelas (A) e 40 bolas vermelhas (V), a probabilidade de retirar-se
ao acaso, ISto e, por sorteio, 1 bola vermelha : Esse nmero est a nos dizer que nessa populao particular existem 300 homens para
cada 100 mulheres.
p (V) = N~mero de casos favorveis "bola vermelha" = __iQ__ _ 40 _
Numero de casos possveis de "retirar 1 bola" 10 + 40 - 50 - 0 8
TABELA 2.3 Comparecimento de Alunos de Ambos os Sexos a uma Exposio de Pintura (Arte
De modo anlogo, Clssica e Arte Moderna)

10
P(A) =-=O 2
50 ,
Comparecimento s Exposies

P(V) e P(A) representam, respectivamente, a " probabilidade de ocorrer bola vermelha" e a "probabi- A rte Mo derna Arte Clssica
lidade de ocorrer bola amarela". Sxo f % f %
Note-se, finalm ente, a analogia existente entre a expresso
Masculino 1.082 (80) 146 (80)
P=f._ Feminino 270 (20) 37 (20)
N
Total 1.352 (100) 183 (100)
e o quociente que d a probabilidade de ocorrncia de um evento . .
20 DESCRIO Organizao de Dados 21

As razes (como as indicadas acima) j no so exaustivamente usadas em pesqui- a taxa de mudana, pode ser usada para comparar uma populao com si prpria em
sas-talvez pelos seguintes motivos: dois momentos distintos. Ao computar a taxa de mudana, comparamos a mudana
1. So necessrias muitas razes para descrever distribuies que possuem vrias efetiva ocorrida entre um tempo 1 e um tempo 2, onde a extenso do tempo 1 serve
categorias de anlise. de base. Desse modo, uma populao que cresceu de 20.000 a 30.000 habitantes entre
2. Pode tornar-se difcil a comparao de razes baseadas em nmeros muito 1960 e 1970 apresenta a seguinte taxa de mudana
grandes.
( 100 f de tempo 2 -f de tempo)
.
3. Alguns pesquisadores preferem evitar as fraes geradas pelas razes.'-' = (1 00) 30.000 - 20.000}
SO ;o
at.

f de tempo 1 20.000
Taxas
Outro tipo de razo- que tende a ser muito mais utilizado pelos pesquisadores- a Em outras palavras, houve um aumento populacional de 50% no perodo de 1960/ 70.
taxa. Os socilogos habitualmente analisam populaes quanto a taxas de reproduo, Observe-se que a taxa de mudana pode ser negativa, caso em que indicar a
mortalidade, crime, divrcio, casamento e fatos semelhantes. Todavia, enquanto que a diminuio de algo num dado perodo. Exemplo: se uma populao mudar de 15.000
maioria das outras razes compara o nmero de sujeitos de um subgrupo qualquer para 5.000 habitantes num dado perodo a taxa de mudana ser
(categoria) com o nmero de sujeitos de qualquer outro subgrupo (categoria), as
taxas indicam comparaes entre o nmero efetivo de sujeitos e o nmero potencial. ( 100) 5.000- 15.000
Por exemplo, para determinar a taxa de nascimento de uma dada populao, podera- - 67%
15.000
mos tomar o nmero efetivo de crianas nascidas vivas e cotej-lo com o nmero de
mulheres cujas idades fossem compatveis com gravidez (ou seja, aquelas mulheres da
DISTRIBUIES DE FREQNCIAS SIMPLES RELATIVAS A DADOS ORDINAIS
populao que esto expostas ao risco de gravidez e que, por isso, representam ca-
E INTERVALARES .
sos**potenciais). De modo anlogo, para determinar a taxa de divrcio, poderamos
comparar o nmero efetivo de divrcios com o nmero de casamentos durante certo . Posto que dados nominais so "rotulados" em vez de graduados ou mensurados, as
perodo (por exemplo, um ano). As taxas so freqentemente dadas em termos de categorias das distribuies de nvel nominal no precisam ser construdas em nenhuma
uma base de 1.000 casos potenciais. Assim, taxas de nascimentos representam o nmero ordem -especfica. Assim, os dados relativos a preferncias religiosas que aparecem
de nascimentos por 1.000 mulheres; taxas de divrcio, o nmero de divrcios por na Tabela 2.4 podem ser apresentados de trs modos diferentes, embora igualmente
1.000 casamentos. Ento, se ocorrerem 500 nascimentos entre 4.000 mulheres (de aceitveis.
idade compatvel com gravidez), vem:
TABELA 2.4 Distribuio de Preferncias Religiosas. (frs Apresentaes Diferentes.)

f de casos efetivos (1.000) 500 Religio f R eligio f Religio f


Taxa de nascimento = ( 1.000) ' = - ---- 125
f d~ Cl!SOS potenciaJ.s 4.000
l'r testantes 30 Catlicos 20 Judeus 10
Disso resulta que para cada 1.000 mulheres passveis de gravidez ocorrem 125 nasci- Catlicos 20 Judeus 10 Protestantes 30
mentos de crianas vivas. lu deus 10 Protestantes 30 Catlicos 20
-
At aqui discutimos taxas que podem ser teis no estabelecimento de compara- Total 60 Total 60 Total 60
es entre diferentes populaes. Por exemplo, poderamos querer comparar taxas de
nascimento entre pretos e brancos, entre mulheres de classe mdia e de classe baixa, Em contraste, as categorias ou os escores das distribuies ordinais ou intervalares
entre grupos religiosos ou sociedades inteiras e assim por diante. Outro tipo de taxa, 1 presentam o grau em que uma caracterstica particular est presente. O arrolamento
d tais categorias ou escores nas distribuies de freqncias simples deve ser feito de
t nl modo que reflita essa ordem.
* N.T. : Dos trs motivos apresentados, o mais fraco , sem dvida, o de n.o 3 , pois, como se ver Por essa razo, as categorias intervalares e ordinais so sempre dispostas em
mais adiante, no se faz praticamente nada em Estatstica sem contnua recorrncia Teoria das
ord m, isto , do valor mais alto ao mais baixo. Por exemplo, poderamos arrolar as
Probabilidades. Ora, a no ser nos casos (raros) de certeza de que ocorre e certeza de que no ocorre,
cujas probabilidades so, respectivamente, 1 e O, todas as demais probabilidades so fracionrias e utcgorias componentes da varivel classe social da mais alta mais baixa (alta, mdia
menores que l (porm positivas). No ser, pois, evitando as razes que evitar-se-o complicaes baixa), ou poderamos atribuir postos aos resultados de um exame semestral de
de clculo causadas pelo surgimento de nmeros fracionrios. Ulologia, onde a ordem desses postos fosse seqencial; portanto, do mais alto ao mais
** N.T.: Comumente aparece a expresso casos com o sentido de sujeitos. hulxo.
I
@ DESCRIO Organizao de Dados 23

TABELA 2.5 Distribuio de Freqncias Relativas a Atitudes Quanto Guerra. Apresentaes TABELA 2.6 Notas de Exame Final de 71 Estudantes Dispostas numa Distribuio de Freqncias
Correta e Incorreta
Nota f Nota f Nota f Nota
Atitude Quanto Guerra Atitude Quanto Gue"a f
f f
99 o 85 2 71 4 57 o
Ligeiramente favorvel 2 Muito favorvel o 98 84 1 70 9 56 1
Um pouco desfavorvel 10 Um pouco favorvel 1 97 o 83 o 69 3 55 o
Muito favorvel o Ligeiramente favorvel 2 96 1 82 3 68 5 54 1
Ligeiramente desfavorvel 4 Ligeiramente desfavorvel 4 95 1 81 1 67 1 53 o
Muito desfavorvel 21 Um pouco desfavorvel 10 94 o 80 2 66 3 52 1
Um pouco favorvel 1 Muito desfavorvel 21 93 o 79 8 65 o 51 I
92 1 78 1 64 1 '50
Total 38 Total 38 91 1 77 o 63 2
90 o 76 Total 71
Incorreto Correto 2 62 o
89 1 75 1 61 o
88 o 74 1 60 2
Perturbar a ordem de categorias intervalares e ordinais reduz a legibilidade das 87 1 73 1 .59 3
descobertas do pesquisador. Tal efeito pode ser observado na Tabela 2.5, onde as 86 o 72 2 58
verses "correta" e "incorreta" de uma distribuio de "Atitudes quanto Guerra"
foram apresentadas. Qual verso voc acha mais fcil de interpretar? TA BELA 2.7 Notas de Exame Final de 71 Estudantes Redispostas numa Distribuio de Freqncias
Agrupadas
DISTRIBUIES DE FREQENCIAS COM DADOS AGRUPADOS
Intervalo de Classe f
Os escores de nvel intervalar espalham-se, s vezes, ao longo de uma extensa amplitude
(valor maior menos valor menor), o que torna a distribuio de freqncias resultante 95 -99 3
no s longa, mas, tambm, difcil de ler. Quando ocorrerem tais situaes, poucos 90-94 2
sujeitos podero estar em correspondncia com cada um dos escores, donde se segue 85 -89 4
que o modelo do grupo torna-se indefinido. Ilustrando: a distribuio apresentada 80-84 7
na Tabela 2.6 contm valores que variam de 50 a 99 e estende-se por quase quatro 75 -79 12
70-74 17
colunas.* 65-69 12
Para tornar mais clara nossa apresentao, poderamos construir uma distribui- 60-64 5
o de freqncias agrupadas, condensando os escores separados num nmero menor 55-59 5
de categorias ou grupos, cada um contendo mais de um escore. Cada categoria ou 50-54 4
grupo numa distribuio assim condensada recebe o nome de intervalo de classe, cujo Total 71
tamanho determinado pela quantidade de escores nele contidos.
As notas de exame dos 71 alunos originalmente apresentados na Tabela 2.6 esto
limite inferior. _p~meira _vista, _os limites superior e inferior de uma dada categoria
redispostas numa distribuio de freqncias agrupadas na Tabela 2.7. Aparecem, a, P_ar~cem ser _os lln:zues_ rems. _Assim, poderamos com certa "lgica" imaginar que os
10 intervalos de classe, cada um de tamanho 5. Desse modo, o intervalo de classe mais hnutes _supenor e mfenor do mtervalo 60-64 fossem 64 e 60, respectivamente. Se assim
alto (95-99) contm cinco valores, a saber: 95, 96, 97, 98 e 99. Da mesma forma, o pro~edessemos, todavia, estaramos errados, uma vez que 60 e 64 no so de fato os
intervalo 70-74, tambm de tamanho 5, contm os escores 70, 71, 72, 73 e 74. linutes do intervalo 60-64.
. Muitos leitores estaro perguntando: por que no? Para responder, vamos exa-
mmar um problema que poderia surgir se tivssemos de definir limites de classe em
Limites de Classe termos do escor~ mais alt? e mais baixo de um intervalo qualquer. Suponham que
De acordo com seu tamanho, cada intervalo de classe tem um limite superior e um t~ntsse~os loc~IZ~r, f.1Um mtervalo de classe, nmeros dotados de uma parte fracion-
na (fraoes decimais) ;" to~e-se por base a distribuio de freqncia apresentada na
Tabela 2. 7. Onde colocanamos o escore 62,3? A maioria de ns concordaria que tal
* N.T.: Obviamente, se o autor reduzisse a altura das colunas de sua tabela, ele poderia "dar mais
nfase" ao que disse acima, pois, a, os escores de 50 a 99 ocupariam, quem sabe(?!), oito colunas.
O argumento logicamente fraco. "'N.T.: curioso que o autor, ao referir-se a nmeros dotados de um a parte fracionria, esclarea
UI\J IV[RSI8~.SE FEC.::-'1 .1l '
DOOrganizao de Dados 25
24 DESCRIO BIBLIOTECA <.t:N'i ' f< AL

valor pertence ao intervalo 60-64. Mas que dizer do escore 69,4? E que tal tentar situar dade de ver, a posio dos limites de classe deve ser estabelecida a fim de ser possvel a
54,2 ou 94,6? O leitor poderia notar que os escores mais alto e mais baixo de um aplicao de certos procedimentos estatsticos.
intervalo qualquer deixam lacunas (espaos vazios) entre grupos numricos adjacentes,
de sorte que alguns valores fracionrios no podem ser includos em nenhum intervalo Ponto Mdio
de classe da distribuio, donde decorre que eles devem simplesmente ser excludos. Outra caracterstica de qualquer intervalo de classe o seu ponto mdio, que se define
Contrariamente ao que sugerem o escore mais alto e mais baixo de um intervalo como o valor "mais central" desse mesmo intervalo. Um mtodo simples e rpido de
qualquer, os limites de classe esto localizados num ponto que se situa a meio caminho achar o ponto mdio procurar o valor do intervalo de classe que se situa exatamente
entre as classes intervalares adjacentes e, portanto, servem para preencher as lacunas no meio. Alguns exemplos: 50 o ponto mdio do intervalo 48-5 2; 3,5 o ponto
existentes (ver Figura 2.1). Assim, o limite superior do intervalo 90-94 94,5 e o limite mdio do intervalo 2-5. O ponto mdio tambm pode ser calculado mediante uma
frmula* que relaciona os limites superior e inferior de um dado intervalo. Por exem-
plo, o ponto mdio do intervalo 48-52
95

Escore
Mais Alto -- 94

93
94,5 - Limite Superior limite inferior +
2
limite superior 48 + 52
2
50

Determinao do Nmero de Intervalos


92
Para apresentar dados intervalares sob a forma de distribuio de freqncias agrupadas,
91 o pesquisador deve levar em conta o nmero de categorias (classes) que ele deseja
Escore
Mais Baixo -- 90

89
89,5 - Limite Inferior
empregar. Os textos geralmente recomendam usar no menos que 5 nem mais que
20 intervalos. No tocante a este aspecto, cumpre lembrar que as distribuies de fre-
qncias agrupadas so usadas com o intuito de revelar ou enfatizar um modelo grupal.**
Intervalos de classe em excesso ou em escassez podem tornar esse modelo menos inteli-
FIGURA 2.1 Escores Mais Alto e Mais Baixo Versus Limites Superior e Inferior da Classe Intervalar gvel e, com isso, trabalhar contra o pesquisador-que procura aumentar a clareza de
90-94 sua anlise. Alm disso, reduzir os escores individuais a um nmero desnecessariamente
inferior do intervalo 95-99 tambm 94,5. Da mesma forma, 59,5 tanto serve de limite pequeno de intervalos, pode redundar em sacrifcio de muita preciso-justamente a
superior do intervalo 55-59 quanto do limite inferior do intervalo .60-64. O leitor preciso que se conseguiu no incio mediante o conhecimento da identidade dos escores
poderia perguntar o que fazer com o valor 59,5, uma vez que ele ca1 exatamen~e no individuais da distribuio. Em suma, portanto, o pesquisador geralmente toma sua
meio do espao que separa duas classes intervalares adjacentes. Esse escore devena ser
includo no intervalo 55-59 ou no intervalo 60-64? Este problema geralmente contor-
* N.T.: Tal como foi explicado nos tpicos anteriores, os nmeros que aparecem nos vrios inter-
nado mediante arredondamento para o inteiro par mais prximo. Por exemplo: 59,5 valos de classe constituem seus limites aparentes. Ento, obriga-nos o rigor matemtico a respeitar-e
seria colocado no intervalo 60-64; 84,5, no intervalo 80-84. * Como teremos oportuni- usar nos clculos-os limites reais de ada intervalo de classe. Assim, o ponto mdio do intervalo
48-52 (que, segundo sugesto anterior, deveria grafar-se 48 r-52) no 50, ~as, sim , 49 ,5 , a menos
que os valores 48 e 52 sejam 'resultantes de uma contagem , pois, nesse caso; a varivel discreta (ou
tratarem-se de "fraes decimais". Se, de um lado, o que ele diz no est errado, de outro, n~o descont(nua), e s admite valores inteiros. A frmula que permite, com rigor matemtico, calcular o
chega a estar completo, uma vez que a notao decimal uma forma de exprimir fraes, mas nao ponto mdio : (limite inferior aparente - 0,5) +(metade da amplitude do intervalo). Em smbolos:
a nica. Alternativamente, existe a notao ordinria, expressa por numerador-trao-denommador, limite inferior aparente
capaz de, em muitos casos, atingir requintes de preciso que superam a notao decimal. Exempli- L limite superior aparente
25 o3 3 . . '
ficando: 2,25 (com notao decimal) o mesmo que 2 + 100 ; entretanto , 3 ... Jamats sera um
h (L - I) =amplitude do intervalo

dado to preciso quanto 1/3. ponto me' d' h


. 10 = (I - 0,5) +2
* N.T.: Em Matemtica, ocorrem com freqncia as seguintes notaes de intervalos: - , H , r- :
--1. Esses sinais significam, respectivamente: intervalo aberto; intervalo fechado ; intervalo fechado_a Exemplo: achar o ponto mdio do intervalo 48 r-52.
esquerda (ou aberto direita); intervalo fechado direita (ou aberto esquerda). ,;o~, uma questao
de rigor, sugere-se que os intervalos que aparecem no corpo da obra notados com :- seJam substi-
. ' . 4 .
Ponto med1o . = (48- 0,5) + 2 = 47 ,5 + 2 = 49 ,5.
tudos por "1-", dirimindo-se assim eventuais dvidas. Com essa nova Simbologia, os mtervalos
95-99 e 90-94 passam a ser designados por 95 1-99 e 90 i--94, respectivamente.
"* N.'r. : Entenda-se por "modelo", aqui, "tendncia".

..
26 DESCRIO Organizao d e Dados 27.

deciso quanto ao nmero de intervalos baseado em seu prprio conjunto de dados e Alm da freqncia acumulada, podemos tambm construir uma distribuio
em seus objetivos pessoais, fatores que podem variar consideravelmente de uma situao que mdica a porcentagem acumulada (c%), ou seja, a porcentagem de sujeitos que
de pesquisa para outra. obtiveram determinado nmero de pontos ou, dito de outra forma, a porcentagem de
sujeitos que obtiveram, no mximo, determinado nmero de pontos. Calcula-se a
porcentagem acumulada atravs da modificao da frmula de porcentagem (%) apre-
DISTRIBUIES CUMULATIVAS sentada pginas atrs neste mesmo captulo:
desejvel, algumas vezes, apresentar freqncias de forma cumulativa, especialmente
fa
quando procuramos situar a posio de um sujeito em funo do desempenho total do c % = (1 00) - , onde
grupo. Definem-se freqncias cumulativas como o nmero total de sujeitos portadores N
de um dado escore ou como o nmero total de sujeitos portadores de um escore menor fa = freqncia acumulada para qualquer categoria (classe);
que outro previamente especificado. Assim, a freqncia acumulada, ou cumulativa (fa), N = total de sujeitos (casos) da distribuio.
de qualquer categoria (ou classe intervalar) obtm-se atravs da soma da freqncia
daquela categoria com a freqncia total de todas as categorias que esto abaixo dela. Se aplicarmos a frmula acima aos dados da Tabela 2.8, verificaremos que a
No caso dos pontos obtidos pelos universitrios (Tabela 2.8), observamos que a fre- porcentagem de alunos que obtiveram 350 ou menos foi
qncia f associada ao intervalo de classe 301-350 12. Tal freqncia (12) correspon- 12
de, tambm, freqncia acumulada relativa ao intervalo 301-350, uma vez que nenhum c% = (100) - = (100)(0,0357) = 3,57%
336
membro do grupo fez menos pontos do que 301. A freqncia* da classe intervalar
A porcentagem dos que conseguiram 400 ou menos foi
TABELA 2.8 Distribuio de Freqncias Acumuladas Varivel: Escores de Desempenho Acadmico
Obtidos por 336 Universitrios 45
c % = (100) - = (100)(0,1339) = 13,39%
336
Intervalo de Classe f fa
A porcentagem dos que obtiveram 450 ou menos foi
751-800 6 336
701-750 25 330 93
651-700 31 305 c % = (100) - = (100)(0,2768) = 27,68%
601-650 30 274 336
551-600 35 244
501-550 55 209 A distribuio de porcentagens acumuladas baseada nos dados da Tabela 2.8 figura na
451-500 61 154 Tabela 2.9.
401-450 48 93
351-400 33 45
301-350 12 12 POSTO PERCENTIL
Total 336 Suponhamos que voc tenha obtido 80 num exame de Estatstica. A fim de determinar
com exatido o seu grau de desempenho, seria provavelmente til saber como a sua
nota 80 compara-se com as notas dos demais colegas de classe que passaram pela mesma
seguinte (351-400) 33, enquanto que a freqncia acumulada para o mesmo intervalo prova. A maioria de seus colegas ficou em torno de 80 ou 90? Se assim foi, a sua clas-
45 (isto , 33 + 12). Essas informaes permitem-nos tomar conhecimento, portanto, sificao (nota) pode no ter sido " terrivelmente alta"! Por outro lado, se a maioria de
de que 33 universitrios situaram-se na faixa 351-400, e de que 45 receberam escores seus colegas no tirou mais que 60 ou 70, a nota 80 pode muito bem situar-se entre as
iguais ou inferiores a 400. Poderamos continuar com este procedimento e obter fre- mais altas do grupo.
qncias acumuladas para todos os intervalos de classe, at chegarmos ao intervalo de Com o aux11io da distribuio de porcentagens acumuladas, podemos fazer com-
maiores limites, 751-800, cuja freqncia acumulada (336) igual totalidade de paraes precisas entre qualquer sujeito e o grupo ao qual ele pertence. Especificamente,
sujeitos- uma vez que nenhum membro do grupo conseguiu mais que 800 pontos. podemos calcular o posto percentil de um escore, que nada mais que um simples
nmero indicativo da porcentagem (total) de sujeitos de uma distribuio que conse-
* N.T.: comum falar-se em freqi.ncia simples para reduzir a possibilidade de confuso com guiram menos que um dado valor. Por exemplo, se ao escore 80 corresponde o posto
freqncias acumuladas. percen'in 95, ento 95% dos alunos receberam, nesse exame de Estatstica, escores
28 DESCRIO Organizao de Dados 29

inferiores a 80 (apenas 5% obtiveram valores acima de 80). Entretanto, se a um escore H vanas caractersticas relativas ao intervalo crtico que devem ser determinadas

I
de 80 corresponder um posto percentil de 45, ento somente 45% receberam notas de antes da aplicao da frmula do posto percentil:
exame abaixo de 80 (donde decorre que 55% conseguiu notas superiores). Em smbolos:
1. O limite inferior do intervalo crtico-que corresponde ao ponto situado
entre o intervalo crtico 601-650 e o intervalo imediatamente abaixo dele,
c% abaixo) [ limite inferior vale dizer: 551-600. Neste caso, o limite inferior (real) do intervalo 601-650
~ do limite escore do intervalo %no 600,5.
Posto percentil =( inferior do + crtico (intervalo) 2. O tamanho do intervalo* crtico-que se determina a partir do nmero de
intervalo tamanho do intervalo crtico escores contidos nesse intervalo. No caso do intervalo 601-650, a amplitude
crtico crtico 50, uma vez que entre 601 e 650 h 50 valores. **
3. A porcentagem dentro do intervalo crtico-que se 'obtm dividindo o nmero
Para ilustrar o procedimento, vamos calcular, relativamente aos dados que apa- de sujeitos contidos nesse intervalo particular (f), pelo nmero total de sujeitos
recem na Tabela 2.8, o posto percentil do escore 620. Antes de aplicar a frmula, da distribuio (N), e multiplicando a resposta por 100. Em smbolos:
TA BELA 2.9 Distribuio de Porcentagens Acumuladas. Varivel: Escores de Desempenho f 30q
Acadmico Obtidos por 336 Estudantes Universitrios. (Esta Tabela Baseia-se na de % = (100) - = (100)- = (100)(0,089) = 8,93%
n. 0 2.8) N 336

Intervalo de Classe fa c%
Vemos, portanto, que 8,93% desses escores obtidos pelos universitrios caem
dentro do intervalo de classe 601-650.
751-800 336 100%
4. A porcentagem acumulada abaixo do limite inferior do intervalo crtico. O
701 -750 330 98,21 valor de c% pode ser lido diretamente na Tabela 2.9, que fornece a distribuio
651-700 305 90,77 das porcentagens acumuladas. Ao percorrermos a coluna da c% de .baixo para
601-650 274 81,55 cima, observamos que 72,62% dos escores ficam abaixo do intervalo crtico;
551 -600 244 72,2 esta , pois, a porcentagem acumulada associada ao intervalo de classe que se
501-550 209 62,20
451-500 154 45 ,83
situa imediatamente abaixo do intervalo crtico.
401-450 93 27,68 Estamos agora preparados para aplicar a frmula do posto percentil:
351-400 45 13,39
301-350 12 3,57
Posto Pe<centil = 72,6 2 +[
6
2fl ~;oo,s (8 ,93)] = 72,62 +[ ;~o (8 ,93)J
1

devemos primeiro localizar o intervalo critico, que corresponde ao intervalo de classe


onde o escore 620 est contido. Tal como demonstrado abaixo, o intervalo crtico = 72,62 + (0,39)(8,93) = 72,62 + 3,48 = 76,10
deste problema 601-650:
Resulta, ento, que pouco mais do que 76% recebeu escores inferiores a 620. Somente
Intervalo de Classe 23,90% obteve valores superiores.

751-800
701-750 N.T.: O tamanho do intervalo tambm chamado amplitude (amplitude da classe, amplitude do
651-700 Intervalo). diferena entre o maior valor e o menor valor de uma distribuio d-se o nome de
amplitude total.
60i-650 ~ Intervalo de classe que contm o escore 620
n N.T. : Observe-se que a amplitude 50 decorre da aplicao da seguinte frmula :
551-600
(L - 1) + 1 = (650 - 601) + 1 = 49 + 1 =50.
501-550
451-500 Nu verdade, trata-se, aqui, da aplicao da frmula que permite calcular o nmero de termos de
401-450 1111111 progresso aritmtica, ou seja:
351-400
an- ai
301-350 11 = - .-r- + 1, onde an =L, a i = I, r = 1
!.JN!Vl:.HS! DAO[ f . :L
-- '-n.AL O~' A'~.
BiBLIOTECA . ,_. t\J,l
30 DESCRIO ...... : .,-1 .
CENTR(}{gpnizao de Dados 31

Como exemplo adicional, vamos calcular o posto percentil relativo ao escore 92 Estamos, agora,' em condies de substituir esses dados na frmula do posto
da seguinte distribuio: percentil:

~;9 5 (12,24~ [ 2~~0 (12,24)]


Intervalo de Classe f [a c% 92
Posto percentil 87,76 +[ = 87,76 +
90-99 6 49 100%
80-89 8 43 87,76
70-79 12 35 71,43 = 87,76 + (0,25)(12,24) = 87,76 + 3,06 = 90,82%
60-69 10 23 46,94
50-59 7 13 26,53 Quase 91% dos alunos, receberam notas menores que 92. Somente 9,18% receberam
40-49 6 6 12,24
notas superiores a 92. *
N = 49 A escala de postos percentis consiste em 100 unidades. Certos postos percentis
situados ao longo dessa escala tm nomes especficos. Os decis dividem a escala em
Conforme a ilustrao abaixo, o intervalo crtico para um escore de 92 90-99: pores de dez. Assim, se um escore estiver situado no primeiro decil (posto percen-
til = 10), sabemos que 10% dos casos situam-se abaixo desse escore; se um escore estiver
Intervalo de Classe no segundo decil (posto percentil = 20), ento 20% dos casos estaro abaixo dele e
assim por diante. Os pontos que dividem a escala de postos percentis em grupos de 25
90-99 +- Intervalo de classe ao qual pertence o valor 92 (isto , 25%) so conhecidos pelo nome de quartis. ** Se um escore estiver localizado
80-89
no primeiro quartil (posto percentil = 25), sabemos que 25% dos casos caem abaixo
70-79 dele; se um escore eStiver no segundo quartil (posto percentil = 50), ento 50% dos
60-69
50-59
40-49 Posto Percentil Decil Quartil

As caractersticas do intervalo crtico que devemos determinar so as seguintes: 90= 9.0


85
1. O limite inferior do intervalo crtico 89,5. 8.0
80=
2. O tamanho (amplitude) do intervalo crtico 10, j que h 10 escores de 75 =
90 a 99 (90, 91,92, 93, 94, 95, 96, 97, 98, 99).* 70 = 7.0
3. A porcentagem dentro do intervalo crtico 12,24%. Em smbolos: 65
60= 6.0
55
f
% = (100) -,donde 50= 5.0 2.0
N 45
40 = 4.0
35
6 30= 3.0
% = (100) - = (100) 0,1224 = 12,24%
49 25 =
20= 2.0
15
4. A porcentagem acumulada abaixo do limite inferior do intervalo crtico pode 10= 1.0
ser encontrada na coluna c%, em correspondncia ao intervalo de classe imedia-
tamente abaixo do j citado intervalo crtico. A porcentagem acumulada que III(;URA 2.2. Escala de Postos Percentis Dividida em Decis e Quartis
corresponde classe intervalar 80-89 87,76%.
N.'l'.: Observe-seque 91%+ 9,18% > 100%. Isto porque o autor arredondou para mais a porcen-
1 111 111 90,82- anteriormente encontrada.
*N.T.: Veja-se, mais uma vez, a nota de rodap anterior. Mediante sua aplicao, resulta, de imedia- N.'l'.: Os sujeitos de uma distribuio que se localizam entre o primeiro e o terceiro quartis
to, o valor 10, pois: (L - 1) + 1 = (99 - 90) + 1 = 10. I' llt'm'cm ao que se convencionou chamar de intervalo de normalidade. Apesar de tratar-se de
32 DESCRIO Organizao de Dados 33

escores estaro situados abaixo dele; por igual raciocnio, para um escore que esteja Estrutura Familiar de Crianas
no terceiro quartil (posto percentil = 75), haver 75% de escores abaixo dele (ver Pretas e Crianas Brancas
Figura 2. 2).
Raa da Criana
Preta Branca
RESUMO Estrutura Familiar f f
Foram introduzidas, neste captulo, algumas das tcnicas bsicas usadas pelo pesqui-
sador na organizao do emaranhado de dados origin?is (brutos) que ele coleta de Um genitor 53 59
Dois genitores 130 167
seus respondentes. Distribuies de freqncia e mtodos para comparar essas distri-
buies-quando compostas de dados nominais (propores, porcentagens, razes e Total 183 226
taxas)-foram discutidos e ilustrados. Examinaram-se, tambm, as caractersticas de
distribuies de freqncias simples, agrupadas e acum11ladas com relao a dados Calcular: (a) a porcentagem de crianas pretas que possuem dois genitores; (b) a
ordinais e intervalares. Finalmente, apresentou-se o procedimento que permite/ obter porcentagem de crianas brancas que possuem dois genitores; (c) a propor"o de
o posto percentil de um escore bruto. crianas negras que possuem dois genitores; (d) a proporo de crianas brancas que
tm dois genitores.
3. Num grupo de 4 sujeitos de alta realizao e 24 de_baixa realizao, qual a razo
PROBLEMAS dos primeiros para os segundos?
1. Usando os dados do quadro abaixo, onde aparecem telespectadores e n"o-telespec- 4. Num grupo de 125 machos e 80 fmeas, qual a razo macho/fmea?
tadores, reclassificados quanto ao seu grau de realizao, calcular:-(a) a porcentagem 5. Num grupo de 15 crianas negras e 20 brancas, qual a razo negros/brancos?
dos que n"o so telespectadores, porm grandes realizadores; (b) a porcentagem dos 6. Se 300 crianas nascem vivas entre 3.500 mulheres (em idade compatvel com gra-
telespectadores que so grandes realizadores; (c) a proporo de no-telespectadores videz), qual a taxa de nascimento?
que so grandes realizadores; (d) a proporo de telespectadores que so grandes 7. Qual a taxa de mudana de uma populao que cresce de 15.000 habitantes em
realizadores. 1950 a 25.000 habitantes em 1970?
8. Transforme a seguinte distribuio de escores numa distribuio de freqncias
Realizao versus Assistncia a Programas agrupadas com quatro intervalos de classe e (a) determine o tamanho dos intervalos
de Televiso de classe ; (b) indique os limites superior e inferior de cada classe; (c) identifique o
ponto mdio de cada intervalo de classe; (d) calcule a freqncia acumulada para
Situaa cada intervalo de classe; (e) calcule a porcentagem acumulada para cada intervalo de
No-te/espectadores Te/espectadores classe.
Realizao f f
Escores f
01V1v,
U:;qj~J
Alta realizao rrf:i-. 46
Baixa realizao g\_ 121 y 'ERsto4DE
12[ 4 a,JJf.Jore F"fDli4t.
Total 183 173 11
10 4 cA ce~v'~' Do
5 RAt p4ff4
2. O quadro seguinte representa (para uma dada regio) a estrutura familiar de crianas
pretas e crianas brancas. ~r
7
6
5
4
~r
I
3
2

I
"conveno", h uma lgica defensvel por trs disso: ho de ser normais os sujeitos que, relativa- 4
1

~}
mente a uma dada varivel, ocupem, pelo menos, 50% da distribuio. Esses 50% devem ocupar o
" centro" da distribuio, ficando os 50% restantes divididos em duas pores de 25%, uma esquerda, 1
outra direita. Os 25% da esquerda so chamados subnormais e os 25% da djreita, supernormais. 2
Finalmente, chamando o 1. 0 quartil de Q 1 , e o 3.0 quartil de Q 3 , define-se a amplitude do intervalo N= 40
de normalidade pela diferena (Q 3 - Q 1 ).
34 DESCRIO

9. Na seguinte distribuio de escores, calcule o (posto)* percentil relativo a (a) 75;

3
(b) 52.

Intervalo de Classe f fa

90-99 6 48
80-89 9 42
70-79

Representaes
10 33
60-69 10 23
50-59 8 13
40-49 5 5
N= 48
G-rficas
10. Na seguinte distribuio de escores, calcular o (posto) percentil para (a) 36; (b) 18.

Intervalo de Classe f

40-44 5
35-39 5
30-34 8
25-29 9
20-24. 10
15-19 8
10-14
Colunas numricas j conseguiram despertar medo, aborrecimento, apatia e mal-enten-
6
5-9 5 didos. Enquanto que algumas pessoas parecem "desligar-se" ao serem expostas a infor-
maes estatsticas em forma tabular, numrica, elas podem prestar bastante ateno s
N= 56
mesmas informaes apresentadas em forma grfica ou pictrica. Da resulta que muitos
pesquisadores e autores. preferem usar grficos em substituio a tabelas numricas.
Razes semelhantes levam pesquisadores a utilizar, comumente, grficos tais como
os setoriais, grficos de barras, polgonos de freqncia etc., num evidente esforo
de tomar mais legveis as suas investigaes.

GRFICOS SETORIAIS
O grfico setorial (ou de setor) um dos mais simples recursos grficos, posto que con-
siste em um crculo cujos setore~ (isto , partes do mesmo crculo) somam 100%. Os
grficos setoriais so particularmente teis quando se trata de visualizar diferenas
freqenciais entre algumas categorias de nvel nominal. Ilustrando: A Figura 3.1 repre-
senta a origem urbana, suburbana ou rural de uma populao de 2.000 universitrios.
Note-se que 70% desses alunos vm de reas suburbanas, enquanto que apenas 12% de
reas rurais. *

"' N.T.: No se tome ao p da letra essa repartio porcentual, uma vez que (a) a sociedade-referncia
(: a norte-americana; (b) essas porcentagens referem-se a um particular universo de universitrios.
Nada garante, portanto, que mesmo nos Estados Unidos todas as universidades apresentem igual
* N. T.: So sinnimas as expresses percentil e posto percentil. repartio de clientela.

/
36 DESCRIO
Representaes Grficas 37

Origem dos Alunos f % Urbana Ocupao (= Profisso) f


"'60
~~ ~
(18%) "g 50
<(lJ

Urbana 240
'& 40 r
12 A Artesanato 52
Suburbana 1.400 70 ~"' 30 r
B Trabalho no qualificado 65
Rural 360 18 Suburbana c Gerencial 29 20 !--
Total 2.000 (70%) D Servios burocrticos 34 10 !-
100
Total """"i80 OL--'------'---'------'---'------'----_l_----'-----
Artesanato Trabalho Gerencial Servios
No qua li- Burocrticos
ficado
Profisso do Respondentc
FIGURA 3.1 Origem Urbana, Suburbana e Rural de uma Populao de 2.000 Universitrios
FIGURA 3.3 Grfico de Barras Ilustrativo de uma Distribuio Ocupacional
GRFICOS DE BARRAS !>< na linha de base horizontal (ou eixo dos X) marcam-se os valores ou as categorias (no
O "grfico de se to rs ilustra, de modo fcil e rpido, dados que podem ser subdivididos presente exemplo so classes sociais); na linha vertical (ou eixo dos Y) localizam-se as
~m . algum~ categorias. Co~parativamente, o grfico de barras (ou histograma) pode freqncias relativas a cada categoria ou a cada valor. (No caso de dados agrupados, so
. aco~od~r qu~quer quantidade de categorias de qualquer nvel de mensurao e, por os pontos mdios dos intervalos de classe que se colocam no eixo dos X.) Note-se que
1sso, e.mmto ma1s usado em pesquisas. as freqncias de cada valor (da varivel) so indicadas por barras retangulares, e de
. Examinem~s.o grfico de barras, Figura 3.2, que ilustra a distribuio de freqn- conformidade com o seguinte critrio: quanto mais alta a barra, maior a freqncia de
Cia de clas~es ,soc1a1s. Esse grfico construdo de acordo com o seguinte procedimento:. ocorrncia.
Na Figura 3.2 as barras retangulares foram unidas a fim de enfatizarem-se as
50
diferenas entre os vrios graus de status representados por diferentes classes sociais.
Acrescente-se a isso o seguinte: as classes sociais foram localizadas no eixo horizontal
4;0
em ordem crescente, isto , da mais baixa para a mais alta. Esse, alis, o critrio
convencional adotado na construo de grficos de barras em que a varivel de obser-
8c: 30
vao de nvel ordinal ou de nvel intervalar.
<Q)

Class~cial f '=' Nos grficos de barras em que a varivel observacional categrica, isto , de
...g' 20 -
IJ. nvel nominal, as barras devem apresentar-se separadas, pois, do contrrio, sua unio
A 5 poder implicar continuidade. Alm disso, as categ9rias resultantes de variveis nominais
B 14 10
podem ser dispostas em qualquer ordem ao longo do eixo horizontal. O grfico de
c 23 barras da Figura 3.3 ilustra bem essa caracterstica.
D 45 o
E 38
F 25
IJ. ~ c y ~ <t: POLIGONOS DE FREQNCIAS~
Total 150
Outra representao grfica comumente usada o poligono de freqncias. Muito
Classe Social do Respondente embora o polgono de freqncias tenha flexibilidade bastante para ajustar-se a uma
ampla variedade de situaes, ele tende a sugerir muito mais continuidade do que
FIGURA 3.2 Grfico de Barras Ilustrativo de uma Distribuio de Classes Sociais* discriminao; da sua particular utilidade na representao de dados ordinais ou inter-
vaiares. Isto acontece porque as freqncias so indicadas por uma srie de pontos
* N.T.: A classificao mais usual no Brasil a da ABA (Associao Brasileira de Anunciantes). colocados exatamente acima (numa vertical) dos valores constantes do eixo dos X ou,
Es~ classificao distribui os indivduos em quatro classes scio-econmicas- A, B, C, D-, onde quando for o caso, exatamente acima dos valores qu~resentam tos mdios
A e a classe ma1s alta e D, a mais baixa, e basta, para tanto, levar em conta os itens e a pon tuao dos intervalos de classe. Esses pontos so, a seguir, unidos por segmentos de retas
indicados no Apndice D.
(~os"), sendo que, em ambas as extremidades, a linha poligonal,
38 DESCRIO Representaes Grficas 39

graas a um prolongamento convencional, toca o eixo dos X.'~ Como bem demonstra \
Intervalo de Classe f fa 350
a Figura 3.4, a altura de cada ponto indica a freqncia com que cada valor particular
ocorre. 751-800 6 336 300
701 -750 25 330
50 651-700 31 305 250
601-650 30 274
Intervalo de Classe f 40 551 -600 35 244 200
501-55 55 209
136-145 11 -er:: .:o 451-500 61 154 .::; 150
126-135 16
116125 29
"",;:s 401-450 48 93
100
' 351-400 33 45
106-115 40 ....[ 20 301-350 12 12
96-105 44 50
86-95 25
N = 336
76-85 13 o
_, _,
Total 178 80,5 90,5 100,5 110,5 120,5 130,5 140,5
w
'o""
-1>-
o
o
-1>-
"'
o
'oo"" v.
"'
o
0\
o
o
0\
"'
o o
o "'o
00
o
o
Qis dos Respondentes Expressos u, u, u, u, u, u, u, u, u, u,
pelos Respectivos Pontos Mdios Limite Superior do
Intervalo de Classe
FIGURA 3.4 Polgono de Freqncias de uma Distribuio de Qls**
FIGURA 3.5 Polgono de Freqncias Acumuladas. Dados da Tabela 2.8
Quando o problema representar graficamente freqncias acumuladas (ou
porcentagens acumuladas), possvel construir o chamado polz'gono de freqncias a linha poligonal que une os pontos num grfico de freqncias acumuladas no pode ser
acumuladas~** Na Figura 3.5, as freqncias acumuladas esto marcadas no eixo ver- "amarrada" ao eixo das abcissas. A razo desse fato que estas freqncias representam
tical e so indicadas pela altura, isto , pela distncia de cada ponto at a linha de um conjunto de adies sucessivas. Uma freqncia acumulada qualquer nunca menor
base. Contrariamente ao que ocorre com um polgono de freqncias (ver Fig. 3.4), (e geralmente maior) do que a freqncia acumulada precedente. Acrescente-se, ainda,
que os pontos num grfico cumulativo so marcados sobre perpendiculares levantadas a
* N.T.: Prolongar a linha poligonal em ambas as extremidades um recurso que permite "aterrizar" o partir dos limites superiores de cada intervalo de classe, coisa que no ocorre com o
desenho, que, de outra forma, ficaria como que "solto" no quadrante determinado pelas coordena- polgono de freqncias comum, onde as marcaes tm como referncia os pontos
das cartesianas ortogonais. O critrio geralmente aceito para essa "aterrizagem" o seguinte: unir
mdios das classes. Isto explica-se pelo fato de que qualquer freqncia acumulada
a extremidade esquerda da linha poligonal ao valor terico que antecede o primeiro valor real da
tabela, e a extremidade dir.eita ao valor terico que sucede o ltimo valor real da mesma tabela. representa o nmero total de sujeitos compreendidos, ao mesmo tempo, dentro e abaixo
**N.T.: prtica no s comum, mas tambm bastante aconselhvel, no unir a extremidade esquer- de um intervalo de classe particular.
da da linha poligonal origem zero do sistema de coordenadas. Isto porque, se houvesse um valor
anterior a 80,5, com certeza ele seria 70,5 e no O (zero). Ento, contorna-se o problema "sanfonan- CONSTRUO DE GRFICOS DE BARRAS E DE POLIGONOS DE FREQNCIAS
do" uma parte do eixo das abscissas, conforme indicado abaixo:
As regras e procedimentos apresentados a seguir podem ser aplicados tanto construo
de diagramas de barras quanto a de polgonos de freqncias:
1. Por questo de tradio e para evitarem-se confuses, o pesquisador sempre
dispe os valores mensurados (escores) ao longo do eixo horizontal, e as
freqncias (ou as porcentagens) no eixo vertical.*
2. Todos os componentes de um grfico devem ter nome. A linha de base hori-
zontal costuma representar uma caracterstica** (por exemplo, a idade do

* N.T.: Isso nem sempre assim . .Talvez fique mais fcil (ou prtico) estabelecer o seguinte : no eixo
das abscissas escrevem-se os valores da varivel independente (designada por V.l.) e, no eixo das
o 70,5 80,5 90,.5 ordenadas, os valores correspondentes da varivel dependente, ou funo (designada por V.D.).
~* N.T.: Essa caracterstica, na verdade, o prprio nome da varivel que constitui objeto de investi-
gao. conveniente identificar seu nvel de mensurao e, alm disso, observar o que foi dito na
*** N.T.: O polgono de freqncias acumuladas tambm conhecido por ogiva de Galton. nota de rodap anterior sobre variveis independentes e dependentes.
40 DESCRIO I Representaes Grficas 41

respondente); a linha vertical costuma ser rotulada de acordo com o que se Existem vrios tipos de distribuies assimtricas ou enviesadas. Quando os
pretende representar (freqncias ou porcentagens), sendo que[os valores nu- escores se amontoam num dos lados da curva assimtrica, a distribuio apresenta
mricos correspondem a pontos situados ao longo dos eixos. Alm disso, todo uma cauda acentuada. A posio dessa causa indica o sentido da assimetria, sentido
grfico deve ter um ttulo capaz de indicar a natureza dos ddos ilustrados. esse que aponta. para o lado onde se situam os escores mais extremos.
3. Na construo de um grfico, o comprimento do eixo vertichl deve ser 75% A distribuio (a) da Figura 3. 7 assimtrica negativa (enviesada para a esquer-
do comprimento do eixo horizontal. Tal procedimento introduz uma forma da), uma vez que sua cauda muito maior do lado esquerdo do que do lado direito.
relativamente padronizada de construir grficos e reduz ao nfnimo fontes de Essa distribuio mostra que a maioria dos respondentes recebeu notas altas, e que
confuso potencial.* / somente alguns receberam notas baixas. Se essa fosse a distribuio dos resultados
4. O primeiro ponto do eixo vertical-o ponto onde o eixo vertical cruza com o de um exame final, poderamos dizer que a maioria dos estudantes saiu-se muito bem,
horizontal-deve ser sempre zero, uma vez que qualquer outro procedimento enquanto que apenas alguns "rodaram".
poderia fornecer uma imagem distorcida dos dados.

(a) (b) (c)

(a) Leptocrtica (b) Pia ticrtica (c) Mesocrtica


FIGURA 3.7 Trs Distribuies Representativas do Sentido da Assimetria
FIGURA 3.6 Variaes em Curtose entre Distribuies Isomtricas
Observe-se em seguida a distribuio (b), cuja cauda est direita. Uma vez que
a assimetria uma funo do sentido da cauda, podemos dizer que essa distribuio
FORMA DE UMA DlSTRIBUIO DE FREQNCIAS
assimtrica positiva (ou enviesada direita). 'Os resultados do exame final dos alunos
Os processos grficos podem ajudar-nos a visualizar a imensa variedade de figuras e dessa nossa classe hipottica seriam bem baixos! .
formatos que as distribuies de freqncia assumem. Algumas distribuies so sim- Finalmente, vamos examinar a distribuio (c), que contm duas caudas idnticas.
tricas: "dobrando-se"a curva ao meio as duas metades coincidem. Portanto, tais distri- Em tal situao h, em ambas as caudas, a mesma quantidade de escores extremos. A
buies contm o mesmo nmero de escores extremos em ambos os lados (escores simetria dessa distribuio absoluta. Se esta fosse a distribuio dos resultados de
altos do lado direito e escores baixos do lado esquerdo)~* Outras distribuies, de- nosso exame final, teramos um nmero grande de estudantes cujas notas estariam
nominadas assimtricas, apresentam maior quantidade de dados extremos numa das prximas da mdia, e poucos estudantes com notas muito altas ou muito baixas.
caudas.
As chamadas distribuies simtricas apresentam considervel variao. Por
RESUMO
exemplo, elas podem diferir acentuadamente em termos de alongamento (ou curtose).
As distribuies simtricas, tais como as da Figura 3.6, podem ser: (a) leptocrticas As representaes grficas de dados podem ser usadas para aumentar a legibilidade
(bastante pontiagudas ou altas); (b) platicrticas (quando so achatadas); (c) meso- de resultados de pesquisas. Nosso estudo de representa.es grficas abrange grficos
crticas (quando no so nem muito pontiagudas nem muito achatadas). Um tipo de setoriais, grficos de barras e polgonos de freqncias. Os grficos setoriais servem
distribuio simtrica mesocrtica (ver Figura 3.6(c)) a curva normal, que tem espe- para ilustraes simples de dados que podem ser classificados em algumas categorias.
cial importncia na pesquisa. (A curva normal ser estudada pormenorizadamente Os grficos de barras so de uso mais generalizado, j que tm a propriedade de acomo-
no Captulo 6.) dar qualquer quantidade de categorias. Os polgonos de freqncias tambm gozam
dessa elasticidade, mas so particularmente teis quando se trata de representar dados de
* N.T.: O procedimento indicado na nota 3, acima, irrelevante uma vez que a interpretao do natureza ordinal ou intervalar, pois o "efeito de continuidade" torna-se mais evidente.
fenmeno posto em grfico depende apenas das escalas de medidas usadas e no do comprimento As variaes na forma das distribuies podem ser caracterizadas em termos de
dos eixos. simetria ou, conforme haja um acmulo de dados extremos na cauda esquerda ou na
**N.T.: As extremidades esquerda e direita de uma curva so comumente chamadas caudas. cauda direita da curva, em termos de assimetria positiva ou negativa.
Medidas de Tendncia Central 43

4
freqncias mximas, que sugerem o costado de um camelo. Essas distribuies so
chamadas de bimodais, em contraste com a variedade mais comum, unimodal, que tem
apenas uma corcova-ou ponto de freqncia mxima (ver Figura 4.1 ).
_ UN;ve~~HJ::.t:: :::, . ~
TA BELA 4.1 Procedunento para Encontrar a Moda, numa Qi l!_j~uio de Frei{')1cia~~m lf'\dos
Isolados u ._J) r._:_ c,~ , '1,4
: t,_~. '.:; . ~ <""!li,. '

Medidas de Valores

7
f

2
6 3

Tendncia Central Mo
5
-+Li} - - - 4 '5-
3
4~

4/
2 3
Pesquisadores em muitos campos tm usado o termo "mdia" em questes tais como: 1 2'

qual a renda mdia de colegiais t;: universitrios j graduqdos? Quantos cigarros fuma, Total 23
em mdia,o adolescente? Qual a nota mdia de uma universitria? Em mdia, quantos
so os acidentes, automobilsticos que resultam diretamente da ingesto de lcool ou
MEDIANA
drogas?
Uma forma til de descrever um grupo como um todo consiste em encontrar Quando dados ordinais ou intemilares so dispostos por ordem de tamanho, torna-se
um nico nmero que represente o que "mdio," ou "tpic?" naquele conjunto possvel localizar a mediana (Md), que corresponde ao ponto central da distribuio.
particular de dados. Em pesquisa, tal valor conhecido por medida de tendncia central,
uma vez que ela geralmente se localiza em torno do meio ou centro de uma distribui-
o-onde a maior parte dos dados tende a concentrar-se .
. A idia que o leigo faz do termo ,:mdia" quase sempre vaga e mesmo confusa.
A concepo do pesquisador muito mais precisa do que a do pblico em geral; ela
expressa numericamente como uma das vrias espcies de "medidas mdias" - ou
Unimodal
de tendncia central-que, para um mesmo conjunto de dados, pode assumir diferentes
valores. Somente as trs medidas de tendncia central mais conhecidas so aqui discuti- FIGURA 4.1 Representaes Grficas de uma Distribuio Unimodal e de uma Bimodal
das: a moda, a mediana e a mdia aritmtica.
Po:tanto, a mediana considerada a medida de tendncia central que corta a distri-
bmo em duas partes iguais.
MODA , Se estivermos diante de uma distribuio com nmero z'mpar de dados, a mediana
. 'i
Para obter a moda (Mo), procure simplesmente o escore ou categoria que, numa dis- sera o dado que cai exatamente no meio da distribuio. A posio do valor mediano
tribuio, ocorre com maior., freqnci~. A moda pode ser localizada com muito mais pode ser determinada pelo exame dos dados ou pela frmula : -
facilidade por exame do que por clculo. Por exemplo, no conjunto de escores (D, .,
, 2, 3, Q), (D, 6, 5, 4, Q), 4, 4, 3, a mo.da 1, uma vez que 1 o nmero que ocorre com
~ ~aior freqncia no conjunto_(quatro vezes). -
Posio da mediana
,'/
..
No caso de uma distribuio de freqncias com dados isolados, onde os escores
e as freqncias figuram em colunas separadas, a moda o valor (escore) que aparece
=
mais amide na tabela. Portanto, na distribuio de freqncias d~ Tabel 4.1, Mo 4.
~
Assim, 16 .o valor mediano naI distribuio l'l, 12, 13, 16 , 17, 20, 25; em outras
~alavras, 1~ o valor que divide a distribuio de tal forma q e, de ambos os lados, h
Algumas distribuies de freqncias apresentam duas ou mais modas. No seguinte
tgual, quantidade de dados. De acordo com a frmula, (7 + I)/ 2, vemos que a mediana;
conjunto de dados, por exemplo, os escores 2 e 6 ocon:em ambos com igual freqncia
16, e o quarto valor da distribuio independentemente do lado por onde se inicie a
alta: 6, 6, 7, 2, 6, 1, 2, 3, 2, 4. Graficamente, tais distribuies tm dois pontos de contagem.
44 DESCRIO Medidas de Tendncia Central 45

Se o nmero de dados for par, a mediana ser sempre aquele ponto da distribuio mais baixo, vamos somando as fregncias at chegar a um valor que contenha o dcimo
que antecedido e precedido por igual nmero de dados.* Para uma distribuio com segundo escore da distribuio. No exemplo em foco, o valor do escore medino 4.
nmero par de dados, sempre h dois valores considerados "centrais". Ilustrando: os
nmeros 16 e 17 representam os dados centrais na seguinte distribuio: 11 , 12). 13, '
MDIA ARITMTICA
@, @, 20, 25, 26. Pela frmula, (8 -i- 1)/2 =4,5, o que significa que a mediana vai
cair entre o quarto e o quinto valores; o ponto central dessa distribuio vai, ento, Sem sombr~ de dvida, a medida de tendncia central mais comumente usada a mdia
ser 16,5, uma vez que ele fica precisamente no meio de 16 (4.o valor) e 17 (5.o valor). aritmtica, X, cujo clculo consiste em somar um conjunto de escores e dividir o total
Por igual raciocnio, a mediana 9 na seqncia 2, 5, @, @, 11, 12,. porque est pelo nmero de parcelas. Portanto, podemos definir mdia aritmtica, mais formal-
situado exatamente entre os dois dados centrais, ou seja, (6 + 1)/2 = 3,5. mente, como a soma de um conjunto de escores dividida pelo nmero de escores desse
Outra' circunstncia que precisa ser explanada e ilustrad, caracteriza-se pelo conjunto. Em smbolos:
_clculo da inediana de uma distribuio em que figuram, na regio central, vrios dados
n~meric~ente idnt_i~os: A soluo simples: ~ele valor particular constitui a me- ~X
X , onde
diana. Asstm, na sequencta 11, 12, 13,@,@,@, 25, 26, 27, a mediana 16, apesar N
de esse valor ocorrer mais de uma vez.
X mdia (leia-se " xis-barra")
Obteno da Mediana numa Distribuio de Freqncias com Dadoslsolados ~ soma (expressa pela letra-grega, maiscula, "sigma" ) 1
Para encontrar a mediana de dados dispostos numa tabela de freqncias simples, X qualquer escore bruto do conjunto (isto , a prpria varivel)
iniciamos com o procedimento apresentado acima. No caso da Tbela 4.1 , N total de escores do conjunto.

23 +1 24 Usando a frmula acima, verificamos que o QI mdio dos oito respondentes


Posio da mediana =-"' 12
2 2 arrolados na Tabela 4.3 108.

-
A mediana vem a ser o dcimo segundo valor nessa distribuio de freqncias. Para TABELA 4.3 Clculo da Mdia Aritmtica: Uma Ilustrao
facilitar a localizao desse dcimo segundo escore, poderamos construir uma distri-
buio de freqncias acumuladas, tal como ilustra a terceira coluna da Tabela 4.2 Respondentes X (Ql)
(para um pequeno nmero de escores isso pode ser feito de cabea). A partir do escore
Benedito 125
Francisco 92 - ~X
TABELA 4.2 Localizao da Mediana numa Distribuio de Freqncias de I>ados Isolados Sara 72 X=-
N
Miguel 126
Jesuno 864
Valores dos Escores f ta 120 = -
Helena 99 8
Benjamim 130
7 -/. - 2 . 23 Paulo 100 = 108
6 3 21
5 4 18 ' ~X = 864
Md-+ 4 5 14
3 4 9
Em oposio ao que acontece com a moda, a mqia nem sempre o escore ue
2 3 5 ?Corre com maior freqnc~a. Tambm, ao contrrl do que se passa com a mediana a
1 2 2: ~dia n~o . necessari~nte o onto central de uma distribui o. o que, ento, sfg-
Total 23 rufica medw? De que maneira ela pode ser interpretada? Veremos adiante que a mdia
pode ser tomada como o "centr-O de gravidade" , isto , o ponto de qualquer distribuio

* N.T.: De acordo com o texto original, a traduo deveria ser : aquele ponto acima e abaixo do
A letra maiscula grega sigma, ( ~), ser observada vrias vezes ao longo do texto. Ela indica sim-
1
qual ocorrem 50% dos valores da distribuio. Esta afirmao foi evitada no corpo do t exto por
tratar-se de uma incoerncia. De fato , se antes da Md h 50% dos escores, e depois dela tambm plesmente que devemos somar ou adicionar os valores da varivel em foco. No exemplo presente
50% de escores, evidente que 50% + Md + 50% > 100%, o que um absurdo ! ~X indica a soma de todos os escores brutos. '
46 DESCRIO Medidas de Tendncw Central 47

em torno do qual se equilibram as discrepncias positivas e negativas. A fim de que seja serve perfeitamente. Entretanto, quando estamos diante de um nmero maior de dados,
possvel perceber essa caracterstica da mdia, devemos primeiro entender o conceito de pode ser mais prtico e menos demorado calcular a mdia de uma distribuio de
discrepncia, que nada mais seno a distncia da mdia a qualquer escore bruto. Para freqncias (dados isolados) pela frmula
calcular uma determinada discrepncia, basta subtrair a mdia aritmtica de qualquer
escore bruto dado. Em smbolos: 'EfX
X --,onde
N
x =X- X ,ond~

X mdia
X =escore-discrepncia ou simplesmente discrepncia (sempre simbolizada por x,
X um escore bruto qualquer da distribuio (isto , a prpria varivel)
isto , "xis .~;pinsculo")
X= qualquer escore bruto da distribuio
fX um escore qualquer multiplicado pela respectiva freqncia de ocorrncia
'Ef X soma dosfX's
X= mdia aritmtica.
N total de escores.
TABELA 4.4 Discrepncias de um Conjunto de Escores Brutos com Relao a X
A Tabela 4.5 ilustra o clculo da mdia de um conjunto de dados isolados (porm
afetados de freqncias).
X X

-
TABELA 4.5 Clculo de X de uma Distribuio de Freqncias Simples (Dldos Isolados)
9
8 + 2
+3} +5
6 o X= 6 X f [X
4
3
-2}
- 3 - 5
8, 2 16
7 3 21
Uma vez que X = 6 para o conjunto de escores brutos 9, 8 , 6, 4 e 3, o valor X = 9 6 5 30
5 6 30 _ 'E!X ill
fica exatamente trs unidades acima da mdia 6 (ou X - X = 9 - 6 = + 3). De modo X - N 4,71
4 4 16 28
anlogo, o escore bruto 4 fica duas unidades abaixo da mdia (ou X - X = 4 - 6 = - 2). 3 4 12
Concluso: quanto maior a discrepncia x, tanto maior a distncia entre um determi- 2 3 6
nado escore bruto e a mdia da distribuio. 1 1 1
Considerando-se a mdia como o ponto de equilbrio da distribuio, pode-se N=28 'E/X=132
dizer, agora, que a soma das discrepncias situadas acima da mdia igual, em valor
absoluto (descartados os sinais "menos"), soma das discrepncias que ficam abaixo
dela. Vamos voltar a um exemplo anterior- o conjunto de escores 9, 8, 6, 4, 3 , onde
COMPARAO ENTRE MODA, MEDIANA E MDIA
i = 6. Se a mdia dessa distribuio for seu "centro de gravidade", ento, desprezando
os sinais "menos" e somando as discrepncias positivas (discrepncias relativas aos H um momento em que o pesquisador procura uma medida de tendncia central para
escores 8 e 9), o resultado deve ser igual ao obtido mediante a soma das discrepncias a sua situao particulr de pesquisa. Empregar ele a moda, a mediana ou a mdia? Sua
negativas (isto , relativas aos escores 4 e 3). Como evidenci!l a Tabela 4.4, precisa- deciso envolve vrios fatores tais como:
. mente esse caso-j que a soma das discrepncias abaixo de X (- 5) igual soma das 1. o nvel de mensurao;
discrepncias acima de X (+ 5). 2. o aspecto ou forma de sua distribui de dados e
Vamos a mais um exemplo: 4 a mdia de 1,2, 3, 4, 5, 6 e 7. Observe-se que a 3. o objetivo da pesquisa.
soma das discrepncias abaixo desse escore - 6, enquanto que a soma das discrepn-
cias acima dele + 6. Voltaremos a examinar o conceito de discrepncia nos Captulos Nvel de Mensurao
5 e 6. Uma vez que a moda requer apenas o conhecimento das freqncias, ela .pode ser
calculada para qualquer conjunto de dados, sejam eles do nvel nominal, ordinal ou
Clculo da Mdia de uma Distribuio de Freqncias (com Dados Isolados) _ intervalar. Por exemplo, poderamos estabelecer que a categoria modal do nvel nomi-
Para obter-se a mdia de um pequeno nmero de escores, a frmula bsica X = 'EX/N nal da varivel "filiao religiosa" (protestante, catlico ou judeu) protestante, se a
48 DESCRIO
.r/11~ Medidas de Tendncia Central

A Figura 4.3 mostra que a moda, a mediana e a mdia no coincidem em dis-


49

maioria dos nossos respondentes se identificassem como tais. Similarmente, poderamos


tribuies assimtricas, muito embora suas posies relativas permaneam constantes;
dizer que a maioria dos estudantes freqentadores de uma dada universidade apresenta
uma nota mdia 2,5 (Mo = 2,5). dito de outra forma, no sentido "pico" /"cauda", a ordem sempre da moda para a
mdia, com a mediana entre esses dois pontos. A moda a que cai mais perto do " pico"
A mediana exige uma ordenao de categorias, da mais alta mai~ baixa. Por essa
da curva, j que ela corresponde ao ponto da escala cujo valor mais freqente. A
razo, ela s pode ser obtida a partir de dados ordina1s ou intervalares, mas nunca de
mdia, ao contrrio, a que est mais prxima da "cauda", onde se situam os escores
dados nominais. Ilustrando: poderamos descobrir que a renda anual mediana de den-
extremos (e poucos). Por essa razo, o escore mdio numa distribuio positivamente
tistas de uma pequena cidade da ordem de Cr$ 289.000,00. Esse resultado fornece-nos
assimtrica (Figura 4.3(a)) localiza-se entre os escores mais altos; a mdia numa distri-
um critrio slido para o exame da tendncia central de nossos dados. Contrariamente,
buio negativamente assimtrica (Figura 4.3(b)} cai perto dos escores mais baixos.
faria pouco sentido calcular a mediana de escalas de filiao religiosa (protestante,
. catlico ou judeu), sexo (masculino ou feminino), ou pas de origem(Inglaterra, Polnia,
Frana ou Alemanha), onde no foi feita uma atribuio de postos (escalonamento).
O uso da mdia est restrito exclusivamente a dados intervalares. Calcular a mdia
de dados ordinais ou nominais d origem a um resultado sem sentido, que em geral no .~
(.)

indica a tendncia central. Que sentido faria o clculo da mdia de uma distribuio ,..,!:::
:;:I
onde a varivel fosse filiao religiosa ou sexo? Embora seja menos bvio, igualmente
inapropriado calcular a mdia de dados que podem ser graduados porm no medidos. l
Forma da Distribuio
O aspecto ou forma de uma distribuio outro fator que pode influenciar o pesquisa- MoMdX XMdMo
dor na escolha de uma medida de tendncia central. Numa distribuio unimodal e
(a) .(h )
perfeitamente simtrica, a moda, a mediana e a mdia sero idnticas, uma vez que o
.p onto de freqncia mxima (Mo) tambm o valor "mais" central (Md) e o "centro
FIGURA 4.3 Posies Relativas de Medidas de Tendncia Central: (a)- Distribuio Positivamente
de gravidade" dos dados (X). Como demonstra a Figura 4.2, as medidas de tendncia Assimtrica e (h)- Distribuio Negativamente Assimtrica
central coincidiro no ponto central, exatamente no "pico" da distribuio simtrica.
Quando o pesquisador trabalha com uma distribuio simtrica, a escolha, de Enquanto que a mdia muitssimo influenciada pelos escores extremos (em
uma medida de tendncia central baseia-se principalmente nos objetivos particulares ambos os sentidos), a mediana sofre pouca ou nenhuma influncia de alteraes nos
de sua investigao e no nvel em que seus dados foram colhidos. Entretanto, quanqo valores extremos. Isto porque a mdia considera todos os escores de qualquer distri-
ele trabalha com uma distribuio assimtrica, sua deciso muito influenciada pelo buio, enquanto que a mediana (por definio) s se preocupa com o valor numrico
formato dos dados de que dispe. do escore que ocupa a posio "mais" central. Como ilustrado abaixo, a mudana do
valor de um escore.extremo de 10 (distribuio .a) para 95 (distribuio b), no modifica
de maneira nenhuma o valor da mediana (Md = 7,5), enquanto que a mdia pula de
7,63 para 18,25.

distribuio A: 5- 6-6 7 8 9-i 0-i l> Md = 7,5 . X 7,63


distribuio B: 5 6 6 7 8 9 10 95 Md=7,5 X 18,25

Numa distribuio assimtrica, a mediana sempre cai em algum lugar entre a


mdia e a moda. essa caracterstica que a torna a medida de tendncia central mais
desejvel para descrever uma distribuio assimtrica. Para ilustrar essa vantagem da
Mo mediana, voltemo-'iios-para Toe1a4.6 e examinemos o salrio anual " mdio" dos
Md empregados que trabalham numa pequena corporao. Se trabalhssemos no departa-
x . mento de relaes pblicas dessa corporao e desejssemos angariar-lhe uma imagem
pblica favorvel, calcularamos, talvez, a mdia, a fim de demonstrar que o empregado
FIGURA 4~2 Distribuio Unimodal, Simtrica, com a Localizao da Moda, da Mediana e da
Mdia (o~de Mo =Md =X) " tpico" ganha Cr $ 306.000,00 (por ano), e , portanto, relativamente bem pago. Por
SO DESCRIO Medidas de Tendncia Central 51

outro lado, se ns fssemos representantes sindicais e estivssemos procurando melhorar nesse grupo de respondentes: uma com um nmero bastante grande de pessoas (Mo= 8)
os nveis salariais, iramos provavelmente empregar a moda para demonstrar que o e outra com apenas algumas pessoas (Mo = 3).
salrio anual "mdio" de apenas Cr$17.000,00, o que representa uma quantia bas- TABELA 4.7 Concepes Ideais de Tamanho de Fam1lia numa Amostra de 26 Respondentes de
tante reduzida. Para finalizar, se fssemos pesquisadores sociais desejosos de dar uma Renda Baixa. (Distribuio Bimodal)
informao acurada do salrio "mdio" dos empregados dessa corporao, emprega-
ramos, inteligentemente, a mediana (Cr$ 51.000,00), uma vez que esse valor cai entre Tamanho Ideal de Famz'lia f
as outras medidas de tendncia central e, portanto, oferece um quadro mais equilibrado
da estrutura salarial. O mtodo mais aceitvel seria indicar as trs medidas de tendncia 10 1
central e permitir que os interessados interpretassem os resultados. Infelizmente 9 2
verdade que poucos pesquisadores sociais-no contando os relaes pblicas e os 8 6
7 3
lderes sindicais-indicam mais do que uma nica medida de tendncia central.
6 2
5 1
TABELA 4.6 Medidas de Tendncia Central numa Distribuio Assimtrica de Salrios Anuais
4 2
3 6
2 2
Salrio Medido em Cruzeiros (Cr$)
N = 26
1.700.000,00
425.000,00
170:000,00 X = Cr$306.000,00
Objetivo da Pesquisa
85 .000,,00 At aqui, discutimos a escolha de uma medida de tendncia central em termos do nvel
17.000,00 Md :::: Cr$ 51.000,00 de mensurao e da forma de uma distribuio de escores. Perguntamos agora: que o
17.000,00 pesquisador espera fazer com a medida de tendncia central escolhida? Se ele procura
17.000,00 Mo=Cr$ 17.000,00 uma medida descritiva que seja rpida, simples, ainda que grosseira, ou se ele estiver
trabalhando com uma distribuio bi111odal, ele geralmente empregar a moda. Na maioria
das situaes com que um pesquisador se defnmta, entretanto, a moda s til como
Ainda mais grave o fato de que alguns relatrios de pesquisa no especificam de forma
um indicador preliminar de tendncia central, que pode ser obtida com rapidez a partir
exata a medida de tendncia central- moda, mediana ou mdia- que foi usada para de um exame cuidadoso dos dados. Se ele procura uma medida de tendncia central que
calcular a quantia ou posio "mdia" de um grupo de escores. Como demonstrou a seja exata,* a deciso fica geralmente entre a mediana e a mdia.
ilustrao anterior, uma interpretao razovel de certos dados pode tornar-se literal-
mente impossvel sem tal informao.
Salientou-se pginas atrs que algumas distribuies de freqncias podem ,ser * N.T.: Muito embora o uso popular tenha tornado sinnimas as palavras preciso e exatida, do
ponto de vista formal estamos diante de coisas diferentes. Um instrumento preciso quando, em
caracterizadas como bimodais, uma vez que elas contm dois pontos de freqncia
sucessivas mensuraes da mesma magnitude, ele apresenta um erro constante. Um instrumento
mxima. Para descrever adequadamente distribuies bimodais, , em geral, til identi- preciso caracteriza-se pela preciso.
ficar ambas as modas; aspectos importantes de tais distribuies podem ser encobertos Um instrumento exato quando, em sucessivas mensuraes da mesma magnitude, o e/TO
se a mediana ou a mdia forem usadas. varivel (para mais ou para menos), porn a mdia aritmtica de todas as mensuraes representa
Considerem a situao em que um pesquisador realizou entrevistas pessoais com valor mais provvel da dita magnitude. Por isso, a mdia aritmtica representa o valor exato bus-
cado . O instrumento que produz mensuraes exatas caracteriza-se pela exatido.
26 respondentes de renda baixa, a fim de estabelecer seus conceitos ideais de tamanho
Exemplificando: Se um objeto pesa realmente 2 kg, pesado com uma balana exata repetidas
de famlia. A cada um deles foi dito o seguinte: "Suponha que voc pudesse decidir vezes, as mensuraes resultantes podero ser: 2,1 kg; 2,2 kg; 1,9 kg; 1,8 kg; etc., onde a mdia
exatamente o tamanho de sua famlia. Incluindo todas as crianas e os adultos, quantas uritmtica produz o valor real buscado. Assim:
pessoas voc gostaria que ela tivesse?" Como demonstra a Tabela 4. 7, os resultados desse
2,1 kg + 2,2 kg + 1,9 g + 1,8,kg = 2 kg
estudo indicaram amplas preferncias por tamanho de famia, preferncias que variaram 4
desde viver sozinho (1) at viver com muitas pessoas (10). Usando ou a mdia ou a
mediana, poderamos concluir que a famia ideal de um respondente "mdio" consis- Seja agora outra balana com a seguinte caracterstica: em cada quilo ela erra, para mais, 10 gramas.
tiria de seis pessoas (X = 5,58 ; Md = 6). Entretanto, sabendo que a distribuio bimo- l-.r1to, esse objeto, cujo peso real 2 kg, pesar sempre 2 kg + 20 g. Se a pesagem for repetida
,..
dal, percebemos que, de fato, houve duas concepes ideais de tamanho de famia n v zcs (n> 1), o erro ser consistente e constante : 20 g.
UNtVERSID,'l.Df. h.:Dr-R , . _
52 DESCRIO ..
., BWU 07. 'c'C ,, Me~Jl'as JJ.q,enllenla Central
1
1
53
. u ,.,_ C:ENT!(A[,
Na descrio de uma distribuio assimtrica, o pesquisador normalmente escolhe Para localizar a med~ana de dados agrupados numa distribuio de freqncias,
a mediana (omo, alis, j foi mencionado em outro local), uma vez que ela tende a. dar devemos (1) encontrar o mtervalo de classe que contm a mediana e (2) interpolar.
um quadro balanceado * dos escores extremos. Alm disso, a mediana algumas vezes Passo l-Para localizar o intervalo mediano, construmos primeiro uma distribui-
usada 'como um ponto da distribuio que divide os escores em duas categorias-ambas o de freqncias acumuladas, tal como figura na terceira coluna da Tabela 4.9. A
com o mesmo nmero de sujeitos. Por exemplo, poderamos dividir os respondentes ' -.- ~
partir do intervalo que contm os valores mais baixos (as idades menores-20/29),
(Tabela 4.7) em dois grupos: aqueles que preferem uma famt1ia grande (valores superio- vamos som~~o as f~eq~~cias at chegar quele intervalo que contm o ponto ( 0
res mediana) e os que preferem famt1ia pequena (valores menores que a mediana). valor) que divtde a dtstnbmo em duas partes iguais, isto , o ponto central. No pre-
Sempre que se deseja uma medida exata de distribuies simtricas, a mQia tem sente exemplo, N = 100. Portanto, devemos procurar o qinquagsimo valor, que :
preferncia sobre a mediana pelo fato de poder ser facilmente usada em anlises estats- N_/2 = 100/2 = 50. Consultando a coluna das freqncias acumuladas (de baixo para
ticas mais avanadas, tais como as que aparecem em captulos subseqentes deste livro. ctma), observamos que 26 sujeitos tm idades de 39 anos ou menos. Vemos tambm
Acrescente-se a isso o fato de ~er a mdia mais estvel que a mediana, ou seja, se de que o qinquagsimo sujeito situa-se no intervalo 40/49, j que esse o intervalo de
uma dada !'>opulao forem extradas diferentes amostras,fra:ve~r menor variao nas cl~s~e cujas freqncias acumuladas contm 53-portanto, mais do que a metade dos
mdias do que nas medianas. Essa vantagem da mdia- muito embora talvez ainda no S~J~ttos. En:.. outras_ ?alavras: _com ~e_lao s freqncias acumuladas, do vigsimo
compreendida ou avaliada pelo leitor-tornar-se- mais evidente em estudos posteriores se:Imo ao qumquagestmo terceuo SUJeitos encontramo-nos no intervalo 40/49. Esse
do tpico que trata do problema das decises em Estatzstica (ver Captulo 7). o mtervalo mediano.*

TABELA 4.9 . Distribuio de Freqncias de Dldos Agrupados (idaJes)


CLCULO DA MODA, DA MEDIANA E DA MDIA NUMA DISTRIBUIO DE .
FREQNCIAS COM DADOS AGRUPADOS Intervalo f fa
Numa distribuio de freqncias com dados agrupados, a moda o ponto mdio do
intervalo de classe que apresenta a freqncia mais alta. De acordo com essa definio, 60-69 15 100
50-59 32 85
a moda da distribuio constante da Tabela 4.8 72, uma vez que esse valor con:espon- 40-49 .- .. 27 -~53
de ao ponto mdio do intervalo que aparece mais vezes (ele ocorre 17 vezes)** 30-39 16 26 .
20-29 10 10
TABELA 4.8 Localizao da Moda numa Distribuio de Freqncias com Dldos Agrupados N = 100

Intervalo de Classe Ponto Mdio f


~asso 2- Para encontrar o valor exato da mediana, aplicamos a frmula
95-99 ' 97 .3
90-94 92 2 Freqncia acumulada
85-89 87 4 N corrrespondente ao
80-84 82 7 2 intervalo anterior ao
75-79 77 12
Limite inferior real
-?0-74 72 17 Mediana do intervalo + que contm a mediana
X
65-69 67 12 mediano Freqncia absoluta do
60-64 . 62 5
55-59 57 5 intervalo mediano
50-54 52 4 Amplitude
N=71 X do intervalo
mediano

*N.T.: Balanceado significa aqui "que no sofre a influncia de valores extremos". * N.T.: Melhor ser_i~ dizer apenas o-seguinte: o intervalo mediano o intervalo que corresponde,
* *N. T. : Rigorosamente, o ponto mdio da 6 ~ classe (de cima para baixo) 71 ,5, se a varivel for con- na. ~oluna ,de frequenc1as acumuladas, ao valor que contm (pela primeira vez) metade do total de
tnua. Para que esse ponto .mdio seja 7 2 preciso que, nas condies da tabela, sejam desprezados os SUJeitos da distribuio. Sendo fai uma freqncia acumulada de ordem i, o intervalo mediano ser
mites do intervalo, ou seja, 70 e 74. Isso porque a classe foi indicada pela notao 70-74, que Obtido po_r correspondncia com a relao fai ~ N/2: O intervalo mediano tambm chamado de
a maneira tradic.ional de indicar um intervalo aberto (dos dois lados). lugar medzano.
Medidas de Tendncia Central 55
54 DESCRIO

Para os dados da Tabela 4.9'~ a mediana calculada como segue: PASSO 2: Multiplicar cada ponto mdio pela respectiva freqncia absoluta, a fim de
obter "LfX
50-26
Mediana = 39,5 +( )10 = 39,5 + 8,89 = 48,39 anos.
27 Intervalo X = Ponto Mdio f fX
Para calcular a mdia de uma distribuio de freqncias com dados agrupados,
podemos usar uma verso modificada da frmula vista anteriormente (ver Tabela 4.5). 17 - 20 18 1 18
14 - 17 15 2 30
Conforme exemplificado abaixo, o smbolo X no ser mais usado para designar um
11 - 14 12 3 36
escore, mas, sim, o ponto mdio de um intervalo de classe. Portanto, 8 - 11 9 5 45
5 -8 6 4 24
"L[X 2 -5 3 2 6
X = - - ,onde -
N N = 17 "LfX = 159

X mdia
PASSO 3: "Entrar" com o resultado do Passo 2 na frmula de X.
X ponto mdio de um intervalo de classe
[X ponto mdio de um intervalo de classe multiplicado pela respectiva freqncia
"L[X 159
absoluta X 9,35
N nmero total de escores. N 17

Podemos ilustrar o clculo da mdia de dados agrupados usando como referncia


a seguinte distribuio.**
RESUMO
f '!
Intervalo
Este captulo introduziu as trs medidas de tendncia central mais conhecidas, vale
17 1-20 1 dizer, medidas do que "mdio" ou "tpico" num conjunto de dados. A moda foi
14 1-17 2 definida como sendo a categoria ou escore que oorre com maior freqncia; a me-
11 1-14 3
diana, como o ponto que divide a distribuio ao meio; a mdia, como a soma de todos
8 f-ll 5
4 os valores dividida pelo nmero de parcelas (isto , de valores do conjunto). Essas
5 1-8
2 medidas de tendncia central foram comparadas relativamente a: nvel de mensurao
2 f-5
N = 17 (da varivel), forma da distribuio (dos dados) e Qbjetivo da pesquisa. Podemos
resumir as condies que regem a escolha de uma dessas medidas de tendncia central
da seguinte maneira:
PASSO 1: Calcular o ponto mdio de cada intervalo de classe.

X = Ponto Mdio Moda:


Intervalo
1. nvel de mensurao: nominal, ordinal ou intervalar;
18
2. forma da distribuio: mais apropriada para distribues bimodais;*
17 !-20
15 3. objetivo: permite obter uma medida de tendncia central rpida, simples,
14 1-17
11 f-14 12 embora grosseira.
8 1-11 9
5 r-8 6 Mediana:
2 1-5 3 1. nvel de mensurao: ordinal ou intervalar; 1
2. forma da distribuio: mais adequada para distribuies muito assimtricas;
* N.T.: A varivel "idade" uma varivel contfnua. Por isso, qualquer limite inferior real obtido a par-
tir do limite inferior aparente menos 0,5. Para ajudar a "enxergar" este fato, o ideal seria ad?t~ a
seguinte notao nos intervalos de classe: 40 -50, 50 -60, etc. Asstm ftca claro que os hmltes ~ N.T.: Melhor seria dizer multimodis, j que a "bimodalidade" est implcita na "multimodali-
inferiores reais so, respectivamente, 39,5 e 49,5, que os superiores so, na mesma ordem, 49,4 e 59,4.
d!tde". Observe-se, ainda, que nada impede que a moda seja a medida "prefervel" mesmo numa
** N.T :: Veja-se a propsito, o que ficou dito na nota do tradutor, pgina 24, Cap. 2, sobre a notao distribuio unimodal. O que rege isso o objetivo da pesqu'isa.
de intervalo.
56 DESCRIO
Medidas de Tendncia Central 57
-
3. objetivo: uma medida de tendnci_a central "confivel"; pode, s vezes, ser
13. Qual a discrepncia de cada um dos seguintes escores com relao a X = 15?
usada em operaes estatsticas mais avanadas ou para "quebrar" uma distri- (a) X = 22,5; (b) X= 3; (c) X= 15; (d) X= 10,5.
buio em duas categorias distintas (por exemplo: alto X baixo).
14. Os esco~es relativos a atitudes de 31 estudantes frente a um grupo minoritrio
Mdia : / for:un dis~ostos ~a seguinte distribuio de freqncias (quanto maior 0 escor~
mrus favoravel a atitude:
1. nvel de mensurao: intervalar (no mnimo);
2. forma da distribuio: mais apropriada para distribuies unimodais simtricas;
Escores Relativos e Atitudes f
3. objetivo: medida de tendncia central exata; pode freqentemente ser usada em
operaes estatsticas mais avanadas, tais como os testes para tomada de
7 3
decises que aparecero mais adiante neste livro. 6 4
5
PROBLEMAS ~
.4.,-<f-- :;z
1. Sete empregados horistas numa companhia de porte mdio ganham Cr$.153,00; 3 5
Cr$136,00; Cr$153,0Q; Cr$68,00; Cr$17,00; Cr$102,00 e Cr$51,00. Calcule 2 4
'o
(a) salrio-hora modal; (b) o salrio-hora mediano e (c) o salrio-hora mdio. 1 2
//2. Suponha que a companhia do problema 1 tenha recrutado mais um empregado N = 3.1
pelo salrio-hora de Cr$17,00, resultando, assim, a seguinte distribuio: Cr$153,00;
Cr$136,00; Cr$153,00; Cr$68,00; Cr$17,00; Cr$102,00; Cr$51 ,00; e Cr$ 17,00. Calcule (a) a moda; (b) a mediana; (c) a mdia.
Calcule (a) o salrio-hora modal; (b) o salrio-hora medtano; (c) o salrio-hora 15. Trinta e um~ cr~anas matriculadas numa terceira srie do primeiro grau de uma
mdio. zona urbana mdicaram, numa pesquisa, o nmero de irmos e/ou irms que viviam
3. Para os escores 205, 6, 5, 5, 5, 2, e 1 calcule (a) a moda; (b) a mediana e (c) a com cada .u~ d~les em casa. Os dados resultantes foram dispostos na seguinte
mdia. Que medida de tendncia central no deveria ser usada p~ra descrever tabela de distnbmo de freqncias :
(isto , para analisar) esse conjunto de escores? Por qu?
~4. Seis estudantes num seminrio de sociologia foram testados por meio de um instru- Nmero de Irmos/irms f
I
/ mento que produz mensuraes de nvel intervalar. O objetivo da pesquisa era
mensurar suas atitudes com relao a um grupo minoritrio. Suas respostas, numa 5 6
4 7
escala de 1 a 10 (quanto mais alto o escore, mais favorvel a atitude), foram: 5, 2, 3 <r 9 <
6, 3, 1 e 1. 2 5
Relativamente aos escores acima, calcule (a) a moda; (b) a mediana e (c) a mdia. 4
No geral, at que ponto esses estudantes so favorveis a esse grupo minoritrio? N = 31
5. Dados os escores 10, 12, 14, 8, 6, 7, 10, 10, encontre (a) a moda; (b) a mediana
e (c) a mdia. Para essa classe de 31 crianas, calcule
_j~j 6 . Dados os escores 3, 3, 4, 3, 1, 6, 5, 6, 6, 4, encontre (a) a moda; (b) a mediana e (a) o nmero modal de irmos/irms;
(c) a mdia.. (b) o nmero mediano de irmos/irms Escores f
7. Dados os escores 8, 8, 7, 9, 10, 5, 6, 8, 8, encontre (a) a moda, (b) a mediana e (c) a mdia de irmos/i~s. '
(c) a mdia. 10 I
3
/J 8. Dados os escores 5, 4, 6, 6, 1, 3, encontre (a) a moda, (q) a mediana e (c) a mdia. I >. Dada a seguinte distribuio de fre- 9 4
9. Dados os escores 8, 6, 10, 12, 1, 3, 4, 4, encontre (a) a moda, (b) a mediana e qncias, calcule (a) a moda; (b) a 8 6
(c) a mdia. 7 8
mediana e (c) a mdia: 6) ,,
/f 1O. Dados os escores 12, 12, 1, 12, 5, 6, 7, encontre (a) a moda, (b) a mediana e (c) a 9
5 7
mdia. 4 5
11. Qual a discrepncia de cada um dos seguintes escores com relao a X = 20,5? 3 2
(a) X= 20,5; (b) X= 33,0; (c) X= 15,0; (d) X= 21,0. 2 1
_;?; 12. Qual a discrepncia de cada um dos seguintes escores com relao' a X = 3,0? 1
(a) X= 4,0; (b) X= 2,5; (c) X= 6,3; (d) X= 3,0. N = 46
58 DESCRIO

17. Dada a seguinte distribuio de freqncias, calcule (a) a moda; (b) a mediana e
(c) a mdia:

Intervalo de Classe f

2
)
I
5
20-24
15-19
10-14
5-9
.)
4
8
5
I
Medidas de
N = 19

~ada a seguinte distribuio de freqncias, calcule (a) a moda; (b) a mediana e


1
Yc)amdia:
Variabilidade
No Captulo 4, vimos que a moda, a mediana e a mdia podiam ser usadas para resumir,
Intervalo de Classe f num nico nmero, aquilo que "mdio" ou "tpico" numa distribuio. Quando
1-
empregada sozinha, entretanto, qualquer medida de tendncia central fornece apenas
90-99 16
- 17
uma viso incompleta de um conjunto de dados e, portanto, pode confundir ou distor-
80-89 -
70-79 15 cer tanto quanto esclarecer.
60--69 3 Com vistas a ilustrar essa situao, admitam que Honolulu (Hava) e Houston
50-59 2 (Texas) tenham quase a mesma temperatura mdia diria de 75. * Ser que, por isso,
40-49 3 podemos admitir que a temperatura basicamente a mesma em ambas as localidades?
/
N =56 Ou no ser possvel que enquanto uma cidade melhor para natao a outra o seja
para atividades externas?
19. Dada a seguinte distribuio de freqncias, calcule (a) a moda;,(b) a mediana;
Como bem ilustra a Figura 5.1, a temperatura em Honolulu varia mito pouco
(c) a mdia: ao longo do ano, oscilando, em geral, entre 70F e 80F. Por outro lado, a temperatura
em Houston pode diferir estacionalmente, isto , apresentar-se baixa em janeiro- cerca
Intervalo de Classe f de 40F- e alta em julho e agosto-bem perto de 100F. Desnecessrio dizer, pois, que
as praias de Houston no esto apinhadas de gente durante todo o ano!
17-19 2
3
Vamos a um outro exemplo. Suponham que, numa particular cidade, tanto ladres
14-16
11-13 6 quanto professores secundrios tenham uma renda mdia anual de Cr$136.000,00.
8-10 5 Ser que essa informao indica que as duas distribuies de renda so necessariamente
5-7 semelhantes? Muito ao contrrio, poder-se-ia descobrir que elas diferem-e muito- num
N = 17 outro aspecto importante, qual seja, o fato de as rendas dos professores concentrarem-se
ao redor de Cr$136.000,00, enquanto que as dos ladres espalham-se mais, o que reflete,
portanto, maior~s oportunidades para prises, desemprego, pobreza e, em alguns casos,
fortunas excepcionais.

~ N. T.: A falta de uma unidade de medida pode, s vezes, confundir o leitor. Este livro, de autor
'norte-americano, traduz, em muitos pontos, aspectos da cultura vigente em pases anglo-saxes;
ntre esses aspectos, destaca-se a escala de temperatura Fahrenheit, cuja caracterstica a seguinte:
~ 2F correspondem ao gelo fundente e 212F, agua em ebulio. Em graus Celsius (centgrados),
7 5F correspondem a 23,9C (aprox.). A frmula de converso usada foi a seguinte:
60 DESCRIO
61

DESVIO MDIO
No captulo anterior, desvio* foi definido como sendo a distncia entre qualquer escore
bruto e a mdia da distribuio. Aprendemos, 'Ss1m, que, para calcular d1screpancias
(desvios), bastava subtrair a mdia (aritrfltica) de qualquer escore bruto: x =(X - X).
Se desejarmos agora obter uma medida de variabilidade que leve em conta todos os
escores da distribuio (e no apenas dois), poderemos tomar o valor absoluto de cada
discrepncia (isto , das distncias com relao mdia), somar esses valores e, ento,
X = 75F X = 75F dividir o total pelo nmero de escores. O resultado ser o desvio mdio. Em smbolos:
AT =
26F AT = 69F
Honolulu Houston ~lxl
DM , onde
FIGURA S. I Diferenas de Variabilidade: Distribuies de Temperaturas em Locais Distintos: N
Honolulu e Houston (Valores Aproximados)

Tal fato demonstra que necessitamos, alm de uma medida de tendncia central, DM desvio mdio
de um ndice que indique o grau de disperso dos escores em torno do centro da distri- ~ ix I soma dos valores absolutos das discrepncias (ou seja, soma das discre-
buio (isto , em torno da mdia). Numa palavra, precisamos de uma medida indicativa pncias sem considerar-se a presena dos sinais + e -)
do que costumeiramente se chama variabilidade (tambm designada como variao ou N total de escores (ou de sujeitos, respondentes ou dados).
disperso). Voltando a um exemplo anterior, poderamos dizer que a distribuio de Nota importante-No clculo de ~lxl devemos ignorar os sinais "mais" (+) e
temperaturas em Houston (Texas) tem maior variabilidade do que a distribuio de "menos" (-) e somar apenas os valores absolutos. Este procedimento correto, porque
temperaturas em Honolulu (Hava). Da mesma forma; podemos dizer que a distribui- a soma das discrepncias reais (~x)-onde os sinais indicam o sentido do desvio com re-
.o de rendas entre professores apresenta menos variabilidade do que a distribuio de lao mdia'r.'L sempre igual a zero.*** As discrepncias positivas e as negativas ten-
rendas entre ladres. O presente captulo discute apenas as medidas de variabilidade dem a cancelar-se (compensar-se) e no podem, por isso, ser usadas para descrever ou
mais conhecidas: a amplitude total, o desvio mdio e o desvio padro. comparar a variabilidade de distribuies. Por outro lado, a soma dos valores absolutos
das discrepncias tende a tornar-se maior medida que a variabilidade da distribuio
AMPLITUDE TOTAL aumenta.
Pode-se obter uma medida de variabilidade rpida (cmoda), embora no muito exata, Podemos agora ilustrar, passo a passo, 'o procedimento para o clculo do desvio
pelo clculo da chamada amplitude total (AI), que nada mais seno a diferena entre mdio. Para tanto, consideremos o seguinte conjunto de escores: 9, 8, 6, 4, 2 e 1.
o maior e o menor escore da distribuio. Por exemplo, se a temperatura anual mais PASSO 1: Calcular a mdia (aritmtica) da distribuio.
alta em Honolulu foi de 88F e a mais baixa, 62F, a amplitude total da temperatura
anual em Honolulu foi de 26F (isto , 88F - 62F = 26"F). Se o dia mais quente em X
Houston apresentou 102F e o mais frio, 33F, a amplitude total da temperatura anual
em Houston foi de 69F (isto , 102F - 33F = 69F). 9
~X
8 X
A vantagem da amplitude total-clculo rpido e fcil- constitui tambm sua mais 6 N
importante desvantagem. Por outras palavras, a amplitude total inteiramente depen- 4 30
dente de apenas dois escores: o maior e o menor num dado conjunto de valores. Como 2 6
resultado, a amplitude total fornece, via de regra, um mero ndice grosseiro da variabili- 1
= 5
dade de uma distribuio. Por exemplo, AT = 98 no seguinte conjunto de dados: 2, 6, 7, u = 30
7, 10, 12, 13, 100 (AT = 100- 2 = 98); entretanto, AT = 12 neste outro conjunto:
2, 6; 7, 7, 1O, 12, 13, 14 (AT = 14 - 2 = 12). Portanto, pela simples troca de um nico "' N.T.: .Insista-se no seguinte : desvio, afastamento e discrepncia so expresses sinnimas. Entre-
tanto, prtica comum usar o termo discrepncia para des"ignar qualquer X i que resulte de (Xi - X).
valor ( 14 em lugar de 100), fizemos com que a amplitude total flutuasse bruscamente de 98
para 12. Qualquer medida que seja to afetada pelo escore de um nico respondente (ou "'* N.T.: Os valores afetados de+ (~ais) esto situados direita do zero ; os afetados de - (menos),
11 esquerda. Nos termos do texto, a mdia (aritmtica), semelhana do zero, fu nciona como uma
por um nico valor da varivel) no pode, por certo, fornecer uma idia precisa quanto origem. Ento : direita da mdia, discrepncias positivas; esquerda, discrepncias negativas.
variabilidade; quando nuito, possvel consider-la como um ndice preliminar ou, at, "'*"' N.T. : Dizer que a soma das discrepnci~ sempre igual a~ero o mesmo que dizer, em sm-
pouco exato. bolos, o seguinte: ~x =O. Ora, ~x =~(X- X). Ento: ~(X- X)= O.
62 DESCRIO Medidas de Variabilidade 63

PASSO 2: Subtrair de cada escore bruto a mdia da distribuio e somar as discrepn- Observem, antes de mais nada, que a mdia de cada distribuio Cr$ 340,00.
cias sem levar em conta os sinais (isto , "fazer de conta" que todas as discrepncias Notem tambm que parece haver diferenas marcantes em termos de variabilidade entre
tm o sinal +) essas distribuies-diferenas que podem ser detectadas com o auxlio da amplitude
total e do desvio mdio.
X X Vamos examinar, primeiro, a distribuio de rendas (a), onde todos os valores
so idnticos. Uma vez que todos os escores dessa distribuio so expressos pe.lo mesmo
9 ' +4.
8 +3 valor numrico (Cr$ 340,00), podemos dizer que ela no apresenta variabilidade alguma.
6 +1 Todas as pessoas (isto , as sete da amostra (a)) ganharam a mesma importncia naquele
4 -1 determinado dia. Como resultado, a amplitude total O (zero) e no h absolutamente
2 -3 nenhum desvio com relao mdia (DM = 0). As distribuies (b) e (c) apresentam va-
1 -4 riabilidade. De forma especfica, a distribuio (b) tem uma amplitude total de Cr$ 102,00
~= 30 Llxl = 16 e um desvio mdio de Cr$ 29,14; a distribuio (c) apresenta uma amplitude total de
Cr$510,00 e um desvio mdio de Cr$145,71. Podemos, pois, dizer que a distribuio
PASSO 3: Dividir L lxl por N, a fim de garantir uma eqidistribuio que leve em (b) contm menos variabilidade que a distribuio (c), ou seja, as rendas que fazem
conta o nmero de dados envolvido. parte da distribuio (b) so, entre si, mais semelhantes que as rendas da distribuio (c).

Llxl 16
DM = 2,67
N 6
De acordo com o procedimento precedente, vemos que o desvio mdio para o DESVIO PADRO
conjunto 9, 8, 6, 4, 2 e 1 2,67. Isso indica que, em mdia, os escores dessa distribuio
oscilam 2,67 unidades em tomo da mdia.
Com vistas a entender melhor a utilidade do desvio mdio, vamos voltar ao pro- Por motivos que logo se tomaro aparentes, o desvio mdio j no muito usado pelos
' blema das distribuies (a), (b) e (c) de rendas dirias, tal como figuram na Tabela 5.1. pesquisadores; na maioria dos casos, ele foi abandonado como ''medida de variabilidade"
em favor de um "parente prximo" mais eficiente: o desvio padro. Como teremos a
TABELA 5.1 Variabilidade em Distribuies de Rendas Dirias, onde a Mdia Fixa (Cr$340,00) oportunidade de verificar, entretanto, o desvio mdio no pode ser considerado uma
perda de tempo, pois, na pior das hipteses, ele oferece-nos uma boa base para a com-
Distribuio (a) Distribuio (b) Distribuio (c) preenso da natureza do desvio padro.
X ixl X lxl X lxl Em discusses anteriores, vimos que o desvio mdio evita o problema de nmeros ne-
CrS Cr$ Cr$ gativos que cancelam os positivos; isso foi conseguido graas conveno de ignorarem-se
os sinais "mais" ( +) e "menos" (-), somando, em seguida, os valores absolutos dos
340 o 391 . +51 595 +255
374 +34 510 +170 desvios com relao mdia. Tal procedimento par~ a criao de uma medida de variabi-
340 o
340 o 357 +17 425 + 85 lidade tem a ntida desvantagem de impedir que esses valores absolutos sejam sempre
340' o 340 o 340 o teis em anlises estatsticas mais avanadas (pois eles no comportam facilmente
340 o 323 -17 255 - 85 manipulaes algbricas).
340 o 306 -34 170 -170
340 o 289 - 51 85 -255 Para superar esse problema e obter uma medida de variabilidade que seja mais
Llxl =O L lxl = 204 L lxl = 1.020 conveniente (isto , ajustada, "usvel") em procedimentos estatsticos avanados,
podemos elevar ao quadrado as discrepncias reais (com os respectivos sinais) e som-las
X Cr$340 x= &$34o X = Cr$340 a seguir (Lx 2 ) . Como ilustrado na Tabela 5. 2, esse procedimento permite " fugir"
AT Cr$0 AT = Cr$102 AT = ' Cr$510 influncia dos sinais, j que o qwidrado de qualquer nmero sempre positivo.
DM Cr$0 DM = Cr$ 29,14 DM = Cr$145,71
Aps termos somado os quadrados das discrepncias, podemos dividir o total por
Nenhuma Pouca Muita N, a fim de garantir uma eqidistribuio desse resultado (total) relativamente a todos
Variabilidade Variabilidade Variabilidade os escores envolvidos. O valor que se obtm dessa operao conhecido pelo nome de
64 DESCRIO Medidas de Variabilidade 65

mdia quadrtica* (ou mdia das discrepncias ao quadrado). (Nota-Recorde-se que desvio padro
procedimento semelhante foi adotado no clculo do desvio mdio, quando ~ lx I foi soma das discrepncias ao quadrado
dividido por N.) Continuando com a ilustrao da Tabela 5. 2, vemos que total de escores da distribuio.

~x 2 52 Para resumir: o procedimento para o clculo do desvio padro no difere muito


- = - = 867
N 6 ' do mtodo que vimos anteriormente para o clculo do desvio mdio. Com referncia
ao exemplo presente, os seguintes passos devem ser seguidos:
TABELA 5.2 Elevao de Discrepncias ao Quadrado para a Eliminao de Nmeros Negativos.
(Dados da Tabela S. 1)
PASSO 1: Calcular a mdia da distribuio.
X X x2

X
9 +4 . .. 16
8 +3 9 9
6 +1 1 ~X
8 X
4
2
-1
-3
1
9 tJ p/2./J; y c /11 6
4 30
N

1 -4 16 6
~
2
~X= 0 ~x2 =52 1 5
~X= 30
Surge, agora, um problema adicional. Como consequencia direta do fato de
termos elevado as discrepncias ao quadrado, a unidade de medida sofreu uma altera-
o, o que dificulta a interpretao do resultado 8,67. De fato, temos 8,67, mas 8,67 PASSO 2: Subtrair de cada escore bruto o valor da mdia da distribuio para, dessa
unidades de qu? Com vistas, ento, a voltar unidade de medida original, extramos forma, obterem-se as discrepncias.
a raiz quadrada da mdia quadrtica, donde resulta:

fYX2 =
'VN . '867 =
yo,o1 2, 94 X X

Podemos agora definir o desvio padro-resultado das operaes atrs realiza- 9 +4


8 +3
das-como sendo a raiz quadrada da mdia das discrepncias ao quadrado. Indicando 6 +1
o desvio padro por DP ou pela letra grega minscula a** (sigma), vem: 4 -1
2 -3
-4
a=
fYX2
'JN onde
PASSO 3: Elevar ao quadrado cada discrepncia e som-las.
,. N.T.: Na verdade, a mdia quadrtica muito mais conhecida pelo nome de varincia. Em

~xN
2
smbolos, S 2 (X)= , onde s 2 (X) representa a varincia. s vezes, em lugar de S 2 (X) aparece) X X x2
. I
2
<?- (X); quando tal ocorrer, interprete-se assim: S (X) a varincia da amostra e <1' (X), da popula9o. 9 +4 16
u N.T. :. Releia-se a nota de rodap anterior . O que ficou dito relativamente varincia tambm 8 +3 9
va le para o desvio padro. Observe-se, ainda, que o Autor no faz, a esta altura, nenhuma distino 6 +1 1
na maneira de notar o desvio padro, quer seja ele calculado para uma populao, quer para uma 4 -1 1
umostra. Essa distino ser feita, entretanto, no Captulo 7. Mais uma observao: o desvio padro 2 -3 9
pode ser definido como sendo a raiz quadrada positiva da varincia. Assim: -4 16
Th2 = 52
+v'\!arincia = Desvio padro.
66 DESCRIO Medidas de Variabilidade 67

PASSO 4: Dividir por N e extrair a raiz quadrada do resultado.


X

R : Ps2- = '867=
9 ~X
8 X 30 = 5
cr = = yo,oJ 294
, N 6
6 6
. 4
x2
Podemos agra dizer que o desvio padro do conjunto de escores 9, 8, 6, 4, 2 e 1 2 25
1
2,94.
~X= 30

Frmula para o Clculo do Desvio Padro a Partir de Dados Brutos


At este ponto, a nica frmula usada para o clculo do desvio padro tem sido y~x /N.
2

PASSO 3: "Entrar" com os resultados dos Passos 1 e 2 na frmula.


No caso particular de estar disponvel uma mquina de calcular, h um mtodo mais
fcil de obter-se o DP- um mtodo que prescinde das discrepncias e que trabalha
diretamente com os dados brutos. ~ -- -y/lNX2
v
- xz = j202
6 - 25 = -v33
I ,67- 25, 00
A frmula desse novo mtodo

= 2,94

Como podemos observar acima, a aplicao da nova frmula aos dados da Tabela
onde 5.2 produz uma resposta idntica obtida com o mtodo original.
desvio padro
soma dos quadrados dos escores brutos (Importante: primeiro, elevar Clculo do Desvio Padro (DP) de uma Distribuio de Freqncias com Dados Isolados
cada escore bruto ao quadrado; depois, efetuar a soma.) Para obter-se o desvio padro de uma distribuio de freq~cias com dados isolados,
nmero total de escores aplique-se a frmula
mdia aritmtica ao quadrado.

O procedimento passo a passo para o clculo do DP mediante a aplicao da


frmula anterior pode ser ilustrado a partir dos dados da Tabela 5. 2.
Vamos, a ttulo de ilustrao, calcular o desvio padro da seguinte distribuio:
PASSO 1: Quadrar (isto , elevar ao quadrado) cada escore bruto separadamente e
somar.
Escores f
X x2 7 1
6 2
9 81 5 3
8 64 4 5
6 36 3 2
4 16 2 2
2 4 1 1
N = 16
~2 = 202

PASSO 2: Calcular a mdia aritmtica e elev-la ao quadrado. PASSO 1 : Multiplicar cada escore (X) pela respectiva freqncia (f), a fim de obter [X.
,.,
' ' I f ~~

68 DESCRIO LL , .Me(iidas de Varibilidade


\ LL~ J ~Ar.
j .
69

Significado do Desvio Padro


X f [X
Essa srie de passos para o clculo do desvio padro pode deixar o aluno com uma
desagradvel sensao relacionada com o significado de seu resultado. Por exemplo,
7 1 7
2 12
suponham que, numa particular distribuio de escores, o desvio padro seja 4 (a = 4).
6
5 3 15 Que indica esse nmero? O que, exatamente, podemos dizer agora a respeito dessa
4 5 20 distribuio que no poderamos ter dito antes?
3 2 6 O captulo seguinte tentar elucidar o significado concreto do desvio padro.
2 2 4 Por ora, estabeleamos sumariamente que o desvio padro (como o desvio mdio)
1
representa a "variabilidade mdia" de uma distribuio, j que ele mede a mdia de
discrepncias (desvios) com relao a X . Os procedimentos de quadrar e extrair a raiz
PASSO 2: Multiplicar cada fX _pelo respectivo X, a fim de obter [}{2. Em seguida, quadrada tambm entram no problema, mas basicamente no sentido de eliminar os
somar tudo para obter 'E,f}{2. sinais de "menos" e voltar a uma unidade de medida mais conveniente, vale dizer, a
unidade de medida dos dados brutos.
X [X [X2 Observamos tambm que quanto maior a variabilidade em torno da mdia de
uma distribuio, maior o desvio padro. Assim, a = 4,5 indica maior variabilidade
que a = 2,5. Por exemplo, a distribuio da temperatura diria em Houston (Texas)
7 7 49
6 12 72 tem um desvio padro maior do que o da distribuio da temperatura diria, no mesmo
5 15 75 perodo, em Honolulu (Hava).
4 20 80 Se desejssemos estudar a distncia que separa uma mesa da parede da sala de
3 6 18 estar, poderamos pensar em termos de centmetros ou metros como unidade de medi-
2 4 8
da. (Por exemplo, "a mesa da sala de estar dista 5 metros desta parede".) Mas como
1 1 1
medir a extenso da linha de base de um polgono de freqncias, onde estejam regis-
'i:,[X2 = 303
trados os escores de um grupo de respondentes-escores classificados em ordem cres-
cente? Ainda com relao ao mesmo assunto, que mtodo usar para encontrar a dis-
PASSO 3: Calcular a mdia aritmtica e elev-la ao quadrado. tncia entre qualquer escore bruto e a mdia de distribuio- mtodo padronizado que
nos possibilitasse fazer comparaes entre escores brutos da mesma distribuio ou
[X ' I entre escores de distribuies diferentes? Se estivssemos falando de mesas, poderamos
dizer que uma dista 5 metros da parede da sala de estar, enquanto que outra est a
7 10 metros da parede da cozinha. Do ponto de vista metros, dispomos de uma unidade
12 'i:,[X padronizada de medida e, portanto, podemos fazer tais comparaes de modo objetivo.
15 X
N Mas como proceder na comparao de escores brutos? Por exemplo, ser que sempre
20
6
65 ..f2 16,48 possvel comparar a nota 85- resultante de um exame de ingls-com a nota 80- resul-
4 16 tante de um de alemo? Qual dessas notas realmente mais alta? Um pouco de ateno
1 4,06 vai demonstrar que isso depende fundamentalmente da maneira como se saram os
- outros alunos em cada uma dessas disciplinas.
'i:.[X = 65
Uma forma de obter-se um indicador grosseiro da extenso (largura) de uma
linha de base calcular a amplitude total, uma vez que ela fornece a distncia entre
PASSO 4: "Entrar" com os resultados dos Passos 1, 2 e 3 na frmula. o escore mais alto e o mais baixo. Tal medida porm no serve para localizar, com
eficcia, um escore particular com relao mdia, pois-deixando de lado outras

u- = ~ Ir; 2
_ x2 =)
3
: -
1
16,48 = y18,94- 16,48 =
fragilidades dessa medida-ela cobre toda a extenso da linha de base. Em contraposio,
o "tamanho" do desvio padro menor do que o da amplitude total e geralmente cobre
muito menos do que toda a extenso da linha de base.
Da mesma forma que medimos o tamanho de um tapete em metros ou centme-
= v'2,46 1,57 tros, tambm podemos medir a linha de base em unidades de desvio padro.(isto , em
70 DESCRIO
Medidas de Variabilidade 71

ponto importante: enquanto que metros, centmetros sempre tm tamanho constante,


o valor do desvio padro varia de distribuio para distribuio. Alis, se no fosse
assim, no poderamos usar o desvio padro-como ilustramos pginas atrs-na compa-
rao de distribuies quanto sua variabilidade (por exemplo, DP ==Cr$ 85.000,00 para
a distribuio da renda de professores secundrios; DP ==Cr$ 255 .000,00 para a distribui-
o da renda de larpios). Por essa razo, precisamos calcular o "tamanho" do desvio
padro de todas as distribuies com que estejamos trabalhando. Tambm em conse-
qncia deste fato, geralmente mais difcil compreender o significado do desvio
65 70 75 80 85 90 95 padro, em contraste com o significado de metros ou centmetros como unidades de
-3a - 2a -la X +la +2a +3a mensurao. No captulo seguinte voltaremos a examinar o conceito de desvio padro.

FIGURA 5.2 Mensurao da Linha de Base ~m Unidades de Desvio Padro. (Neste exemplo, o
desvio padro (a) 5 e a mdia (X) 80)
COMPARAO ENTRE AMPLITUDE TOTAL, DESVIO MDIO E DESVIO PADRO
A amplitude total pode ser considerada um mero ndice preliminar ou grosseiro da va-
unidades "sigma"). Por exemplo, poderamos somar um desvio padro ao valor da riabilidade de uma distribuio. Sua obteno rpida e fcil; todavia, ela no muito
mdia, a fim de determinar qual escore bruto localiza-se a exatamente um desvio padro "confivel". Pode ser aplicada a dados intervalares ou ordinais.
dela (isto , um e!core bruto distante da mdia um sigma). Como ficou demonstrado A amplitude total tem utilidade no que diz respeito ao clculo do desvio padro.
na Figura 5.2, se X == 80 e DP == 5, ento o escore bruto 85 fica a exatamente um desvio A Figura 5. 2 ilustra que seis desvios padres cobrem quase que inteiramente a distncia
padro acima da mdia (80 + 5 == 85); isso equivale a dizer que o escore 85 dista dela que vai desde o menor escore at o maior numa distribuio (de -3a a +3a). Esse fato
+la. Essa direo "mais" (+) porque todas as discrepncias acima da mdia so isolado j nos d um mtodo conveniente para estimar (mas no calcular) o desvio
positivas; todas as discrepncias abaixo da mdia so "menos" (- ) ou negativas. padro. De modo geral, o tamanho do desvio padro cerca de um sexto ( 16 ) do
Podemos continuar "graduando" a linha de base mediante a adio de mais um tamanho da amplitude total. Por exemplo, se a amplitude total for 36, espera-se que
desvio padro ao escore bruto 85. Tal procedimento d-nos o escore bruto 90, que se o DP caia bem perto de 6; se a amplitude total for 6, o DP deve de estar prximo de 1.
situa a exatamente dois desvios padres acima da mdia (85 + 5 == 90). Por igual pro- Essa regra pode assumir considervel importncia aos olhos do aluno que deseja
cedimento, adiciona-s~ um desvio padro ao escore bruto 90 e obtemos 95-que repre- " testar" se seu resultado tem grande probabilidade de estar correto. Tomemos um caso
senta o escore bruto localizado a exatamente trs desvios padres acima da mdia. extremo: se AT == 10 e o DP (calculado)== 12, devemos ter cometido algum erro, pois o
Para contin~r esse processo do "lado negativo" (abaixo da mdia), vamos subtraindo, DP no pode ser maior que a amplitude total. Uma nota de alerta: a regra do "um
a partir de X, um desvio padro, dois desvios padres etc., donde resulta: 75 (localizado sexto" s se aplica a distribuies compostas de grande nmero de escores. Quando
a - 1a), 70 (localizado a - 2a), e assim por diante. o nmero de escores for pequeno, via de regra, haver necessidade de menos desvios
Como bem ilustra a Figura 5.3, o processo de medir a linha de base em unidades padres para cobrir toda a amplitude da distribuio.
de desvio padro , em muitos aspectos, semelhante mensurao da distncia em metros Enquanto que a amplitude total calculada a partir de apenas dois escores, tanto
entre uma mesa e uma dada parede. No entanto, a analogia falha em pelo menos um o desvio padro quanto o desvio mdio levam em conta todos os escores da distribuio.
Apesar da sua relativa estabilidade, o desvio mdio no muito usado em pesquisa,
uma vez que ele no se presta a muitas anlises estatsticas avanadas. Por outro lado,

(a) r=r- 2 metros ----+- .


o clculo do desvio padro implica a utilizao de um procedimento aceitvel do ponto
de vista matemtico, com vistas a contornar o problema dos sinais ( +; -): quadrar as
discrepncias em vez de simplesmente ignorar os sinais. Como resultado, o desvio padro
acabou por tomar-se o passo inicial na obteno de certas medidas estatsticas, em par-
ticular no terreno das inferncias. Essa caracterstica do desvio padro ser explorada
em detalhes em captulos subseqentes, especialmente nos de nmeros 6 e 7.
(b) X = 90 - -- + 2a - - - .- X = 80 a == 5 unidades de escore bruto Apesar da sua utilidade como medida de disperso "confivel", o desvio padro
tambm apresenta algumas desvantagens. Comparado com outras medidas de variabili-
FIGURA 5.3 Mensurao de Distncias: (a) entre uma mesa e uma parede, onde a unidade de dade, seu clculo no s difcil como demorado. Todavia, essas desvantagens esto
medida usada o metro; (b) entre um escore bruto e a mdia da distribuio, onde dia a dia sendo superadas pelo crescente uso ou .de mquinas de calcular de alta veloci-
a unidade de medida vem expressa em unidades de desvio padro dade ou de computadores programados para a execuo de anlises estatsticas. O desvio
72 DESCRIO Medidas de Variabilidade 73

padro (da mesma forma que o desvio mdio) tambm tem a caracterstica de ser uma
medida intervalar, donde decorre que sua utilizao toma-se impossvel com dados X= ponto mdio f fX
nominais ou intervalares-via de regra utilizados no traballio de muitos pesquisadores.
9 5 45 = 159
CLCULO DA AMPLITUDE TOTAL, DO DESVIO MDIO E DO DESVIO PADRO 6 4 24 17
DE DADOS AGRUPADOS 3 2 6
'i:-fX = 159 = 9,35
Estejam os dados agrupados ou no, a amplitude total sempre a diferena entre o
maior e o menor escore. Seu clculo no requer o uso de nenhum mtodo especial ou PASSO 3: Calcular o desvio (= a discrepncia) de cada ponto mdio com relao
fnnula. mdia.
Com o propsito de ilustrar passo a passo o procedimento para a obteno do
desvio mdio numa distribuio de freqncias com dados agrupados, considere-se a X= Ponto Mdio X - X= lxl
seguinte tabela*:
18 8,65
Intervalo 15 5,65
de Classe f 12 2,65
9 0,35
17- 19 6 3,35
14-16 3 6,35
2
11-13 3
8- 10 5
5- 7 4
PASSO 4 : Multiplicar cada discrepncia pela freqncia correspondente ao intervalo
2- 4 _J. de classe e, em seguida, somar esses produtos.
N = 17
Intervalo f x fx
PASSO 1: Calcular o ponto mdio de cada intervalo de classe.
17- 19 1 8,65 8,65
14-1 6 2 5,65 11 ,30
Intervalo X= Ponto Mdio 11- 13 3 . 2,65 7,95
8-10 5 0,35 1,75
5-7 4 3,35 13,40
17- 19 18 2-4 2 6,35 12,70
14- 16 15
11 - 13 12 N = 17 Lf X = 55,75
8-1 0 9
5-7 6
2-4 3 PASSO 5: Dividir por N.

PASSO 2: Determinar a mdia da distribuio. 'i:-flxl 55,75


DM= 3,28
N 17
X= ponto mdio f fX
Chegamos, assim, a um desvio mdio de 3,28.
18 1 18 Para o clculo do desvio padro de dados agrupados, podemos usar uma fnnula
15 2 30 X
= 'i:,fX
12 N que se utiliza apenas dos dados brutos da tabela inicial. Em str~bolos, temos:
3 36

N.T. : sempre interessante especificar, na coluna onde figuram os intervalos de classe, a unidade
om que a varivel foi mensurada.
74 DESCRIO
Medidas de Variabilidade 75
onde
PASSO 3: Multiplicar cada ponto mdio por fX e somar esses produtos.
a desvio padro
Intervalo de Ponto
f freqncias dos intervalos de classe Classe f mdio (X) /X /X
2
X ponto mdio de cada intervalo de classe
N nmero total de escores 17- 19 1 18 18 324
r quadrado da mdia (aritmtica). 14- 16
11-13
2
3
15
12
30
36
450
432
8-10 5 9 45 405
5- 7 4 6 24 144
2-4 2 3 6 18
O procedimento passo a passo para o clculo do desvio padro pode ser ilustrado "f.JX2 = 1773
por exemplo, com relao seguinte tabela de dados agrupados: '
PASSO 4 : "Entrar" com os resultados dos Passos 2 e 3 na frmula.
Intervalo
~2-r:- - x 2 = ) 1 ~~3 _ 87,42
2
de Classe f o-= = "1104,29- 87,42
17- 19 1
14- 16 2
11 - 13 3 = V'l6,87 = 4,11
8- 10 5
5- 7 4 O desvio padro, conforme sugere a prpria frmula, 4, 11 .
2- 4 2
RESUMO
Introduzimos, neste captulo, o conceito de amplitude t9tal, de desvio mdio e de
desvio padro-que so trs medidas de variabilidade ou, para dizer de outra forma,
PASSO 1 : Multiplicar cada ponto mdio pela freqncia do intervalo de classe cor-
respondente e somar esses produtos. medidas que "mostram" a maneira como os escores agrupam-se em torno do centro
da distribuio. A amplitude total foi definida como um indicador de variabilidade
rpido e grosseiro, facilmente calculada a partir da diferena entre o maior e o menor
Intervalo de Classe f Ponto Mdio (X) escore da distribuio. O desvio mdio-ou seja, a soma dos valores absolutos das dis-
/X
17- 19 crepncias (desvios), dividida por N- foi, desde o incio, tratado como uma medida
18 18
14-16 2 15
inadequada de variao, do ponto de vista matemtico, apesar de constituir slida base
30
11 - 13 3 12 para a compreenso do desvio padro; este, por sua vez, foi definido como .sendo a
36
8-10 5 9 raiz quadrada da varincia da distribuio. O desvio padro _uma medida de variabi-
45
5- 7 4 6 lidade confivel, de nvel intervalar, que pode ser utilizada em operaes estatsticas
24
2- 4 _l 3 _6 avanadas, descritivas ou inferenciais. O significado amplo do desvio padro ser
N = 17 "f.[X = 159 objeto de estudos posteriores: nas discusses relacionadas com a curva normal e nas
generalizaes de amostras para populaes.

PASSO 2: Calcular a mdia aritmtica e elev-la ao quadrado. PROBLEMAS


"f.[X 159 1. Um grupo de 5 estudantes obteve as seguintes notas de exame, numa escala de
X l i = l7 = 9,35 10 pontos: 7, 5, 3, 2 e 1. Relativamente a esse conjunto de escores, calcule (a) a
amplitude total; (b) o desvio mdio; (c) o desvio padro.
87,42 2. Numa escala destinada a mensurar atitudes para com o problema da segregao
racial, duas classes de universitrios obtiveram os seguintes pontos:
76 DESCRIO
Medidas de Variabilidade 77

Classe A 8. Calcule 0 desvio padro relativo seguinte distribuio freqencial de escores:


Classe B

4 3 X f tiNJVERSlDADE fTDERAL DO PARA


6 3 Bl!3L10TECA. CENTl~AL
2 2 10 2
1 9 5
4 8 8
2 7 7
6 4
5 3
Compare a variabilidade de atitudes relativamente segregao racial entre os N = 29
membros das classes A e B mediante a determinao do seguinte: (a) amplitude
9. Calcule relativamente seguinte tabela de dados agrupados por freqncias, (a) a
total para cada classe; (b) o desvio mdio dos escores de cada classe; (c) o desvio
padro de cada classe. Qual das classes apresenta maior variabilidade de atitudes?
amplit~de total; (b) o desvio mdio; (c) o desvio padro.
3. Para o seguinte grupo de escores: 3, 5, 5, 4, I, calcule (a) a amplitude total; (b) o Intervalo de Classe f
desvio mdio; (c) o desvio padro.
90-99 6
80- 89 8
4. Dado o conjunto de escores: I, 6, 6, 3, 7, 4, IO, calcule o desvio padro.
70- 79 4
60-69 3
5. Dado o conjunto de escores: I2, I2, IO, 9, 8, calcule o desvio padro. 50- 59 2
N = 23
6. Calcule o desvio padro relativo seguinte distribuio freqencial de escores:
10. Relativamente seguinte tabela de dados agrupados por freqncias, calcule: (a) a
amplitude total; (b) o desvio mdio; (c) o desvio padrq.
X f
5 Intervalo de Classe f
3
4 5
3 17- 19 2
6
2 14-16 3
2
1 . 11-13 6
2
8-10 5
N = 18 5-7 1

I I. Relativamente seguinte tabela de dados agrupados por freqncias, calcule: (a) a


7. Calcule o desvio padro relativo seguinte distribuio freqencial de escores: amplitude total; (b) o desvio mdio; (c) o desvio padro.

Intervalo de Classe f
X f
20-24 2
7 2 15-19 4
6 3 10- 14 8
5 5 5-9 5
4 7
3 N = 19
4
2 3
1 1
N = 25
PARTE 11
Da Descrio
Tomada de Decises
6
A Curva Norm.al

Nos captulos anteriores, vimos que as distribuies de freqncias podem assumir


uma grande variedade de formas. Algumas so simtricas ou livres de alongamento;
outras so negativa ou positivamente alongadas; outras, ainda, apresentam-se com
mais de uma "corcova", e assim por diante. Apesar dessa grande diversidade, h uma
distribuio de freqncias com a qual muitos de ns j nos familiarizamos, se no por
outra razo, pelo fato de termos sido classificados de acordo com ela por nossos pro-
fessores. Essa distribuio, comumente chamada curva normal, um modelo terico
ou ideal que resulta muito mais de uma equao matemtica do que de um real de-
lineamento de pesquisa com posterior coleta de dados. 1 ,Entretanto, a utilidade da
curva normal para o pesquisador pode ser evidenciada atravs de suas aplicaes a
efetivas situaes de pesquisa.
Como veremos neste captulo, por exemplo, a curva normal pode ser usada na
descrio de distribuies de escores, na interpretao do desvio padro e em afirmaes
relacionadas com a noo de probabilidade. Em captulos subseqentes, veremos que a
curva normal constitui um ingrediente essencial para a tomada de decises estatsticas, a
partir da qual o pesquisador pode generalizar para populaes as concluses a que tenha
chegado ao lidar com amostras. Antes de prosseguirmos com a discusso de tcnicas para
tomada de decises, faz-se necessrio q~;~e conheamos alguns dados relacionados com
as propriedades da curva normal.

A curva normal pode ser construda a partir da seguinte frm:~la:

(X- X ) 2
N 2 0
Y = -- e onde

Y ordenada correspondente a um dado valor de X (isto , a ordenada representa a freqncia


com que X ocorre na distribuio)
rr = 3,1416
e = 2,7183
82 DA DESCRIO TOMADA DE DECISES A Curva Normal 83

CARACTERfSTICAS DA CURVA NORMAL


Como pode ser caracterizada a curva normal? Quais as propriedades que a distinguem de
outras distribuies? Tal como indica a Figura 6.1, a curva normal um tipo de curva
simtrica, suave, cuja forma lembra um sino e, por isso, amplamente conhecida por
"curva em sino". possvel que o aspecto mais marcante dessa curva seja a sua simetria
se :ctobrss~mos" a curva em seu ponto central (que corresponde freqncia mxima):
danamos ongem a duas metades, sendo que cada uma delas seria a imagem espelhada da
outra.*
Alm disso, a curva normal unimodal, isto , possui um s (pico ou) ponto de 130 140
freqncia mxima; esse ponto, por sua vez, aquele situado no meio da distribuio
(curva), em que a mdia, a mediana e a moda coincidem. (Recorde-se que, conforme o FIGURA 6.2 Distribuio Hipottica de Quocientes de Inteligncia (Qis)
Captulo 3, a mdia, a mediana e a moda ocorrem em pontos diferentes (isto , no
coincidentes) numa distribuio alongada (assimtrica).) A partir do topo (central, exemplo, veramos que a maioria dos adultos estaria na faixa que vai de 15 2 em (aprox.)
arredondado), a curva normal "cai" gradualmente at formar as caudas (duas, uma de at 183 em (aprox.), com muito pouca gente menor que 15 2 em ou maior que 183 em.
cada lado), que se estendem de forma indefinida, aproximando-se cada vez mais da A Figura 6 .2 demonstra que o QI tambm seria previsvel-a maioria dos Qls situando-se
linha de base (eixo das abscissas) sem, entretanto, jamais toc-la.** entre 90 e 110; como podemos observar, h uma " descida" gradual dos escores para
ambas as caudas, com pouqussimos " gnios" que tm QI superior a 140 e, da mesma
CURVAS NORMAIS: O MODELO E O MUNDO REAL forma, pouqussimas criaturas menos privilegiadas, cujos Qls esto abaixo de 60. Por
Poderamos perguntar: at que ponto as distribuies de dados reais (ou seja, de dados igual raciocnio, relativamente poucos sujeitos poderiam ser considerados polticos
ooletados por pesquisadores ao longo de suas pesquisas) ajustam-se ou aproximam-se extremistas- de direita ou de esquerda- enquanto que a tendncia poltica da maioria
figura (ao formato) da curva normal? A ttulo de ilustrao, vamos imaginar que todos seria considerada moderada.
Finalmente, mesmo o desgaste dos pisos, resultante do fluxo de transeuntes, lembra a
os fenmenos sociais, psicolgicos e fsicos sejam normalmente distribudos. Como
seria esse mundo hipottico? distribuio normal: a maior parte do desgaste ocorre no centro dos pisos (degraus etc.),
enquanto que nos lados, medida que nos afastamos do centro, o desgaste vai-se tor-
Se atentssemos para as caractersticas fsicas dos seres humanos, estatura, por
nando cada vez menor. .
Os leitores tero, a esta altura, observado que o mundo hipottico da curva normal
no difere de forma radical do mundo "real" em que vivemos no momento. Fenmenos
tais como estatura, QI, orientao poltica, desgaste dos pisos etc. aproximam-se, na
~
,.,c:
I::S
prtica, at que muito bem da distribuio normal terica. Pelo fato de tantos fenme-
[ nos terem essa caracterstica-isto , pelo fato de ela ocorrer to freqentemente na
~ natureza (e por outras razes que logo se tornaro aparentes)-pesquisadores de diferen-
tes campos tm feito uso extensivo da curva normal, aplicando-a aos dados que eles
coletam e analisam.
Observe-se, porm, que alguns fenmenos no campo social- como em qualquer
outro-simplesmente no se ajustam noo terica da distribuio normal. Muitas
FIGURA 6.1 Formato da Curva Normal distribuies so assimtricas; outras tm mais de uma moda; outras so simtricas, mas
no tm a forma de " sino". Como exemplo concreto, consideremos a distribuio de
riqueza no mundo. fato bem conhecido que "os que tm" superam de longe "os que
~ N.T.: Essa "dobra" representa, de maneira mais formal, um eixo de simetria. Tomando-se esse
no tm" . Assim, como ilustra a Figura 6.3, a distribuio de riquezas (indicada pela
l'ixo como referncia, observa-se que a curva normal bicaudal. Ento, para retomar a idia do autor,
1:1zer que uma metade a imagem espelhada da outra o mesmo que dizer o seguinte: "dobrando-se" renda per capita) de extrema.assimetria (pelo menos na aparncia), de sorte que apenas
u curva em seu eixo de simetria, a cauda da esquerda ajusta-se (sobrepe-se) perfeitamente cauda uma pequena proporo da populao mundial recebe poro significativa da renda tptal.
tlu direita. De forma anloga, especialistas em demografia dizem-nos que os Estados Unidos da
u N.T.: Diz-se, por essa razo, que o c ampo de variao de uma distribuio normal estende-se de Amrica do Norte tomaram-se, nos ltimos tempos, uma terra de jovens e velhos. Do
ooa + oo ponto de vista econmico, essa distribuio de idades representa um fardo pesado
84 DA DESCRIO TOMADA DE DECISES A Curva Normal 85

20 Poderamos limitar uma poro dessa rea total se trassemos, a partir de dois
pontos quaisquer tomados na linha de base, segmentos perpendiculares at a prpria
15
., curva. Por exemplo, usando a mdia como ponto de partida, poderamos traar um
'J
.:
( Q)
segmento em X e um_ outro no ponto que coincide com 1 DP (1 distncia si~a) acima
:;::! 10
g' (isto , direita) de X. Esta poro sombreada da curva normal ilustrada na F1gura 6.5
~ abrange 34,13% da freqncia total.
5
Da mesma forma, podemos dizer que 47,72% dos sujeitos sob a curva norml!!
caem entre X e 2 DP acima ( direita) da mdia; igualmente, que 49,87% caem entre X
e 3 DP acima da mdia (ver Figura 6.6).
Como veremos mais adiante, uma proporo constante da rea total sob a curva
normal eair entre a mdia e qualquer distncia dada a contar de X - desde que a men-
Renda (em USS) surao seja feita em unidades de desvio padro. Esta afirmao verdadeira, indepen-
FIGURA 6.3 Distribuio da Renda "Per apita" (Naes do Mundo) dentemente da mdia e do desvio padro da distribuio particular que estejamos
estudando e aplica-se a todos e quaisquer dados que tenham distribuio normal. Assim,
a rea sob a curva normal compreendida entre X e 1 DP acima da mdia vai sempre
para um grupo relativamente pequeno de trabalhadores, isto porque, sendo todos
incluir 34,13% da totalidade dos dados, quer estejamos discutindo a distribuio de
cidados de meia-idade, tm a seu encargo um nmero assustador tanto de velhos
estaturas, de inteligncia, de filiao partidria ou de desgaste nos degraus das portas
(aposentados) quanto de jovens (ainda em perodo escolar).
entrada de nossas casas. O requisito bsico, em cada situao, que estejamos tra-
Naquelas circunstncias em que temos boas razes para esperar grandes diver-
balhando com escores que tenham realmente distribuio normal.
gncias da normalidade-como, por exemplo, no caso da idade e da renda-a curva
A natureza simtrica da curva normal leva-nos a tirar outra concluso impor-
normal no pode ser usada como "modelo" para os dados coletados. Vemos, assim,
tante: qualquer distncia medida em "sigmas", acima ou abaixo da mdia, contm
que no possvel aplic-la com liberdade a todas as distribuies que o pesquisador
a mesma poro da rea sob a curva. Ento, se 34,13% da rea total situam-se entre
obtm, e deve, .a o contrrio, ser usada com uma boa dose de bom senso. Felizmente
a mdia e 1 DP acima de X, tambm 34,13% da rea total situam-se entre a mdia e
os estatsticos sabem que grande quantidade de fenmenos de interesse segue o modelo
1 DP abaixo de X; se 4 7, 72% situam-se entfe a mdia e 2 DP acima de X, tambm
normal.
47,72% situam-se entre a mdia e 2DPabaixo de X; finalmente, se 49,87% situam-se
entre a mdia e 3 DP acima de X, tambm 49,8 7% situam-se entre a mdia e 3 DP
abaixo de X . Em out ras palavras, como ilustra a Figura 6.7, 68,26% da rea total sob
A REA SOB A CURVA NORMAL
a curva normal (34,13% + 34,13% = 68,26%) caem entre - la e +la, sendo a mdia
A fim de podermos empregar a curva normal na soluo de problemas, precisamos, antes, (aritmtica), X, o ponto de referncia; 95,44% da rea total (47,72% + 47 ,72%) caem
aprender o significado da expresso "re sob a curva normal": aquela poro do plano, entre - 2a e +2a a partir de X; 99,74% da rea total-que, alis, praticamente toda
compreendida entre a curva e a linha de base, que corresponde, em qualquer distribuio a rea sob a curva-caem entre -3a e +3a (sempre X como ponto de partida). Podemos
normal, a 100% dos dados considerados. A Figura 6.4 ilustra essa caracterstica.

FIGURA 6.5 Porcentagem da ~rea Total sob a Curva Normal Limitada por X e por um Desvio
FIGURA 6.4 A rea sob a Curva Normal Padro Acima de X
86 DA DESCRIO TOMADA DE DECISES A Curva Normal 87

X +2 a +3a 70 X= 100 130

l47,72%~
(- 3 a) (+ 3 a)

49,87% '----- - - -- - 99, 74%- - - -----'

FIGURA 6.6 Porcentagem da r~a Total sob a Curva Normal Limitada por X e por Dois Desvios FIGURA 6.8 Distribuio de Qls Masculinos
Padres Acima de X .

Neste caso especfico, vamos admitir que os Qls masculinos apresentem maior hetero-
geneidade do que os femininos; em outras palavras, a distribuio dos Qls masculinos
contm uma porcentagem maior de escores extremos-representativos de sujeitos
"'0:
'
brilhantes e de sujeitos medocres- enquanto ttue a distribuio de Qls femininos
<<I)
:;:s
C" contm uma porcentagem maior de escores localizados prximos mdia, isto , ao
Q)

~ redor do ponto de freqncia mxima, no centro.


Em virtude de o desvio padro ser uma medida de variabilidade, essas diferenas
ligadas a sexo deveriam refletir-se no valor do DP de cada distribuio de Qls. Podera-
mos, assim, verificar, por exemplo, que DP = 10 para sujeitos do sexo masculino e que
- 3a - 2a - la X + la + 2a +3 a DP = 5 para os do sexo feminino.

~:::~::_j
Se conhecssemos o desvio padro de cada conjunto de escores QI e admits-
1 1 1 semos que cada conjunto tivesse distribuio normal, poderamos estimar e, em seguida,
comparar as porcentagens de machos e fmeas localizadas numa dada amplitude de Qls.
99,74%

FIGURA 6.7 Porcentagens da rea Total sob a Curva Normal Compreendidas Entre J a, 2a e
3a

dizer, ento, que 6 DPs abarcam, para efeitos prticos, a totalidade dos dados sob
qualquer curva normal (mais de 99%).

TORNANDO A NOO DE DESVIO PADRO MAIS CLARA: UMA ILUSTRAO


Uma importante caracterstica da curva normal auxiliar na interpretao e compre-
enso do desvio padro. Para entendermos melhor essa caracterstica, vamos examinar 85 X = 100 115
(- 3 a ) (+ 3 a )
o que os antroplogos nos dizem a respeito de diferenas de Qls ligadas a sexo. Muito
embora isso contrarie a opinio dos chauvinistas, h provas de que homens e mulheres '---- - - - - 99,74%- - - -- --'
tm um QI mdio aproximadamente igual a 100. Diga-se tambm, de passagem, que
esses Qls diferem acentuadamente em termos de variabilidade em torno da mdia. FIGURA 6.9 Distribuio de Qls Femininos
88 DA DESCRIO TOMADA DE DECISES A Curva Normal 89

Por exemplo, se medirmos a linha base da distribuio de Qis masculinos em a partir da mdia, deveria incluir mais de 34,13%, porm menos de 47,72% do total da
unidades DP (desvio padro), ficaremos sabendo que 68,26% dos escores caem entre rea sob a curva normal.
-1 a e + 1a, a partir da mdia. Como o desvio padro sempre expresso em unidades Para calcular a porcentagem exata (dos sujeitos que caem dentro) desse intervalo,
brutas e a = 10, automaticamente descobrimos onde se localizam, na distribuio, os devemos empregar a Tabela B do final do livro, tabela essa que fornece a porcentagem
escores 90 e 100 (ou seja: X a =X; portanto 100- 10 = 90 e 100 + 10 = 110). sob a curva normal entre a mdia e diversas distncias sigmas (medidas a partir de X).
Desse modo, 68,25% dos representantes do sexo masculino tero, nas condies propos- Tais distncias sigmas (de 0,0 a 5,0) aparecem na coluna do lado esquerdo da Tabela B
tas, Qls situados entre 90 e 110. e foram calculadas at a primeira casa decimal. A segunda casa decimal aparece na
Distanciando-nos progressivamente de X no sentido das caudas, verificamos, tal primeira linha, no topo da tabela.
como ilustra a Figura 6.8, que 99,74%, isto , a quase totalidade dos sujeitos (machos), Observe-se que a simetria da curva normal torna possvel calcular as porcentagens
tem Qls entre 70 e 130 (entre -3a e +3a). para apenas um dos lados* da mdia, ou seja, relativamente metade da rea da curva
Da mesma forma, se examinarmos, a seguir, a distribuio dos Qls femininos-tal (50%). Os valores da Tabela B correspondem a qualquer dos lados.** Abaixo figura um
como vem ilustrado na Figura 6.9- verificaremos que 99,74% dos dados cairo entre os extrato dessa tabela.
escores (Qis) 85 e 115 (tambm entre - 3a e +3a). Assim, se compararmos as duas
distribuies, veremos que a dos Qis femininos apresenta-se relativamente homognea, z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
uma vez que possui menor proporo de escores extremos em ambas as caudas. Tal
diferena reflete-se no " tamanho relativo" de cada DP, e nos escores Qls que caem 0,0 00,00 00,40 00,80 01,20 01,60 01 ,99 02,39 02,79 03 ,19 03,59
0,1 03,98 04,38 04,78 05,17 05,57 05 ,96 06,36 06,75 07,14 07,53
entre -3a e +3a, a contar da mdia. 0,2 07,93 08,32 08,71 09,10 09,48 09,87 10,26 10,64 11 ,03 11,41
0,3 11 ,79 12,1 7 12,55 12,93 13,31 13,68 14,06 14,43 14,80 15,17
0,4 15,54 15,91 16,28 16,64 17,00 17,36 17,72 18,08 18,44 18,79
USO DA TABELA B
Na discusso da distribuio normar' lidamos, at este ponto, apenas com aquelas distn- Para aprender a usar e entender a Tabela B, poderamos, primeiro, tentar localizar
cias, contadas a partir da mdia, que so mltiplos exatos do desvio padro. Em outras a porcentagem de dados situados entre uma distncia sigma igual a 1,O e a mdia. (A
palavras, at aqui s trabalhamo~ com DPs iguais a 1, 2 ou 3, acima ou abaixo de X. razo disso . simples: j sabemos que 34,13% da rea total caem entre esses dois pontos
O problema que se coloca agora o seguinte: que devemos fazer para determinar a na linha base.) Ao observar a Tabela B. verificamos que, de fato, ela indica que 34,13%
porcentagem de sujeitos que se situam entre duas quaisquer ordenadas (no expressas da freqncia total caem entre a mdia e uma distncia sigma igual a 1,00. Da mesma
por nmeros inteiros)? Por exemplo, suponha o leitor que desejemos estabelecer a forma, vemos que a distncia sigma igual a 2,00 abarca exatamente 4 7,12% da rea
porcentagem da freqncia total que cai entre a mdia e, digamos, um escore bruto total sob a curva, enquanto que a distncia sigma igual a 2,01 corresponde a 4 7, 78%
localizado a 1,40 DPs acima da mdia. Como bem demonstra a Figura 6.10, um escore dessa rea total.
bruto situado a 1,40 DPs acima da mdia obviamente maior que 1 DP, porm menor
que 2 DPs-contados, ambos a partir de X. Sabemos, assim, que essa distncia, calculada ESCORES PADRONIZADOS E A CURVA NORMAL
Estamos agora preparados para calcular a porcentagem da rea total, sob a curva normal,
associada a qualquer distncia sigma que seja tomada a partir da mdia. Entretanto,
ainda resta uma questo importante por responder: como determinamos a distncia
sigma de qualquer escore dado? Em outras palavras, como fazemos para traduzir nosso
escore bruto-aquele que foi originalmente colhido no contato com os respondentes,
por exemplo- em unidades' de desvio padro? Se desejssemos traduzir ps em jardas,
simplesmente dividiramos o nmero de ps por 3, uma vez que h 3 ps numa jarda.***
Da mesma forma, se estivssemos traduzindo minutos em horas, dividiramos o nmero
de minutos por 60, j que h 60 minutos em cada hora. De maneira idntica, podemos

* N. T.: Por questo de comodidade, o lado escolhido o da direita, j que, assim, nenhum valor
+1,40 a precisa vir antecedido de sinal.
** N.T. : Observe-se o que ficou dito na N. do T. anterior.
FIGURA 6.1 O Localizao de um Escore (Bruto) Localizado a 1 ,40 DPs Acima de X *** N.T.: 1 p=30,48 cm.l jarda =3 ps e, portanto, igual a 3(30,48 em) =91,44 em.
90 DA DESCRIO TOMADA DE DECISES A Curva Normal 91

traduzir qualquer escore bruto em unidades de desvio padro, dividindo a distncia* x escore-diferena ou escore-discrepncia
que separa esse escore da mdia (X) pelo desvio padro da distribuio. Para ilustrar: a desvio padro da distribuio
vamos imaginar um escore bruto igual a 6 numa distribuio cuja mdia = 3 e cujo z escore padronizado
desvio padro = 2. Calculando-se a diferena entre esse escore bruto e a mdia, obtm-se
um escore-diferena representado por (6 - 3); esse clculo simples mostra que um Exemplo 1
escore bruto igual a 6 est a 3 unidades acima da mdia-sendo que essa " medida" Vamos estudar a distribuio da renda anual de uma cidade norte-americana. A renda
tambm expressa em escores brutos. Se dividirmos esse escore-diferena (discrepncia) anual mdia de US$5.000 e o desvio padro, US $ 1.500. Admitindo-se que a distri-
pelo desvio padro, que igual a 2, veremos que o escore bruto "6" est a 1,5 (um e meio) buio da renda anual tenha distribuio normal, podemos traduzir um escore bruto
desvios padres acima da mdia. Em outras palavras, a distncia sigma de um escore de, por exemplo, US $7.000 em escore padro do seguinte modo:
igual a 6, nesta distribuio particular, 1,5. Note-se que, independentemente da "situa-
o de mensurao", sempre h 3 ps numa jarda e 60 minutos numa hora. A constncia 7.000 - 5.000
z = +1,33
que caracteriza todas essas medidas padronizadas no se aplica ao desvio padro, uma 1.500
vez que ele varia de distribuio para distribuio. Por essa razo, precisamos conhecer
o desvio padro de uma distribuio ou por clculo ou por estimativa ou por informao Vemos, assim, que uma renda anual de US $7.000 corresponde a um 1,33 desvios
de terceiros sempre que tenhamos em mente traduzir um determinado escore bruto em padres acima da mdia anual de US $ 5.000 (ver Figura 6.12).
unidades de desvio padro.
O processo que acabamos de ilustrar-ou seja, o clculo da distncia sigma a partir Exemplo 2
de X - produz um valor chamado escore z ou escore padronizado, que indica, em unida- Ao trabalhar com uma distribuio normal de escores representativos do grau de conten-
des de desvio padro, o sentido e o grau com que um dado escore bruto se afasta da tamento manifestado por um grupo de inquilinos beneficirios do servio pblico de
mdia da distribuio qual ele pertence. (Observe-se que a coluna do lado. esquerdo habitao, vamos supor que X = 1O e DP = 2. (Por conveno, quanto maior o escore,
da Tabela B no fim do livro vem encimada com z.) Assim, um escore z de + 1,4 indica maior a satisfao advinda do servio pblico.) Para determinarmos quantos desvios
que o escore bruto fica a 1,4 DPs (ou quase 11/ 2 DPs) direita (acima) da mdia, en- padres um escore igual a 3 dista da mdia (X = 10), a primeira coisa que devemos
quanto que um escore z de -2, 1 significa que o escore bruto correspondente cai fazer obter a diferena entre esse escore e X. Assim:
esquerda (abaixo) da mdia, num ponto ligeiramente superior a 2 DPs (ver Figura 6.11).
Obtemos um escore z atravs do clculo do escore-diferena (x =X- X)-que d z = X - X = 3 - 10 = -7
a distncia de um X qualquer at a mdia- e, ento, pela diviso dessa diferena por a.
Em smbolos: Dividindo, ento, o resultado pelo desvio padro, vem:
X - X X
z -
a
ou
a
, onde
z = ~ =
a
-+ = -3,5

Portanto, como bem demonstra a Figura 6.13, um escore bruto de 3, nessa distribuio,
cai a 3,5 desvios padres abaixo ( esquerda) da mdia.
Nota: conhecendo-se um escore z (padronizado), sempre possvel obter-se o
escore bruto equivalente mediante o emprego da seguinte frmula:

X = za +X
Entrando com os dados do presente exemplo nessa frmula, resulta:

z = +1,4 X = (- 3,5)(2) + 10 = - 7 + 10 = 3

FIGURA 6.1 I Posio dez= -2,1 e dez =+I ,4 Numa Distribuio Normal
PROBABILIDADE E CURVA NORMAL
'' N.T.: Essa distn cia entre o escore bruto e a mdia a prpria discrepncia. C'omo veremos a seguir, a curva normal pode ser usada em conjuno com os escores z
92 DA DESCRIO TOMADA DE DECISES A Curva Normal 93

$5.000 $7.000 3 10
z = +1,33 z = - 3,5

FIGURA 6. I 2 Posio dez =I ,33 (na Curva Normal), Relativa ao Escore Bruto US $ 7.000 FIGURA 6.1 3 Posio de z = -3,5 Relativa ao Escore Bruto = 3

(escores padronizados) e a Tabela B no clculo da probabilidade associada a qualquer da a mdia, onde se localizam os escores mais freqentes, e h, ainda, reas me-
dado de uma distribuio. No contexto presente, o termo probabilidade refere-se nores progressivamente mais prximas de ambas as extremidades (caudas), onde en-
freqncia relativa de ocorrncia de um dado ou evento qualquer; em outras palavras, contramos, em pequenas propores, escores muito altos ou muito baixos. Ento, em
a probabilidade associada a um evento qualquer o nmero de vezes que tal evento termos probabilsticos, podemos dizer que a probabilidade decresce medida que, na
pode ocorrer em relao ao nmero total de eventos. Redispondo os termos dessa linha de base, nos afastamos da mdia em ambos os sentidos. Desse modo, dizer que
definio: 68,26% da freqncia total sob a curva normal caem entre -1 a e + 1a, a partir da
mdia, o mesmo que dizer que a probabilidade de cerca de 68 em 100 de que um
Nmero de vezes que o dado escore bruto qualquer caia dentro desse intervalo ( -1 a 1-------1 +1a). De forma anloga,
Probabilidade de um dado ou evento pode ocorrer dizer que 95,44% da freqncia total sob a curva normal caem entre -2a e +2a, a
ou de um evento qualquer contar da mdia, o mesmo que dizer que a probabilida-de de aproximadamente
Nmero total de dados 95 em 100 de que um escore bruto qualquer venha a situar-se dentro desse intervalo
ou eventos ( -2a 1---l +2a) e assim por diante.
Assim, a probabilidade de extrair uma nica carta (digamos, um "s de espadas"), O que acabamos de fazer foi repetir precisamente o mesmo conceito de probabili-
de um mao embaralhado de 52 cartas, 1 em 52, uma vez que o evento "s de espadas" dade ou freqncia relativa que j estudamos quando extramos uma carta de um
s pode ocorrer uma vez no total (pois entre as 52 cartas s existe um "s de espadas"). baralho completo, quando jogamos uma moeda ou quando abrimos de forma aleatria
A probabilidade de obter-se "cara" com uma moeda honesta,* (ou perfeitamente balan- um livro numa pgina qualquer. Note-se, contudo, que as probabilidades associadas s
ceada), numa s jogada 1 em 2, j que "cara" s ocorre uma vez no conjunto total de reas sob a curva normal so sempre expressas com relao a 100%-que correspondem
possibilidades (2). Por igual raciocnio, se nos mandassem abrir um livro de 100 pginas rea total sob a curva (por exemplo, 68 em 100; 95 em 100; 99 em 100 e assim por
numa pgina qualquer (por exemplo, pg. 23), ** a probabilidade de conseguir, numa s diante). Por essa razo e para garantir que em todo o resto deste livro o termo seja
tentativa e aleatoriamente, abrir o livro naquela pgina s-eria de 1 em 100. entendido de modo padronizado, vamos sempre falar em probabilidade como sendo o
A curva normal uma distribuio na qual possvel determinar probabi- nmero de vezes que um dado evento pode ocorrer num conjunto de 100 repeties.
lidades associadas a todos os pontos da linha de base. Como j foi mencionado Assim, a probabilidade de sortear um s de espadas de um baralho bem misturado
anter_iormente, a curva normal uma distribuio de freqncias; a freqncia to- de 1,92 em 100 (-h); a probabilidade de tirar "cara" no lance de uma moeda de 50
tal sob a curva igual a 100%; essa curva apresenta uma rea central que crcun- em 100 (~). Note-se, alm disso, que usual expressar probabilidades sob a forma
decimal (P). Por exemplo, podemos dizer que P = 0,50- isto , U~0 )-de tirar "cara"
num s lance; analogamente, podemos dizer que P = 0,68- ou seja, ( 16~0 )-de que um
* N.T.: . Alm do termo "honesto"(a), muito comum em Estatstica, ocorrem, ainda: eqiprovvel, score bruto caia entre - la e +la sob a curva normal.
balanceado(a), na viesado(a). Expressa sob a forma de razo (quociente), a probabilidade ser sempre um
* * N.T.: Esse raciocnio falho! Se a idia for abrir o livro .na pgina 23, o mais "ingnuo" dos nrmero que oscila entre O e 1. A probabilidade de ocorrncia de um evento O quando
pesquisadores procurar abri-lo na " primeira metade" e, a, o 100 fica sem sentido. Melhor seria tamos absolutamente seguros de que ele no ocorrer; 1 quando estamos convenci
suprimir a sugesto quanto pgina, deixando apenas qualquer.
d s de que sem dvida nenhuma ele ocorrer. O problema que os pesquisadores nunca
94 DA DESCRIO TOMADA DE DECISES A Curva Normal 95

'
esto totalmente seguros a respeito de coisa alguma! Em conseqncia, podemos, via
de regra, esperar encontrar probabilidades iguais a 0,60, 0,25 ou 0,05; mas raras vezes
possvel esperar reduzir a probabilidade a O ou, por outro lado, elev-la a 1.
. Probabilidade de sair "cara" no primeiro lance
1
2

Uma caracterstica importante das probabilidades reside na regra da soma, que .lx
Probabilidade de sair "cara" no segundo lance 2
estabelece o seguinte : a probabilidade de ocorrncia de um evento qualquer, num con-
junto de alternativas, igual soma das probabilidades separadas. Suponham, por
exemplo, que desejemos encontrar a probabilidade de extrair, dum mao bem embara-
lhado de 52 cartas, ou o "s de espadas", ou a "rainha de ouros" ou o "rei de copas"
'
Probabilidade de sarem " caras" nas duas joga-
das sucessivas
f (isto , P = 0,25)
num nico lance. Pela soma das probabilidades isoladas-( h + h+ h)-verificamos que v
a probabilidade de obteno de qualquer dessas cartas, numa nica tentativa igual
FIGURA 6.15 Ilustrao da Regra da Multiplicao: Clculo da Probabilidade de Sarem " Caras" em
~ , ou seja, P = 0,06. Em outras palavras, temos 6 chances em 100 de obter, numa nica
2 Jogadas Sucessivas da Mesma Moeda
tentativa, ou um "s de espadas", ou uma "dama de ouros" ou um "rei de copas"
(ver Figura 6.14). a probabilidade de obteno de eventos mutuamente excludentes em srie igual ao
A regra da soma sempre pressupe que os eventos sejam mutuamente excludentes, produto das probabilidades separadas. Em lugar de "ou ... ou", a regra da multiplicao
em outras palavras, que dois eventos no podem jamais ocorrer em simultaneidade. sugere "primeiro, segundo, terceiro, ..."
Por exemplo, num baralho de 52 cartas, no possvel que, ao mesmo tempo, uma carta Por exemplo, qual a probabilidade de obter "cara" em duas jogadas sucessivas
seja de "espadas", de "ouros" e de "copas". Analogamente, uma moeda, jogada uma de uma moeda (isto , "cara" tanto no primeiro lance quanto no segundo)? Visto que
s vez, no pode produzir em conjunto "cara" e "coroa".. esses eventos so independentes, o evento relacionado com o primeiro lance no influen-
Admitida a mtua excluso de eventos, podemos dizer que as probabilidades cia o segundo. Na primeira jogada da moeda, a probabilidade de sair "cara" igual a ~
associadas a cada uma das possveis ocorrncias de um evento sempre tm 1 por soma. (ou seja, P = 0,50); na segunda jogada, a probabilidade desse mesmo evento ainda igual
Essa afirmao estabelece que algo tem que ocorrer. Se no sair "cara", sai "coroa"; se a ! (isto , P = 0,50). Portanto, a probabilidade de conseguirmos "cara" em dois lances
no for um "s", ser um "rei", "rainha", "valete", "dez" e por a afora. No lana- sucessivos de uma moeda igual a Ct )(t) =t (ouP = 0,25) (ver figura 6.15).
mento de uma moeda, a probabilidade de sair "cara" de ~ (isto , P = 0,50). Natural- Para aplicarmos o conceito precedente de probabili~ade com referncia curva
t
mente, a probabilidade de sair "coroa" tambm de (ou seja, P = 0,50). Ento, se normal, vamos voltar a um exemplo anterior. Recorde-se o leitor de que naquele proble-
somarmos as probabilidades relativas a todas as ocorrncias, verificaremos que a proba- ma relacionado com a distribuio de renda anual de uma cidade (norte-americana),
bilidade de sair "cara" ou "coroa" 1 (isto , t +f
= 1). um particular escore bruto teve de ser transformado no seu eqivalente z. Tal distribui-
Outra propriedade importante das probabilidades a regra da multiplicao: a, o de rendas tinha mdia de US$5.000 e desvio padro de US$1.500.
o problema consiste em determinar a probabilidade de realizao de dois ou mais Ao aplicarmos a frmula da "escala z", verificamos, anteriormente, que uma
eventos em sucesso, um aps o outro. A regra da multiplicao estabelece o seguinte: renda anual de US$ 7.000 situava-se a 1,33 DPs acima da mdia (US $ 5.000); ou seja,

7.000 - 5.000 3
1
z = 1.500
= +13 '
Probabilidade de extrair um "s de espadas" 52
Vamos agora determinar a probabilidade associada a um escore situado entre
1 US$5.000-a prpria mdia-e US$ 7.000. Em outras palavras, qual a probabilidade
Probabilidade de extrair uma "dama de ouros" 52+ de escolher-se de forma aleatria, numa s tentativa, uma pessoa dessa cidade cuja
renda anual caia entre US$5.000 e US$ 7.000? O problema est ilustrado graficamente
Probabilidade de extrair um "rei de copas" = .!.
52
na Figura 6.16 (observe-se a rea sombreada sob a curva) e pode ser resolvido (em ma-
temtica) pela aplicao da frmula dos escores z, combinada com a Tabela B (fim
do livro).
Probabilidade de extrair ou um " s de espa-
das" , ou uma " dama de ouros" ou um rei de /:J.; isto , P = 0,06 PASSO 1: Transformar o escore bruto (US$ 7.000) em escore z *
copas"

FIGURA 6. 14 Exemplo Ilustrativo da Regra da Soma: Trata-se, Aqui, de Extrair num S Lance, ou "' N.T.: Alm de "escore z", comum falar-se em "escore reduzido", "(varivel) normal reduzida"
um "s de Espadas", ou uma " Dama de Ouros" ou um "Rei de Copas" ou, simplesmente, valor da "escala z".
96 DA DESCRIO TOMADA DE DECISE A Curva Normal 97

$5.000 $7.000

FIGURA 6. J(i Proporo da rea Total (sob a Curva Normal) qual Desejamos Associar urna Proba FIGURA 6. J 8 Poro da rea Total (sob a Curva Normal) Cuja Probabilidade de Ocorrncia Dese-
bilidade de Ocorrncia jamos Estabelecer

outras vezes, a porcentagem da rea at esse escore; finalmente, a porcentagem da rea


X-X 7.000- 5.000
z -
a
-----"- = +1,33 . alm dele , caso em que a idia de "caudalidade" deve estar presente.* Por exemplo, no
1.500 caso em pauta, talvez desejssemos saber qual a probabilidade associada ao evento
" renda anual= US$ 7.000 ou mais que VS$ 7.000".
Vemos, assim, que o escore bruto US$ 7.000 est a 1,33 DPs acima da mdia. Este problema pode ser ilustrado graficamente, conforme a Figura 6.18 (ver rea
sombreada). Neste caso, o procedimento seguir os passos 1 e 2 acima, a fim de obter o
PASSO 2: Usando a Tabela B, procurar a porcentagem da freqncia total (sob a escore z e encontrar a porcentagem sob a curva normal entre X= US $5.000 e z = 1,33
curva) que cai entre o escore z (z = +1,33) e a mdia. (ver Tabela B). No presente caso, entretanto, precisamos ir um passo alm e subtrair de
50% a porcentagem obtida na Tabela B-ou seja, aquela porcentagem da rea que se
Na Tabela B, verificamos que 40,8 2% (quase 41 %) da populao total dessa cidade localiza direita (ou esquerda) de X. Esta afirmao vetdadeira porque a Tabela B
ganha entre US$5.000 e US$7.000 (ver Figura 6.17). Assim, se caminharmos com a sempre registra a porcentagem da rea que vai de j[ at um dado z (e nunca a porcenta-
vrgula duas casas para a esquerda e arredondarmos, veremos que a probabilidade de gem associada a um z particular ou rea situada alm dele).
41 em 100; P = 0 ,41 de que, ao extrair aleatoriamente um sujeito dessa populao, sua Portanto, subtraindo 40,82% de 50%, verificamos que pouco mais de 9% (9,18%)
renda anual esteja compreendida nesses limites. caem em ou alm de VS$ 7.000. Em termos probabilsticos podemos dizer (caminhando
No exemplo anterior, o problema era determinar a probabilidade associada com a vrgula duas casas para a esquerda) que s h pouco mais de 9 chances em 100
distncia entre a mdia e um particular valor sigma. Muitas vezes, entretanto, possvel (isto , P = 0,09) de encontrarmos casualmente, nessa cidade, um sujeito cuja renda
que queiramos achar a porcentagem da rea associada a um escore bruto particular; anual seja igual a ou maior que US$ 7.000.
J mencionamos anteriormente que qualquer distncia sigma acima da mdia
contm um:a proporo de sujeitos (dados) idntica encontrada na mesma distncia
sigma aBaixo da mdia. Por essa razo, o procedimento para calcular probabilidades
associadas a pontos (valores, dados, escores) abaixo de X idntico ao adotado nos
exemplos acima.
Por exemplo, a porcentagem da freqncia total entre z = - 1,33 (US$3 .000)
e a mdia idntica porcentagem entre z = 1,33 (US$7.000) e a mdia. Portanto,
sabemos que a probabilidade de sortear um sujeito dessa populao (cidade) cuja renda
anual caia entre US$3.000 e US$5.000 de P = 0,41. Por igual raciocnio, a porcen-
$5.000 z = +1,33
L41%_j * N.T.: "Caudalidade" um neologismo necessrio. Ter presente a "caudalidade" significa obser
var se o escore em foco est direita ou esquerda na curva. Fala-se, a, em unicaudalidade. Tambm
possvel, porm, em casos especiais, pensar-se em bicaudalidade, circunstncias em que dois escores
FIGURA 6.17 Porcentagem da rea Total sob a Curva Entre .i= US $5.000 e z =+l ,33 so considerados simultaneamente.
\
98 DA DESCI\IO TOMADA DE DECISES
A Curva Normal 99

tagem da freqncia total em ou alm dez= -1,33 (ou seja, US$3.000 ou menos) PROBLEMAS
igual porcentagem em ou alm dez = + 1,33 (US$ 7.000 ou mais). Desse modo, sabe-
mos que P = 0,09 de obtermos aleatoriamente algum dessa cidade com uma renda 1. Em qualquer distribuio normal, qual a porcentagem da rea total que cai (a) entre
anual de US$3.000 ou menos. -1 DP e +1 DP; (b) entre - 2 DPs e +2 DPs; (c) entre - 3 DPs e +3 DPs? _
Podemos usar a regra da adio para encontrar a probabilidade de obteno 2. Dado um conjunto de escores brutos com distribuio normal, onde X = 7,5 e
de mais de uma poro da rea sob a curva normal. Por exemplo, j determinamos DP = 1,3, exprimir cada um dos seguintes escores brutos em termos de escala z :
que P = 0,09 tanto para rendas de US$3.000 ou menos quanto para rendas de (a) X= 8,0; (b) X= 6,0;(c) X= 5,3;(d) X= 10,2;(e) X = 7,5;(f) X= 8,5;(g) X= 11.
US$ 7.000 ou mais. Para encontrarmos a probabilidade de obter "US$ 3.000 ou menos" 3. Seja uma distribuio de ganhos dirios, onde X = Cr$ 178,50 e DP = Cr$4?,60.
ou"US$ 7.000 ou mais", simplesmente somamos as probabilidades individuais (isto , Supondo-se distribuio normal, como podem ser expressas, em escala z, as segumtes
separadas): dirias: (a) X= Cr$ 142,80; (b)X = Cr$187,00; (c)X = Cr$224,40; (d)X = Cr$85 ,00;
(e) X= Cr$ 255,00; (f) X= Cr$195 ,50; (g) X= Cr$ 153,00.
p = 0,09 + 0,09 = 0,18 4. Mesmos dados bsicos do problema 3, acima. Determinar: (a) a porcentagem de res-
pondentes que ganham uma diria de Cr$ 255 ,00 ou mais; _(b) a probabilidade de
De modo similar, podemos calcular a probabilidade de sortear algum cuja renda
sortear um respondente cuja diria seja de Cr$ 255,00 ou mais; (c) a porcentagem de
caia entre US$3.000 e US$ 7.000; para tanto, basta somar as probabilidades associadas
ao escore z = 1,33 de cada lado da mdia.* Portanto, respondentes que ganham de Cr$ 170,00 a Cr$178,50; (d) a probabilidade de ~~rtear
um respondente cuja diria caia entre Cr$170,00 e Cr$178,50; (e) a probabthda_d_e
p = 0,41 + 0,41 = 0,82 de sortear um respondente cuja diria seja de Cr$170,00 ou menos; (f) a probabili-
dade de sortear um respondente cuja diria seja de "Cr$170,00 ou menos" ou de
"Cr$187,00 ou mais"; (g) a probabilidade de sortear dois respondentes cujas dirias
Observe-se que 0,82 + 0,18 = 1, resultado que corresponde soma de todas as
ocorrncias possveis relacionadas com um mesmo fenmeno. sejam de Cr$1 70,00 ou menos. _
A aplicao da regra da multiplicao curva normal pode ser ilustrada com o 5. Dado um conjunto de escores brutos, distribudos normalmente, onde X = 80 e
seguinte problema: qual a probabilidade de sortearmos de forma aleatria, nessa popu- DP = 7 5 determinar (a) a porcentagem de respondentes que obtiveram 60 ou
lao, quatro sujeitos cujas rendas anuais sejam de US$ 7.000 ou mais? J sabemos que menos; Cb) a probabilidade de sortear um respondente que tenha obtido 60 ou
a probabilidade de extrair casualmente um sujeito (dessa populao) cuja renda anual menos; (c) a porcentagem de respondentes que obtiveram entre 80 e 90; (d) a proba-
seja no m{nimo igual a US$ 7.000 P = 0,09. Portanto, bilidade de sortear um respondente que tenha obtido entre 80 e 90;(e) a porcentagem
de respondentes que obtiveram 85 ou mais; (f) a probabilidade de sortear um respon-
p = (0,09)(0,09)(0,09)(0,09) = (0,09)4 ** = 0,00007 dente que tenha obtido 85 ou mais ; (g) a probabilidade de sorteru: ~m respondente
que tenha tirado "70 ou menos" ou "90 ou mais"; (h) a probabilidade de sortear
Pela aplicao da regra da multiplicao, vemos que a probabilidade de extrao trs respondentes que tenham tirado 90 ou mais.
aleatria de quatro sujeitos de renda igual ou superior a US$ 7.000 corresponde a 7
(chances) em 100.000.

- ....
RESUMO
Procurou-se, neste captulo, relacionar as propriedades da distribuio normal terica
com problemas do "mundo real", que apresentam interesse para a pesquisa. Demons-
trou-se, assim, que a rea sob a curva normal pode ser usada tanto na interpretao do
desvio padro quanto na elaborao de afirmaes que envolvem a noo de probabi-
lidade. A importncia da distribuio normal tornar-se- mais visvel em captulos
subseqentes deste livro.

* N.T.: Aqui, por exemplo, o problema exige que pensemos em "bicaudalidade".


** N.T. : Seria de grande utilidade para o leitor familiarizar-se, neste ponto, com a chamada Distri-
buio Binomial.
A mostras e Populaes 101

MTODOS DE AMOSTRAGEM

Os mtodos de amostragem do pesquisador so, em geral, mais elaborados e sistemti-


cos do que aqueles utilizados no dia-a-dia. Ele preocupa-se basicamente m saber se

7
sua amostra de sujeitos bem representativa da populao, a fim de ser-lhe possvel
fazer generalizaes de uma para a outra. Para fazer tais inferncias, o pesquisador
seleciona um mtodo apropriado de amostragem que leva em conta a possibilidade de
todos os membros da populao fazerem parte da amostra ou, ento, de apenas alguns
membros fazerem parte dela. Se todos os_compoll~t~ de tal po ulao t~_!gual
oportunidade (grobabilid~de) de participar da amostra, diz-se que o mtodo usado. o

Amostras e Populaes da ii.ostra~em ca~u_,al; se este no for o caso, fala-s~ em amostragem no-casual.

Amostras No-casuais
O mtodo de amostragem no-casual mais conhecido- amostragem acidental- difere
muito pouco dos nossos procedimentos dirios de amostragem, uma vez que ele se
baseia com exclusividade no que convm ao pesquisador. EmY~!as pa!avras, o pesqui-
sador simplesmente inclui os sujeitos convenm~s.J).'! amostra,..dela~xcluindo os incon-
O pesquisador social procura geralmente tirar concluses a respeito de um grande venientes. A maioria dos estudantes recorda-se de, pelo menos, algumas ocasies em que
nmero de sujeitos. Por exemplo, ele poderia desejar estudar os 220.000.000 de cida- ~m instrutor, interessado numa pesquisa, pediu-lhes que participassem de um experi-
dos que constituem a populao dos Estados Unidos da Amrica do Norte, os 1.000
mento ou preenchessem um questionrio. A popularidade dessa forma de amostragem
membros de um sindicato particular, os 10.000 norte:americanos negros que moram acidental em Psicologia fez com que alguns crticos olhassem para essa disciplina como
numa cidade do sul ou os 45.000 estudantes habitualmente matriculados numa univer-
sidade do leste. sendo "a cinci dos calouros universitrios", dada a grande freqncia com que eles
figuram como sujeitos experimentais em pesquisas.
At aqui~ temos admitido que o pesquisador social investiga todo o grupo que
Outro tipo de amostragem no-casual ~ de quotas. Neste procedimento, diversas
ele tenta compreender. Conhecido por populao ou universo, tal grupo consiste em
caracter sticas de uma populao, tais como idade, sexo, classe social ou etnia so amos-
um conjunto de indivduos que partilham de, pelo menos, uma caracter~tica comum,
tradas nas mesmas propores em que figuram na populao. Suponham, por exemplo,
seja ela cidadania, filiao a uma associao de voluntrios, etnia, matrcula na univer-
que tivssemos de extrair uma amostra, por quota, da populao de alunos de uma dada
sidade etc. Desse modo, poderamos falar a respeito da populao dos Estados Unidos,
universidade, onde 42% fossem mulheres e 58%, homens. Usando esse mtodo, os entre-
da populao dos membros do sindicato, da populao dos norte-americanos negros
vistadores recebem a incumbncia de localizar uma quota de estudantes de tal forma que
residentes numa cidade do sul ou da populao de alunos universitrios.
somente 42% da amostra consista de mulheres e 58%, de homens. As mesmas porcenta-
Posto que o pesquisador trabalha com tempo, energia e recursos econmicos gens que figuram na populao so reproduzidas na amostra. Se o tamanho global da
limitados, ele raras vezes estuda individualmente todos os sujeitos da populao na amostra fosse 200, ento 84 moas e 116 rapazes deveriam ser selecionados.
qual est interessado. Em lugar_disso, o pesquisador estuda apenas_uma_amastra- Uma terceira vatiedi!.de _de amo~tra no-casual a de julgamento ou conve.nin-
.que_se constitui de ..um..Jimer_o !lleng_LQ~_~ujeitos _!irad<:)S de _!!ma cietermillada popu- _cia. * idia bsica aqui envolvida a de que a lgica, o senso comum ou um julgamen-
la.o. AtraYJLdo .processo_de amostragem, o.pesquisado_r__bJ:lsca g_erie_!alizar (cortclus_es) to equilibrado podem ser usados na seleo de uma amostra que seja representativa de
d~2!1- amgstra (o gr.upo_p~queno) para a populao toda {o grup9 maior), .da.qual essa um grupo maior (populao). Por exemplo, para extrair uma amostra de revistas que
m~.rpa amostra foi extrada. -~
reflitam valores da classe mdia norte-americana, poderamos, levados apenas pela
O processo de amostragem faz parte do dia-a-dia. De que outra forma consegui- intuio, selecionar Reader's Digest, People ou Parade, uma vez que os artigos dessas
ramos informao acerca de pessoas diversas, no fora amostrando as que esto nossa revistas parecem refletir aquilo que a maioria dos norte-americanos de classe mdia
volta? Por exemplo, poderamos casualmente discutir assuntos polticos com alguns deseja (por exemplo, a satisfao do sonho americano, sucesso econmico, e coisas
estudantes a fim de determinar a opinio geral que a classe estudantil tem com relao semelhantes). De modo similar, certos bairros que tradicionalmente elegiam o candi-
a esse assunto; poderamos tentar descobrir como nossos colegas de classe esto-se dato oficial, poderiam ser selecionados num esforo de predizer o resultado de uma
preparando para um exame particular atravs de conversas antecipad1s com apenas eleio oficial.
alguns membros da classe; poderamos mesmo investir na bolsa depois de descobrir
que uma pequena amostra de nossos scios ganhou dinheiro dessa forma. * N.T.: Uma traduo mais literal obrigaria o uso de "proposital".
102 DA DESCRIO TOMADA DE DECISES A mostras e Popula6es 103

AmostrasCasuais* I<'
( )":.>V~\co I,v asua1-- fakaf;-/ k \)I(
r aleatrios, o pesquisador arranja, em primeiro lugar, uma lista de todos os componen-
Como_jLfoi-mencionado_an.terionnente., ~a_am~tragem casual_@ a cada_membro da tes da populao, e atribui a cada um deles um (e um s) nmero de identiflcaa:o. Por
QQpulao igual oportunidade de. fazer parte_Q!l ~ostra_,_ Esta caracterstica da amos- exemplo, se ele estivesse fazendo uma pesquisa que envolvesse os 500 alunos matricula-
tragem casual implica que todos os sujeitos da populao devein ser identificados dos na disciplina "Introduo Sociologia", ele poderia conseguir, com a secretaria,
antes da extrao da amostta, exigncia geralmente preenchida mediante a obteno uma lista de todos os nomes, e atribuir a cada um, sem repeties, um nmero da
(elaborao) de uma lista que contenha todos os sujeitos da populao. Um pouco de srie 001 , 002, etc. at 500. Concluda a preparao da lista, ele inicia a montagem
ateno sugere logo que o fato de conseguir um arrolamento completo de todos os de sua amostra extraindo nmeros de uma tabela de nmeros aleatrios. Digamos que
membros da populao nem sempre tarefa fcil, mormente se uma populao muito o pesquisador queita extrair uma amostra de 50 alunos para representar os 500 membros
grande ou muito diversificada estiver sendo estudada. Para dar um exemplo simples, dessa populao. Ele poderia iniciar a consulta tabela de nmeros aleatrios a partir
onde poderamos conseguir uma lista completa dos alunos regularmente matriculados de qualquer nmero (de olhos fechados, por exemplo) e, movendo-se em qualquer
numa universidade grande? Aqueles pesquisadores que j tentaram fazer isto podero sentido, pegar nmeros adequados at que os 50 membros fossem selecionados. Ao
dar testemunho da dificuldade encontrada. Para exemplificar uma tarefa um pouco olhar para uma poro da tbua de nmeros aleatrios acima, poderamos arbitraria-
mais laboriosa, tente-se encontrar ~ma lista de todos os residentes numa cidade grande. mente comear na interseco da coluna 1 com a linha 3, caminhar da esquerda para a
De que modo podemos estar seguros de ter identificado todo mundo-mesmo aqueles direita e tomar todos os nmeros que surgissem entre 001 e 500. Os primeiros nmeros
residentes que no desejam ser identificados? que aparecem no cruzamento da coluna 1 com a linha 3 so O, 4 e 5. Desse modo, o
O tipo bsico de amostra aleatria (casual), amostra casual simples, pode ser obti- aluno nmero 045 o primeiro membro da populao a ser selecionado para a amostra.
do por um processo que no diferente daquela to conhecida tcnica de escrever o Continuando da esquerda para a direita, vemos que 4, 3 e 1 so os trs nmeros que
nome de cada um em pedacinhos separados de papel e, de olhos vendados, extrair vm a seguir, de modo que o aluno 431 (da lista original) selecionado. Esse processo
apenas alguns nomes de um chapu. Este procedimento d, idealmente, a cada membro continua at que os 50 sujeitos da amostra tenham sido escolhidos. Nota ao estudante:
da populao uma igual oportunidade de ser selecionado para a amostra, uma vez que ao usar uma tbua de nmeros aleatrios, no considere nmeros que se repetem ou
um e somente um pedacinho de papel, por pessoa, colocado no chapu. Por vrias que sejam superiores aos necessrios.
razes (inclusive o fato de que o pesquisador necessitaria um chapu extremamente Todos os mtodos de amostragem casual so, na verdade, variaes do procedi-
grande), o pesquisador interessado numa amostra casual via de regra no tira nomes de mento de amostragem aleatria simples que acabou de ser Uustrado. Por exemplo, no
chapus. Em vez disso, ele usa uma tbua de nmeros aleatrios semelhante Tabua H caso de amostragem sistemtica, no h necessidade de usar uma tbua de nmeros
localizada no fim deste livro. Parte de uma tbua de nmeros aleatrios foi reproduzida aleatrios, uma vez que os membros da populao que participam da amostra so
abaixq. determinados a partir de intervalos fixos. Ao empregar amostragem sistemtica, ento,
cada n-simo membro de uma populao includo numa amostra daquela populao.
Coluna Ilustrando: na extrao de uma amostra de tamanho 1.000 de uma populao composta
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 de 10.000 inquilinos, poderamos, depois de proceder ao arrolamento inicial, selecionar
2 3 1 5 7 5 4 8 5 9 o 1 8 3 7 2 5 9 9 3 cada dcimo sujeito da lista.
1
o 2 3 o 3 6 7 4 4 o A vantagem da amostragem sistemtica est no fato de que no necessrio usar
.s"'
~ 2 6 2 4 9 7 8 8 6 9 5
..... 3 o 4 5 5 5 o 4 3 1 o 5 '3 7 4 3 5 o 8 9 o tbuas de nmeros aleatrios. Como resultado, esse mtodo leva menos tempo do que
4 1 1 8 3 7 4 4 1 o 9 6 2 2 1 3 4 3 1 4 8
o 3 5 o 3 2 4 o 4 3 6 2 2 2 3 5 o o o da amostragem casual simples, especialmente quando as populaes so muito grandes.
5 1 6
Do ponto de vista das desvantagens, extrair uma amostra sistemtica implica admitir
que o fator "posio" na lista dos componentes da populao no introduz vis nos
Uma tbua de nmeros aleatrios construda com a finalidade de gerar uma resultados, isto , no toma a seleo menos aleatria. Se esse aspecto no for levado a
sene de nmeros totalmente desprovida de uma "lei de formao". Como resultado, srio, na amostra final podem aparecer mais sujeitos de um tipo do que de outro.
o processo de utilizao de uma tbua de nmeros aleatrios produz uma amostra Isso pode ocorrer, por exemplo, quando se extrai uma amostra sistemtica de uma
no-viesada semelhante produzida pela retirada de nomes, com os olhos vendados, populao de casas, onde as de esquina (por serem geralmente as mais caras do quar-
de um chapu. teiro) ocupam uma posio fi.xa; ou, ento, quando os nomes de uma lista telefnica
Para extrair uma amostra casual simples por meio de uma tbua de nmeros so amostrados por intervalos fixos, pode ocorrer que certos nomes, vinculados a
problemas tnicos, sejam subestimados.
* N.T.: Em alguns textos j aparece a expresso amostra randmica onde "randmica" um apor- Outra variao da amostra casual simples, a amostra estratificada, consiste em
tuguesamento da palaVIa inglesa random (casual, aleatrio). dividir a populao em subgrupos mais homogneos-estratos-dos quais amostras aleat-
104 DA DESCRIO TOMADA DE DECISES Amostras e Popula6es tOS

rias, simples, so extradas. Suponham, por exemplo, que desejemos estudar a aceita- gem estratificada, surge uma exceo quando um estrato particular est desproporcl naJ.
o de vrios dispositivos para o controle da natalidade entre os membros de deter- mente bem representado na amostra, tomando-se possvel, assim, uma subanJise mal
minada cidade. Como as atitudes relativas a controle da natalidade variam com a reli- minuciosa daquele grupo. Tal situao poderia surgir, por exemplo, quando n gr
gio e com a situao scio-econmica, poderamos estratificar nossa populao com norte-americanos, que constituem uma pequena proporo de uma dada populaa! ,
base nessas variveis, e obter, assim, subgrupos cuja homogeneidade maior. Mais so "superamostrados" num esforo de examinar suas caractersticas de maneira m i
especificamente, suponhamos que fosse possvel identificar, na populao, catlicos, pormenorizada.
protestantes e Judeus, bem como classe alta, classe mdia e classe baixa. Nosso proce- Apesar de suas aparentes similaridades, amostras por quota e por estratos slfo
dimento de estratificao poderia produzir os seguintes subgrupos ou estratos: essencialmente diferentes. Enquanto que os membros de amostras por quotas siTo
escolhidos atravs do mtodo pelo qual o pesquisador optou, os membros de amostras
protestantes de classe alta estratificadas so sempre selecionados de forma casual, de hbito por meio de uma
protestantes de classe mdia tbua de nmeros aleatrios aplicados lista completa (rol) dos componentes da
protestantes de classe baixa populao.
catlicos de classe alta
Antes de encerrarmos o tpico de mtodos de amostragem, vamos examinar a
catlicos de classe mdia natureza de uma forma particularmente popular de amostragem casual, conhecida por
catlicos de classe baixa mtodo de conglomerados. Tais amostras so bastante usadas para reduzir os custos
judeus de classe alta de grandes pesquisas, nas quais os entrevistadores devem ser enviados a locais muito
judeus de classe mdia esparsos, fato do qual decorrem muitas viagens. No emprego do mtodo de conglome-
judeus de classe baixa rados pelos menos dois nveis de amostragem so empregados:
Tendo identificado nossos estratos, comeamos a colher amostras casuais simples 1. a unidade primria de amostragem ou conglomerado, que corresponde a algu-
de cada subgrupo ou estrato (por exemplo, de protestantes da classe baixa, de catlicos ma rea bem delineada onde se concentram caractersticas encontradas na po-
da classe mdia, e assim por diante), at que toda a populao tepha sido amestrada. pulao toda (por exemplo, estado, comarca, quarteiro, e assim por diante) e
Em outras palavras, cada estrato tratado, para fins de coleta de amostra, como se 2. os sujeitos amestrados dentro de cada conglomerad~.
fosse uma populao completa, e o procedimento de amostragem casual simples
aplicado. Especificamente, cada membro de um estrato recebe um nmero de identi- Para fins ilustrativos, imaginem que quisssemos entrevistar uma amostra repre-
ficao, arrolado e, a seguir, amostrado por meio de uma tbua de nmeros aleatrios. sentativa de sujeitos que vivem numa rea grande da cidade. Extrair uma amostra casual
O passo final do procedimento consiste em juntar, num s grupo, os sujeitos seleciona- simples, ou sistemtica ou estratificada de respondentes espalhados numa grande rea,
dos de cada subgrupo ou estrato, a fim de obter-se uma amostra da populao toda. implicaria muitas viagens, sem mencionar tempo e dinheiro. Se recorrssemos a amos-
A estratificao baseia-se na idia de que um grupo homogneo requer uma tragem por conglomerados, entretanto, limitaramos nossas entrevistas queles sujeitos
amostra menor do que um grupo heterogneo. Por exemplo, estudar os sujeitos que localizados dentro de relativamente poucos conglomerados. Poderamos comear, por
passam por uma particular esquina do centro da cidade, provavelmente requer uma exemplo, tomando os quarteires da cidade como nossa unidade primria de amostra-
amostra maior do que a necessria para estudar sujeitos que vivem num subrbio de gem . ou conglomerado. Seria possvel continuar, ento, arranjando uma lista de todos
classe mdia. Em geral, encontram-se, no centro da cidade, sujeitos que podem apre- os quarteires abrangidos pela rea, a partir da qual sorteramos uma amostra casual e
sentar as mais variadas combinaes de caractersticas. Em contraste, as pessoas que simples de quarteires. Depois de ter extrado nossa amostra de quarteires da cidade
moram num subrbio de classe mdia so, via de regra, mais semelhantes no que res- selecionaramos os respondentes (ou lares) de cada quarteiro pelo emprego do mesm~
peita a educao, renda, orientao poltica, tamanho da fami1ia, atitude para com o mtodo casual. Mais especificamente, todos os sujeitos (ou lares) de cada um dos quar-
trabalho-para mencionar apenas algumas caractersticas. teires escolhidos so listados (arrolados) e, com o aux11io de uma tbua de nmero
Superficialmente, as amostras estratificadas casuais apresentam uma enorme aleatrios, seleciona-se uma amostra de respondentes de cada quarteiro. Atravs do
semelhana com o mtodo de quotas no-casuais, tal como j discutido, uma vez que mtodo de congl~merados, cada entrevistador opta por um dos quarteires j sorteado
ambos os procedimentos requerem, de hbito, a incluso de caractersticas de amostra e contacta alguns respondentes que ali residem.
nas propores exatas com que figuram na populao. Portanto, se 32% de nossa popu- Numa escala mais ampla, o mesmo procedimento de conglomerados pode ser
lao compem-se de protestantes da classe mdia, ento exatamente 32% da nossa aplicado a pesquisas de mbito nacional; para tanto, basta (1) que regies, estados,
amostra devem ser colhidos dentre protestantes da classe mdia; da mesma forma, se parquias sejam tomados como unidades amostrais primrias, sobre as quais incide
11% de nossa populao consiste em judeus da classe baixa, ento 11 % de nossa amostra o processo inicial de escolha e (2) que de cada regio, estado ou parquia seja extrada
devem ser constitudos de forma semelhante, e assim por diante. No terreno da amostra- uma amostra aleatria simples- objeto das entrevistas. Desse modo, os entrevistado-
106 DA DESCRIO TOMADA DE DECISES
' Amostras e Populaes 107

res no precisam percorrer (cobrir) todas as regies, est~dos ou pa~quias, mas s~mente aritmeticamente idntica a qualquer das mdias amostrais; de modo anlogo, h dife-
uma quantidade muito menor de reas-que tenham stdo aleatonamente selecionadas renas entre as prprias mdias amostrais.
para a pesquisa.
DISTRIBUIO AMOSTRAL DE MDIAS
ERRO AMOSTRAL Dada a existncia de erro amostrai, o aluno pode perguntar-se como possvel gene-
Daqui para a frente, tomaremos um cuidado especial em distinguir as caracterstic~s ralizar de uma amostra para uma populao. Para dar uma resposta sensata, vamos
das amostras (que de fato estudamos) das caractersticas das ~o~ul~es-que consti- considerar o trabalho de um pesquisador hipottico que esteja estudando o tempo gasto
tuem objeto de nossas generalizaes. A fim de marcar essa ~tstmao em nossos pro- em audio de rdio pela populao de um milho de residentes numa cidade do
cedimentos estatsticos, no podemos mais usar os mesmos stmbolos para repres_ent.ar centro-oeste. Para economizar tempo e dinheiro, ele entrevista somente uma amostra
a mdia e 0 desvio padro tanto de uma amostra como de uma populao. Ao .m~es, colhida ao acaso da populao de residentes. Ele escolhe 500 residentes por meio de
devemos empregar diferentes smbolos, conforme estejamos tratando de_cara~t~nstlcas uma tbua de nmeros aleatrios e pergunta a cada membro- "Quantos minutos voc
amostrais ou populacionais. Com referncia mdia, vamos sempre stmbobza-la p_or ouve rdio diariamente?" -e descobre que o tempo gasto varia de O a 240 min. Como
i quando se tratar de uma amostra e por M, quando se tratar de uma populaao. demonstra a Figura 7.1, o tempo mdio gasto em audio de rdio, numa amostra
Com referncia ao desvio padro, notaremos por s quando se tratar de amostra e por de 500 residentes, de 101,55 min.
a, quando se tratar de populao. . Acontece que o nosso pesquisador hipottico um tanto excntrico, e possui uma
o comportamento tpico do pesquisador tentar obter um~ amostra que SeJa inclinao notvel para a extrao de amostras de populaes. To intenso o seu
representativa da populao (grupo maior) na qual ele tem algum_mteresse. Uma vez entusiasmo por amostragem que ele continua a extrao de amostras adicionais, cada
que amostras casuais simples do a todos os membros da populaao a mesma ~portu uma composta de 500 residentes, e calcula, a seguir, o tempo mdio de audio para
nidade de seleo, elas acabam sendo, no final das contas, mais represe~tat~vas ~as cada amostra. Esse procedimento continua at que o nosso excntrico pesquisador tenha
caractersticas poplacionais do que as amostras no-casuais. Tal como fm discutido conseguido extrair 98 amostras, cada uma com 500 residentes. Nosso processo de extrao
de forma sucinta no Captulo 1, entretanto, por obra do acaso, sozinho, podem~s de 98 amostras casuais, ele, de fato, estuda 49.000 respondentes (500 X 98 == 49.000).
sempre esperar alguma dif~rena entre uma amostra, aleat~ria ou no, e ~ ~o~ul_aao Vamos admitir, conforme demonstra a Figura 7.2, que a populao inteira de
da qual ela foi extrada. X quase nunca ser exatamente tgual_a M; s sera tdent~co a nossa cidade do centro-oeste tenha uma m~ia de tempo de audio de 99,75 min.
a em rarssimas ocasies. Conhecida por erro amostra[, essa dtferena aparece mde- Como tambm ilustra a Figura 7.2, vamos supor que as amostras colhidas pelo nosso
pendentemente do fato de o plano amostrai ter sido bem elab~rado e exec~tado, apesar excntrico pesquisador comportem mdias que variem de 89 a 111 min. De acordo com
das melhores intenes do pesquisador, e em casos onde nao tenha haVIdo burla ou a discusso prvia que foi feita, isso poderia simples e facilmente ocorrer por causa do
erro. erro amostrai.
Para ilustrar a ocorrncia do erro amostrai, vamos observar a Tabela 7.1, que Distribuies de freqncias de escores brutos podem obter-se tanto de amostras
contm uma populao composta de 20 notas fmais de exame e 3 am_ostras, A,_B e quanto de populaes. De modo anlogo, podemos construir uma distribuio de
extradas de forma casual dessa populao (mediante o uso de uma tabua de n~me; mdias amostrais, ou seja, uma distribuio de freqncias de um grande nmero de
r~s aleatrios). Como seria de esperar-se, a mdia populacional (M = 71 ,55) nao e

TABELA 7.1 Populao e Trs Amostras Casuais de Notas Finais de Exame

Amostra A Amostra B Amostra C Nota: X == 101 ,55 representa a


Populao
mdia de uma amostra aleatria
de tamanho 500, onde os sujeitos
96 40 72
70 80 93 so respondentes sorteados de
90 99 86 96 uma populao cuja mdia, M,
86 85
56 56 49 igual a 99,75 min.
56 52 67
57 52 67 56
40 78
89 49 48 303 249 273
99 72
94
30
x==75,75 x =62,25 x =68,25
96 431
FGURA7.1 Mdia do Tempo de Audio de uma Amostra Aleatria Tirada de uma Populao
M==71,55 Hipottica
108 DA DESCRIO TOMADA DE DECISES
A mostras e Populaes 109

2. A mdia de uma distribuio de mdias amostrais ("a mdia das mdias')


igual verdadeira mdia popukzcional. Se tomarmos um grande nmero de
mdias amostrais casuais da mesma populao e calcularmos a mdia de todas
elas, obteremos o valor da verdadeira mdia populacional. Portanto, como
demonstra a Figura 7.3, a mdia da distribuio amostrai de mdias (a) igual
mdia da populao original; (b) essas mdias podem ser consideradas permu-
tveis, isto , podem ser tomadas umas pelas outras.
3. O desvio padro de uma distribuio de mdias amostrais menor do que o
desvio padro da popukzo.
M = 99,75 min.

TABELA 7.2 Distribuio de Mdias Amostrais (Audio de Rdio) Resultantes de 98 Amostras


Casuais

Mdias f

111 min
110
109 1
108 2
107 2
FIGURA 7.2 Mdia do Tempo de Audio, Relativa a 98 Amostras Casuais Sorteadas de uma
106 3
Populao Hipottica em queM=99,75 min. 105 4
104 5
mdias amostrais aleatrias que tenham sido extradas da mesma populao. A Tabela 103 6
7.2 apresenta, sob a forma de distribuio, as 98 mdias amostrais coletadas pelo nosso 102 8
pesquisador excntrico. Tal como quando se trabalha com uma distribuio de escores 101 9
100 9
brutos, as mdias da Tabela 7.2 foram dispostas consecutivamente, da mais alta mais
99 9
baixa, e suas respectivas freqncias de ocorrncia indicadas numa coluna adjacente. 98 8
97 7
Caractersticas de uma Distribuio de Mdias Amostrais 96 6
At este ponto, no atacamos diretamente o problema da generalizao de amostras 95 5
para populaes. O modelo terico conhcido por distribuio de mdias amostrais 94 4
93 3
(tal como foi ilustrado pelas 98 mdias amostrais obtidas pelo nosso excntrico pes-
92 2
quisador) tem certas propriedades que lhe conferem um papel importante no processo 91 1
de amostragem. Antes de prosseguirmos com o processo de generalizaes de amostras 90 1
para populaes, precisamos examinar primeiro as caractersticas de uma distribuio 89 min 1
amostrai de mdias: N = 98
1. A distribuio de mdias amostrais aproxima-se de uma curva normal. Tal
como graficamente ilustrado na Figura 7.3(a), dispondo as mdias amostrais
da Tabela 7.2 num polgono de freqncia, acabamos obtendo uma distri- Co~o _i~ustra a Figura 7.3, a variabilidade da distribuio amostrai sempre menor
buio normal. Isto verdade para todas as distribuies de mdias amostris que a vanabilidade da populao toda. Isso verdade porque tomamos escores mdios
independentemente da forma da distribuio dos escores brutos que consti- (e~ lugar da totalidade dos escores brutos que entram na composio dessas mdias), eli-
tuem a populao da qual as mdias foram extradas. 1 ~mando, ~esta forma, valores extremos. Por exemplo, o escore mdio 100 pode ser ob-
tido a partu dos escores 60, 90, 110 e 140. Assim: (60 + 90 + 110 + 140 =~o = 100).
1
Isso pressupe que extramos grandes amostras casuais, de igual tamanho, de uma dada populao Ao levar esses escores brutos a um grfico, inclumos valores que se estendem de 60 a
de escores brutos.
140; entretanto, ao colocar o escore mdio em grfico, obviamente reduzimos a ocor-
110 DA DESCRIO TOMADA DE DECISES A mostras e Populaes 111

89 M = 99,75 M = 99,75
(a) (b)

FIGURA 7.3 Polgonos de Freqncias Relativos a (a) Distribuio de Mdias Amostrais da Tabela
7.2 e (b) Populaes das Quais essas Mdias Foram Extradas
DP = desvio padro
rncia de valores extremos a um nico valor, 100. Como resultado, esperamos obter
FIGURA 7.4 A Distribuio de Mdias Amostrais Vista Como uma Distribuio de Probabilidades
um desvio padro menor sempre que certa quantidade de escores mdios for agrupada
e levada a grfico.
de uma curva normal, podemos dizer que as probabilidades decrescem medida que nos
distanciamos da mdia das mdias (isto , da verdadeira mdia populacional). Isto faz
A Distribuio de Mdias Amostrais Vista como uma Curva Normal sentido porque, como o aluno poder recordar, a distribuio amostrai um resultado
Se definirmos probabilidade em termos de freqncia de ocorrncia, como indicado que decorre de diferenas aleatrias entre mdias amostrais (erro amostrai). Por essa
no Captulo 6, ento a curva normal poder ser considerada uma distribuio de proba- razo, podemos esperar que, por acaso e puro acaso, a maioria das mdias amostrais
bilidades (e pode-se dizer que a probabilidade diminui medida que caminhamos ao cair perto do valor que representa a verdadeira mdia populacional, enquanto que
longo da linha de base, a partir da mdia, em ambos os sentidos). relativamente poucas mdias amostrais cairo longe dela.
Com essa noo, podemos encontrar a probabilidade de obter diferentes escores A Figura 7.4 indica que cerca de 68% das mdias amostrais de uma distribuio
brutos numa distribuio, desde que sejam dados a mdia e o desvio padro. Por exem- amostrai caem entre -1 DP e + 1 DP, a partir da mdia das mdias (a verdadeira mdia
plo, para encontrar a probabilidade associada localizao de um indivduo cuja renda populacional). Em termos probabilsticos, podemos dizer que P = 0,68 para qualquer
anual est entre Cr$85.000,00 e Cr$119.000,00 numa populao de renda mdia igual mdia amostrai que caia nesse intervalo. Da mesma forma, podemos dizer que a proba-
a Cr$85.000,00, e desvio padro igual a Cr$25.500,00, traduzimos o escore bruto bilidade de que qualquer mdia amostrai caia entre -2 DP e +2 DP de 0,95 (95 casos
Cr$119.000,00 em escore z (+ 1,33) e entramos na Tabela B do fim do livro para obter favorveis em 100), e assim por diante.
a porcentagem da freqncia total que cai entre o escore z (1 ,33) e a mdia. Essa rea Uma vez que a distribuio amostrai toma a forma da curva normal, podemos
contm 40,82% dos escores brutos. Portanto, P = 0,41 (arredondando) de encontrarmos tambm usar os escores z e a Tabela B para calcular a probabilidade de obter qualquer
um sujeito cuja renda anual situa-se entre Cr$ 85.000,00 e Cr$119.000,00. Se desejar- mdia amostrai-e no apenas aquelas que so mltiplos exatos do desvio padro. Dados
mos a probabilidade de encontrar algum cuja renda de Cr$119.000,00 ou mais, a mdia das mdias e o desvio padro da distribuio amostrai, o processo idntico
precisamos ir um passo adiante, subtraindo de 50% o porcentual obtido na Tabela B. ao usado no captulo anterior relativamente a uma distribuio de escores brutos. A
(Subtramos de 50% porque essa a porcentagem que se localiza de ambos os lados da nica coisa que muda so os nomes.
mdia.) Subtraindo 40,82% de 50%, verificamos que 9,18% caem exatamente em ou Imaginem, por exemplo, que certa universidade divulgue que seus alunos recebem
alm de Cr$119.000,00. Portanto, movendo a vrgula duas casas para a esquerda, uma renda anual mdia (M) de Cr$ 34.000,00. Supondo que temos boas razes para
podemos dizer que P = 0,09 (9 casos favorveis em 100) de encontrarmos um sujeito questionar a legitimidade dessa afirmao, decidimos test-la com uma amostra aleatria
de renda igual a ou maior que Cr$119.000,00. de 100 alunos. No processo, obtemos uma mdia amostrai de apenas Cr $23.800,00.
Na presente situao, no estamos interessados em obter probabilidades associa- Perguntamos agora: com que probabilidade obteramos uma mdia de Cr$ 23.800,00
das distribuio de escores brutos. Ao contrrio, encontramo-nos trabalhando com ou menos se a verdadeira mdia populacional fosse, de fato, Cr$34.000,00? Ser que a
uma distribuio de mdias amostrais que foram extradas de uma populao total de universi~ade divulgou a verdade? Ou ser que isso apenas um golpe publicitrio na
escores, e desejamos fazer afirmaes probabilsticas acerca dessas mesmas mdias. tentativa de aumentar as matrculas ou as doaes? A Figura 7.5 ilustra a rea para a
Como ilustra a Figura 7.4,j que a distribuio de mdias amostrais toma a forma qual buscamos uma soluo.
112 DA DESCRIO TOMADA DE DECISES A mostras e Populaes 113

primeira qualidade com referncia distribuio de mdias amostrais. Estivemos tra-


balhando como se ele, da mesma forma como o pesquisador excntrico, realmente
tivesse coligido dados de um nmero bem grande de mdias amostrais, todas colhidas
de forma aleatria de alguma populao. Se tal fato tivesse ocorrido como se acabou
. de expor, seria uma tarefa bastante simples fazer generalizaes a respeito da populao,
uma vez que a mdia das mdias assume um valor que igual ao da verdadeira mdia
populacional.
Na prtica, o pesquisador raramente coleta dados de mais do que uma ou duas
amostras, a partir das quais ele ainda deseja generalizar para a populao toda. Extrair
M = Cr$34.000,00 uma distribuio de mdias amostrais requer o mesm esforo que o de estudar indi-
vidualmente cada membro da populao. Como resultado, o pesquisador no tem
FIGURA 7.5 Probabilidade Associada Obteno de uma Mdia Amostrai de Cr$23.800,00 ou
Menos, no Caso de a Verdadeira Mdia Populacional ser Cr S 34.000,00 com um
conhecimento real nem da mdia das mdias nem do desvio padro da distribuio
Desvio Padro de Cr$4.420,00 amostrai. Todavia, ele possui um bom mtodo para estimar o desvio padro da distri-
buio de mdias amostrais a partir dos dados que lhe fornecem uma nica amostra.
Suponhamos que o desvio padro da distribuio amostrai seja de Cr$4.420,00. Essa estimativa conhecida por erro padro da mdia e simbolizada por a x .* Em
Seguindo o procedimento estabelecido, "traduzimos" a mdia amostrai de Cr$23.800,00 smbolos:
em escore z, da seguinte forma: s
ax = , onde
vN-1
X-M 23.800,00 - 34.000,00
z = = -2,3.1,
ax 4.420,00 a x erro padro da mdia (es~imativa do desvio padro de uma distribuio
de mdias amostrais) .
onde s = desvio padro de uma amostra
X mdia de uma amostra da populao N nmero total de escores da mesma amostra.
M mdia das mdias (que corresponderia verdadeira mdia populacio-
nal- segundo a declarao da universidade) Para ilustrar, se o desvio padro de uma amostra de dez respondentes for 2,5,
ento
ax desvio padro da distribuio de mdias amostrais.
2,5
O resultado do procedimento acima informa-nos que uma mdia amostrai de 0,83
Cr$23.800,00 cai a exatamente 2,31 desvios padres abaixo da mdia populacional 3,0
de Cr$34.000,00-argda como verdadeira. Consultando a Tabela B no fim do
livro, verificamos que 48,96% das mdias amostrais situam-se entre Cr$ 23.800,00 e Como salientamos acima, o pesquisador que examina apenas uma ou duas amos-
Cr$34.000,00. Se subtrairmos essa porcentagem de 50%, obteremos o porcentual tras no pode conhecer a mdia das mdias, ou seja, o valor que corresponde verda-
da distribuio que corresponde s mdias amostrais de Cr$ 23.800,00 ou menos-na deira mdia da populao. A_ nica coisa que ele tem a mdia amostrai, a qual difere da
hiptese de a mdia populacional ser mesmo Cr$34.000,00. Tal porcentagem corres- mdia real (da populao) por fora do chamado erro de amostragem. Mas, com isso,
ponde a 1,04% (50%- 48,96% = 1,04%). Portanto, a probabilidade, por arredonda- no acabamos voltando ao ponto de partida? Como possvel estimar a verdadeira
mento, de 0,01 (1 caso em 100) de obter-se uma mdia amostrai de Cr$23.800,00 mdia populacional a partir de uma simples mdia amostrai, especialmente diante de tais
ou menos, caso a verdadeira mdia populacional seja Cr$34.000,00. Com uma proba- diferenas inevitveis entre amostras e populaes?
bilidade to pequena de erro, podemos dizer com certa confiana que a verdadeira
mdia populacional no realmente Cr$34.000,00. No de estranhar se o relatrio
~ N.T.: Em m~ito~ textos, o erro padro da mdia, baseado no desvio padro da populao e simbo-
da universidade com relao renda anual de seus alunos representar apenas propa- lizado por ax, d1stmgue-se do erro padro da mdia estimado, cujo clculo baseia-se no desvio
ganda de baixa categoria. padro da amostra e cujo smbolo S X. Sem medir toda a populao, entretanto, o valor do ~eu
desvio padro no conhecido e deve, por isso, ser estimado. A ttulo de simplificao, decidimos
ERRO PADRO DA MDIA fechar os olhos a essa distino, introduzindo uma nica frmula para o erro padro da mdia,
At agora, estivemos admitindo que o pesquisador possua, de fato, informao de simbolizado por ax, cuja base so os dados amostrais.
114 DA DESCRIO TOMADA DE DECISES Amostras e Populaes 115

Na verdade, j nos,dismcmos bastante de nossa posio original. Depois de ter X mdia amostrai UNrVERS!o
.llOf F.
discu~do a na:trz~ da distribuio de mdi,.:ts amostrais, estamos agora preparados ax erro padro da mdia BliJl.IOTe fDRA.L D
para estimtr o vlor de uma mdia populacional. Com a ajuda do erro padro da mdia, CA CEty O ~AftA
podemos encontrar o intervalo de valores dentro do qual a verdadeira mdia populacio- Aplicando a frmula acima ao problema em foco, resulta: 1'RAl.
nal pode cair. Podemos, tambm, estimar a probabilidade com que nossa mdia popula-
intervalo de confiana de 68% = Cr$ 23.800,00 Cr$ 3.400,00
cional realmente cair dentro desse mesmo intervalo (de valores de mdias). Este o
= Cr$ 20.400,00 1---j Cr$ 27.200,00
conceito de interv(IIo de confiana.
O pesquisador, portanto, afirma que ele tem 68% de confiana de que a renda mdia
da populao composta por esses alunos universitnos de Cr$23.800,00 Cr$3.400,00.
INTERVALOS DE CONFIANA Em outras palavras, h 68 possibilidades em 100 (P = 0,68) de que a verdadeira mdia
A fim de podermos explorar o procedimento que leva obteno de um intervalo de populacional cria realmente no intervalo de limites Cr $ 20.400,00 e Cr$ 27.200,00
confiana, vamos aprofundar o exame de um exemplo anterior. Suponham que uma (Cr$23.800,00 - Cr$3.400,00 = Cr$ 20.400,00; Cr $ 23.800,00 + Cr$ 3.400,00 =
amostra aleatria de 100 alunos de certa universidade apresente uma renda anual mdia = Cr$ 27.200,00). Essa estimativa feita a despeito do erro amostrai, embora dentro
de Cr$ 23.800,00. Como esses dados resultam de apenas uma amostra aleatria, e no de uma margem de erro (de mais ou mimos Cr$ 3.400,00) e a um nvel de confiana
de toda a populao de alunos, no h uma maneira segura de garantir que essa renda especificado ( 68%).
mdia reflita, de fato, a renda mdia da populao de alunos da universidade. Como j Os intervalos de confiana podem ser construdos para qualquer nvel de proba-
vimos anteriormente, o erro amostrai , no fim das contas, a conseqncia inevitvel bilidade. A maioria dos pesquisadores no se sente suficientemente confiante em estimar
de amostrar a partir de populaes. uma mdia populacional sabendo que s h 68 possibilidades em 100 da mesma estar
Sabemos, entretanto, que 68,26% de todas as mdias amostrais aleatrias, numa correta (de cada 100 mdias amostrais 68 cairo dentro do intervalo Cr$ 20.400,00 e
distribuio de mdias amostrais, situar-se-o entre - 1 DP e +1 DP, a contar da verda- Cr$ 27.200,00). Como resultado, tomou-se convencional usar um intervalo de confiana
deira mdia populacional. Se estimarmos o desvio padro da distribuio amostrai mais amplo, embora menos preciso , mas que assegura com melhor probabilidade o
(ax = Cr$3.400,00), e usarmos a nossa mdia amostrai de Cr$23.800,00 como uma clculo da estimativa da mdia populacional. O uso do intervalo de confiana de 95%
estimativa da mdia populacional, poderemos estabelecer o intervalo dentro do qual, permite obter esse clculo atravs do qual a mdia populacional estimada com a
com 68 possibilidades em 100 (por arredondamento), a verdadeira mdia populacional certeza de que h 95 possibilidades em 100 de estar-se correto; e h 5 possibilidades
cair. Conhecido por intervalo de confiana de 68%, esse intervalo de rendas mdias em 100 de estar-se errado (de cada 100 mdias amostrais, 95 cairo dentro do intervalo).
est ilustrado graficamente na Figura 7.6. Entretanto, mesmo usando o intervalo de confiana de 95%, deve-se ter sempre em mente
O intervalo de confiana de 68% pode ser obtido da seguinte maneira: que a mdia amostrai do pesquisador poderia ser uma daquelas cinco mdias amostrais
que caram fora do intervalo estabelecido. Na tomada de decises estatsticas nunca h
intervilo de confiana de 68% = X a x , onde possibilidade de ter certeza absoluta.
Como proceder para encontrar o intervalo de confiana de 95%? J sabemos que
95,44% das mdias amostrais numa distribuio amostrai situam-se entre - 2 DP e
+2 DP, contados a partir da mdia das mdias. Consultando a Tabela B, podemos
afirmar que 1,96 desvios padres, em ambos os sentidos, cobrem exatamente 95% das
mdias amostrais (47,50% de cada lado da mdia das mdias). A fim de encontrar o
intervalo de confiana de 95%, devemos primeiro multiplicar o erro padro da mdia
por 1,96 (o intervalo corresponde a 1,96 unidades de a x,
contadas para a esquerda e
para a direita a partir da mdia). Portanto,

intervalo de confiana de 95% = X (1 ,96) a x , onde


Cr$ 20.400,00 Cr$ 27.200,00
Cr$23.800,00 X = mdia amostrai
- 1 ax +1 a, a x = erro padro da mdia.
L68,26%-J Se aplicarmos o intervalo de confiana de 95% estimativa da renda mdia dos alunos
FIGURA 7.6 Um Intervalo de Confiana de 68%, Quando ax =Cr$3.400,00 e X =Cr$23.800,00 universitrios, veremos que
Amostras e Populaes 117
116 DA DESCRIO TOMADA DE DECISES

intervalo de confiana de 95% = Cr$ 23.800,00 (1,96) Cr$3.400,00 X x2


= Cr$23!800,00 Cr$6.664,00
= Cr$17.136,00 1--1 Cr$30.464,00 1
2 4 = .Js,9- 7,29
2 4
Concluso: temos 95% de certeza de que a verdadeira mdia populacional cai entre 4 16 =Ni
Cr$17.136,00 e Cr$30.464,00. 3 9 = 1,27
V~os resumir, passo a passo, o procedimento que leva obteno do intervalo LX2 = 89
de confiana de 95% na seguinte amostra casual de escores brutos:

PASSO 3: Calcular o erro padro da mdia.


X

s 1,27 1,27
a:x = --r===='===- 0,42
5 VN - 1 v 1o - 1 3
2
3 PASSO 4: Multiplicar o erro padro da mdia por 1,96.
4
1
2 Intervalo de confiana de 95% = X 1,96) ax
2
4
2,7 (1,96)(0,42) = 2,7 0,82
3
PASSO 5: Somar e subtrair esse produto da mdia amostrai, a fim de obter o intervalo
dentro do qual cai a mdia populacional.
PASSO 1: Calcular a mdia da amostra.
Intervalo de confiana de 95% = 2, 7 0,82 = 1,88 1--->-------i 3,52
X

Podemos estar 95% confiantes de que a verdadeira mdia populacional caia entre 1,88 e
5 3,52. ':'
2 LX Um intervalo de confiana ainda mais rigoroso o intervalo de confiana de 99%.
3 X Ao consultar a Tabela B no fim do livro, vemos que o escore z de 2,58 representa
N
4
49,50% da rea situada de cada lado da curva, a partir do centro (mdia). Dobrando essa
1
2 -27 porcentagem, obtemos 99% da rea sob a curva; isso significa que 99% das mdias
10 amostrais cairo nesse intervalo. Em termos probabilsticos, de cada 100 mdias amos-
2
4 2,7 trais, 99 cairo entre -2,58 DP e +2,58 DP a contar da mdia. Reciprocamente, so-
3 mente 1 de cada 100 mdias cair fora do intervalo. Em smbolos:
:EX= 27
intervalo de confiana de 99% = X (2,58) a x, onde
PASSO 2: Calcular o desvio padro da amostra. X = mdia amostrai
a x ~ erro padro da mdia.
X

5
1 1
25 s = j L X2
-
N
-X
_2 * N.T.: A ttulo ilustrativo foi usada uma amostra pequena. Na prtica, entretanto, um pcsqui
sador que use o procedimento acima para calcular um intervalo de confiana deve trabalhar com,
2 4 pelo menos, 30 dados, a fim de garantir a suposio de normalidade na distribuio de mdias
3
4
9
16 J~~ - (2,7)
2 amostrais. (Ver a discusso da estatstica t no Captulo 8.)
II8 DA DESCRIO TOMADA DE DECISES Amostras e Populaes 119

Com referncia nossa estimativa da renda mdia dos alunos universitrios, temos: PASSO 2: Calcular o desvio padro da amostra.
intervalo de confiana de 99% Cr$ ~3.800,00 (2,28) Cr$3.400,00
Cr$ 23.800,00 Cr$8.772,00 X x2

Cr$15.028,00 Cr$32.572,00
1 I

=J~:2
Acabamos de estabelecer que, com 99% de certeza, a verdadeira mdia populacional 5 25 -2
cair em algum ponto entre Cr$15.028,00 e Cr$32.572,00. 2 4 - X
3 9
O aluno deveria observar que o intervalo de confiana de 99% consiste em uma
faixa mais ampla (de Cr$15.028,00 a Cr$32.572,00) do que o intervalo de confiana
4
1
I6
1
=Jf? - (2,7)
2

de 95% (de Cr$17.136,00 a Cr$30.464,00). O intervalo de confiana de 99% abrange 2


2
4 =h,9 -7,29
a maior parte da rea total sob a curva normal e, portanto, um nmero maior de mdias
amostrais. Essa faixa mais ampla de escores mdios d-nos maior confiana no sentido 4
4
I6 =fl:6i.
3 9 = 1,27
de termos estimado bem a verdadeira mdia populacional. Apenas uma nica mdia
~x2 = 89
amostrai em cada 100 ficar fora do intervalo. Por outro lado, se aumentarmos a nossa
confiana de 95% para 99%, tambm sacrificaremos o grau de preciso no estabeleci-
mento da mdia populacional. Mantendo o tamanho da amostra constante, o pesquisa- PASSO 3: Calcular o erro padro da m.dia.
dor deve escolher entre estar correto com maior preciso ou estar correto com maior
confiana. ax- -- - s- = - 1,27
- - = I,2
- 7 = 0,42
A fim de resumir passo a passo o procedimento para o clculo do intervalo de ~ vio=l 3
confiana de 99%, vamos reexaminar a mesma amostra aleatria de escores:
PASSO 4 : Multiplicar o erro padro da mdia por 2,58.
X
Intervalo de confiana de 99% x (2,8)ax 2, 7 (2,58)(0,42)
2,7 1,08
5
2
3 PASSO 5 : Somar e subtrair esse resultado (produto) da mdia amostrai, a fim de ober
4 o intervalo dentro do qual cai a mdia populacional.
1
2
Intervalo de confiana de 99% = 2, 7 1,08 = 1,6 2 ~ 3, 78.
2
4
3 Temos, assim, 99% de certeza de que a verdadeira mdia populacional cai entre 1,62
e 3,78.
PASSO 1 : Calcular a mdia da amostra.
ESTIMATIVA DE PROPORES
5 At aqui, concentramo-nos em procedimentos para estimar mdias populacionais.
2 No raro, entretanto, o pesquisador procura obter uma estimativa duma proporo
~X
3 X
4
N populacional a partir de uma outra proporo resultante do estudo de uma amostra
I casual. Uma circunstncia em que isso ocorre com freqncia a chamada prvia eleito-
27
2 ral, cujos dados sugerem que certa proporo de votos ir para determinado partido ou
IO
2 determinado candidato. Quando um pesquisador de opinio pblica anuncia que 45%
4 = 2,7 dos votos sero a favor de certo candidato, ele o faz com a convico de que no est
3
- 100% correto. Em geral, ele tem 95% ou 99% de confiana de que sua proporo esti-
~X= 27
mada cai dentro de certa faixa de propores (por exemplo, entre 40% e 50%).
120 DA DESCRIO TOMADA DE DECISES A mostras e Populaes 121

Estimamos propores da mesma mooeira utilizada para a estimao de mdias. PASSO 1: Obter o erro padro da proporo.
Todas as estatsticas-inclusive mdias e propores-possuem distribuies amostrais
prprias. Da mesma forma como calculamos h pouco o erro padro da mdia, podemos
agora calcular o erro padro da proporo. Em smbolos: ap = j P (1 - P) = j 0,40(0,60) = ~ 0,049
N 100 100

U'p -
_ ~P(l - P) onde
PASSO 2: Multiplicar o erro padro da proporo por 1,96.
N
Intervalo de confiana de 95% = P (1 ,96)ap = 0,40 (1 ,96)(0,049)
ap erro padro da proporo (estimativa do desvio padro da distribuio = 0,40 0,096
amostrai de propores)
p proporo amostrai PASSO 3: Somar esse resultado (produto) proporo amostrai e depois subtrair esse
N tamanho da amostra. resultado da mesma proporo amostrai, a fim de obter o intervalo dentro do qual se
situa a proporo populacional.
A ttulo ilustrativo, vamos admitir que 45% de uma amostra aleatria de 100
alunos universitrios declare-se favorvel legalizao do uso de drogas. O erro padro Intervalo de confiana de 95% = 0 ,40 0,096 = 0 ,30 t----1 0,50
da proporo seria
Podemos assim dizer, com 95% de certeza, que a verdadeira proporo populacional cai
entre 0,30 e 0,50.
)0,45(0,55) )0,2475 .~
ap = = - - = v 0,0025 = 005.
100 100 ' ' RESUMO
Para encontrar o intervalo de confiana de 95%, multiplicamos o erro padro da Este captulo explorou os conceitos e os procedimentos bsicos relacionados com o proble-
proporo por 1 ,96, e o resultado obtido (a) somamos proporo amostrai e (b) sub- ma de fazer generalizaes de amostras para populaes. Foram apresentados dois mtodos
tramos da proporo amostrai. Assim: de amostragem: casual e no-casual. Salientou-se que o erro amostrai- aquela diferena
inevitvel entre amostras e populaes-ocorre sempre, a despeito de o plano de amos-
Intervalo de confiana de 95% P (1 ,96)ap , onde tragem ter sido bem concebido e bem executado. Como conseqncia do erro amostrai,
h possibilidade de discutir as caractersticas da distribuio de mdias amostrais, distri-
P proporo amostrai buio essa que, graficamente, assume a forma de uma curva normal, e cujo desvio
ap = erro padro da proporo. padro pode ser estimado com o auxlio do erro padro da mdia. Munidos de tais
informaes, podemos calcular intervalos de confiana para mdias (ou propores),
Se quisermos estimar a proporo de universitrios que so favorveis legalizao dentro dos quais ser-nos- possvel ter uma dada certeza (95% ou 99%) de onde a ver-
do uso de drogas, procedemos da seguinte forma: dadeira mdia (ou proporo) populacional cai de fato.
Dessa forma, teremos condies de fazer generalizaes 5
Intervalo de confiana de 95% = 0,45 (1 ,96)(0,05) 0,45 0,098 3
de uma amostra para uma populao.
3
= 0,351----10,55
1- 2
5 2
Temos, dessa maneira, 95% de certeza de que a verdadeira proporo populacional nem PROBLEMAS 4 3
menor que 0 ,35, nem maior que 0,55. Mais especificamente, em algum ponto entre 5 2
1. Calcule o erro padro da mdia com a seguinte
35% e 55% situa-se a porcentagem de alunos universitrios que so favorveis a essa 1 4
amostra composta de 30 escores amostrais. 6 6
legalizao. H um risco de 5% de estarmos errados; por outras palavras, 5 vezes em cada
3
100 tais intervalos de confiana no contero a verdadeira proporo populacional. 2 1
Vamos resumir o procedimento que permite estimar uma proporo mediante o 1 3
uso do intervalo de confiana de 95%. Admitamos que a proporo amostrai a partir da 1 4
qual nossa estimativa deve ser feita seja da ordem de 0,40 ( 40% dos 100 sujeitos cairo 2 .. 3
nessa categoria). 3 4

~z
122 DA DESCRIO TOMADA DE DECISES A mostrasePopula6es 123

2. Com a mdia amostrai do problema 1, calcule (a) o intervalo de confiana de 95%; informao, (a) calcule o erro padro da proporo e (b) construa um intervalo de
(b) o intervalo de confiana de 99%. confiana de 95%.
3. Calcule o erro padro da mdia com a seguinte amostra composta de 34 escores: 8. Dadas uma amostra de tamanho 150 e uma proporo amostrai de 0,32, (a) calcule
o erro padro da proporo e (b) construa um intervalo de confiana de 95%.
lO l 9. Dadas uma amostra de tamanho 200 e uma proporo amostrai de 0,25, (a) calcule
4 8 o erro padro da proporo e (b) construa um intervalo de confiana de 95%.
lO 7
5 5
5 6
6 10
7 6
3 8
5 ,c7
4 7
4 6
5 5
6 5
6 4
7 3
5 4
8 5

4. Com a mdia amostrai do problema 3, calcule (a) o intervalo de confiana de 95%;


(b) o intervalo de confiana de 99%.
5. Calcule o erro padro da mdia com a seguinte amostra composta de 32 escores:

4 4
2 3
5 6
6 6
1 7
1 1
7 5
8
7
7
8
/
8 8
8 4 I
2 5
6 3
5 2
6 6
4 5

6. Com a mdia amostrai do problema. 5, calcule (a) o intervalo de confiana de 95%;


(b) o intervalo de confiana de 99%.
7. Tendo em mente estimar a proporo de alunos de um determinado "campus" uni-
versitrio que eram favorveis extino dos centros acadmicos, um pesquisador
social entrevistou uma amostra aleatria de 50 estudantes e descobriu que 57%
deles era, de fato, favorvel a essa extino (proporo amostrai = 0,57). Com essa
,...

I,
PARTE 111 .
Tomada de Decises
..

8
. ,.
\", ' ._.,

No Captulo 7, vimos que uma mdia populacional ou uma proporo podem ser esti-
madas a partir da informao que obtemos de uma nica amostra. Por exemplo, po-
deramos estimar o grau de anomia em determinada cidade, a proporo de pessoas
idosas economicamente prejudicadas ou a atitude mdia relativa ao problema da segre-
gao racial numa populao de norte-americanos negros.
Muito embora tenha o enfoque descritivo da estimao de mdias e propores
' importncia bvia, ele no constitui a atividade principal. nem o objetivo ltimo do
processo de tomada de decises exercitado pelos pesquisadores. A maioria deles, con-
trariamente, preocupa-se com o problema denominado teste de hiptese, onde esto
envolvidas diferenas entre duas ou mais amostras.
Ao testarem diferenas entre amostras, os pesquisadores fazem perguntas tais
como: (a) Ser que os alemes diferem dos norte-americanos com respeito obedincia
autoridade? (b) O maior ndice de suicdios ocorre entre protestantes ou catlicos?
(c) Ser que o fato de um entrevistador ser branco ou preto interfere na "honestidade"
da resposta de um negro? ( d) Ser que polticos conservadores do a seus filhos uma
disciplina mais severa que polticos liberais? (Ver Captulo 1.) Observe-se que cada uma
dessas indagaes implica fazer uma comparao entre dois grupos: conservadores versus
liberais, entrevistadores negros versus entrevistadores brancos, protestantes versus
catlicos, alemes versus norte-americanos.

HIPTESE NULA : NO H DIFERENA ENTRE AS MDIAS .


Tomou-se habitual em anlise estatstica comear pelo teste da chamada hiptese
nula- que, em termos bem simples, afirma terem duas amostras sido extra idas da mesma
populao. De acordo com a hiptese nula, qualquer diferena observada entre as amos-
tras considerada como uma ocorrncia casual, mero resultado de erro amostrai. Por-
tanto, uma diferena entre duas mdias amostrais no representa, luz da hiptese nula,
uma verdadeira diferena entre as mdias populacionais.
128 TOMADA DE DECISES Testes de Diferenas entre Mdias 129

No contexto presente, a hiptese nula pode ser simbolizada da seguinte forma: hiptese experimental que afirma existir uma verdadeira diferena populacional. Em
pesquisa, esse o resultado final sempre esperado. A hiptese experimental estabelece
que as duas amostras foram colhidas de populaes portadoras de mdias diferentes.
Diz mais: que a diferena obtida do confronto entre as mdias amostrais grande demais
M1 mdia da primeira populao para ser explicada apenas por erro de amostragem.
M2 mdia da segunda populao A hiptese experimental relativa diferena entre duas mdias simbolizada
como se segue:
Vamos examinar as hipteses nulas relativas s indagaes h pouco formuladas:
I . Os alemes so nem mais nem menos obedientes autoridade que os norte-
-americanos. M1 mdia da primeira populao
2. Protestantes apresentam a mesma taxa de suicdio que catlicos. M2 mdia da segunda populao (=F significa "no igual")
3. Respondentes negros so igualmente honestos em suas respostas, quer sejam
entrevistados por negros, que por brancos. Com referncia s indagaes h pouco formuladas, eis como poderiam ser as hipteses
4. As crianas tanto de polticos conservadores quanto de polticos liberais rece- experimentais:
bem a mesma "dose" de sentido disciplinar.
I. Os alemes diferem dos norte-americanos com relao obedincia auto-
Deve-se notar que a hiptese nula no nega a possibilidade de ocorrerem diferen- ridade.
as entre mdias amostrais. Ao contrrio, ela procura explicar tais diferenas atravs 2. Protestantes e catlicos apresentam diferentes taxas de suicdio.
da inevitvel presena do erro amostrai. De acordo com a hiptese nula, por exemplo, 3. Respondentes negros diferem em suas respostas conforme sejam entrevistados
se descobrirmos que uma amostra aleatria de dentistas do sexo feminino ganha menos por negros ou brancos.
dinheiro (X = Cr$ 204.000,00) do que uma amostra aleatria de dentistas do sexo 4. Polticos liberais diferem de polticos conservadores quanto "dose" de sen-
masculino (X = Cr$ 255.000,00), no conclumos, s por isso, que a populao das tido disciplinar imposta aos filhos.
dentistas ganha menos que a populao dos dentistas. Em lugar disso, tratamos nossa
diferena amostrai (Cr$255.000,00 - Cr$204.000,00 = Cr$51.000,00) como um DISTRIBUIO AMOSTRAL DE DIFERENAS ENTRE MDIAS
produto de erro amostrai-aquela diferena que inevitavelmente surge quanto extramos
. uma amostra de uma populao. Como veremos mais tarde, esse aspecto da hiptese No captulo precedente, vimos que as 98 mdias resultantes das 98 amostras colhidas
nula estabelece um elo importante com a teoria da amostragem. pelo nosso excntrico pesquisador puderam ser levadas a grfico, dando origem a uma
distribuio amostrai de mdias. De modo anlogo, vamos agora imaginar que o mesmo
HIPTESE EXPERIMENTAL:* H DIFERENA ENTRE AS MDIAS pesquisador excntrico colha no uma_, mas duas amostras aleatrias de cada vez, de um
dado universo de pessoas. Suponha-se, por exemplo, que ele colha uma amostra de
A hiptese nula em geral (embora no necessariamente) estabelecida com a esperana
500 polticos liberais e uma amostra de 500 polticos conservadores. Para testar a hip-
de que possa ser rejeitada. Tal afirmao faz muito sentido se atentarmos para o fato de
tese experimental de que os liberais so pais mais ou menos permissivos que os conser-
que a maioria dos pesquisadores vive buscando relaes entre variveis. Em outras
vadores, ele formula perguntas a todos os indivduos componentes das amostras acerca
palavras, eles esto sempre muito mais interessados na busca de diferenas do que na
de seus mtodos educacionais (por exemplo: Voc costuma punir seus filhos? Voc
prova de que elas no existem. Para ilustrar: quem se daria o trabalho de estudar catli-
j os espancou? Em caso afirmativo, com que freqncia?) . Das respostas a tais pergun-
cos e. protestantes, quanto sua' taxa de suicdio, na esperana de concluir que eles
tas, o pesquisador obtm uma medida* da permissividade relacionada com a educao
no diferem? As diferenas entre grupos-sejam elas baseadas em fundamentos tericos
ou empricos- freqentemente fornecem a estrutura lgica para a realizao de um
estudo. * N.T.: Seria ingenuidade imaginar que o conjunto de tais perguntas constitui um instrumento
Se rejeitarmos a hiptese nula, ou seja, se concluirmos que a hiptese que antecipa vlido, capaz de produzir uma tp.edida consistente da varivel "permissividade educacional".
a inexistncia de diferena entre as mdias frgil, automaticamente aceitaremos a fcil de perceber que nada impede- alis tudo favorece! - que esses polticos dem respostas que,
embora contrariando sua postura pessoal, convenham imagem pblica que desejam projetar. No
* N.T.: A hiptese experimental, tambm chamada hiptese alternativa, costuma ser indicada se trata, aqui, de "criticar" o instrumento " desse excntrico pesquisador", mas, sim, de alertar o I
por Ha (ler "ag-a"). A hiptese nula, tambm chamada hiptese probanda, designa-se por Ho (ler leitor para o fato de que a construo de um instrumento de medida (questionrio ou qualquer
"ag-zero"). outro) implica utilizar tecnologia bastante especial.
I O TOMADA DE DECISES Testes de Diferenas entre Mdias 131

de crianas, medida essa que pode ser usada na comparao entre a amostra de liberais Aps ter colhido suas amostras, nosso excntrico pesquisador interroga cada
c a de conservadores. Os escores que resultam desse questionrio variam de 1 (no per- sujeito de cada amostra (isto , 1.000 X 70 = 70.000 pessoas) relativamente ao mtodo
missivo) a 10 (muito permissivo). Como graficamente ilustrado na Figura 8.1, nosso que adota na educao dos filhos; desse levantamento, resulta um escore mdio da
p~squisador excntrico descobre que a amostra proveniente de liberais mais permissiva varivel " permissividade" para cada uma das amostras de liberais e outro escore mdio
(X = 8,0) do que aquela procedente de conservadores (X = 3,0). (da mesma varivel) para cada uma das amostras de conservadores. Alm disso, ele
Poderamos perguntar: luz do erro amostrai, ser que a diferena entre 8,0 e 3,0 calcula, para cada par de amostras, o escore-diferena das mdias. Por exemplo, se a
(8,0- 3,0 = +5,0) pode ser estritamente explicada apenas pela ao do acaso? Ser que mdia de permissividade para os liberais for 7,0 e a mdia de permissividade para os
devemos aceitar a hiptese nula (H0 ) de que no h diferena populacional?* Ou ser conservadores, 6,0, ento o escore-diferena ser +1 ,0; por igual raciocnio, se a mdia
que a diferena amostrai obtida ( +5,0) grande o suficiente para indicar (sugerir) a para os liberais for 5,0 e a mdia para os conservadores, 8,0, o escore-diferena ser
existncia de uma verdadeira diferena populacional entre conservadores e liberais, dife- -3,0. Obviamente, quanto maior o escore-diferena, mais as duas amostras diferem
rena relacionada com suas prticas de educar crianas? com respeito caracterstica pesquisada (isto , permissividade na educao dos filhos).
Aprendemos, no Captulo 2, a interpretar distribuies de freqncias de dados Note-se que sempre subtramos, para cada amostra, o escore mdio dos conservadores
brutos colhidos numa particular populao. No Captulo 7, vimos .que era possvel do escore mdio dos liberais. Os 70 escores-diferenas (resultantes das diferenas entre
construir uma distribuio amostrai de escores mdios, bem como uma distribuio de as mdias dos 70 pares de amostras) obtidos pelo nosso pesquisador foram ilustrados
freqncias de mdias amostrais. Focalizando nossa ateno no problema especfico na Figura 8. 2.
desse captulo, precisamos ampliar a noo de distribuio de freqncias e examinar Vamos supor que saibamos que a populao de conservadores e a de liberais na
a natureza de uma distribuio amostrai de diferenas, isto , uma distribuio de fre- verdade no diferem absolutamente com respeito permissividade nos mtodos de criar
qncias de um nmero bem grande de diferenas entre mdias amostrais aleatrias que filhos. Digamos que M = 5,0 em ambas as populaes. Se admitirmos que a hiptese
tenham sido extradas de uma dada populao. nula est correta e que liberais e conservadores so idnticos nesse aspecto, poderemos
Para ilustrar a distribuio amostrai de diferenas, vamos voltar ao trabalho de usar as 70 diferenas de mdias que o nosso pesquisador obteve para ilustrar a distribui-
nosso pesquisador excntrico cujo amor pela amostragem levou-o, mais uma vez, a
extrair um nmero to grande de amostras que ultrapassa os limites habituais. Em
Nota: cada escore re-
lugar de extrair uma nica amostra de 500 liberais e outra nica amostra de 500 con- presenta a diferena en-
servadores, ele deci~e extrair 70 pares de tais amostras (70 amostras com, cada uma, tre (a mdia de) uma +3 -2 +4
500 conservadores, e 70 outras amostras com, tambm, 500 liberais cada uma). Em amostra de 500 liberais +3 +2
outras palavras, cada vez que ele extrai 500 conservadores aleatoriamente ele extrai, e (a mdia de) outra - 1 o - 1 +2
tambm de forma casual, 500 liberais. amostra de 500 conser- o - 2 - 1 +1
vadores. +1 - 2
+2 o - 4
+5 -3 -2
- 2 -2 -1
-3 - 1
- 1 / +2
Nota: 5,0 representa a diferena - 2
o
-4 o
entre as mdias de duas amostras +1 - 2
- 3 o - 3
aleatrias, cada uma composta de -1
5 00 sujeitos.
+1 o +1
+3 o
o o +1
-5 o
+1
+2

FIGURA 8.1 Diferena Entre as Mdias de Permissividade Resultantes de Amostras de Liberais e de


Conservadores (Populao Hipottica)

* N.T.: Essa uma forma abreviada de perguntar o seguinte : "Ser que devemos aceitar a hipte~e FIGURA 8.2 Setenta Escores-diferenas Representativos das Diferenas Quanto Permissividade
nula de que, sendo diferentes as mdias das amostras, so tambm diferentes as mdias das populaes? Entre Amostras Aleatrias de Liberais e Conservadores. (Populao Hipottica)

!
Testes de Diferenas entre Mdias 133
132 TOMADA DE DECISES

\.
o amostrai das diferenas. Esta afirmao procede porque a distribuio amostrai 20
de diferenas parte do pressuposto de que todos os pares de amostras s diferem por
fora do erro amostrai e no por causa de reais diferenas entre as populaes.
As 70 diferenas entre as mdias, que figuram na Figura 8. 2, foram reagrupadas
sob a forma de distribuio de freqncias na Tabela 8.1. Da mesma forma como tem
ocorrido com outros tipos de distribuies de freqncias, essas diferenas foram
colocadas em ordem decrescente, com as respectivas freqncias de ocorrncia na
coluna adjacente.
Com vistas a salientar as propriedades mais importantes de uma distribuio
amostrai de diferenas, os dados da Tabela 8.1 foram graficamente apresentados
na Figura 8.3. Vemos que, como ilustra a tabela, a distribuio amostrai de diferenas
entre mdias amostrais tende para uma curva normal cuja mdia ("mdia das diferen-
as") zero. 1 Isso faz sentido porque as diferenas entre mdias, sendo algumas posi-
tivas e outras negativas, tendem a compensar-se na distribuio (j que para cada valor FIGURA 8.3 Polgono de Freqncia Relativo Distribuio Amostrai de Diferenas (Ver Tabela 8.1)
negativo existe um valor positivo eqidistante da mdia.
populao de conservadores e a de liberais for zero, tambm esperamos que a mdia de
TABELA 8.1 Distribuio Amostrai das Diferenas Resultantes de 70 Pares de Amostras Aleatrias uma distribuio amostrai de diferenas seja zero.

Diferenas Entre
Mdias* f TESTES DE HIPTESES RELACIONADOS COM
A DISTRIBUIO DE DIFERENAS
+5 1
+4 2 Em captulos anteriores, aprendemos a fazer afirmaes probabilsticas acerca da ocor-
+3 5 rncia de escores brutos e mdias amostrais. No presente caso, vamos tentar fazer afir
+2 7 maes de probabilidade com relao aos escores-diferenas da distribuio amostrai
+1 "" lO das diferenas mdias. Como j foi salientado anteriormente, essa distribuio amostrai
o 18
assume a forma de uma curva normal e, portanto, pode ser considerada como uma
-1 10
-2 8 distribuio de probabilidade. Podemos dizer que a probabilidade decresce medida
-3 5
-4 3
-5 1
N = 70

* Esses escores-diferenas incluem os valo-


res fracionrios. (Por exemplo, - 5 inclui os
valores que vo desde - 5,0 at 5,9)

Por ser uma curva normal, a maioria das diferenas mdias amostrais desta distri-
buio cai nos arredores de zero- que o ponto da distribuio que tem freqncia

l l
- 3SD - 2SD - lSD O +lSD +2SD +3SD
mxima; h relativamente poucas diferenas mdias em quaisquer das caudas da distri-
buio. Tal fato de se esperar, uma vez que o conjunto de todas as diferenas da distri-
buio resulta muito mais de erro amostrai do que de reais diferenas populacionais Ll=68,26%~ 95,44%
ntre conservadores e liberais. Em outras palavras, se a diferena mdia real entre a 99,74%

1 FIGURA 8.4 Distribuio Amostrai de Diferenas Entendida Como uma Distribuio de Probabi-
O que pressupe que extramos aleatoriamente amostras grandes de uma dada populao de
ores brutos. lidades
134 TOMADA DE DECISES Testes de Diferenas entre M'dias 135

que nos afastamos da mdia das diferenas (zero). Mais especificamente, como ilustra No contexto presente procuramos, de forma semelhante, traduzir a nossa diferen-
a Figura 8.4, vemos que 68,26% das diferenas mdias caem entre - 1 DP e +1 DP, a a mdia amostrai ( +5) em unidades de desvio padro, mediante a seguinte frmula:
contar de zero. Em termos probabilsticos, isso indica que P = 0,68 de que qualquer
diferena entre mdias amostrais cair dentro desse intervalo. De forma anloga, pode- (X I - X 2) - O , onde
mos dizer que a probabilidade de aproximadamente 0,95 (95 casos em 100) de que z =
qualquer diferena de mdias amostrais caia entre -2 DP e +2 DP a contar da mdia adif
da distribuio, que zero, e assim por diante.
A distribuio amostrai de diferenas oferece uma slida base para testarmos
X1 mdia da primeira amostra
hipteses acerca da diferena mdia. entre duas amostras aleatrias. Suponhamos, por
X2 mdia da segunda amostra
"O" " zero" , isto , o valor da mdia da distribuio amostrai de dife renas_
. exemplo, que uma amostra de 100 liberais tenha um escore mdio de permissividade
(admitimos queM1 - M2 =O)
igual a 7 e que outra amostra, tambm de 100 sujeitos, porm conservadores, apresente
mdia 2. O raciocnio o seguinte: se a diferena mdia que obtivemos, 5, resultante
adif = desvio padro da distribuio amostrai de diferenas.
de (7 - 2 = 5), situar-se to longe da diferena "zero" de maneira a conferir-lhe somente J que o valor da mdia da distribuio de diferenas sempre admitido como
uma pequena probabilidade de ocorrncia na distribuio amostrai de diferenas, rejeita- sendo zero, podemos eliminar esse valor (O) da frmula acima (escala z) sem alterar o
mos a hiptese nula, ou seja, a hiptese que afirma ser a diferena obtida apenas o resul- resultado. Portanto:
tado da ao do acaso.* Se, por outro lado, nossa diferena mdia amostrai cai to perto
de zero de forma que sua probabilidade de ocorrncia grande, devemos aceitar a hi-
ptese nula e tratar a diferena obtida como resultante de erro de amostragem. z =
Portanto, devemos procurar determinar a que distncia a diferena mdia obtida
(neste caso, 5) fica da diferena mdia de zero. Ao fazer isso, devemos primeiro trans-
Com relao permissividade entre liberais e conservadores, precisamos, primeiro,
formar nossa diferena obtida em unidades de desvio padro.
traduzir nossa diferena mdia (obtida, calculada) no eqivalente z. Se o desvio padro
Recorde-se que para traduzir escores brutos em unidades de desvio padro usamos
da distribuio amostrai de diferenas (adif) for 2, obter~mos o seguinte escore z:
a frmula

X-X 7-2 5
z = - --- , onde z = + 2,5
a 2 2

X escore bruto Portanto, a diferena mdia, 5, entre liberais e conservadores situa-se a 2,5 desvios
X mdia da distribuio de escores brutos padres, a contar da mdia zero, na distribuio de diferenas.
a = desvio padro da distribuio de escores brutos. Perguntamos: qual a probabilidade de que uma diferena de 5 ou mais entre
mdias amostrais ocorra nica e exclusivamente em funo do erro amostrai? Recor-
Analogamente, podemos traduzir os escores mdios de uma distribuio de mdias rendo Tbua B no fim do livro, verificamos que z = 2,5 representa 49,38% da distri-
amostrais em unidades de desvio padro atravs da frmula , buio quer para a direita, quer para a esquerda da mdia zero. Em outras palavras,
98,76% (isto , 49,38% + 49,38% = 98.,76%) das diferenas mdias amostrais caem
v ' illf
z = , onde entre zero e uma diferena mdia de 5 para ambos os lados (a partir da mdia), donde
ax resultam, como ilustra a Figura 8.5, valores positivos e valores negativos. Em termos pro-
babilsticos, isto significa que existe uma P = 0,99 (99 possibilidades em 100) de que uma
X mdia amostrai diferena mdia caia entre -5 e +5. Se subtrairmos de 100% (100%- 98,76% = 1,24%),
M mdia da populao (mdia das mdias) encontraremos, por arredondamento, P = 0,01; essa a probabilidade de que uma dife-
ax erro padro da mdia (estimativa do desvio padro da distribuio de rena mdia de 5 (ou maior que 5) entre amostras ocorra nica e exclusivamente por
mdias). causa do erro amostrai. Em outras palavras, uma diferena mdia de 5 ou mais ocorre
por fora do erro amostrai (e, portanto, aparece na distribuio amostrai) apenas uma
vez em cada 100 diferenas mdias. Sabendo disso, no poderamos considerar a rejeio
N.T.: comum usar-se com o mesmo sentido erro amostrai e diferena resultante da ao do da hiptese nula e a aceitao da hiptese experimental? (Lembremo-nos de que a hip-
ac-aso.
tese experimental-Ha-estabelece que realmente existe uma diferena populacional
Testes de Diferenas entre Mdias 137
136 TOMADA DE DECISES

rejeio da hiptese nula sempre que for muito pequena a probabilidade de que a di-
ferena amostrai tenha sua origem no erro de amostragem (por exemplo, 5 casos em
100). *
Por uma questo de conveno, usamos o nivel de confiana (significncia) de
0,05 (= 5%). Em termos mais simples, estamos dispostos a rejeitar a hiptese nula se a
diferena amostrai obtida ocorrer por acaso somente 5 vezes ou menos em 100(isto , 5%
z 2,5 z +2,5 no mximo). O nvel de confiana de 0,05 foi indicado graficamente na Figura 8.6.
Como ela bem ilustra, este nvel de confiana encontra-se nas reas pequenas das caudas
da distribuio de diferenas entre mdias. Essas so as reas sob a curva que represen-
- 7 - 6 - 5 -4 -3 - 2 - 1 o +1 +2 +3 +4 +5 +6 +7 tam uma distncia de (mais ou menos) 1,96 desvios padres contados a partir de zero,
que a mdia das diferenas.
L-- - -- -98, 76%- - - - - - ' Com vistas a entender melhor por que esse ponto particular na distribuio
amostrai representa o nvel de confiana (significncia) de 0,05, podemos recorrer
FIGURA 8.5 Representao Grfica da Porcentagem da rea Total na Distribuio de Diferenas Tabela B (fim do livro) para determinar a porcentagem da freqncia total que est
Entrez = -2,5 e z =+2,5 associada aos 1,96 desvios padres contados a partir da mdia. Vemos que 1,96 desvios
padres para ambos os lados demarcam 2,5% das diferenas mdias amostrais. (Assim:
entre conservadores e liberais-no caso de a varivel observacional ser a permissividade 50% - 4 7,5% = 2,5%.) Em outras palavras, 95% das diferenas amostrais caem entre
na criao de filhos.) Afinal, 1 possibilidade em 100 representa uma boa margem de -1,96 DPs e +1 ,96 DPs contados da mdia das diferenas (zero); somente 5% caem a
risco, no mesmo? partir desse ponto (1,96) (2,5% + 2,5% = 5%).
Dada a situao acima, a maioria de ns decidiria rejeitar a hiptese nula, ainda Nveis de significncia podem ser estabelecidos para qualquer grau de probabili-
que pudssemos estar errados ao faz-lo. (No esquea de que sempre existe 1 possibili- dade. Por exemplo, o nvel de 0,01 mais rigoroso, uma vez que sua adoo implica
dade em 100.) Entretanto, a deciso no sempre to fcil. Suponha-se, por exemplo, rejeitar a hiptese nula somente no caso de haver 1 possibilidade em 100 de que a dife-
que seja do nosso conhecimento o fato de a diferena mdia ocorrer, por erro amostr~,
10 (isto , p = 0,10), 15 (isto , P = 0,15) ou 20 (isto , P = 0,20) vezes em cada 100. Sera
que ainda assim vamos rejeitar a hiptese nula? Ou ser melhor e mais "prudente"
atribuir nossa diferena ao erro amostrai?
Precisamos, pois, de um ponto de referncia consistente* para decidir se uma di-
ferena entre duas mdias amostrais grande demais para ser explicada apenas pela
ao do acaso. Em outras palavras, precisamos de um mtodo que nos possibilite decidir
quando um determinado resultado estatisticamente significante.**

NIYEIS DE SIGNIFICNCIA
z = - 1,96 o
Para decidir se a diferena amostrai obtida estatisticamente significante-resultado de
uma real diferena entre as populaes e no apenas produto de erro amostrai- habi- tL---- 95%-----~
tual estabelecer um nivel de confiana (tambm chamado nvel de significncia), nvel
esse que representa a probabilidade com que a hiptese nula pode ser rejeitada com
FIGURA 8.6 Representao Grfica do Nvel de Significnda (Confiana) de 0,05 (isto , 5%)
confiana (segurana)*** ou, dizendo de outro modo, a probabilidade com que a hip-
tese experimental pode ser aceita (com confiana). Em conseqncia, decidimos pela
/
* N.T.: Sendo de importncia"capital esse aspecto da teoria da deciso estatstica, no demais
recolocar a questo nos seguintes termos: uma diferena entre rndzs rnostrais ocorre (1) porque
N.T.: Esse ponto de referncz comumente designado valor critico. existe uma real diferena entre as rndzs das populaes de onde foram extradas as amostras ou
u N.T.: Um resultado estatisticamente significante quando igual a ou maior que o valor (2) porque houve interferncz do erro de amostragem Se houve erro de amostragem, tudo se passa
cr(tico (isto , o ponto de referncz) , o qual, via de regra, encon~ra-se tabelado. corno se no existisse diferena entre as mdias amostrais. Esse fenmeno, porm, relativamente
** N.T.: Essa confzna ou segurana sempre relativa e no constitui um problema do estatis-
raro e, por isso, est associada a ele uma probabilidade muito pequena. Em outras palavras, as reais
diferenas no ocorrem por acaso, mas, sim, por fora de um agente especifico.
tlco, seno do especzlista na rea em que determinada pesquisa esteja sendo feita.
138 TOMADA DE DECISES
Testes de Diferenas entre Mdias 139

rena amostrai encontrada deva-se apenas ao do acaso, isto , do erro de amostra- amostras pareadas, a fim de tornar possvel o seu clculo. Contudo, esse desvio padro
gem. O nvel de 0,01 representado pela rea que se estende de - 2,58 a +2,58 desvios desempenha um importante papel nos testes de hipteses relacionados com diferenas
padres contados a partir de zero. entre mdias e, portanto, no pode ser ignorado.
Os nveis de confiana no nos oferecem garantia absoluta quanto correo da Felizmente, existe um mtodo simples atravs do qual o desvio padro da distri-
hiptese nula. Sempre que decidimos rejeit-la a um certo nvel de significncia, expo- buio de diferenas pode ser estimado de forma acurada com base nas duas amostras
mo-nos ao risco de estar tomando a deciso errada. Rejeitar a hiptese nula quando extradas. Essa estimativa do desvio padro da distribuio amostrai de diferenas
deveramos t-la aceitado ocasiona o chamado erro alfa (ou erro tipo I). A probabilidade costuma ser designada erro padro da diferena e simbolizada por adif Em smbolos:
de cometer um erro alfa s existe quando rejeitamos* a hiptese nula e varia de confor-
midade com o nvel de confiana adotado. Por exemplo, se rejeitarmos a hiptese nula,
ao nvel de 5%, e concluirmos que conservadores de fato diferem de liberais quanto aos
adif = -./ax 1 2 + ax 2 2 , onde
mtodos de criao de filhos, haver 5 possibilidades em 100 de estarmos errados. Em
Odif erro padro da diferena
outras palavras, P = 0,05 de que cometamos um erro alfa- e conservadores no diferem
realmente de liberais. De modo anlogo, se escolhermos o nvel de confiana (signifi-
OX I erro padrO da primeira mdia amOStra}
ax 2 erro padro da segunda mdia amostrai.
cnci) de 1%, s h 1 possibilidade em 100 (P = 0,01) de tomarmos a deciso errada
quanto diferena entre liberais e conservadores. bvio que, quanto mais rigoroso o
Com o propsito de ilustrar, vamos supor que obtivemos os seguintes dados para
nosso nvel de confiana, menor a probabilidade de cometermos um erro alfa. (Note-se,
uma amostra de 50 liberais e outra amostra de 50 conservadores:
tambm, que, quanto mais rigoroso o nvel, mais na "ponta" das caudas ele se localiza.)
Para exemplificar com um caso extremo, se adotarmos o nvel de 0,001 , o risco de
Liberais (N =50) Conservadores (N =50)
ocorrncia de um erro alfa fica limitado a uma vez em cada mil.
Entretanto, quanto mais nas pontas das caudas localizar-se o nvel de significncia, X = 7,0 X = 6,0
maior o risco de estrmos cometendo outro tipo de erro, conhecido por erro beta (ou s = 2,0 = 1,5
erro tipo /I). assim que se designa o erro de aceitar a hip~ese nula quando, na verda-
de, ela deveria ter sido rejeitada. O erro beta indica que a nossa hiptese experimental A fim de calcular o erro padro da diferena, precisamos,. primeiro, encontrar o erro
ainda pode estar correta, apesar da deciso de rejeit-la em favor da hiptese nula. padro para cada mdia amostrai. Recorde-se que isso se faz a partir do desvio padro
Uma forma de reduzir o risco de cometer este tipo de erro beta aumentar o tamanho das de cada amostra (ver Captulo 7):
amostras, de sorte que, havendo uma real diferena entre as populaes, tal fato fique
mais evidenciado pelo procedimento.* * s, 2,0 2,0
Nunca podemos estar certos de que no tomamos uma deciso errada relativamen-
U'J(, = 0,29
VN1 - 1 v'50 - 1 7,0
te hiptese nula, j que examinamos apenas uma amostra e no a populao toda.
Como no temos conhecimento dos verdadeiros valores populacionais,*** corremos o Sz 1,5 1,5
risco de cometer ou um erro tipo I ou um erro tipo 11, dependendo da nossa deciso. U';y2 0,21
vN2- 1 v'50 - 1 7,0
Tal risco, na tomada de decises estatsticas, depende da disposio do pesquisador.

Uma vez que conheamos o ax para cada mdia amostrai, podemos obter o adif como
ERRO PADRO DA DIFERENA se segue:
Nunca temos a possibilidade de conhecer, de imediato, o desvio padro da distribuio
de diferenas entre mdias. E, tal como o caso da distribuio amostrai de mdias -./0,08 + 0,04
(Captulo 7), seria um esforo descomunal tentar extrair um nmero muito grande de
= 0,35
~ N.T.: Quando rejeitamos a hiptese nula indevidamente. O erro padro da diferena (nssa estimativa do desvio padro da distribuio de dife-
u N.T.: Uma analogia pode ajudar a entender melhor o procedimento: quando certas partculas renas) , pois, 0,35. Se estivssemos testando a diferena entre liberais (X = 7,0) e
nuo so faci lmente visveis numa superfcie, uma lente de aumento, porque "aumenta" toda a regio conservadores (X = 6,0) com respeito varivel "permissividade", poderamos usar
por ela abrangida, reala, tambm, aquilo que antes era imperceptveL
nosso resultado (0,35) a fim de traduzir a diferena mdia amostrai (obtida) no seu
~ ~ N.T.: Verdadeiros valores populacionais o mesmo que parmetros. equivalente z (isto , em escala z) :
140 TOMADA DE DECISES TestesdeDifcrtmas ntrt>MMia 141

7-6 Homens (N=35) Mu lheres (N=35)


z = 0,35
2,86
0 ,35
XI x2

Voltando Tabela B (fim do livro), verificamos que um escore z igual a 2,86 I


representa exatamente 49,79% das diferenas mdias para cada lado, ou 99,58% das 1 2 4
2 4 4 16
diferenas mdias para ambos os lados da curva a partir da mdia das diferenas, que
1 1 1 1
zero. (Em outras palavras, 49,79% + 49,79% = 99,58%.) Se subtrairmos essa soma 2 4 1 1
de l 00%, veremos que menos de 1% (0,42%) dos escores-diferenas entre mdias possui 1 1 1
um valor igual ou superior a 1. Portanto, P menor que 0,01 de obtermos uma diferena 1 1
mdia igual a 1 por puro acaso (= erro de amostragem). Podemos rejeitar a hiptese 5 25
1 1 I
nula tanto aonvel de significncia de 0,05 quanto ao de 0,01 dependendo, apenas, do
2 4 2 4
critrio estabelecido para o nosso estudo.':' 4 16 2 4
5 25 1
1 1
Uma Ilustrao 1 1
2 4 1 1
Com vistas a dar ao leitor uma ilustrao passo a passo do procedimento (acima) que
1 1 2 4
permite testar a significncia da diferena entre duas mdias amostrais, vamos imaginar 2 4 3 9
que, ao nvel de 0,05, quisssemos pr prova a seguinte hiptese: do ponto de vista 1 1
etnocntrico, no h diferena entre homens e mulheres (M 1 = M 2 ). Nossa hiptese 2 4
experimental que as mulheres diferem dos homens com respeito ao etnocentrismo 2 1 1 1
I I 2 4
(M 1 =I= M 2 ). Para testar essa hiptese, vamos imaginar que "aplicamos" um instrumento
1 I 2 4
destinado a avaliar a varivel "etnocentrismo" a uma amostra aleatria de 35 homens e 1 I 2 4
a outra amostra, tambm aleatria, de 35 mulheres, obtendo os seguintes escores para 3 9
cada uma delas (X = escores etnocntricos. A escala vai de 1 a 5 e quanto maior o valor 3 9
maior o grau de etnocentrismo.) 1 1 1
4 16 1
I:X = 60 I:x2 = 142 I:X =54
Homens (N = 35) Mulheres (N = 35)

XI x2 x2 x2 PASSO 1 : Achar a mdia aritmtica de cada amostra.

1 1 lX 1 60
1 1 1 1 N 35
= 1,71
1 1 2 4
2 4 1
1 1 1 1 X 2-- lX2
1 1 1 1
N = 3545 = 1,54
3 9 3 9
3 9 1 PASSO 2: Achar o desvio padro de cada amostra.

-J-~
2

"Etnocentri smo " refere-se tendncia de ava liar todos os grupos de pessoas pela utilizao de
- X2 =
1 2
.J 3~ - 2,92 = -J4,6 - 2,92 1,07
nossos prprios padres culturais.
;o N.T.: prtica no s usual como tambm "cientificamente saudvel" fixar o nvel de signifi-
nlnc ia antes d a realizao do experimento e da coleta de dados. Ta l prtica impede o pesquisador
..j3,26 - 2,3 7 0,94
ck fazer-se "concesses", caso os resultados finais no abonem a sua hiptese experimental.
142 TOMADA DE DECISES Testes de Diferenas entre Mdias 143

PASSO 3: Achar o erro padro de cada mdia. que contm pequeno nmero de respondentes (ou de dados). Do ponto de vista prtico,
uma amostra pode ser considerada pequena se contiver, por exemplo, menos de 30
S1 - 1,07 1,07 sujeitos. Embora os resultados baseados em amostras pequenas possam ser convenientes,
<Ty, - V34 = 0,18
=~ 5,83 se no necessrios, dada a dificuldade de colher amostras maiores, eles podem com-
prometer de forma sria as concluses, se sua interpretao for associada rea sob a
s2 0,94 0,94 curva normal (Tabela B). Esta afirmao verdadeira porque a distribuio amostrai de
rr v:!
-
= V34 = 5,83 0,16
~ diferenas s assume a forma da curva normal se as amostras que a compem forem
grandes. Um pesquisador que esteja trabalhando com 5, 10 ou 20 respondentes por
PASSO 4: Achar o erro padro da diferena. amostra no tem condies de satisfazer tal exigncia. Como resultado, ele no pode
usar escores z baseados na distribuio normal.
v'0,03 + 0,03 Esse "afastamento da normalidade" na distribuio de diferenas pode ser com-
pensado estatisticamente mediante o uso do que se convencionou chamar razo t (ou
= 0,25 estatlstica t). Tal como ocorre com o escore z , a razo t pode ser usada para traduzir
uma diferena mdia amostrai em unidades de erro padro da diferena. Ainda com a
PASSO 5: Traduzir a diferena mdia amostrai em unidades de erro padro da diferena. escala z como pano de fundo, a razo t pode ser analogamente obtida da seguinte
forma : calcular a diferena entre as mdias das amostras e dividi-la pelo erro padro
1,71 - 1,54 0,17 da diferena. Em smbolos:
z 0,68
0,25 0,25
t , onde
PASSO 6: Achar a porcentagem da rea total sob a curva normal entre z e a mdia das
diferenas (O). (Ver Tabela B.)
X1 mdia da primeira amostra
25,17% x2 mdia da segunda amostra
+25 ,17% adif erro padro da diferena.
50,34% Como pode ser observado acima; a frmula da razo t idntica usada para o
clculo dos escores z, aprendida anteriormente. Porm, ao contrrio do que ocorre com
PASSO 7: Subtrair de 100% para achar a porcentagem da rea total associada dife- a estatstica z, a estatstica t precisa ser interpretada com referncia a graus de liber-
rena mdia amostrai obtida. dade3 (gl), graus esses que no s variam com o tamanho da amostra mas que so res-
ponsveis diretos pelo formato da distribuio amostrai de diferenas. Quanto maior
100,00% a amostra, maior o nmero de graus de liberdade. Quanto maior o nmero de graus de
- 50,34% liberdade, maior a aproximao da distrib_uio de diferenas curva normal. Com infi-
49,66% nitos graus de liberdade, a razo t transforma-se num escore z e, a, podemos empregar
a Tabela B para interpretar nossos resultados.
Do resultado do Passo 7, acima, vemos que, por arredondamento, h P = 0,50
Mas que ocorre quando trabalhamos com amostras pequenas? Como que resol-
de obtermos uma diferena mdia de 0,17 (isto , 1,71 - 1,54 = 0,17) por mero erro
vemos o problema de encontrar os graus de liberdade e interpretar nossa razo t? Quan-
amostrai. Como conseqncia, devemos aceitar a hiptese nula e rejeitar a hiptese
do esta ltima estiver sendo usada na comparao de duas mdias amostrais, o nmero
experimental ao nvel de significncia de 0,05. A probabilidade de ocorrncia da nossa
de graus de liberdade pode ser calculado pela aplicao da frmula
diferena mdia obtida entre homens e mulheres maior que 5% (ou seja, 5 em 100).
Para sermos exatos, a probabilidade de 50 em 100! Concluso : nossos dados amostrais gl = N1 + N2 - 2, onde
no indicam que, rel;ltivamente varivel "etnocentrismo", haja diferena significativa
entre homens e mulheres. 3
Graus de liberdade, tecnicamente, referem-se liberdade de variao num conjunto de escores.
Se tivermos uma amostra de 6 escores, ento 5 deles tm " liberdade" de variar, enquanto que 1 e
COMPARAES ENTRE AMOSTRAS PEQUENAS apenas 1 fixo (quanto ao valor) . Portanto, numa amostra simples de tamanho 6 (por exemplo, 6
ncomum que pesquisadores, principalmente no campo social, trabalhem com amostras respondentes), gl = N - 1 ou 5.
144 TOMADA DE DECISES Testes de Diferenas ntrc Mdias 145

N1 = tamanho da primeira amostra


Identidade
N2 = tamanho da segunda amostra. Anonimato (N = 6) Conhecida (N =6)
Portanto, se estivermos comparando uma amostra de 6 liberais com outra de 8 conser-
vadores, nossos graus de liberdade sero:;(i + 8 - 2 = 12. ~ ~ ~ ~
-----------~fJwNmf'.lff~RSSt!ii9ADE FEDERAL DO
, Coin o auxlio da Tabela C (fim do livro) e do nmero (calculado) de graus de 1 PARA
liberdade, podemos interpretar qualquer valor obtido de t. A Tabela C registra os valores 2 4 ;
2~1BLIOTJ::CA CE NTR:At
de t necessrios para a rejeio da hiptese nula aos nveis de significncia de 0,05 e 1 5 25
0,01, associados a diferentes graus de liberdade. Ao examinar a Tabela C, vemos uma 1 5 25
2 4 4 16
coluna encimada por gl (graus de liberdade) e uma lista de valores t para cada grau de 1 1 5 25
liberdade (p. ex., 1, 2, 3, ... , 30, ... , 40, ... 100, ... , 00) , aos nveis de significncia de 0,05 e
~X= 8 ~x2 = 12 ~x = 21 ~x2 = 125
0,01. Como veremos adiante, esses valores t podem ser usados na interpretao do nosso
t calculado (tambm chamado observado).
Observamos que os 6 membros da amostra "annima" deram, no total, 8, en-
Comparao entre Amostras Pequenas: Uma llustrao quanto que os 6 membros da amostra "no-annima", 27. O procedimento passo a
Para ilustrar o uso da estatstica t, dos graus de liberdade e da Tabela C no teste da di- passo que se segue pode ser usado para testarmos se a diferena obtida estatisticamente
ferena entre mdias de duas amostras pequenas, considere-se a seguinte situao: certo significante.
pesquisador decide testar se o "comportamento caridoso" varia em funo do "anoni-
mato" ou "no-anonimato" do doador. Da: PASSO 1: Achar a mdia de cada amostra.

Hiptese Nula: O grau de "comportamento caridoso" no varia em funo do "ano- LX, 8


(M1 = M2 ) nimato "ou "no-anonimato" do doador. - 6 1,33
N
Hiptese Experimental: O grau de "comportamento caridoso" varia conforme seja o X_ LX2 27
(M1 =f= M 2 ) doador mantido no "anonimato" ou no "no-anonimato". z- N = 4 50
6 '

Para testar essa hiptese, o pesquisador estabelece 5% como nvel de significncia; PASSO 2: Achar o desvio padro de cada amostra.
por outras palavras, ele decide, desde o incio, rejeitar a hiptese nula somente se a
probabilidade for de 5 em 100 * de que a diferena mdia amostrai resulte de erro de s, =
V/LNX z - X2 =
y/ 162 - (1,33)2 =-:::-:::-~-==-
v'2,oo- 1,n 0,48
amostragem (isto , por ao do acaso). Depois de ter estabelecido esse critrio de signi-
ficnci, ele colhe duas amostras aleatrias de doadores potenciais. A todos os membros
~~
2
de ambas as amostras ele solicita donativos, em dinheiro, para distribuio aos sobrevi-
ventes de um terremoto de grandes propores. Aos 6 membros da primeira amostra ele
s2 = - X2 = ~-1 ~ 5 - (4,50) 2 y20,83 - 20,25 0,76
d a garantia do anonimato; aos 6 membros da segunda amostra ele promete tornar
pblicos os seus nomes. Temos, a, as condies experimentais de anonimato versus PASSO 3: Achar o erro padro de cada mdia.
identidade conhecida.
As quantias** doadas pelos membros de ambas as amostras figuram no quadro (J',Y, =
S. -0,48 0,48
abaixo: ~ -V5 2,24
0,21

s 0,76 0,76
(J'x. = 0,34
* N.T.: Cumpre salientar que o nvel de significncia de 5%, tal como foi estabelecido, a proba-
bilidade mxima tolerada, mas nada impede que esse nvel seja efetivamente menor que o estabele-
~ V5 2,24
cido. Maior que no pode!
'"* N.T.: No texto original, as quantias figuram em dlares (US$). Tendo em mente aproveitar o PASSO 4: Achar o erro padro da diferena.
exemplo, que foi muito bem concebido, a unidade monetria (US $) foi eliminada, de sorte que
I , 2, 3, 4 e 5 podem significar qualquer quantia, em qualquer moeda, desde que seja respeitada a
paridade cambial.
y0,04 + O, 12 = v'J6 0,40
146 TOMADA DE DECISES Testes de Diferenas entre Mdias . 147

onde
PASSO 5: Traduzir a diferena mdia amostrai em unidades de erro padro da diferena.
desvio padro da primeira amostra
x, .- .X2 f.:.=.> .: r,:n - 4,so 3,17 desvio padro da segunda amostra
t - -7,93 tamanho da primeira amostra
Octif ..., 0,40 0,40
tamanho da segunda amostra.
PASSO 6: Achar o nmero de graus de liberdade.
Para ilustrar passo a passo o procedimento que permite comparar amostras de
gl = N1 + N2 - 2 = 6 + 6 - 2 = 10 tamanhos diferentes, considere-se a hiptese de que crianas negras e crianas brancas
de certa regio urbana diferem quanto tendncia para a crirninalidade: Nesse caso,
temos:
PASSO 7: Comparar a razo t (obtida, calculada) com o t adequado (que figura na
Tabela C). Hiptese Nula: Crianas negras no diferem de crianas brancas com relao varivel
t 0 = t observado (obtido) (M 1 = M 2 ) observacional "tendncia para a criminalidade ".
7,93
te = t crtico (tabelado) 2,228 Hiptese Experimental: Crianas negras diferem de crianas brancas com relao
gl 10 (M 1 =I=M2 ) varivel observacional "tendncia para a criminalidade".
p 0,05
Para testar essa hiptese ao nvel (de confiana/significncia) de 0,05, imagine-se
Como bem evidencia o passo 7, para rejeitarmos a hiptese nula ao nvel de que certo pesquisador tenha submetido duas amostras aleatrias, de tamanhos diferen-
confiana (significncia) de 0,05, com 10 graus de liberdade, nosso t observado (t0 ) tes, a um instrumento de medida capaz de fornecer informaes numricas (dados)
deve ser igual a 2,228 ou maior. No caso em foco, obtivemos um t = 7,93 . Portanto, relacionadas com a "tendncia para a crirninalidade" . A amostra de crianas brancas era
rejeitamos a hiptese nula e aceitamos a hiptese experimental. O grau de "compor- de tamanho 4 e a de negras, 7. Nessa escala, o valor 1 representa baixa tendncia para a
tamento caridoso" varia, na realidade, em funo do anonimato e do no-anonimato. criminalidade e o valor 5, forte tendncia. Os escores finais constam do quadro abaixo:
Para ser mais especfico, a condio "identidade conhecida" produz, significantemente
"mais caridade" (X = 4,50) do que a condio "anonimato" (X = 1,33). Brancas (N =4) Negras (N = 7)

COMPARAES ENTRE AMOSTRAS DE TAMANHOS DIFERENTES x, x2 x2


At agora, temos trabalhado com amostras que contm exatamente o mesmo nmero 1 1 4 16
de respondentes ou de dados. Na ilustrao anterior, por exemplo, cada amostra con- 2 4 1
tinha 6 respondentes. Porm, quando, de fato, estamos realizando uma pesquisa, no 1 1 1
3 9 1
raro ocorre que nossas amostras diferem quanto ao tamanho. Poderamos, assim, ter
uma amostra de 50 liberais e outra de 64 conservadores ou uma amostra de 15 homens I:x, =7 I:X2 = 15 2 4
2 4
e outra de 22 mulheres. Para que seja possvel fazer comparaes entre amostras de
tamanhos diferentes, precisamos encontrar uma forma de atribuir peso adequado
influncia de cada amostra. No caso de X, isso ocorre automaticamente, uma vez que
sempre dividimos I:X por N. Tal, porm, no se aplica ao erro padro da diferena: cada
O procedimento para testar essa hiptese pode ser ilustrado como se segue:
desvio padro amostrai-em que se baseia o Octif- "contribui" da mesma maneira na
frmula aprendida pginas atrs, muito embora diferenas grandes e importantes, ligadas
PASSO 1 : Calcular a mdia de cada amostra.
ao tamanho da amostra, possam estar presentes.
Esse problema pode ser contornado mediante o emprego da frmula do erro
X _ lX, 7
1,(5
padro da diferena, em que a influncia relativa de cada desvio padro pode ser ponde- , - N 4
rada em termos do respectivo tamanho da amostra. Essa frmula figura a seguir:
- lX 2 12
X2=/T 1,71
7
148 TOMADA DE DECISES
Testes de Diferenas entre Mdias 149

PASSO 2: Calcular o desvio padro de cada amostra. mens vs. mulheres", "negros vs. brancos", "liberais vs. conservadores". Antes de pas-
sarmos para outro tpico, precisamos introduzir uma ltima variao de procedimento
2 estatstico para a comparao de duas mdias. Estamos falando do procedimento
/lX - X2 = /l.Q_ - 3 06 = y3,75 - 3,06 0,83 chamado painel ou antes-e-depois: trata-se de mensurar a mes11Ul amostra em dois
"' JV . " 4 ' momentos distintos (momento 1 vs. momento 2). Por exemplo, um pesquisador pode
querer medir a varivel "hostilidade" numa mesma amostra de crianas em dois mo-
1,04 mentos distintos: antes e depois de terem assistido a um particular programa de tele-
viso. Da mesma forma, poderamos querer medir "diferenas atitudinais" com refe-
PASSO 3 : Calcular o erro padro da diferena. rncia a um determinado candidato em dois momentos tambm distintos: antes e
depois da campanha eleitoral.

(
2
4(0,83) 7(1,04)
4 + 7 - 2
2
)' (l'~+
4~
l)7 Para ilustrar, passo a passo, esse procedimento comparativo (antes-e-depois),
vamos supor que diversos sujeitos tenham sido desapropriados e forados a mudar
de residncia em virtude da construo de um novo elevado. Como pesquisadores
sociais, temos interesse em determinar o impacto da mobilidade residencial forada
= ~( 2 76 ; 7 56
) co,25 +0,14)= ~C 0932 )co,39)= v1 ,15~,o,39) sobre os sentimentos de "vizinhana" (isto , se havia, por parte dos mesmos sujeitos,
predisposio favorvel para com os vizinhos antes da mudana e se essa predisposio
= V,4S = 0,67 sofreu alterao depois dela). Nesse caso, ento, M 1 o escore mdio de "aceitao
dos vizinhos" no momento 1 (antes da mudana) e M 2 o escore mdio de " aceitao
PASSO 4: Traduzir a diferena mdia amostrai em unidades de erro padro da ~iferena. dos vizinhos" (outros, naturalmente) no momento 2 (depois da mudana). Portanto:

1,75 - 1,71 0,04 Hiptese Nula : O grau de "aceitao dos vizinhos" no sofre influncia da varivel
t 0,06 (M1 =M2 ) "mudanaforada':
0,67 0,67
Hiptese Experimental: O grau de "aceitao dos vizinhos"sofre influncia da vari-
PASSO 5: Achar opmero de graus de liberdade. (M1 i=M2 ) vel "mudana forada':

gl = N 1 + N 2 - 2 = 4 + 7 - 2 = 9
~ara testar o impacto da mudana forada sobre os sentimentos de "vizinhana",
entrevistamos uma amostra aleatria* de 6 sujeitos, antes e depois da mudana. De
PASSO 6: Comparar a razo t obtida com a razo t tbelada (Tabela C). nossas entrevistas resultam os seguintes escores de "aceitao dos vizinhos" (escores
mais altos, numa escala de 1 a 4, indicam maior aceitao):
razo t obtida (t observado) 0,06
razo t tabelada (t crtico) 2,262 Antes da Depois da
gl 9 Mudana Mudana Diferena (Diferena) 2
p 0,05 Respondente D2
X! x2 X1 -X2=D

Como indica o passo 6, para rejeitarmos a hiptese nula ao nvel de 0,05, com Estvo 2 1 I 1
9 graus de liberdade, nosso t calculado deve ser igual a 2,262 ou maior. Posto que Mrian 1 2 - 1 1
Carolina 3 1 2 4
obtivemos um t calculado de apenas 0,06, devemos aceitar a hiptese nula e rejeitar
Linda 3 1 2 4
a hiptese experimental. Nossos resultados no sustentam a opinio de que crianas Alan 4 - 1 1
negras e crianas brancas diferem significativamente com respeito varivel "tendncia Davi 4 1 3 9
-
para a criminalidade". I:xl = 14 I:x2 = 8 w2 = 20

OMPARAO DE DADOS RESULTANTES DE DUAS


MENSURAES TEMPORALMENTE DISTINTAS DA MESMA AMOSTRA * N.T.: A casualidade da amostra refere-se apenas ao momento 1; no momento 2, os suje itos en-
trevistados vo ser obrigatoriamente os mesmos.
At aqui, discutimos comparaes entre duas amostras independentes, tais como " ho-
150 TOMADA DE DECISES Testes d e Diferenas entre Mdias I5I

O quadro acima demonstra que o foco da comparao do tipo antes-e-depois PASSO 6: Comparar a razo t calculada com a razo t tabelada (Tabela C).
est na diferena entre os momentos 1 e 2, como bem reflete a frmula para o clculo
do desvio padro (da distribuio dos escores-diferenas antes/depois): raz'o t calculada (t observado) 1,47
razo t tabelada (t crtico) 2,571
Ur~IVER!310ADE FEO:RAL 00 PARA
gl 5
p BlBLJOTECA CENTRAL
0,05

Nessa frmula, A fim de que seja possvel rejeitar a hiptese nula ao nvel de 0,05, com 5 graus
de liberdade, devemos obter um t observado de 2,571. Como o nosso t observado
s desvio padro da distribuio de escores-diferenas antes/ depois igual a 1,47-menos do que o t crtico- aceitamos a hiptese nula e rejeitamos a hip-
D diferena resultante da subtrao do "escore depois" do "escore antes" tese experimental. A diferena amostrai obtida relativamente a "sentimentos de vizi-
N tamanho da amostra (nmero de respondentes). nhana" antes e depois da mudana fruto, na verdade, de puro erro amostrai.

pASSO 1 : Calcular a mdia de cada momento. REQUISITOS PARA O USO DO ESCORE z E DA RAZO t
Como teremos a oportunidade de ver ao longo de todo o restante do livro, todos os
lX1 14 -
N
6 - 2,33 testes estatsticos, para poderem ser usados, devem preencher certos requisitos. Quando
mais no for, pelo menos deve ser possvel admitir certas condies: O emprego de um
teste inadequado pode confundir e levar o pesquisador a falsas concluses. Por isso, os
~ = 1,33 seguintes requisitos devem ser rigorosamente observados sempre que cogitemos de usar
os escores z ou a razo t como testes de significncia:
PASSO 2: Calcular o desvio padro da diferena entre os escores colhidos nos mo- 1. Comparao entre duas mdias. O escore z e a razo t ~o empregados a
mentos 1 e 2. fim de possibilitar: (a) comparao entre duas mdias de amostras (aleatrias)
independentes; (b) comparao entre as mdias de dois conjuntos de escores
s - relativos mesma amostra, porm colhidos em momentos distintos.
2. Dados Intervalares. Admitimos, aqui, que os nossos dados pertencem ao nvel
intervalar de mensurao. Portanto, no podemos usar escores z ou razo t
y3,33 - 1,00 = v'2,33 = 1,53 com dados ordinais ou dados que s possam ser categorizados, como o que
ocorre no nvel nominal de inensurao (ver Captulo 1).
PASSO 3: Calcular o erro padro da diferena. 3. Amostragem aleatria (casual). As nossas amostras devem ser sempre colhidas
s 1,53 aleatoriamente.
1,53 = 0,68
2,24 4. Distribuio normal. O emprego da razo t em amostras pequenas pressupe
vN -1
que a varivel observacional (na amostra) tenha distribuio normal na popula-
pASSO 4: Transformar a diferena mdia amostrai em unidades de erro padro da o. O escore z, em amostras grandes, no muito afetado se esse requisito
diferena. no for respeitado. Geralmente, no temos 100% de certeza de que existe nor-
malidade de distribuio. No havendo razo para supor o contrrio, muitos
2,33 - 1,33 1,00 pesquisadores admitem pragmaticamente que a varivel observacional tenha dis-
1,47 tribuio normal. Entretanto, se o pesquisador tiver boas razes para suspeitar
0,68 0,68
a
de possvel no-normalidade, aconselhamo-lo no dar preferncia ao teste t
PASSO 5: Achar o nmero de graus de liberdade. (ver Captulo 6).
I

gl=N-1 6 -1 5 Nota: N refere-se ao tamanho da amostra e


no ao nmero de escores j que h RESUMO
2 por respondente. Este captulo ocupou-se dos testes de hipteses relacionadas com diferenas entre
152 TOMADA DE DECISES Testes de Diferenas entre Mdias 153

mdias amostrais. Com esse propsito em mente, descrevemos e ilustramos uma distri-
buio de diferenas entre mdias amostrais como uma distribuio de probabilidades. Amostra 1 Amostra 2
Com o auxt1io dessa distribuio e do erro padro da diferena, foi possvel fazer afir-
8 1
maes de probabilidade acerca da diferena mdia; a partir da, foi tambm possvel 3 5
rejeitar ou aceitar uma hiptese nula a um especfico nvel de confiana (ou nvel de 8
significncia). Alm disso, vimos que uma estatstica t (razo t), associada a graus de 7 3
liberdade, podia ser usada para testar hipteses relacionadas com diferenas entre 7 2
pequenas amostras e entre amostras de tamanhos diferentes e, ainda, para testar a 6 1
8 2
mesma amostra quando mensurada em dois momentos distintos. A adequao da esta-
tstica t depende de certos requisitos, tais como: (1) comparao entre duas mdias;
4. Dadas as duas seguintes amostras aleatrias de escores, testar a significncia da
(2) dados intervalares; * (3) amostragem aleatria e ( 4) distribuio normal dos dados.
diferena entre suas mdias:

Amostra 1 Amostra 2
PROBLEMAS
1. Pesquisadores sociais procuraram testar a hiptese de que os jornais lidos pela 6 6
classe baixa so igualmente "dirigidos" para temas sexuais quanto os lidos pela 6 5
classe mdia. Empregando um "ndice de sexualidade", eles coligiram dados de 8 7
7 7
uma amostra aleatria composta de 40 artigos publicados em revistas de classe
5 3
mdia e outra amostra, tambm aleatria, com outros 40 artigos publicados em 4 3
revistas de classe baixa. Enquanto que a amostra da classe mdia apresentou uma 8 5
mdia de sexualidade igual a 3,0, com um desvio padro de 1,5, a amostra da classe 7 6
mais baixa apresentou mdia 4,0 e desvio padro igual a 2,0. (Critrio: maiores 7 3
escores mdios indicam maior grau de sexualidade.) Com os dados acima, testar a
hiptese de que no h diferena (significativa), relativamente sexualidade, entre 5. Testar a significncia da diferena entre as mdias das seguintes amostras aleatrias
os contedos das publicaes dirigidas a essas duas classes scio-econmicas. O que de escores:
que indicam os seus resultados?
Amostra 1 Amostra 2
2., Dois grupos de alunos fizeram exames finais de Estatstica. Um desses grupos re-
cebeu preparao formal para esse exame, enquanto que o outro apenas leu os 15 10
textos bsicos, sem, entretanto, comparecer s aulas. O primeiro grupo (o que 18 11
12 12
assistiu s aulas) conseguiu as seguintes notas: 2, 2, 3 e 4; o segundo grupo (o que
17 10
no assistiu s aulas) obteve as seguintes notas: 1, 1, 2 e 3. Testar a hiptese nula 19 10
de que no h diferena, com respeito aos escores de exame, entre o primeiro grupo
de alunos e o segundo. Que que seus resultados indicam? (Observao: a escala de 6. Testar a significncia da diferena entre as mdias das seguintes amostras aleatrias
notas ia de 1 a 10, sendo que os maiores valores atribua-se maior conhecimento de de escores:
Estatstica.)
3. Dadas as duas seguintes amostras aleatrias de escores, testar a significncia** da Amostra 1 Amostra 2
diferena entre suas mdias:
2
1 2
2 4
" N.T.: Melhor seria dizer no mnimo "dados intervalares" . Com efeito , nada impede que, com 3 2
" dados racionais", faa-se uso da estatstica f. 3 2
*" N.T.: Testar a significncia significa verificar se o t calculado ou observado (t0 ) igual a ou
maior que o t cr(tico <te). Lembrar que se to ~ te -+ H 0 rejeitada 7. Testar a significncia da diferena entre as mdias das seguintes amostras aleatrias
e se to < te -+ H 0 no rejeitada. de escores:
154 TOMADA DE DECISES
Testes de Diferenas antre Mdias 155

Amostra 1 Amostra 2 11. Testar a significncia da diferena entre mdias, numa situao do tipo "antes-
-depois", com os seguintes escores componentes de amostras aleatrias:
5 10
7 7
Respondente Antes Depois
7 9
3 9
A 7 3
6 7
B 6 4
5 8
4
c 5 2
D 4 3
6
7
12. Testar a significncia da diferena entre mdias, numa situao do tipo "antes-
8. Testar a significncia da diferena entre as mdias das seguintes amostras aleatrias
de escores: -depois", com os seguintes escores componentes de amostras aleatrias:

Amostra 1 Amostra 2 Respondente A ntes Depois

3 7 A 6 3
6 8 B 7 4
4 8 c 10 9
t/f'lll!fRSto
4 . . 9 D 9 7 4DE F.
i. 9 E 8 5
lliBI.Jorec EDiRAf.. o
6
5 A CetvTRAt. P4R~

9. Testar se. a diferena entre as mdias dos escores que compem as duas seguintes
amostras aleatrias significante :

Amostra 1 Amostra 2

10 10
4 10
1 8
2 7
4
8
3
5

1O. Antes e depois de assistirem a um filme, cujo objetivo era aliviar a discriminao
contra grupos minoritrios, seis estudantes foram testados. A varivel observa-
cional era " atitude para com judeus", e
quanto maiores fossem os escores, mais
Estudantes Antes Depois
favorveis seriam as atitudes. Com os dados
abaixo, testar a hiptese de que, com rela- A 2 4
o s "atitudes", o filme no exerceu B 2 5
a menor influncia sobre os estudantes. c 4 3
D 6 8
E 7 9
F 5 8
Anlise de Varincia 157

serem consideradas significantes. Quanto mais testes estatsticos realizarmos, entretanto,

9 maiores as possibilidades de encontrarmos valores estatisticamente significantes em


virtude de erro amostrai (mais do que em virtude de uma real diferena populacional) e,
da, cometer um erro alfa. Quando realizamos um grande nmero de tais testes, a inter-
pretao do resultado torna-se problemtica. Um exemplo extremo: como interpreta-
ramos um t significante no meio de 1.000 comparaes pareadas feitas num estudo

Anlise de Varincia particular? Sabemos que pelo menos algumas diferenas entre mdias podem ocorrer
simplesmente como resultado de erro amostrai.
Para superar esse problema e esclarecer a interpretao de nosso resultado, neces-
sitamos de um teste estatstico que, mantendo o erro alfa num nvel constante, permita
tomar uma nica deciso-geral-quanto presena de uma diferena significativa entre
as trs ou mais mdias que buscamos comparar. Tal teste conhecido por anlise de
varincia.
Negros e brancos, machos e fmeas, liberais e conservadores representam as espcies
de comparaes de duas amostras que ocuparam nossa ateno no captulo anterior.
Entretanto, a realidade social no pode-sempre- ser convenientemente dividida em A LGICA DA ANLISE DE VARINCIA
dois grupos; os respondentes nem sempre se dividem de modo to simplificado. Para fazer uma anlise de varincia, a variao total de um conjunto de escores tratada
Como resultado, o pesquisador quase sempre procura fazer comparaes entre como sendo dvisvel em dois componentes: a distncia * dos escores brutos com relao
trs, quatro, cinco ou mais amostras ou grupos. Para ilustrar, ele pode querer estudar s mdias dos grupos a que pertencem-e a isto se chama variao dentro dos grupos-, e
a influncia da identidade racial (negros, brancos ou orientais) sobre a discriminao a prpria distncia existente entre as mdias dos vrios grupos- o que recebe o nome de
profissional, do grau de privao econmica (severo, moderado ou brando) sobre a variao entre grupos.
delinqncia juvenil, da classe social (alta, mdia, baixa ou operria) sobre a motivao . A fim de tornar possvel o exame da variao dentro dos grupos, os escores
subjacente s realizaes. de motivao-realizao de sujeitos pertencentes a quatra classes sociais-( 1) baixa,
O aluno pode perguntar a si mesmo se devemos usar uma srie de razes t para (2) operria, (3) mdia e (4) alta-foram representados graficamente na Figura 9.1,
fazer comparaes entre trs ou mais mdias. Suponhamos, por exemplo, que deseje- onde X 1, X 2, X 3 e X 4 correspondem a escores brutos em seus grupos de referncia e
mos testar a influncia da classe social sobre a motivao subjacente a realizaes. Por i 1 , X 2 , X 3 e X 4 , s respectivas mdias grupais. Em termos simb~licos, vemos que_tal
que no podemos comparar duas a duas todas as possveis combinaes de classe so- variao " d~tro" dos grup~s refere-se s distncias entre X 1 e X 1, entre X2 e X 2,
cial e obter um t (t observado) para cada comparao? Pelo uso deste mtodo, quatro
entre X 3 e X 3 e entre X4 e X 4.
amostras geram seis combinaes pareadas para as quais seis valores (razes) t devem ser Podemos visualizar tambm a variao "entre" grupos. Com o auxi1io da Figura
calculados: 9.2, vemos que o grau de motivao subjacente a realizaes varia com a classe social:
1. classe alta versus classe mdia; o grupo pertencente classe alta (X 4 ) tem maior motivao do que o grupo pertencente
2. classe alta versus classe operria; classe mdia (X 3 ) o qual, por sua vez, tem maior motivao do que o grupo perten-
3. classe alta versus classe baixa;
4. classe mdia versus classe operria;
5.
6.
classe mdia versus classe baixa;
classe operria versus classe baixa.

O procedimento de calcular uma srie de razes t envolve no somente uma boa


dose de trabalho como tambm uma limitao estatstica. Isto deve-se ao fato de ele
il!rvrvJ\ill
x 1-X1
Baixa
x2-X2
Operria
Xa-Xa
Mdia
x4-x4
Alta
aumentar a probabilidade de cometer-se um erro alfa- o erro de rejeitar-se a hiptese
nula quando, na verdade, ela deveria ser aceita. Recordem que o pesquisador est FIGURA 9.1 Representao Grfica da Variao Dentro de Quatro Grupos Pertencentes a Classes
Sociais Distintas '
geralmente disposto a aceitar um risco de 5% no que se refere a cometer um erro alfa
(o chamfidO nvel de confiana da ordem de 0,05). Ele espera, portanto, que, por mero
acaso, 5 de cada 100 diferenas qe mdias amostrais sejam grandes o suficiente para "' N.T.: Distncia, aqui, corresponde a discrepncia.
158 TOMADA DE DECISES Anlise d e Varincia 159

e seus dois componentes, temos as seguintes notaes: SSt = soma total de quadrados,

ilirvTvM\ X1
Baixa
X2
Operria
Xa
Mdia
x4
Alta
SSe = soma de quadrados entre grupos, e SSct = soma de quadrados dentro dos grupos.

Uma Ilustrao de Pesquisa


Consideremos uma situao de pesquisa em que seja possvel calcular cada tipo de soma
de quadrados. Suponha-se que busquemos determinar a influncia da orientao poltica
sobre os mtodos de educar as crianas. No captulo precedente, estudamos esse tpico
FIGURA 9.2 Representao Grfica da Variao Entre Quatro Grupos Pertencentes a Classes pela comparao entre liberais e conservadores. Em contraste, queremos agora fazer
Sociais Distintas comparaes que representam vrios pontos ao longo da, por assim dizer, escala pol-
tica (continuum poltico). Por exemplo, poderamos comparar a permissividade na
cente classe operria (X 2 Le este, fechando o crculo, maior motivao do que o grupo educao infantil demonstrada por conservadores, moderados, liberais e radicais. Em
pertencente classe baixa (X 1 ). tal caso, teramos:
A distino entre a variao dentro dos grupos e a variao entre grupos no
peculiar anlise de varincia. Muito embora no figurasse com essa denominao, Hiptese Nula: conservadores, moderados, liberais e radicais no diferem com respeito
encon~amos_uma distino semelhante na definio da estatstica t, onde a diferena permissividade na educao infantil. (M 1 =M2 =M3 =M4 )
entre X 1 e X 2 foi comparada com o erro padro da diferena ( Octif), que corresponde Hiptese Experimental: conservadores, moderados, liberais e radicais diferem com
a uma estimativa combinada de diferenas dentro de cada grupo. Portanto, respeito permissividade na educao infantil. (M 1 =I=M2 =I=M3 =I=M4 )

Vamos imaginar que de fato entrevistamos amostras aleatrias de quatro conser-


X1 - X2 +- variao entre grupos vadores, quatro moderados, quatro liberais e quatro radicais com vistas a determinar
t
Octif +- variao dentro dos grupos seus mtodos de educar crianas. Imaginemos, ainda, que os valores obtidos para per-
missividade sejam os constantes da Tabela 9.1 (onde a varivel permissividade assume
De modo similar, a anlise de varincia comporta uma razo F, cujo numerador valores que vo de 1 (pouca) at 5 (muita).
representa a variao entre os grupos comparados, e cujo denominador contm uma
estimativa da variao dentro desses grupos. Como veremos, a estatstica F (razo F) in- Soma de Quadrados Dentro dos Grupos
dica o tamanho da diferena entre os grupos em funo do tamanho da variao dentro de A soma de quadrados dentro dos grupos d-nos a soma dos quadrados dos afastamentos
cada grupo. Da mesma forma como era verdade para a estatstica t, quanto maior a de cada valor bruto cbm relao mdia da amostra a que ele pertence. Portanto, a
estatstica F (quanto maior a variao entre os grupos com relao variao dentro dos soma de quadrados dentro dos grupos pode ser obtida simplesmente pela combinao
grupos), maior a probabilidade de rejeitar-se a hiptese nula e aceitar-se a hiptese .da soma de quadrados dentro de cada amostra. Em smbolos:
experimental.
SSct = LXI + LX~ + LX + LX~ , onde
SOMAS DE QUADRADOS x = afastamento (discrepncia) obtido a partir de (X - X).
No mago da anlise de varincia est o conceito de soma de quadrados, que representa
o passo inicial para medir a variao total e a variao entre e dentro dos grupos. Pode Aplicando a frmula SSct aos dados da Tabela 9.1, obtemos:
ser at uma agradvel surpresa descobrir que somente o ttulo "soma de quadrados"
novidade para ns. O conceito em si foi introduzido no Captulo 5 como sendo um
SSct = 1,00 + 2,00 + 0,74 + 2,74 = 6,48.
passo importante no procedimento para a obteno do desvio padro. Naquele con-
texto, aprendemos a encontrar a soma de quadrados multiplicando, numa dada distribui- Som de Quadrados Entre Grupos
o; cada discrepncia por si mesma, somando, em seguida, os valores resultantes (Lx 2 ). A soma de quadrados entre grupos representa a soma dos quadrados dos afastamentos
Esse procedimento eliminou os sinais negativos, ao mesmo tempo que forneceu uma de cada mdia amostrai com relao media total. De acordo com o que precede,
base matemtica slida para o desvio padro. devemos determinar a diferena entre cada mdia amostrai e a mdia total (X - Xt),
Quando aplicado a uma situao em que grupos devem ser comparados, h mais elevar essa diferena ao quadrado, multiplic-la pelo nmero de valores da amostra e,
de um tipo de soma de quadrados, muito embora cada um deles represente a soma de por fim, somar tudo. A frmula decorrente da definio de soma de quadrados entre
afastamentos, ao quadrado, a partir da mdia. Conforme a distino entre variao total grupos
160 TOMADA DE DECISES Anlise de Varldncia 161

SSe = I:(X- XdN, onde Soma Total de Quadrados


Pode-se demonstrar que a soma total de quadrados, a soma dos quadrados dos afasta-
X qualquer mdia amostra! mentos de cada valor bruto com relao mdia total do estudo em questtlo, igual
Xt mdia total (mdia de todos os valores brutos originrios de todas as a uma combinao (soma) dos seus componentes "dentro" e "entre". A soma total
amostras combinadas) de quadrados para os dados da Tabela 9.I pode ser calculada como se segue:
N nmero de valores em qualquer das amostras
SSe soma de quadrados entre grupos. SSt = SSe + SSd = 0,48 + 6,48 = 6,96.
A soma total de quadrados pode tambm ser definida em termos da equao
O procedimento para encontrar a soma de quadrados entre grupos, relativamente aos
dados da Tabela 9.I, figura logo abaixo do quadro.* SSt = I:(X- Xt) 2 , onde

TABELA 9.1 Valores para Permissividade Relacionada com a Educao de Crianas, Obtidos de X um valor bruto de qualquer arriostra
Amostras de Conservadores, Moderados, Liberais e Radicais. Xt mdia total (mdia de todos os valores brutos originrios de todas as
amostras combinadas)
Conservadores (JV = 4) Moderados (N = 4) SSt soma total de quadrados.
X! X x2 x2 X x2
Usando a frmula anterior, subtramos a mdia total (Xt) de cada valor bruto do estudo
1 - 0,50 0,25 1 - 1 (X), elevamos ao quadrado os desvios (afastamentos) resultantes, somando-os em
2 0,50 0,25 3 1 1 seguida.
1 - 0,50 0,25 2 o o Para os dados da Tabela 9. I, vem :
-
2 0,50 0,25
-
2 o o 2
SSt = (I- I,75)2 + (2- I,75) 2 +(I- I,75)2 + (2 - I ,75) 2 +(I- I,75)
Lx=6 I:x 2 = 1,00 Lx=8 I:x 2 =2,00
+ (3- I,75) + (2- I ,75) + (2- I,75) + (1- I,75) + (2- I,75) 2
2 2 2 2

- 6
X 1 =4 = 1,5 x2=% = 2,o + (2- 1,75)2 + (2- I,75) 2 + (3- 1,75) 2
+ (2- 1,75)2 +(I- I,75) 2 +(I- I,75) 2
(-0,75) 2 +(0,25) 2 +(-0,75)2 +(0,25) 2 +(-0,75) 2 +(1 ,25) 2
Liberais (N=4) Radicais (N=4)
+ (0,25) 2 + (0,25) 2 + (- 0,75) 2 + (0,25) 2 + (0,25) 2 + (0,25) 2
x3 X x2 X4 X x2 +(1,25) 2 +(0,25) 2 +(-0,75) 2 +(-0,75) 2
0,56 + 0,06 + 0,56 + 0,06 + 0,56 + I ,56+ 0,06 + 0,06 + 0,56 + 0,06
1 - 0,75 0,56 3 1,25 1,56
0,25 0,06 0,06
+ 0,06 + 0,06 + I ,56 + 0,06 + 0,56 + 0,56
2 2 0,25
2 0,25 0,06 - 0,75 0,56 6,96
2 0,25 0,06 1 - 0,75 0,56
2
- Clculo das Somas de Quadrados
I:X=7 I:x = 0,74 I:X = 7 I:x 2 = 2,74
As frmulas decorrentes das definies de somas de quadrados para valores intra-grupos,
i3 =t- = 1,75 .x4 =t- = 1,75 valores inter-grupos e valores totais baseiam-se na manipulao de afastamento, o que
torna o processo trabalhoso e demorado. Felizmente, podemos, ao invs, empregar as
Xt=1,75 frmulas abaixo, muito mais simples, para obter um resultado na forma de estatstica F,
a qual idntica (excetuados os erros de arredondamento) que se obtm com as
SSe = (I,50 - I,75) 2 4 + (2,0 - 1,75)2 4 + (1,75- I,75) 2 4 + (1,75- 1,75)2 4 frmulas decorrentes das definies, de natureza mais complexa.
(- 0,25) 2 4 + (0,25) 2 4 + (0)4 + (0)4 = (0,06)4 + (0,06)4 + (0)4 + (0)4 Os valores brutos da Tabela 9.1 foram transcritos na Tabela 9.2 com o propsito
0,24 + 0,24 = 0,48 de ilustrar o uso das frmulas abreviadas para a soma de quadrados.
A frmula abreviada que permite calcular a soma total de quadrados a seguinte:
" N.T.: Por comodidade, N o mesmo para todas as amostras, isto , o nmero de elementos (I:Xt) 2
(sujeitos, dados) no varia de uma para outra. Isso no absolutamente necessrio, porm muito SSt = I:~ - - - , onde
comeniente, e o tipo de coisa bastante controlvel pelo pesquisadr. Nt
162 TOMADA DE DECISES Anlise de Varincia 163

Nt = nmero total de valores, combinadas* todas as amostras. Por exemplo, na Tabela 9.2:
Introduzindo os dados da Tabela 9.2 nessa frmula resulta:
(28) 2 36 64 49 49 784
(6 + 8 + 7 + 7) 2 =- + + +
SSt = (10 + 18 + 13 + 15) 16 4 4 4 4 16
4+4+4+4
9,0 + 16 + 12,25 + 12,25 - 49,0 = 49,5 - 49,0 = 0,50
(28) 2 784
56 - = 56 - - = 56 - 49 = 7
16 16 Posto que a soma de quadrados intra-grupos constitui a parte mais demorada
TABELA 9.2 Valores para Permissividade Relacionada com a Educao de Crianas, Obtidos de para ser calculada, podemos tirar vantagem do fato de que a soma total de quadrados
Amostras de Conservadores, Moderados, Liberais e Radicais igual soma de seus dois componentes. Portanto,

Conservadores (N =4) Moderados (N =4) SSd = SSt - SSe

X! x2 No presente caso,
1 I 1 1
2 4 3 9 SSd = 7,00- 0,50 = 6,50
1 2 4
2 4 2 4 A seguinte frmula abreviada serve para encontrar eventuais erros no clculo da soma
-- --
~X=6 ~x = 10
2
~X=8 ~x =18
2
de quadrados de valores intra-grupos:

x =f = 1,5 X = ~ = 2,0

Liberais (N = 4) Radicais (N =4) onde

X = escore bruto de qualquer amostra


1 3 9 N = o nmero total de escores de qualquer amostra.
2 4 2 4
2 4 1 Introduzindo os dados da Tabela 9.2, resulta:
2 4 1 1
---
c~ ]
2
c~ ]
2
~X=7 ~X=7 ~x2 =15
ssd = [ 10 - + [ 18 - + [ 13 - c~z] + [ 15 - c~z]
i=~ = 1, 7 5 i =-t = 1,75
~)
4
Xt = 1,75
( 10 -
36
4 ) + ( 18 - i)
6
+ (13 - + ( 15 - i)
(10- 9,0) + (18- 16,0) + (13- 12,25) + (15- 12,25)
A soma de quadrados entre grupos pode ser obtida mediante a seguinte frmula:
1,0 + 2,0 + 0,75 + 2,75 = 6,50
SS = ["' (~X)2] - (~Xtotat )2 d
e L, N Ntotal 'on e

N nmero total de escores (valores) em qualquer amostra QUADRADO MDIO


Nt nmero total de escores, combinadas todas as amostras Como bem poderamos esperar de uma medida de variao, o valor das somas de qua-
drados tende a tornar-se maior medida que a variao aumenta. Por exemplo, pro-
+ N.T.: "Combinada", a, no alude a nenhum aspecto de anlise combinat~ria; a palavra est vvel que SS = 10,9 designe uma variao maior do que SS = 1,3. Entretanto, a soma
~ ndo usada para indicar a juno de vrias amostras numa s, que, por isso, torna-se maior. de quadrados tambm se torna maior com o aumento do tamanho da amostra, de sorte
166 TOMADA DE DECISES Anlise de Varidrtcia 167

cantes, isto , razes F que precisamos obter* para que seja possvel rejeitar a hlptese Hiptese Experimental (ou Alternativa): As classes alta, mdia e baixa diferem signifi
nula aos nveis de significncia de 0,05 e 0,01. Tal como ocorreu com a estatstica t , o cativamente com respeito ao QI (M 1 =I= M 2 =I= M 3).
valor especzfico de F que devemos considerar (relativamente Tabela D) depende do
nmero de graus de liberdade. Portanto, ao consultar a TabelaD, procuramos duas vezes Para testar essa hiptese, vamos convencionar o nvel de significncia de 5% como
os graus de liberdade: uma para os grupos " entre" e outra para os grupos "dentro". critrio da confiana depositada nos resultados da pesquisa. Admitamos que seja pos-
Os graus de liberdade associados ao numerador (gle) foram escritos horizontalmente no svel medir o QI dos membros das trs amostras de classes sociais colhidas: alta, mdia
topo da tabela (D); os graus de liberdade associados ao denominador (gld) foram colo- e baixa. Os resultados das mensuraes figuram abaixo:
cados na vertical do lado esquerdo da mesma tabela. O corpo da Tabela D contm os F
significantes aos nveis de 0,05 e 0,01. Classe Alta (N = 5) Classe Mdia (N = 5)
Para os dados da Tabela 9.2, encontramos gle = 3 e gld = 12. Ento, entramos na
Tabela D localizando, em .primeiro lugar, a coluna gle = 3 e a linha gld = 12. Com esse
procedimento encontramos, no cruzamento, um F significante que, ao nvel de 0,05,
deve ser igual a 3,49, no mnimo; na tabela da pgina seguinte (ainda Tabela D), verifi- 130 16900 120 14400
camos que, ao nvel de 0,01, o F crtico deve ser igual a ou maior que 5,95. O nosso F 125 15625 115 13225
130 16900 115 13225
calculado (F0 = F observado) de apenas 0,31. Como resultado, no temos outra 120 14400 110 12100
escolha seno "aceitar" a hlptese nula e atribuir as diferenas das mdias amostrais 122 14884 112 12544
(no tocante permissividade ligada criao de filhos) a erro amostrai. Nada nos leva ~X=627 ~x2 = 78709 ~X=572 ~2 =65494
a crer que essas diferenas devam-se a uma real diferena nas populaes constitudas
por conservadores, moderados, liberais e radicais. X1 = 125,4 x2 = 114,4
Os resultados de nossa anlise de varincia podem ser apresentados num quadro-
-resumo semelhante' ao da Tabela 9.3. Tornou-se prtica comum resumir uma anlise
de varincia desse jeito. Classe Baixa (N = 5)

TABELA 9.3 Quadro-resumo de Anlise de Varincia (Resumo Ligado aos Dados da Tabela 9.2)
110 12100
Fonte de Variao gl ss MS F 100 10000
90 8100
Entre grupos 3 0,50 0,17 0,31 100 10000
Dentro dos grupos 12 6,50 0,54 85 7225
~X=485 ~x2 =47425

Uma Ilustrao x3 = 97,0


Com vistas a oferecer uma ilustrao passo a passo de uma anlise de varincia, vamos
supor que desejemos testar a hlptese de que o QI varia em funo da classe social. O procedimento passo a passo para testar a significncia estatstica das diferenas entre
Portanto: as mdias obtidas o seguinte :

Hiptese Nula: As classes alta, mdia e baixa no diferem significativamente com res- PASSO 1 : Calcular a mdia de cada amostra.
peito ao QI (M1 =M2 =M3).

x _ ~x~
~ -N
x 2 = ~X2
N
-
X 3=--
~x3
N.T.: a) A razo F ou a estattstica F que se obtm a partir de um conjunto de dados, e que o N
Autor chama de calculada, costuma ser tambm denominada "F0 " (F observado). b) As razes F 627 572 485
que figuram na Tabela D so tambm chamadas "Fc" (F crtticos). Observe-se que a rejeio de 5 5 5
uma hiptese nula em favor de uma hiptese experimental (ou alternativa) ocorre sempre que
Fo ~Fc. = 125,4 = 114,4 = 97,0
164 TOMADA DE DECISES Anlise de Varincia 165

que N = 200 produzir uma SS maior do que quando N =


20. Como resultado, a soma e
de quadrados no pode ser considerada como uma medida de variao "pura" inteira-
mente satisfatria, a menos que, claro, possamos encontrar uma forma de controlar gld = 16 - 4 = 12.
o nmero de escores envolvidos.
Felizmente, tal mtodo existe numa medida de variao conhecida por quadrado Estamos agora preparados para obter os quadrados mdios:
mdio (ou varincia), que se obtm atravs da diviso da SSe ou da SSct pelo nmero .
adequado de graus de liberdade (no Captulo 5, dividimos, de forma anloga, ~x 2 por 0,50
N como um passo na obteno do desvio padro). Portanto, 0,17
3
SSe
-,onde e
gle 6,50
MSct 0,54.
MS e quadrado mdio entre grupos 12
SSe soma de quadrados entre grupos
gle graus de liberdade entre grupos

e A ESTATSTICA F (RAZO F)
Como observamos artteriormente, a anlise de varincia produz uma estatstica F na
SSct
MSct -,onde qual se comparam a variao entre grupos e a variao dentro dos grupos. Estamos
gld agora prontos para especificar o grau de cada tipo de variao- quando medida por
meio de quadrados mdios. Portanto, a estatstica F pode ser considerada como indica-
MSct quadrado mdio dentro dos grupos tiva do tamanho do quadrado mdio entre grupos com relao ao tamanho do quadrado
SSct soma de quadrados dentro dos grupos mdio dentro dos grupos, ou seja:
glct graus de liberdade dentro dos grupos.

F
Contudo, precisamos ainda obter os graus de liberdade apropriados. Para o quadra-
do mdio entre grupos,
Para a Tabela 9.2,
gle R - 1, onde
0,17
R = nmero de amostras. F 0,31
0,54

Para encontrar o nmero de graus de liberdade no quadrado mdio dentro dos Tendo obtido uma razo (estatstica) F, devemos agora decidir se ela grande o
grupos,
suficiente para rejeitar a hiptese nula e levar aceitao da hiptese experimental.
Ser que conservadores, moderados, liberais e radicais realmente diferem quanto per-
- Ntotal - R , onde missividade na educao de crianas? Quanto maior a razo F calculada (isto , quanto
maior a MSe e menor a MSct), com maior probabilidade vamos obter um resultado
Ntotal = nmero total de escores, somadas todas as amostras significante em termos estatsticos.
R = nmero de amostras. Mas como reconhecer de maneira exata uma razo F significante? Recorde-se que,
Ilustrando com os dados da Tabela 9.2, na qual SSe = 0,50 e SSct = 6,50, calcula- no Captulo 8, a razo t que obtivemos foi comparada com diversos valores de uma
mos nossos graus de liberdade como se segue: tabela de razes t, ao nvel de significncia de 0,05, e com os graus de liberdade apro-
priados. De forma anloga, devemos agora interpretar nossa estatstica F (calculada)
gle = 4 - 1 = 3 com o auxlio da Tabela D no final do livro. Ela contm uma lista de razes F signifi-
168 TOMADA DE DECISES Andlise de Varldncia 169

Note-se que diferenas entre as mdias existem de fato , e que h uma tendncia de PASSO 5: Calcular os graus de liberdade entre grupos.
aumento nos Qis medida que a classe varia de baixa para alta.
gle = k-l =3-1 =2
PASSO 2: Calcular a soma total de quadrados
PASSO 6: Calcular os graus de liberdade dentro dos grupos.
~ 2 (LX total ) 2
SStotal = "-X total - N
total gld = Nt - k = 15 - 3 = 12
(627 + 572 + 485) 2
= (78709 + 65494 + 47425)- 15 PASSO 7 : Calcular o quadrado mdio entre grupos.
2
191628 - --rs-
(1684)
=
191628
-
2835856
15 SSe
MSe = - =
2050,53
= 1025,27
gle 2
191628 - 189057;07 = 2570,93
PASSO 8: Calcular o quadrado mdio dentro dos grupos.
PASSO 3: Calcular a soma de quadrados entre grupos.
SSd 520 40
(LX)2] (~X t)2 MSd - = - -' - = 43,37
SSe = [ L J:l - -----;;- gld 12

(627)2 (572) 2 (485) 2 (1684) 2 PASSO 9: Calcular a razo F (F0 , isto , o F observado).
= - 5- + - 5- + - 5- - 15
MS e 1025,27
393129 327184 235225 2835856 F = 23,64
5 + 5 + 5 - 15 MSd 43,37
= 78625,8 + 65436,8 + 47045,0-189057,07 = 191107,60- 189057,07
PASSO I O: Comparar o F observado com o F crtico constante da Tabela D.
= 2050,53
F observado = 23,64
F crtico 3,88
PASSO 4: Calcular a soma de quadrados dentro dos grupos.
2
SSd = SSt - SSe = 2570,93- 2050,53 = 520,40 gl
12
ou
p 0,05
ssd = L [ (LX ) 2
- (~)~ Como bem demonstra o passo 10, para rejeitar-se a hiptese nula ao nvel de
significncia de 0,05, com~ graus de liberdade *, nosso F calculado (observado) deve
( 6 ~7 ) ] + [ 65494- ( 5 ~2 )~ + [ 47425
2

( 4 ~5 ) ]
2
ser de, no mnimo, igual a 3,88. Uma vez que obtivemos um F igual a 23,64, podemos
,;, [ 78709 - -
rejeitar a hiptese nula e aceitar a hiptese experimental. Especificamente, possvel
concluir que, com relao varivel QI, existe uma real diferena entre as classes baixa,
393129] + [ 65494 - 327184] + [ 47425 - 235225] mdia e alta.
= [ 78709 - 5 5 5

= [78709- 78625,8) + [65494- 65436,8) + [47425- 47045,0) * N. T. : No existe grau de liberdade menor que 1. Por isso, no se v confundir
gl 2 com uma frao ~ significa: 2 gl no numerador
= 83,2 + 57,2 + 380,0 = 520,40 i2 12 12 gl no denominador
170 TOMADA DE DECISES Anlise de Varincia 171

COMPARAO MLTIPLA DE MDIAS comparadas. Dependendo do valor de qa, quanto maior o nmero de mdias, mais
Um F significante d-nos uma informao a respeito da diferena global existente entre " conservadora" (= resistente) torna-se a DHS no tocante rejeio da hiptes nula.
os grupos (amostras) estudados. Se estivssemos pesquisando a diferena entre apenas Como resultado, obteremos menos} iferenas significantes com a DHS do que com a
duas mdias amostrais, nenhuma anlise adicional seria necessria para a interpretao razo t . Alm disso, uma diferena entre mdias tem maior probabilidade de ser signi-
de .nosso resultado: em tal situao, a diferena obtida ou estatisticamente significante ficante numa comparao mltipla de trs mdias do que numa comparao mltipla
de quatro ou cinco.
ou no, dependendo da magnitude de F. Entretanto, quando encontramos um F signi-
ficante relacionado com diferenas entre trs ou mais mdias, pode ocorrer que seja Para ilustrar o uso da DHS, vamos voltar ao exemplo anterior em que se verificou
importante determinar onde se situam essas diferenas. Por exemplo, na ilustrao existirem diferenas nas classes sociais com respeito varivel QI. Mais especifica-
mente, obtivemos um F significante (F= 23,64) para as seguintes mdias colhidas de
anterior, descobrimos que existem, com relao s trs classes sociais pesquisadas,
amostras das trs classes sociais :
diferenas de QI significantes do ponto de vista estatstico. Considerem as possibilida-
des levantadas por esse F significante: X 1 (alta) poderia diferir significantemente de X 1 (classe alta) 125,4
.x2 (mdia); .X, (alta) poderia diferir significantemente de .x3 (baixa); x2 poderia X2 (classe mdia) 114,4
diferir significativamente de X 3 (baixa). X3 (classe baixa) 97,0
Como j foi explicado pginas atrs, tentar obter uma razo t para cada compara-
o (X 1 versus X 2 ; X 1 versus X 3 ; X 2 versus X 3 ) implicaria uma quantidade proibitiva PASSO 1: Construir uma tabela de diferenas entre mdias ordenadas. Para os dados
de trabalho, alm de aumentar a probabilidade de cometer-se um erro alfa. Felizmente, presentes, a ordem das mdias (da menor para a maior) 97,0, 114,4 e 125,4. Elas so
estatsticos desenvolveram vrios outros testes que permitem fazer comparaes mlti- dispostas em tabela de tal forma que a diferena entre cada par de mdias aparea numa
plas a partir de um F significante (isto , F0 ;;. Fc) e localizar onde se situam as diferen- matriz. Assim a diferena entre X 1 (alta) e X 3 (baixa) 28,40; a diferena entre X 1
as significantes en!re mdias. Vamos introduzir, ento, o teste DHS de Tukey, um (alta) e X 2 (mdia) 11 ,0; e a diferena entre X 2 (mdia) e X 3 (baixa) 17,4*.
dos mais teis no terreno da comparao mltipla. (Obs. : DHS significa "diferena
-
honestamente significante".) X3 = 97,0 x2 = 114,4 x , = 125,4
O DHS de Tukey usado apenas quando um F significante j foi obtido**. Por este
mtodo, o que fazemos comparar a diferena entre quaisquer duas mdias com a DHS. x3 - 17,4 28,4
Uma diferena entre duas mdias diz-se estatisticamente significante s se for igual a ou x2
-
- - 11,0
maior que a DHS. Em smbolos: x, - - -

DHS = qa~MS~ PASSO 2: Procurar qa na Tabela L Para encontrar qa na Tabela I (fim do livro), pre-
cisamos ter: (a) os graus de liberdade (gl) relativos a MSd ; (b) o nmero mximo de
onde mdias (k) e (c) o nvel de significncia-0,01 ou 0,05 . J sabemos, graas anlise de
varincia realizada, que gl = 12. Portanto, entramos na Tabela I pela coluna do lado
qa valor tabelado (isto , valor crz'tico) para um dado nvel de significn- esquerdo, at localizar 12 graus de liberdade. Em seguida, como estamos comparando
cia ''', a partir do nmero mximo de mdias que estejam sendo com- trs pares de mdias, consultamos a tabela horizontalmente, da esquerda para a direita,
paradas. at localizar a coluna que contm o nmero mximo de mdias (k = 3). Convencio-
MSd quadrado mdio intra-grupos (obtido na anlise da varincia) nando um nvel de significncia de 0,05, observamos que q0,05 = 3, 77.
n nmero de respondentes em cada grupo (admite-se que em todos os
grupos, ou amostras, haja o mesmo nmero de sujeitos). PASSO 3: Calcular a DHS.

Em oposio ao que ocorre com a razo t, a DHS leva em conta o fato de que a
probabilidade de um erro alfa aumenta medida que aumenta o nmero de mdias
DHS = q0,05 ~ = 3,77 v{4337
5 = 3,77 V8:67 = 3,77(2,94)
= 11 ,08 .

N.T.: Recorde-se, mais uma vez, que o Autor " prefere" usar a expresso " nvel de confiana" PASSO 4 : Comparar a DHS com a matriz de diferenas de mdias. Para que qualquer
m lugar de "nvel de significncia". Na verdade, no h grande inconvenincia, desde que essa diferena entre mdias (ver matriz) seja considerada estatisticamente significante
"confiana" seja interpretada da seguinte forma:. (100%- 5%) ou (100%- 1%).
n N.T.: Isto , quando F 0 ;;, F c. * N.T. : As diferenas so consideradas em valores absolutos, isto , desprovidas de sinal.
l72 TOMADA DE DECISES UNIVERSIDADE
BiBLIOTECA
FE - . ....
dlise de Varincia
CcN1' ) '
173

preciso que ela se iguale a ou exceda a DHS. De volta nossa matriz de diferenas de Classe
mdias, verificamos que a diferena de 28,4 QI entre XI (classe alta) e x3 (classe
Baixa Operria Mdia Alta
baixa), e a diferena de 17,4 QI entre X 2 (classe mdia) e X 3 (classe baixa) so maiores
que DHS = 11 ,08. Como resultado, conclumos que essas diferenas entre mdias so
8 7 6 5
estatisticamente significantes ao nvel de 0,05 . Somente a diferena de 11 ,O entre 4 3 2
5
X 1 e X 2 no se iguala a nem excede DHS- e , por isso, no-significante do ponto de 7 2 5 1
vista estatstico. 8 8 4 3

EXIGNCIAS PARA O USO DA ESTATSTICA F (RAZO F)


2. Testar a significncia das diferenas entre as mdias das seguintes amostras aleatrias:
A anlise de varincia s deve ser feita depois de o pesquisador ter levado em conta as
seguintes exigncias:
Amostra 1 Amostra 2 Amostra 3
1. Comparao entre trs ou mais mdias independentes- A razo F geral-
mente empregada para fazer-se uma comparao entre trs ou mais mdias
2 5 8
extradas de amostras independentes. A estatstica F no se presta para testes 1 4 9
em que o nmero de amostras menor que dois. Porm, no caso especfico 3 3 7
de duas amostras, tanto faz usar F ou t , uma vez que F= t 2 . 3 4 8
2. Dados intervalares-Ao fazer uma anlise de varincia, pressupomos ter atin-
gido o nvel intervalar de mensurao. Por igual raciocnio, dados categorizados 3. Testar se as diferenas entre as mdias das seguintes amostras aleatrias so sig-
ou ordenados no devem ser usados. nificantes:
3. Anwstragem casual- Nossas amostras devero ter sido extradas aleatoriamente,
de uma dada populao de escores. Amostra 1 Amostra 2 Amostra 3
4. Distribuio normal-Admitimos que a varivel em foco possui, na populao
da qual se extraem as amostras, distribuio normal*. 12 6 3
6 5 2
RESUMO 8 7 5
A anlise de varincia pode ser usada para fazer comparaes entre trs ou mais mdias 7 5 3
amostrais. Esse teste produz uma estatstica ou razo F cujo numerador representa a 6
variao entre grupos, e cujo denominador contm uma estimativa da variao dentro
dos grupos. A soma de quadrados representa o passo inicial para mensurar a variao. 4 . Testar se as diferenas entre as mdias das seguintes amostras aleatrias so signi-
Entretanto, ele sofre grande influncia do tamanho da amostra. Para superar esse proble- ficantes:
ma, dividimos SSe ou SSd pelos graus de liberdade apropriados, a fim de obter o quadra-
do mdio. A razo F indica o tamanho do quadrado mdio entre os grupos em funo Amostra 1 Amostra 2 Amostra 3
do tamanho do quadrado mdio dentro dos grupos. Interpretamos nosso F observado
(calculado) mediante uma comparao com um F crtico adequado constante da Tabela 5 4 3
O. Com base nessa comparao, decidimos se a hiptese nula deve ou no ser rejeitada. 5 3 5
Aps a obteno de um F significante, podemos determinar onde se localizam as dife- 4 2 1
renas significantes aplicando o mtodo de Tukey para a comparao mltipla de 3 2 3
6 3
mdias.
PROBLEMAS 5. Utilizando os mesmos dados do problema 4, determinar atravs do mtodo de
I . Nas seguintes amostras aleatrias de classe social, testar a hiptese nula de que a Tukey (comparao mltipla de mdias), onde, exatamente, ocorrem as diferenas
"camaradagem entre vizinhos" no varia com a "classe social". (Nota: escores mais significantes.
altos indicam maior grau de camaradagem.)
6. Testar se as diferenas entre as mdias das seguintes amostras aleatrias s:ro sig-
~ N.T. : No se pode admitir isso arbitrariamente. Havendo dvida quanto normalidade, faz-se nificantes:
um teste pata garantir-se esse pr-requisito.
174 TOMADA DE DECISES

Amostra F

1
1
Amostra 2

3
2
Amostra 3

4
4
Amostra 4

6
6
10
3
4
2
2
1
5
2
2
3
5
5
4
Qui-quadrado
5 3 6

7. Utilizando os mesmos dados do problema 6, determinar, atravs do mtodo de


Tukey (comparao mltipla de mdias), onde, exatamente, ocorrem as diferenas
e outros Testes
significantes.

No-paramtricas
Tal como indicamos nos Captulos 8 e 9, precisamos exigir muito do pesquisador que
emprega uma estatstica t ou uma anlise de varincia para fazer comparaes entre
suas amostras. Cada um desses teste_s de significncia apresenta uma lista de requisitos,
que inclui, entre outros, o pressuposto de que a caracterstica estudada (isto , a vari-
vel observacional) tem distribuio normal numa prticular populao. Alm disso,
cada um desses testes supe que a varivel tenha sido mensurada a nvel intervalar, no
mnimo, garantindo-se, assim, a possibilidade de atribuir a cada membro da amostra
o respectivo escore. Quando um teste de significncia- tal como a estatstica (razo) t
ou a anlise de varincia-requer (1) normalidade e (2) nvel intervalar de mensurao,
fala-se em teste paramtrica. 1
Como se arranja o pesquisador que no consegue empregar um teste paramtrica
porque no pode, honestamente, admitir normalidade de distribuio ou porque seus
dados foram colhidos num nvel de mensurao inferior ao intervalar? Suponha-se, por
exemplo, que ele esteja trabalhando com uma distribuio assimtrica, tal como renda
anual, ou com dados que tenham sido categorizados ou contados (nvel nominal) ou,
ainda, com dados ordenados (nvel ordinal).':' De que modo esse pesquisador pode fazer
comparaes entre amostras sem violar os requisitos de um determinado teste?
Afortunadamente, os estatsticos desenvolveram uma boa quantidade de testes

1
Tal designao baseia-se no termo "parmetro", aplicvel a qualquer caracterstica de uma
populao.
* N.T.: Esse problema de nveis de mensurao deve ser entendido como uma "escada": qualquer nvel,
a partir do segundo, pressupe que as caractersticas dos anteriores estejam sempre presentes. Ento,
por exemplo, suponha-se que X assuma os valores 160 em, 170 em e 185 em, onde X representa a
estatura de trs sujeitos. Pelo que j foi visto anteriormente, "comprimento" pertence ao nvel ra-
cional (escala de razo); entretanto, nada impede que se atribua o "posto" 1 ao sujeito de 160 em, o
2 ao de 170 em e o 3 ao de 185 em. Ou, nessa mesma ordem, podem aplicar-se as denominaes
"baixo", "mediano" e " alto", onde (baixo < mediano < alto). Essa operao, como fcil de ob-
servar, constitui um abaixamento de nvel de mensurao (de nvel racional para nvel ordinal).
O que importante notar que o abaixamento de nvel quase sempre poss{vel enquanto que a
elevao (isto , melhora) raramente se consegue- com sucesso.
176 TOMADA DE DECISES Qui-quadrado e outros Testes No-pa,amtrlcos 177

no-paramtricas de sighificncia- testes cuja lista de requisitos no inclui normalidade porque na populao matriz existem reais diferenas* entre -as variveis estudadas.
de distribuio ou nvel intervalar de mensurao. Para entendermos a posio impor- Porm,, ao contrrio do que ocorre com os testes de significncia anteriores, o qui-qua-
tante dos testes no-paramtricos em pesquisa, precisamos entender tambm o conceito drado e empregado para fazer comparaes entre freqncias e no entre escores m
estatstico de poder. Poder de um teste a probabilidade de rejeitarmos a hiptese nula -dios. Como resultado, a hiptese nula para o teste de qui-quadrado estabelece que a
quando ela realmente falsa- e, por isso mesmo, deve ser rejeitada. populaes no diferem relativamente freqncia com que ocorre uma caracterstica
O poder varia de um teste para outro. Os testes mais poderosos-aqueles que, com particular; por outro lado, a hiptese experimental estabelece que as diferenas amos-
maior probabilidade, levam rejeio da hiptese nula (H 0 ) quando ela mesmo fal- trais refletem diferenas reais na populao matriz- a partir da freqncia relativa de
sa- so testes que possuem os pr-requisitos mais difceis de satisfazer. Geralmente, uma dada caracterstica.
esses testes so paramtricas, tais como o t ou o F, que pressupem dados colhidos em Para ilustrar o uso do qui-quadrado com dadqs freqenciais (ou com propores
nvel intervalar (no mnimo) e distribuio normal, na populao, das caractersticas que possam ser reduzidas a freqncias), imagine-se que, ainda uma vez, tenhamos sido
estudadas (isto , as variveis) na amostra. Em contraposio, as alternativas no-para- chamados a investigar a relao entre "orientao poltica" e "permissividade na educa-
mtricas exigem muito menos em termos de pr-requisitos, e constituem-se testes de sig- o de crianas". Em vez de dar. notas (isto , atribuir escores) a liberais e conservadores
nificncia com poder bem menor que o dos correspondentes paramtricas. Em conse- em termos de seu grau de perrnissividade, podemos categorizar nossos sujeitos amostrais
qncia, ao admitir a hiptese nula falsa (e ao manter inalterados fatores tais como numa base estritamente do tipo "ou ... ou" ;** em outras palavras, o problema decidir
o tamanho da amostra), mais provvel que o pesquisador a rejeite pelo uso adequado quais so permissivos e quais so no-permissivos. Portanto:
de F ou de t do que mediante uma alternativa no-paramtrica.
bvio que os pesquisadores querem, a todo custo, rejeitar a hiptese nula-quan- Hiptese Nula: A freqncia relativa de liberais permissivos igual freqncia relativa
do ela falsa mesmo. Por isso, a maioria deles preferiria, idealmente, empregar testes de conservadores permissivos.
paramtricas de significncia. Entretanto, como observamos h pouco, comum no Hiptese Experimental: A freqncia relativa de liberais permissivos diferente da fre-
ser possvel preench~r as exigncias mnimas dos testes paramtricas. Em primeiro lugar, qncia relativa de conservadores permissivos:
muitos dos dados no campo psicossocial pertencem ou ao nvel ordinal ou ao intervalar.
Depois, nunca podemos ter certeza de que as caractersticas estudadas na amostra-tm,
de fato, distribuio normal na populao da qual ela foi extrada. CLCULO DO QUI-QUADRADO
Quando os requisitos de um teste (paramtrico) so violados, torna-se impossvel
conhecer o seu poder. Da que os resultados de um teste paramtrica, cujos requisitos O teste de significncia denominado qui-quadrado. o.cupa~se essencialmente com a dis-
no foram satisfeitos, no tm interpreta~o significativa. Sob tais condies, a maioria !i!!,o entre freqncias esperadas e freqncias obtidas (observadas). As freqncias
dos pesquisadores opta inteligentemente por testes de significncia no-paramtricas. e~p_e:_~das ([~) ~efere~-se aos termos da hiptese_~ul~, de acordo com os quais se espera
Este captulo introduz alguns dos mais conhecidos testes de significncia no-para- que a frequenc1a relativa (ou a proporo) seja a mesma para todos os grupos. Por exem-
mtricos: qui-quadrado , teste da mediana, prova de Kruskal-Wallis (anlise de varincia plo, se a expectativa de que os liberais sejam permissivos de 50%, ento ela tambm
por postos) e prova de Friedman (dupla anlise de varincia). corresponde a 50% para os conservadores. Em contraposio, s freqncias observadas
_(fq) referem-se aos re~_?ltados obtidos de forma efetiva no momento da coleta de dados,
donde decorre que, de um grupo para outro, elas podem- ou no-variar. No caso de
QUI-QUADRADO: UM TESTE DE SIGNIFICNCIA as diferenas entre as freqncias obtidas e as esperadas serem suficientemente grandes
O mais "popular" teste no-paramtrica de significncia utilizado em pesquisa chama-se que rejeitamos a hiptese nula e decidimos pela afirmao de que existe uma diferena
real na populao.
qui-quadrado (x2 ). Como veremos adiante, o teste de X2 usado na comparao* entre
duas ou mais amostras. Continuando com o presente exemplo, suponha-se que extrassemos uma amostra
semelhana do que ocorreu com a estatstica t e a anlise de varincia, existe aleatria de 20 liberais e outra amostra, tambm aleatria, de 20 conservadores ; em
uma distribuio amostrai de qui-quadrado que pode ser usada para estimar a probabili- seguida, esses 40 sujeitos poderiam ser dicotomizados em "permissivos" e "no-permis-
dade da obteno de um valor significante (de qui-quadrado) por mero acaso e no sivos" relativamente varivel observacional "mtodo de educar crianas". A Tabela
10.1 apresenta as freqncias o~tidas que poderiam resultar.

* N.T.: O termo "comparao" precisa ser interpretado, j que ele pressupe "maior que," menor * N.T.: Veja-se, a propsito, o que ficou dito na nota anterior.
que" o.u "igual a". O que o teste de qui-quadrado geralmente permite fazer um estudo relaciona/
l'ntre variveis, ou seja, a determinao do tipo de relao existente entre elas: independnCia ou *'* N.T.: Categorizar com base no critrio "ou ... ou" , ao cabo, dicotomizar (se forem duas
dependncia. H, ainda, o qui-quadrado de aderncia e o qui-quadrado de homogeneidade, cujos categorias), tricotomizar (se forem tr_s), tetracotomizar (se forem quatro) e assim por diante.
objetivos s<j:o outros. Esses dois ltimos testes no so estudados neste livro.
178 TOMADA DE DECISES Qui-quadrado e outros Testes Nilo-para mtricos 179

TABELA I 0.2 Dados da Tabela 10.1 Dispostos numa Tabela 2 X 2*


Os dados da Tabela 10.1 indicam que "mtodos permissivos" foram usados por
5 dos 20 liberais e por 10 dos conservadores. Esses dados podem ser retabelados num
quadro do tipo 2 X 2 (2 linhas e 2 colunas), no qual as freqncias observadas esto Liberais Conservadores
distribudas pelas caselas, ao lado das freqncias esperadas (tericas), que figuram Freqncia Freqncia
entre parnteses (Tabela 10.2). Qbserve-se que essas freqncias esperadas baseiam-se , Observada Esperada
apenas na ao do acaso, donde decorre uma pressuposio (provisria) de que a hipte- Permissivo 5 (7 ,5) 10 (7,5)
se nula esteja correta. Note-se, tambm, que os totais marginais na Tabela 10.2 foram
obtidos pela soma horizontal ou vertical das freqncias das caselas, ou seja: 15\ r 25
representam as somas das linhas (somas horizontais); 20 e 20, as somas das colunas Total Marginal
(somas verticais). O nmero total de sujeitos (N = 40), sito , o tamanho da amostra, / (Horizontal)
pode ser obtido somando-se os totais marginais horizontais ou os totais marginais 15 (12,5) 10 (1 2,5) 25
No-permissivo
verticais.*

TABELA 10.1 Freqncias Observadas num Estudo de Permissividade Relacionada com Orientao
Poltica
20 20 N = 40

Orientao Politica
Mtodos de Educao de Liberais Conservadores xz (5 - 7,5) 2 (10- 7,5) 2 + (15 - 12,5) 2 (10- 12,5) 2
7,5
+ +
Crianas fo lo 7,5 12,5 12,5

Permissivo 5 10 (- 2,5) 2 (2,5) 2 (2,5) 2 ( - 2,5) 2


No-permissivo 15 10 7,5
+ + +
7,5 12,5 12,5
Total 20 20
6,25 + 6,25 + 6,25 + 6,25
Tendo conseguido as freqncias observadas e as esperadas para o problema em 7,5 7,5 12,5 12,5
foco, o valor do qui-quadrado pode ser calculado mediante a frmula.* *
0,83 + 0,83 + 0,50 + 0,50 2,66

Vemos, assim, que x = 2,66. A fim de podermos interpretar esse valor de qui-quadra-
2

onde do, devemos, ainda, determinar o nmero de graus de liberdade adequado. Esta determi-
nao pode ser feita mediante o emprego da seguinte frmula independentemente do
fo = freqncia observada por casela nmero de linhas ou de colunas existentes numa tabela:
fe = freqncia esperada por casela
gl (/ - 1)(c - 1), onde
x2 = qui-quadrado
De acordo com a frmula do x2 , devemos (1) subtrair cada freqncia esperada nmero de linhas na tabela de freqncias observadas
da freqncia observada correspondente, (2) quadrar a diferena, (3) dividir o quadrado c nmero de colunas na tabela de freqncias observadas
de cada diferena pela freqncia esperada adequada*** e (4) somar os quocientes parciais gl nmero de graus de liberdade
para obter o ~alor do qui-quadrado (x~).
Os dados da Tabela 10.2 podem ser usados para ilustrar o procedimento acima: Posto que as freqncias observadas na Tabela 1O. 2 do origem a duas linhas e
duas colunas (2 X 2), vem que:
*N.T.: Obviamente, a soma dos totais marginais horizontais deve ser igual soma dos totais marginais
v rticais. Essa, alis, uma prova elementar de coerncia.
u N.T.: O qui-quadrado assim calculado comumente chamado qui-quadrado observado e designa-
SC por~-
* N.T.: Leia-se "tabela dois por dois". Alm disso, essa tabela conhecida pelos nomes tabela de
dupla entrada e tabela de contingncia.
ou N.T. : A freqncia esperada adequada a que figura, em cada casela, entre parnteses.
l80 'lliMADA DE DECISES Qui-quadrado e outros Testes No-paramtricas 181

gl = (2- 1)(2- 1) = (1)(1) = 1 Para a casela inferior esquerda da Tabela 10.2 (liberais no-permissivos) :

Consul1a.ndo a Tabela E (no fim do livro), encontramos uma lista de valores de qui-qua- fe = (20)(25) 500 = 12,5
drado, >~< os quais so significantes aos nveis (de confiana/significncia) de 0,05 e 0,01. 40 40
Ao nvd de 0,05 e 1 grau de liberdade, vemos que o qui-quadrado crtico 3,84. Para '
que a hiptese nula possa ser rejeitada, preciso que esse valor (isto , 3,84) seja exce- Finalmente, para a casela inferior direita da Tabela 10.2 (conservadores no-permissivos):
dido ou, pelo menos, igualado pelo qui-quadrado observado. Como o nosso x2 observa-
do (calculado) somente 2,66-e, portanto, menor que o valor tabelado (ou seja, menor fe = (20)(25) 500
= 12,5
que o ~)-devemos aceitar a hiptese nula e rejeitar a hiptese experimental. As fre- 40 40
qnciru obtidas (observadas) no se afastam das esperadas o suficiente para podermos
explicar a diferena como resultado de real diferena populacional.** Em outros ter- Como veremos mais adiante, o mtodo que acabamos de apresentar pode ser aplicado a
mos, tal diferena (3,84 - 2,66) deve ser interpretada como resultante da ao do qualquer problema de qui-quadrado que implique obter freqncias esperadas ife).*
acaso.
Ilustrao
CLCULO DAS FREQNCIAS ESPERADAS (TERICAS) Para resumir passo a passo o procedimento que permite obter o qui-quadrado observado
As freqlincias esperadas para cada casela devem refletir a ao do acaso nos termos da ou calculado (x~), vamos supor que quisssemos estudar a relao entre "fumar maco-
hiptese nula (H 0 ). Se tais freqncias tm que indicar ''mesmice" em todas as amos- nha" e "desejo de cursar o segundo grau" (antigo "colegial"). Poderamos especificar
nossas hipteses da seguinte forma:
tras, de1em ser proporcionais aos seus totais marginais, quer para as linhas, quer para
as colums. Ho: a relao entre "fumar maconha " (X) e "fazer o segundo grau " (Y) de independn-
Para obter a freqncia esperada relativa a uma determinada casela, simplesmente cia, isto , X e Y so independentes.
multiplicamos seus "respectivos totais marginais (de linha e de coluna), dividindo, em Ha: a relao entre X e Y de dependncia.
seguida, o produto por N. Portanto:
A fim de testar estas hipteses ao nvel de significncta de 0,05, colhemos duas
( f. _ (total marginal "linha")(total marginal "coluna") amostras de alunos de primeiro grau (preferentemente das ltimas sries): uma, compos-
e- N
ta de 21 sujeitos cujo objetivo " prosseguir os estudos" e, outra, com 15 sujeitos cuja
deciso "parar os estudos aps concluso do primeiro grau". Suponha-se que, aps a
Para a casela superior esquerda da Tabela 1O. 2 (liberais permissivos): realizao da pesquisa com esses 36 sujeitos, resultassem os dados condensados na
Tabela 10.3.
f. = (20)(15) = 300 = 7 5 Como podemos observar nessa tabela, 15 dos 21 alunos que tencionam fazer o segundo
e 40 40 ' grau fumam maconha; entre os que no pretendem fazer o segundo grau, apenas 5 fu-
mam essa erva. Para descobrir se h uma relao significante entre "fumar maconha" e
Da mesma forma, para a casela superior direita da Tabela 1O. 2 (conservadores permis- "continuar os estudos", os passos que devemos efetuar so os seguintes:
sivos):

= (20)(15) = 300 = 7 5 * N.T.: Tal afirmao ~em sempre verdadeira! Se o pesquisador estiver trabalhando com "J(
f.e 40 40 ' de aderncia (teste de), as freqncias tericas (esperadas) so obtidas a partir da lei que rege o
particular fenmeno que esteja sendo estudado. Por exemplo, num jogo de cara-ou-coroa, onde
,. N.T.: Os valores tabelados de qui-quadrado so geralmente chamados qui-quadrados crfticos e C =cara e K =coroa, suponha-se que C = 20 e K = 80, com N = 100 (obviamente). Ento , se a
notados por~ - moeda for honesta, a freqncia esperada para a varivel C dever ser igual freq ncia esperada
'"* N.T.: Insista-se, mais uma vez, no que ficou dito na nota pg.176 . Dessa comparao entre o~ e para a varivel K, ou seja :
o JG: resulta uma informao a respeito do tipo de relafo existente entre as variveis estudadas. fo !e
~nto, se xiJ < JG:, as variveis so independentes; se X )!: JG:, as variveis so dependentes. No c 20 50 Observe-se, pois, que a regra apresentada pelo autor no se
exemplo em foco, xf < JG: e, por isso, a hiptese experimental foi rejeitada. Isso equivale a dizer """*
K """* 80 50 aplica ao clculo dessas freqncias, uma vez que o fenmeno
que, com certeza de 95% as variveis "filiao poltica" e "permissividade na criao dos filhos" so estudado (isto , "sair cara-ou-coroa") possui uma lei prpria.
variveis independentes. N """* 100 100
182 TOMADA DE DECISES Qui-quadrado e outros Testes No-paramtricas 183

TABELA I 0.3 Consumo de Maconha entre Alunos de Primeiro Grau e sua Relao com Objetivos PASSO 3 : Subtrair cada freqncia esperada da respectiva freqncia observada
Acadmicos Posteriores
lo- fe
Tenciona Cursar o 2. 0 Grau (superior esq uerda) 15 - 11,67 3,33
(superior d ireita) 5- 8,33 - 3,33
Sim No (inferior esquerda) 6 - 9,33 - 3,33
Furrui Maconha (fo) (fo) (inferior direita) 10 - 6,67 3,33

Sim 15 5
No 6 10 PASSO 4: Quadrar essas diferenas
Total 21 15 2
(fo - fe)
(superior esquerda) (3, 33) 2 11 ,09
PASSO 1: Dispor os dados numa tabela de dupla entrada (tipo 2 X 2). (superior direita) ( -3,33) 2 11 ,09
(inferior esquerda) (- 3,33) 2 11 ,09
Continuam os Param os (inferior direita) (3,33) 2 11 ,09
Estudos Estudos

PASSO 5: Dividir o quadrado de cada diferena pela respectiva freqncia esperada


Fumantes 15 ( ) 5 ( ) 20
2
(fo- fe)
fe
11,09
No-fumantes 6 ( ) 10 ( ) 16 (superior esquerda) 0,95
11,67
11 ,09
(superior direita) 1,33
21 15 N = 36 8,33
11,09
(inferior esquerda) 1,19
PASSO 2: Obter a freqncia esperada (terica) para cada casela 9,33

(21 )(20) 11 ,09


(inferior direita) 1,66
(superior esquerda) fe 6,67
36
420
11,67 PASSO 6: Somar esses quocientes para obter o qui-quadrado observado
36
2
(15)( 20) (fo- fe)
15 (11 ,67) 5 (8,33) I 20 (superior direita) fe - -- ~
36 fe
300
8,33 0,95
36
1,33
(21)(16) 1,19
6 (9,33) . 10 (6,67) 16 (inferior esquerda) fe
36 1,66
~ = 933 -l = 5,13
36 ,
21 15 N = 36
(15)(16)
(inferior direta) fe
36 PASSO 7: Achar o nmero de graus de liberdade
240
6,67
36 gl = (/ - 1)(c - 1) = (2- 1)(2 - 1) = (1)(1)
184 TOMADA DE DECISES Qui-quadrado e outros Testes No-paramtricas I 85

PASSO 8: Comparar o valor do qui-quadrado observado (obtido) com o qui-quadrado Numa tabela 2 X 2, a disposio das caselas (A, B, C e D), com os resp cllvos
crtico (tabelado). Veja Tabela E (fim do livro) totais marginais, segue o modelo abaixo :

.J. obtido (observado) 5,13


x2
X tabelado (crtico) 3,84 A B A +B
gl I t\ilVERSIDADE FEDE .,
p 0,05 Ull:5UOTECA : .1..,,

c D C +D
O passo 8 sugere que, para rejeitarmos a hiptese nula a um nvel de significncia
de 0,05 e com I grau de liberdade, o nosso qui-quadrado observado dever ser igual a A +C B +D N
ou maior que 3,84. Como o qui-quadrado que obtivemos de 5,13 (isto , x~ < :0),
podemos rejeitar a hiptese nula e aceitar a hiptese experimental. Nossos resultados Para ilustrar o uso dessa nova frmula, vamos voltar aos dados da Tabela 10.3
"sugerem" que a proporo de fumantes de maconha maior entre os alunos que pre- (uso de maconha vs. continuidade dos estudos), para a qual j obtivemos um x2 de
tendem cursar o segundo grau do que entre os que pretendem parar os estudos no 5,13. Podemos entrar na nova frmula diretamente com as freqncias observadas.
primeiro grau.* Assim:
O procedimento que acabamos de ilustrar, passo a passo, pode ser resumido, em
forma tabular, como se segue: 15 5
A B
2
(fo - fe)

fo fe fo - fe (fo - fe)
2
fe
c D
(superior esquerda) 15 11,67 3,33 11 ,09 0,95 6 10
(superior direita) 5 8,33 - 3,33 11,09 . 1,33 - - -- -_J

(in ferior esquerda) 6 9,33 - 3,33 11 ,09 1,19


(inferior direita) 10 6 ,6 7 3,33 11 ,09 1,66 aplicando a frmula , vem que:
t = 5,13
(15 + 5(6 + 10)(15 + 6)(5 + 10)
FRMULA PARA O CLCULO DO QUI-QUADRADO DE UMA TABELA 2 X 2
Podemos evitar o processo lento e trabalhoso de calcular as freqncias esperadas para 36[(15)(10) - (5)(6)f 36(1 50 - 30)2
um qui-quadrado associado . a uma tabela 2 X 2 (2 linhas por 2 colunas), usando a (15 + 5)(6 + 10)(15 + 6)(5 + 10) (20)(16)(21)(15)
seguinte frmula :
36(120)2 36(14.400) 518.400
N(AD - BC) 2 5,14
100.800 100.800 100.800
(A + B)(C -i- D)(A + C)(B + D) ' onde

A freqncia observada para a casela superior esquerda CORREO DE FREQ:~NCIAS ESPERADAS PEQUENAS
B freqncia observada para a casela superior direita
C freqncia observada para a casela inferior esquerda l
,I
Se as freqncias esperadas numa tabela 2 X 2 forem muito pequenas (menores que 1O
D freqncia observada para a casela inferior direita em cada casela), as frmulas que aprendemos at aqui podero produzir um qui-qua-
drado "inflado", isto , um valor de qui-quadrado maior do que o real. Note-se que isso
s se aplica s freqncias esperadas e no s de fato obtidas no decorrer de uma pesqui-
sa; estas, alis, podem ser de qualquer tamanho.
* N.T.: No se v inferir da que existe uma relao obrigatria de causa e efeito. Alm disso, nada A fim de reduzir o "tamanho" do qui-quadrado observado e, assim, chegar-se a
indica que essa relao seja verdadeira. Primeiro, porque se trata de uma situao hipottica; segundo ,
porque, ainda que fosse verdadeira a relao de dependncia, ela seria, quando muito, verdadeira para um resultado mais "sensato", aplicamos a conhecida co"eo de Yates-sempre que a
um particular grupo de sujeitos, numa particular comunidade (norte-americana, no caso). tabela for do tipo 2 X 2. A correo de Yates consiste em reduzir de meia unidade
186 TOMADA DE DECISES Qui-quadrado e outros Testes No-paramtricas 187

(0,5) todas as diferenas entre cada freqncia observada e a terica (esperada) respecti-
va. Uma vez que o x2 depende do tamanho dessas diferenas, conseguimos restringir, ( lfo - f e i - 0,50)2
tambm, o tamanho do prprio qui-quadrado observado.* A frmula "corrigida" do ( I fo - fe i - 0,50)2 fe
qui-quadrado, para situaes em que as freqncias esperadas so muito pequenas,
a seguinte: 8,01 0,69
8,01 0,96
X2 = I:
( I f o - fe I - 0,50)2
~-=----=--c:.___c___--=--c.......:....
8,01 0,86
fe 8,01 1,20
. X2 = 3,71
Na frmula "corrigida" (acima), as barras verticais que ladeiam lo - fe indicam que
meia unidade (0,5) deve ser subtrada do valor absoluto de cada diferena-ignorando-se
Como se observa acima, a correo de Yates produz um qui-quadrado (x2 = 3,71)
os sinais-.
menor do que o obtido por meio das frmulas no-corrigidas (X2 = 5,13). No exemplo
Vamos aplicar a frmula corrigida aos dados da Tabela 10.3:
em foco, nossa deciso quanto hiptese nula fica inteiramente a merc do fato de se
usar ou no a correo de Yates. Com a frmula corrigida, aceitamos a hiptese nula
2- (115-11,671- 0,50) 2 + ( 15-8,33 1 -0,50)2 (pois 3,71 < 3,84), e com as frmulas no-corrigidas, rejeitamos esta mesma hiptese.
X - 11,67 8,33 A correo de Yates tambm se aplica frmula alternativa para o clculo do
qui-quadrado numa tabela 2 X 2. Assim:
+ ( I 6- 9,33 I - 0,50) 2 + (I !O- 6,67 I - 0,50) 2
9,33 6,67 2 _ N( I AD- BC I - N/ 2) 2
(3,33 - o,:o)2 + (- 3,33 - 0,50)2 (- 3,33 - 0,50)2 X - (A + B)(C + D)(A + C)(B + D)
8,33
+
11,67 9,33
Retomando os dados da Tabela 10.3, vem que:
+ (3,33 - 0,50)2
6,67 xz = 36[1(15)(10)- (5)(6) l- 36/2] 2 36( I 150-30 I- 18)2
(2,83) 2 + (2,83) 2
+ (2,83) 2
+ (2,83) 2 {15 + 5)(6 + 10)(15 + 6)(5 + 10) (20)( 15)(21 )(15)
11,67 8,33 9,33 6,67
36(120 - 18)2 36(102)2 36(10404) 374.544
8,01 + 8,01 + 8,01 + 8,01 3,71
100.800 100.800 100.800 100.800
11,67 8,33 9,33 6,67
0,69 + 0,96 + 0,86 + 1,20 = 3,71 /'
COMPARAO DE VRIOS GRUPOS
O procedimento acima, em que se aplica a frmula "corrigida" do qui-quadrado, At aqui, limitamos nossas ilustraes ao esquema 2 X 2 amplamente empregado.
pode se resumido em frmula tabular: Deve-se enfatizar, entretanto, que freqente calcular-se o qui-quadrado para tabelas
maiores que as do tipo 2 X 2; nessas tabelas ingressam vrios grupos ou categorias. O
I- 0,50 procedimento passo a passo usado na comparao* de vrios grupos ; em essncia,
fo fe l fo -fe I lfo - fe
igual ao adotado na situao 2 X 2. Vamos ilustrar com um problema 3 X 3 (3 linhas
15 11,67 3,33 2,83 por 3 colunas), embora tal procedimento se aplique para qualquer nmero de linhas
ou colunas.
5 8,33 3,33 2,83
9,33 3,33 2,83 Imagine-se, mais uma v~z, que o problema seja pesquisar a relao entre "orienta-
6
2,83 o poltica" e "mtodos de educao de crianas". Desta vez, porm, vamos admitir
10 6,67 3,33

~ N.T. : As mesmas observaes feitas anteriormente com respeito ao termo "comparao" valem
* N.T.: Essa operao tambm conhecida pelo nome de correo de continuidade. pura tabelas maiores que 2 X 2.
188 TOMADA DE DECISES Qui-quadrado e outros Testes No-paramtricas 189

que trs amostras aleatrias tenham sido extradas: 3 2 liberais, 30 moderados e 27 A frmula acima pode ser empregada no problema 3 X 3 conforme se segue :
conservadores. Suponha-se, ainda, que os mtodos de educao de crianas estejam
categorizados em: "permissivos", "moderados" e "autoritrios". Ento: PASSO 1: Dispor os dados numa tabela de dupla entrada (tipo 3 X 3)
Orientaa Polz'tica
Hiptese Nula*: A freqncia relativa de mtodos permissivos, moderados e autoritrios
a mesma tanto para liberais quanto para moderados quanto para Mtodos Usados na Conservadores Moderados Liberais
conservadores. Educao de Crianas

Hiptese Experimental: A freqncia relativa de mtodos permissivos, moderados e Permissivo 7 9 14 30


autoritrios no a mesma para liberais, para moderados e
para conservadores.

Vamos admitir que, terminada a coleta de dados, resulte a Tabela 10.4. Nel, veri- Moderado 10 10 8 28
ficamos que 7 dos 32 conservadores, 9 dos 30 moderados e 14 dos 27 liberais adotam Freqncia
prticas permissivas relativamente educao de seus filhos. observada

TABELA 10.4 Educao de Filhos vs. Orientao Poltica (Problema 3 X 3) 5 31


Autoritrio 15 11

Orientao Polftica
30 27 N = 89
Mtodo de Conservadores Moderados Liberais / 32
Educao de Filhos fo fo !o Total marginal

Permissivo 7 9 14
Moderado 10 10 8 PASSO 2: Calcular a freqncia esperada para cada casela
Autoritrio 15 11 5
- -
Total 32 30 27
7 9 14 (30)(32) 960
(10,79) (10,11) (9 ,1 0) (superior esquerda) fe =
89 98
Tepha-se em mente que tanto a correo de Yates quanto a frmula alternativa 30
para o x2 so aplicveis apenas quando se trata de uma tabela (problema) 2 X 2, no 10,79
sendo possvel, por isso, aplic-las a vrios grupos, como, por exemplo, o caso presente 10 10 8
(10,07) (9,44) (8,49)
(3 X 3). Para determinar se h uma diferena significativa na Tabela 10.4, temos de 28 (28)(32) 896
(intermediria
utilizar a frmula original de X2 , apresentada no incio deste captulo, isto : esquerda) fe
89 89
15 11 5
(11,41) (10,45) (9,40)
31 10,07

32 30 27 (31)(32) 992
N= 89 (inferior esquerda) f e
89 89

11,14
* N.T. : Com o objetivo de no se perder de vista que o que se testa a independncia entre as
variveis, essas hipteses podem ser reformuladas, a fim de obter maior preciso, para:
H0 : As variveis P, Me A guardam relao de independncia com as variveis X, Y e Z.
(intermediria
fe
(30)(30) = 900
superior) 89 89
Ha: As variveis P, Me A guardam relao de dependncia com as variveis X, Y e Z.
P = mtodo permissivo; M = mtodo moderado; A = mtodo autoritrio; X liberais; 10,11
Y = moderados e Z = conservadores.
190 TOMADA DE DECISES
Qui-quadrado e outros Testes Nlio -paramtrlcos 191

(central) (28)(30) 840 (intermediria superior) (- 1,11)2 1,23


fe
89 89 (central) (0,56) 2 0,31
(intermediria inferior) (0,55) 2 0,30
9,44 (superior direita) (4,90) 2 24,01
(intermediria direita) (- 0,49) 2 0,24
(intermediria (31)(30) 930 (inferior direita) (- 4,40) 2 19,36
. inferior) fe 89 89

10,45 PASSO 5: Dividir cada diferena, ao quadrado, pela respectiva freqncia esperada

(superior direita) fe (30)(27) 810 ifo - fd


89 89 fe
9,10
14,36
(superior esquerda) 1,33
(intermediria (28)(27) 756 10,79
direita) !e 89 89
8,49 0,01
(intermediria esquerda) 0,00
10,07
(31)(27) 837
(inferior direita) fe 89 89
14,90
(inferior esquerda) 1,34
9,40 11,14

PASSO 3: Subtrair cada freqncia esperada da respectiva freqncia observada


1,23
(intermediria superior) 0,12
10,11
fo - fe
(superior esquerda) 7 - 10,79 -3,79
(intermediria esquerda) 0,31
10 - 10,07 -0,07 (central) 0,03
(inferior esquerda) 15 - 11,14 9,44
3,86
(intermediria superior) 9 - 10,11 -1,11
(central) 10- 9,44 0,56 0,30
(intermediria inferior) 0,03
(intermediria inferior) 11 - 10,45 0,55 10,45
(superior direita) 14 - 9,10 4,90
(intermediria direita) 8 - 8,49 -0,49
(inferior direita) 5 - 9,40 24,01
-4,40 (superior direita) 2,64
9,10
PASSO 4: Quadrar essas diferenas
0,24
(intermediria direita) 0,03
ifo - fd 8,49
(superior esquerda) (- 3,79) 2 14,36
(intermediria esquerda) (- 0,07) 2 0,01 19,36
(infe.rior esquerda) (3 ,86) 2 14,90 (inferior direita)
9,40
2,06
192 TOMADA DE DECISES Qui-quadrado e outros Testes Nilo-para mtricos 193

PASSO 6: Somar esses quocientes para obter o qui-quadrado observado (calculado) entretanto, que os requisitos para o uso de testes no-paramtricas sa'o via de regra
preenchidos com mais facilidade-pelo menos quando comparados com os "corres-
1: ifo -fd pondentes" paramtricas, tais como a estatstica t ou a anlise de varincia. Com isso
fe ,m mente, vamos voltar nossa ateno para alguns dos mais importantes requisitos
oara o uso da prova de significncia chamada qui-quadrado:
1,33
0,00 1. "Comparao "*entre duas ou mais amostras.
1,34 Como procurou ilustrar este captulo, o teste de qui-quadrado usado para,
0,12 atravs da comparao entre um x2 observado e um x2 crtico (tabelado), levar
0,03 o pesquisador a decidir se, numa amostra aleatria, duas ou mais variveis guardam
0,03 entre si uma relao de independncia. Isso torna obrigatrio que tenhamos, no
2,64 mnimo, uma tabela 2 X 2 (no mnimo 2 linhas, como tambm 2 colunas). Na
0,03 montagem da tabela, importante que o mesmo 'sujeito no figure em mais de uma
2,06 casela. A amostra deve ser explorada (com relao s variveis observacionais)
x2 7,58 exaustivamente e a distribuio dos sujeitos pelas vrias caselas deve ser indepen-
dente. Assim, se numa amostra aleatria de N = 100 sujeitos, desejarmos pesquisar
a relao entre cor de olhos (claro/escuro) e cor de cabelos (claro/escuro), o mes-
PASSO 7: Achar onmero de graus de liberdade mo sujeito no pode, relativamente a esse par de variveis, figurar em mais de
uma casela. Essa circunstncia torna a utilizao do qui-quadrado em situaes ex-
gl = (L - l)(c - 1) = (3 - 1)(3 - 1) perimentais do tipo antes-e-depois algo restritiva , embora no impeditiva.**
(2)(2) = 4
2. Dados pertencentes ao nz'vel nominal de mensurao.
O pesquisador s necessita de freqncias, isto , do nmero de sujeitos observa-
PASSO 8: Comparar o valor do qui-quadrado obtido (observado) com o do qui-quadra- dos para cada situao.
do tabelado (crtico). Veja Tabela E 3. Amostragem aleatria.
Os sujeitos amostrais devem ter sido extrados aleatoriamente de uma particular
x2 observado (obtido) 7,58
populao.
x2 tabelado (crtico) 9,49
gl 4 4. As freqncias esperadas (tericas) por case/a no devem ser muito pequenas.
p 0,05 O tamanho mnimo de uma fe depende da natureza do problema. Numa tabela
2 X 2, nenhuma freqncia esperada deveria ser menor que 5. Alm disso,
Necessitamos, portanto, de um valor de qui-quadrado que seja pelo menos igual a aconselhvel que se use a correo de Yates sempre que, numa tabela 2 X 2,
9,49 para podermos rejeitar a hiptese nula. Uma vez que o nosso x2 obtido de ape- qualquer freqncia esperada for inferior a 10. Numa situao em que vrios
nas 7,58, devemos aceitar a hiptese nula e atribuir as diferenas amostrais ao do grupos estejam sendo "comparados" (por exemplo, 3 X 3 ou 4 X 5), no h uma
acaso. No conseguimos descobrir nenhuma prova estatisticamente significante capaz de regra rgida para o estabelecimento de freqncias tericas mnimas por casela,
sustentar a idia de que as freqncias relativas dos mtodos de educao de filhos embora seja recomendvel que bem poucas contenham menos que 5. Note-se,
diferem para liberais, moderados e conservadores.
* N.T.: O termo "comparao", como foi anteriormente salientado, deve ser interpretado. "Com-
parao" supe um cotejo entre o resultado obtido (observado) e o resultado terico (tabelado). No
caso de qui-quadrado, a um dado nvel de significncia e com certo nmero de graus de liberdade, a
REQUISITOS PARA O USO DO QUI-QUADRADO "comparao" se faz en tre x}j e:0,
Independentemente do fato de que os testes no-paramtricas no pressupem distri- ** N.T.: Em Edwards, Allen L. - Statistical Analysis, 3.a ed., Holt, Rinehart and Winston, Inc.,
buio normal de uma particular varivel na populao, eles apresentam, tambm, pgs. 158-159; cita-se o exemplo de um pesquisador que aplicou aos mesmos 90 sujc:;itos amostrais
dois testes: um, antes do tratamento e outro, depois. Apesar de a idia bsica ser a de ifldependncia
uma srie de requisitos que devem ser levados em conta pelo pesquisador desejoso de dos resultados em face de uma particular varivel (tratamento), o teste de significncia torna obri-
proceder a uma escolha inteligente de algum teste de significncia. O leitor notar, gatrio conhecer t de aderncia, que no estudado neste livro.
Qui-quadrado e outros Testes No-paramtricas 195
194 TOMADA DE DECISES

porm, que, em qualquer situao, a soma de todas as freqncias esperadas A mediana 0 14. 0 escore contado a partir de qualquer extremo da tabela- cujos dados
dever ser igual soma de todas as freqncias observadas, ou seja: devero ser ordenados a priori.
Para encontrar a mediana, dispomos todos os escores (de homens e mulheres) em
'E/e= 'E/o * ordem consecutiva (sem levar em conta a origem da amostra) e localizamos a mediana
"combinada":

O TESTE DA MEDIANA 18
18
O qui-quadrado pode ser aplicado a qualquer nmero de amostras independentes men- 17
suradas no nvel nominal. Quando os dados forem ordinais, o teste da mediana constitui 17
um procedimento no-paramtrica simples capaz de determinar o grau de "certeza" 16
com que duas amostras aleatrias foram extradas de populaes que tm a mesma 16
16
mediana.
15
Para ilustrar o uso do teste da mediana, admitamos que certo pesquisador dese- 15
jasse estudar reaes masculinas/femininas a uma particular situao social tida como 15
embaraosa. Para criar a situao embaraosa, pediu a 15 homens e 12 mulheres-cuja 14
"vocao" para cantores era apenas "mdia" - que cantassem, individualmente, diante 14
13
de uma audincia de "peritos", algumas canes do repertrio popular. O nmero ~ Mediana (14<? escore contado a partir de qualquer extremo)
12
de minutos que cada sujeito manteve-se disposto a continuar cantando figura na ta- 11
bela abaixo, onde, quanto menor o nmero, maior a intensidade da sensao de 11
embarao.** 10
10
10
Nmero de Minutos Durante os quais 9
cada Sujeito Cantou 9
Homens Mulheres Homens Mulheres 9
8
15 12 11 9 8
18 7 10 11 7
15 15 8 14 6
17 16 14 9 6
17 6 9
16 8 18
10 10 16 PASSO 2: Contar em cada amostra o nmero de sujeitos que se situam "acima da
l3 6
mediana" e "no acima da mediana".*

PASSO 1: Achar a mediana depois de fundir as duas amostras num s grupo. Em Homens Mulheres
Smbolos: f f
Posio da mediana
N-
- + -1 27 + 1 = 14.0 dado da tabela
2 2 Acima da Mediana 10 3
No Acima da Mediana 5 9

* N.T.: Como regra prtica, j que este assunto algo controvertido, acrescente-se a tudo o que N = 27
ficou dito mais o seguinte: a prova de qui-quadrado deve ser evitada sempre que qualquer fe < 5
c, simultaneamente, ('Efe = '1:-[0 = N) <30. Assim, quando N < 30, aconselha-se usar a Prova
Exata de Fisher.
* N.T.; "No acima da mediana" no o mesmo que "abaixo da mediana". "No acima da media-
""' N.T.: O exemplo serve apenas para ilustrar o procedimento denominado teste da mediana. Do
na" vai at Mdn = 12, isto , o 12 pertence a essa categoria.
ponto de vista experimental, o delineamento est cheio de impropriedades.
196 TOMADA DE DECISES Qui-quadrado e outros Testes No-paramrlcos 197

Como v~mos, os valores (durao do canto) da tabela anterior, para cada amostra, quan- 2. Dados ordinais.
do coteJados com a mediana da distribuio, so transfonnados em freqncias, origi- Para que seja possvel aplicar o teste da mediana, preciso que os dados p rt n-
nando um qu~dro 2 X 2. No problema em foco, 10 dos 15 homens e apenas 3 das 12 am, no mnimo, ao nvel ordinal. Dados nominais no podem ser usados.
mulheres continuaram a cantar por um perodo superior ao representado pela mediana 3. Amostragem aleatria.
do grupo maior (homens + mulheres). Dada uma populao, as amostras devem ser extradas aleatoriamente.

PAS~O 3: Real~ar um tes~e de qui-quadrado para verificar se o resultado significante.


Se nao houver diferenas ligadas ao sexo com respeito durao do canto (e ao presu- DUPLA ANLISE DA VARINCIA POR POSTOS: x 2 DE FRIEDMAN
mido embarao que dele decorre), podemos esperar que ambas as amostras se "quebram"
No Captulo 8, introduzimos uma variao da estatstica t passvel de ser usada na com-
no mesmo ponto mediano, de sorte que metade dos homens e das mulheres caem
acima da mediana. Para determinar se as diferenas obtidas entre homens e mulheres so
parao de dados resultantes da mesma amostra em dois momentos distintos. No esque-
estatisticamente significantes ou apenas resultado de erros de amostragem, fazemos um ma "antes-e-depois", por exemplo, o grau de hostilidade numa amostra de crianas
teste de x 2 . poderia ser mensurado em duas ocasies distintas: antes e depois de terem assistido a
um violento programa de televiso.
Homens Mulheres A dupla anlise de varincia por postos-o x 2 de Friedman Cx1)-constitui uma
aproxima no-paramtrica que permite testar diferenas numa mesma amostra de
Acima da Mediana 10 (A) 3 (B)
No Acima da M~diana
respondentes que tenham sido mensurados sob, pelo menos, duas condies distintas.
5 (C) 9 (D)
Em smbolos:
N = 27
12
N( I AD - BC I - N/2) 2 Nk(k + 1) ~ (~R ;)2 - 3N(k + 1) onde
27[ I (10)(9)- (3)(5) 1 - ~ ] 2
(A+ B)(C + D)(A + C)(B + D) (10 + 3)(5 + 9)(10 + 5)(3 + 9) k nmero de tratamentos, (via de regra representam o nmero de " condi-
27(75 - 13,5) 2 es" em que foram feitas as mensuraes dos respondentes)
102.120,75 = 3,12
N tamanho da amostra (nmero de respondentes)"
32.760 32.760
"J:.Ri soma dos postos relativos a uma particular mensurao (via de regra re-
Consultando a Tabela E no fim do livro, verificamos que o x 2 deve igualar-se a ou presentam a soma dos postos relativos a um particular tratamento).
exceder 3,84 (com gl = 1) a fim de que possa ser, ao nvel de 0,05, encarado como
significante. -~isto q~~ o_ nosso x obtido igual a 3,12, no possvel rejeitar a hip-
2
Dustrao
tese nula. Ha msufic1enc1a de provas para concluirmos, com base nos nossos resultados Para ilustrar a aplicao da dupla anlise de varincia por postos de Friedman, supo-
que homens e mulheres diferem com respeito a suas reaes diante da situao social: nha-se que desejemos testar a hiptese de que a hostilidade em crianas varia segundo
mente embaraosa chamada "cantar em pblico". o grau de violncia a que se exponham assistindo a programas de televiso. A fim de es-
tudar a influncia da violncia televisada, imaginemos que tenhamos condio de expo~
Requisitos para o Uso do Teste da Mediana uma amostra aleatria de dez crianas a trs diferentes nveis de violncia televisada,
As seguintes condies devem ser satisfeitas a fim de tomar possvel uso adequado num programa que seja essencialmente o mesmo quanto a todos os outros aspectos.*
0
do teste da mediana numa pesquisa: Vamos tambm admitir que obtivemos os seguintes escores de hostilidade dessas 10
crianas, nas trs difyrentes condies a que estiveram expostas (a escala vai de 20 a 60,
1. Comparao entre duas ou mais medianas independentes. e quanto mais alto o escore, maior a hostilidade :
O teste da mediana usado em comparaes entre duas ou mais medianas origin-
rias de amostras independentes.* * N.T. : Em linguagem experimental, fala-se, geralmente, em variveis de trs tipos (muito embora
existam outros): variveis independentes (VI), dependentes (VD) e relevantes (VR). As variveis
independentes so manipuladas; as dependentes so observadas e mensuradas; as relevantes so
"' _N.T.: A rigor, n~ bem ~~so. A mediana foi usada como ponto de partida para a definia ope- mantidas sob controle. No exemplo em foco, N = 10 crianas foram -submetidas s VIs "tipos de
raclOnal,de uma partzcular varlllvel. No exemplo estudado acima, o que 0 pesquisador fez foi testar programas violentos"; as VDs so as " reaes individuais" e as VRs constituem as " demais condies
se a vanavel "embarao" estava associada, numa relao de dependncia, varivel "sexo". a.m bientais".
198 TOMADA DE DECISES Qui-quadrado e outros Testes NHoparnm trl 'tiN t 99

PASSO 1: Atribuir postos a todas as condies (tratamentos) a que cada respondente


esteve exposto (cada coluna corresponde a um tratamento). A fim de realizarmos a
anlise de varincia de Friedman, trabalhamos diretamente com os postos atribudos a Baixa Mediana A lta
cada respondente at esgotar-se a lista de mensuraes. 2 Criana (B) Posto (M) Posto (A) Posto
Como foi possvel verificar acima, o nvel de hostilidade da criana A aumentou de
23 para 30 e desse valor para 32 medida que a "dose" de violncia televisada que A 23 3 30 2 32 1
ela estava sendo exposta passou de "baixa" para "mediana" e de "mediana" para "alta". B 41 3 45 1 43 2
Pensando em termos de postos, o escore-hostilidade da criana A foi mais alto ( 1) no c 36 2 35 3 39
tratamento "violncia alta" (coluna A), mediano (2) no tratamento "violncia media- D 28 3 29 2 35 1
E 39 3 41 2 47 1
na" (coluna M) e baiXo (3) no tratamento "violncia baixa" (coluna B). Prosseguindo F 25 3 28 1 27 2
na lista, o mesmo raciocnio aplica-se criana B: posto 1 para o escore-hostilidade G 38 3 46 2 51 1
maior (coluna M), posto 2 para o escore-hostilidade mediano (coluna A) e posto 3 para H 40 3 47 2 49 1
o escore-hostilidade menor (coluna B). Com relao criana C, o quadro o seguinte: I 45 2 46 1 42 3
posto 1 para o escore da coluna A (39), posto 2 para o escore da coluna B (36) e posto 3 J 29 3 34 2 38 1
para o escore da coluna M (35). * Os postos atribudos a cada criana sob os diferentes
tratamentos figuram na tabela
(B) (M) (A)
Criana Posto Posto Posto
Nfveis de Violncia Televisada
Baixa Mediana Alta A 3 2 1
Criana (B) (M) (A) B 3 1 2
c 2 3 1
A 23 30 32 D 3 2
B 41 45 43 E 3 2 1
c 36 35 39 F 3 1 2
D 28 29 35 G 3 2 1
E 39 41 47 H 3 2 1
F 25 28 27 2 1 3
G 38 46 51 J 3 2 1
H 40 47 49 ~R= 28 ~R = 18 ~R = 14
I 45 46 42
J 29 34 38
PASSO 3: Entrar na frmula para obter o xJ
PASSO 2: Somar os pontos reiativos a cada tratamento (cada coluna corresponde a
X~ Nk(~ +
2 2
um tratamento). Se a hiptese nula estiver correta- e, por isso, no existir diferena 1) 2 (2R;) - 3N(k + 1)
significativa entre os tratamentos-,podemos esperar que as somas dos postos sejam
iguais entre si, descartados os erros devidos ao acaso. No exemplo em causa, h trs
condies: violncia televisada baixa, mediana e alta. Os postos e respectivas somas
(10)(3~(~ + 1) (28 2 + 182 + 142) - 3(10)(3 + 1)
totais para cada uma dessas condies (isto , tratamentos) so: 12
== 1 2 0 (784 + 324 + 196) - 120
2
Na presente ilustrao no apareceram postos "espelhados" (empatados). No caso de tais postos
ocorrerem (por exemplo, se o escore de hostilidade da criana A tivesse sido precisamente o mesmo = 0,10(1.304) ....,. 120 = 130,4 - 120 10,4
para dois ou mais nveis de violncia), adote-se o procedimento recomendado para postos "espelha-
dos", Captulo 11, sob o ttulo "Coeficiente de Correlao de Postos" . PASSO 4: Achar o nmero de graus de liberdade
N.T.: Tanto faz que a atribuio de postos se faa, relativamente aos escores, do maior para o
menor ou vice-versa. gl =k-1 =3 - 1 = 2
200 TOMADA DE DECISES Qui-quadrado e outros Testes No-para mtricos 201

PASSO 5: Comparar o xfi (obtido, observado, calculado) com o x2 crtico (tabelado) N nmero total de dados ou de respon ft~\l{ lf''!ADf. FEDE AL 00
na Tabela E n nmero de respondentes por amoHfi t HI~LlOTECA J :J.::.Nl"RAL
'L Ri soma dos postos por amostra.
xfi (obtido) 10,4
x2 (tabelado) 5,99 llustrao
gl 2 Para ilustrar a utilizao da prova de Kruskal-Wallis, considere-se a possvel influncia
p 0,05 da varivel "idade" sobre a varivel "habilidade (capacidade) para arranjar emprego".
Vamos supor que, para estudar esse problema, tenhamos extrado amostras aleatrias
O xfi constitui um valor (de qui-quadrado) que decorre diretamente da soma dos de populaes constitudas, respectivamente, de sujeitos velhos, de meia-idade e de
postos para todos os tratamentos. Como conseqncia, podemos comparar o X~ obtido jovens, e que a todos tenha sido dado igual nmero de dias (prazo) para encontrar
com o x2 tabelado (Tabela E). Com gl = 2 e ao nvel de significncia de 5%, necessita- emprego. Admitamos que os dados obtidos sejam os seguintes:
mos de um qui-quadrado igual a, no mnimo, 5,99 para podermos rejeitar a hlptese
nula. Como o xfi obtido igual a 10,4, rejeitamos a hlptese nula e aceitamos a hlptese Nmero de Dias Antes de Encontrar Emprego
experimental. Acabamos de reunir, com isso, suficientes provas de que a violncia tele-
Adultos de Adultos Jovens
visada realmente exerce influncia sobre o comportamento hostil de crianas. H, pois, Adultos Velhos (X1 ) Meia-idade (X2 ) (X )
3
diferenas significantes na hostilidade medida que a violncia torna-se mais intensa.
(n = 7) 63 (n = 8) 33 (n = 6) 25
Requisitos para o Uso da Dupla Aitlise da Varincia por Postos (x2 de Friedman) 20 42 31
43 27
O uso da dupla anlise da varincia por postos-x2 de Friedman-implica que as se- 58
6
28 14
guintes condies sejam satisfeitas: 57 51 18
1. Comparao de uma mesma amostra mensurada sob duas ou mais condies. 71 64 13
45 12
O teste de Friedman no pode ser aplic&do para testar diferenas entre amos-
30
tras independentes; ao contrrio, ele pressupe que a mesma amostra de res-
pondentes tenha sido mensuraa pelo menos duas vezes (ou, ento, que os mem-
PASSO 1: Atribuir postos ao grupo total de escores (N = 21) e achar a soma desses
bros de duas ou mais amostras tenham sido aglutinados em funo de variveis
postos por amostra. Os postos atribudos aos escores devem obedecer ao seguinte
especficas).
critrio : ao posto 1 corresponde o menor escore (6) e ao posto 21, o maior escore (71).
2. Dados ordinais. Na presente ilustrao, tanto 6 quanto 71 representam dias. 3
O teste s pode ser realizado com dados aos quais possam ser atribudos postos.
3. O nmero de respondentes (isto , o tamanho da amostra) no deve ser muito
X1 Posto x2 Posto x3 Posto
pequeno.
63 19 33 12 25
O tamanho mnimo de N depende do nmero de tratamentos (k) aos quais os res- 20 7
6 42 13 31 11
pondentes vo ser expostos. Por exemplo, N deve ser igual a ou maior que 1O 4 14 27 8 6 1
quando k = 3;j com k = 4, N ;;;.: 5. SB 18 28 9 14 4
57 17 51 16 18
71 5
21 64 20 13 3
ANLISE DA V ARINCIA POR POSTOS: H DE KRUSKAL-WALLIS 4 15 12 2
30 'LR3 = 31
A anlise da varincia de Kruskal.Wallis ~ma alternativa no-paramtrica anlise que 'LR 1 = 110 10
se faz por recorrncia estatstica F, e pode ser usada para comparar vrias amostras 'LR2 = 90
independentes desde que os dados sejam de, no mnimo, nvel ordinal. Para podermos
aplicar a prova de Kruskal-Wallis, devemos calcular a estatstica H como se segue:
N u IIJ)Uteceram postos "espelhados" (empatados) na ilustrao presente. No caso de tais postos
H = 12 ~[ C!.Ri)z] - 3(N + 1) onde <l I t'fllll (por exemplo, se duas pessoas levarem exatamente 24 dias para encontrar um emprego),
N(N + 1) LJ n llr " procedimento apresentado no Captulo 11, sob o ttulo "Coeficiente de Correlao de
tu "
202 TOMADA DE DECISES Qui-quadrado e outros Testes No-paramtrlcos 203

PASSO 2: Entrar na frmula para achar H. RESUMO


Os estatrsticos desenvolveram certo nmero de testes no-paramtricas de signifi ' 11
H= 12 ~ [CIR;)z] - 3(N 1) da- testes cujos requisitos no incluem distribuio normal da varivel de observal'
N(N + 1) LI n +
nem nvel intervalar de mensurao. O qui-quadrado (x2 ) , o mais conhecido dos test s
2 2 no-paramtricas, usado em comparaes entre freqncias. Quando as diferenas
12 ) (110 90 31:.\
= ( 21(21 + 1) -7- + 8 + 6} - 3(21 + 1) entre as freqncias esperadas e as observadas so muito grandes, rejeitamos a hiptese
nula e aceitamos a hiptese experimental (alternativa), que acena com uma verdadeira
= (__g_)
462
(12100
7
+ 8100
8
+ 961) - 66
6
diferena na populao. Esse o requisito bsico para que um qui-quadrado observado
seja significante. Existem ainda outros procedimentos no-paramtricas: o teste da
(0,03XL728,57 + 1.012,50 + 160,17) - 66 mediana determina se h uma diferena significativa entre as medianas de duas amos-
tras; a dupla anlise da varincia de Friedman permite fazer comparaes entre mensu-
= (0,03)(2.901,24) - 66 = 8 7,04 - 66 = 21,04 raes distintas da mesma amostra (duas mensuraes, no mnimo) e, finalmente, a
anlise da varincia por postos de Kruskal-Wallis d margem a uma comparao entre
PASSO 3: Calcular o nmero de graus de liberdade. vrias amostras independentes.

gl=k-1 =3-1 =2 PROBLEMAS


1. Amostras aleatrias de homens e de mulheres foram entrevistadas com o objetivo
PASSO 4: Comparar H com o qui-quadrado crtico (Tabela E). de pesquisar-se o comportamento de "fumar cigarros". Descobriu-se que, de 29
homens, 15 eram fumantes ; igualmente que, de 30 mulheres, 20 tinham o hbito
H 21,04 de fumar. Teste a hiptese nula de que a freqncia relativa de homens que so
x2
crtico (tabelado) 5,991 fumantes igual de mulheres que tambm o so. Que indicam seus resultados?
gl 2 2. Dois grupos de estudantes fizeram exames finais de Estatstica. Somente um grupo
p 0,05 recebeu preparao formal para o exame; o outro grupo leu o texto recomendado,
mas nunca compareceu s aulas. Enquanto que 22 .dos 30 membros do primeiro
Para rejeitarmos a hiptese nula ao nvel de significncia de 0,05, com 2 graus de grupo (os " freqentadores'J passaram no exame, apenas 1O dos 28 do segundo
liberdade, nosso H teria que ser igual a ou maior que 5,991. Como obtivemos H= 21 ,04, grupo (os "ausentes") lograram aprovao. Teste a hiptese nula de que a freqn-
podemos rejeitar a hiptese nula em favor da hiptese alternativa (experimental). Nossos cia relativa dos "freqentadores" que passaram nas provas finais igual freqn-
dados revelam que existem diferena.s significativas, por idade, na quantidade de dias cia re'lativa dos "ausentes" que tambm passaram. Que que seus resultados
necessria para arranjar-se um emprego. indicam?
3. Aplicando correo de Yates, realize uma prova de qui-quadrado para o seguinte
Requisitos para o Uso da Anlise da Varincia de Kruskal-Wallis problema 2 X 2: *
A prova de Kruskal-Wallis pressupe as seguintes condies para seu uso adequado:

1. Comparao de trs ou mais amostras independentes. rn


u~
A prova de Kruskal-Wallis no pode ser usada para testar diferenas numa nica
amostra de respondentes mensurados mais de uma vez.
2. Dados ordinais.
Essa prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja 4. Aplicando a correo de Yates, realize uma prova de qui-quadrado para o seguinte
possvel atribuir postos. problema 2 X 2:
3. O tamanho mnimo de cada amostra deve ser 6.
Quando n > 5 por grupo de respondentes, a significncia de H pode ser determi-
nada por recorrncia Tabela E (qui-quadrados crticos). Para testar diferenas * N.T.: importante salientar duas coisas: {1)- no se faz co"eo de continuidade (correo de
entre amostras de tamanho inferior a 6, o leitor deve recorrer a tabelas especiais Yates) em tabelas com dois ou mais graus de liberdade ; (2)-mesmo em tabelas com um grau de
encontradas em Siegel (1956). liberdade, s tem sentido aplicar tal correo se a hiptese nula tiver sido rejeitada.
Qui-quadrado e outros Testes No-paramtricas 205
204 TOMADA DE DECISES

9. Pediu-se a duas amostras (aleatrias) de alunos que lessem e em seguida avaliassem


um conto escrito por um novo autor. metade dos estudantes (isto , primeira

lsEJ amostra) foi dito que o texto era de autoria de uma mulher, enquanto que outra

ru
metade (segunda amostra), que a autoria era de um homem. Resultaram as seguintes
avaliaes, onde escores mais altos indicam atitudes mais favorveis:

X1 (Foi-lhes Dito que X2 (Foi-lhes Dito que


S. Aplicado a correo de Yates, realize uma prova de qui-quadrado para o seguinte o Texto era de o Texto era de
problema 2 X 2: Autoria de Autoria de
uma Mulher) um Homem)

EEJ 6
5
6
8

~
1 8
1 2
3 5
4 6
6. Faa uma prova de qui-quadrado para o seguinte problema 3 X 3: 3 3
6 8
5 6
20 17 5 5 8
1 2
3 2
15 16 16 5 6
6 8
6 4
4 14 18 3 3

7. Faa um teste de qui-quadrado para o seguinte problema 4 X 2: Aplicando a prova da mediana, decida se existe uma diferena significativa entre as
medianas desses grupos. Ser que as avaliaes feitas pelos estudantes sofreram
influncia da varivel "sexo do autor"?
25 6
10. Aplicando o teste da mediana, determine se h uma diferena significativa entre as
10 medianas das seguintes amostras de escores:
19

xl x2
15 15
7 4
8 20 8 9 7 3
7 5 3 2
6 9 2 2
8. Faa uma prova de qui-quadrado para o seguinte problema 2 X 3: 7 8 3 6
7 9 4 4
8 7 7 5
9 9 4 4
8 10 15 7 9 5 4
6 6 4
9 2 3
-
12 10 9
206 TOMADA DE DECISES Quiquadrado e outros Testes No-para mtricos 207

11. Uma amostra de 14 crianas, constituinte do grupo "harmonia e identificao", foi 13. Pesquisadores analisaram a varivel " alienao poltica" entre trs amostras d uni
mensurada em dois momentos distintos: antes e depois de sua participao numa versitrios: bacharelandos em "profisses liberais", em " engenharia" e em "art ".
tarefa de classe cujo objetivo era tomar os alunos mais dependentes uns dos outros Cada amostra forneceu um grupo de escores, conforme abaixo indicado (quant
na consecuo de uma promoo curricular. mais alto o escore maior a alienao):
Resultaram os seguintes escores-identificao (escores mais altos indicam maior
"harmonia grupal"): X 1 (Prof Liberais) X2 (Engenharia) X3 (Artes)
100 101 97
Tarefa Cooperativa 110 90 98
95 92 99
Antes Depois 93 100 100
Tempo 2 106 90 104
Aluno Tempo 1
102 96 103
A 62 75 92
B 51 53
c 60 62
D 43 51 Aplicando a anlise da varincia de Kruskal-Wallis, verifique se h uma diferena
E 49 52
significativa entre as citadas amostras de universitrios com respeito ao nvel de
F 45 46
73 62 alienao poltica.
G
H 66 68 14. Aplicando a prova de Kruskal-Wallis, verifique se h uma diferena significativa
I 57 55 entre as seguintes amostras de dados:
J 63 69
K 43 45
L 46 45 X1 x2 x3
M
N
67
61
68
67
125
100
122
100
99
105
95
90
86
"~-98to.
127 103 96
JJifJ '41)~
115 116 88 '<-to]' ~~a .
Aplicando a dupla anlise de varincia de Friedman (por postos), determine se h
129 98 89 ~C'-1 i1]>4.
uma diferena significativa entre os resultados obtidos no Tempo 1 e Tempo 2 C'<? '(,
130 ~;. bo
relativamente varivel "harmonia grupal". R-1( ,04-i>~
12. Aplicando a dupla anlise de varincia por postos-x2 de Friedman-verifique se h
uma diferena significativa entre os escores produzidos por uma amostra de 11
respondentes em trs momentos distintos: T1, T2 e T3.

Respondente TI T2 T3

A 60 62 64
B 53 54 50
c 59 65 71
D 65 66 68
E 55 63 61
F 71 74 76
G 57 58 63
H 77 76 79
I 63 65 70
J 54 59 62
K 63 62 65
Correlao 209

grama de disperso, a varivel X localiza-se no eixo horizontal, enquanto que a varlv I


Y, no vertical.*
Na Figura 11.1, temos dois diagramas de disperso: em ambos, h uma r pr s n

11 tao grfica da relao entre "anos de escola" (X) e "renda" ( Y). Observe-se qu ssu
relao, na Figura 11.1(a), refere:se a homens, enquanto que na Figura 11.1(b), a
mulheres. Note-se, ainda, que , nesses diagramas de disperso, todos os pontos result m
do "cruzamento" de dois escores- educao e renda- relativos a um particular respon
dente . (Em outras palavras: a cada respondente correspondem dois escores e estes, em
conjunto, do origem a um ponto do diagrama de disperso.) Na Figura ll.l(a), por
Correlao exemplo, vemos que a um homem com 4 anos de escolarizao corresponde uma renda
de Cr$68.000,00 (anuais), enquanto que a um homem com 13 anos de estudos, a renda
de Cr$170.000,00. **
Podemos dizer que a fora de correlao entre X e Y aumenta medida que os
pontos, no diagrama de disperso, mais compactamente se agrupam em torno de uma
linha reta imaginria. Portanto, a Figura ll.l(a) (homens) representa uma correlao
mais forte do que a 11.1(b) (mulheres), muito embora ambos os diagramas indiquem
que a renda tende a aumentar com o aumento dos anos de escolarizao. Tais dados,
na verdade, sugerem fortemente que a renda das mulheres (com relao dos homens)
Caractersticas tais como orientao poltica, inteligncia e classe social variam de um
est menos relacionada com o nvel de escolaridade por elas atingido.
respondente para outro e so, por isso, chamadas varidveis. Em ca tulos anteri..QI~
~~pamo-nos com o estabelecimepto da pre~9us__nci_a g~ rela._~_J:mtre duas __
variveis C}!l~Sq!l~r, qu~__llitW-Ii por-diane, _fi~ar~m.os X e Y; por exemplo, relao SENTIDO DA CORRELAO***
entre orientao poltica (X) e mtodo de educar filhos (Y), entre classe social (X) e A correlao pode ser classificada, quanto ao sentido , em positiva ou negativa. Uma
inteligncia (Y) ou entre orientao acadmica (X) e uso de entorpecentes (Y). Auxilia- correlao positiva indica que os respondentes que obtiveram escores altos na varivel
dos pela razo t, pela anlise de varincia ou pelo qui-quadrado, procuramos, pginas X tendem a obter escores tambm altos na varivel Y. De forma recproca, responden-
atrs, descobrir se uma diferena entre duas ou mais amostras podia ser considerada tes que obtm escores baixos em X tendem a obter escores tambm baixos em Y (e,
estatisticamente significativa- reflexo de uma verdadeira diferena populacional- e no nesse caso, a correlao tambm positiva). A correlao positiva pode ser ilustrada a
apenas o resultado de erro de amostragem (ao do acaso). partir da relao entre escolaridade e renda. Como j vimos antes, respondentes com
muitos anos de escolaridade tendem a apresentar rendas anuais maiores do que aqueles
que freqentaram a escola por poucos anos.
FORA DA CORRELAO Diz-se que h correlao negativa quando, com relao aos mesmos respondentes,
Descobrir a existncia de uma relao no esclarece muito a respeito do grau de associa- medida que se obtm escores altos na varivel X , h a propenso de se obterem escores
s.o ou correlao_5U1tr..e.duass~ Muitas so as relaes estatisticamente signfflcll= baixos na Y Reciprocamente, ocorrer tambm correlao negativa se, em correspon-
tes; poucas expressam correlao perfeita ou exata. Ilustremos: sabemos que peso e dncia a valores baixos na varivel X, existir uma tendncia a valores altos na varivel Y.
estatura so variveis associadas, uma vez que, quanto mais alta a pessoa, maior tende a A relao entre escolaridade (anos de) e renda (anual) no caracteriza uma correlao
ser seu peso. H numerosas excees regra, entretanto. Algumas pessoas altas pesam
muito pouco; algumas pessoas baixas pesam muito. Da mesma forma, uma relao entre
orientao para estudos universitrios e uso de entorpecentes no prenuncia a possibili-
* N.T.: Trata-se de um sistema cartesiano de eixos ortogonais.

dade de encontrarmos centenas de no-viciados entre estudantes que pretendam conti- ** N.T.: Em ambos os casos, mas principalmente no primeiro- a julgar pelo valor do salrio mnimo
vigente- trata-se de empregados com algum grau de especializao.
nuar a vida acadmica ou muitos viciados entre os que no planejam freqentar a
,....,. N.T.: No texto original, o Autor fala em direo de correlao. Parece que o termo sentido 6
universidade. mais rigoroso, j que a mesma direo r (reta r) pode ser "percorrida" em dois sentidos (que se
As correlaes, na verdade, variam com respeito sua fora. Podemos visualizar opem): de A para B e de B para A. Assim:
diferenas, quanto fora de correlao, por meio de um diagrama de disperso, que
A B
um grfico capaz de mostrar a maneira pela qual os valores de duas variveis, X e Y,
distribuem-se ao longo da faixa dos possveis resultados. Convencionalmente, nuni. dia-
210 TOMADA DE DECISES Correla/lo 211

$14.000 $14.000 Assim, famt1ias da classe mdia tm pequeno nmero de filhos: o tamanho da fam(lia
"'Q) (Y) aumenta medida que a situao scio-econmica torna-se melhor ou pior.
..."'
Q)
12.000 ~ 12.000
"'
::5
~~
eu
10.000
8.000
. ::5
~~ 10.000
eu 8.000
$14.000 140
Q)

"''O
Q)

Q)
"''O
Q)

12.000 ~ 120
6.000 6.000
,g"' 'E.
c:
'O 'O
<:: 10.000 100
<::
"' 4.000
Q)
cz:: 4.000 {.)o-

cz::
o o """'
c:
Q)
8.000 ~ ~
8A. Ci 60
80
CZ:: 6.000 v
4 6 8 10 12 14 4 6 8 10 12 14
4.000 ~ .;'. 40
Anos de Estudo Anos de Estudo 2.000 ~_, 20
(a) Homens (b) Mulheres
o OL-~~-L-L-L~~~~~

4 5 6 7 8 9 10 11 12 13 4 5 6 7 8 9 10 11 12 13
FIGURA 11.1 Diagramas de Disperso Ilustrativos de Diferenas na "Fora da Relao" entre Escolaridade em Anos Escolaridade em Anos
"Escolaridade" e "Renda" (Homens e Mulheres). (a) (b)

negativa, uma vez que respondentes com muitos anos de estudo no tendem a apresen- FIGURA 11.2 Diagramas de Disperso: (a) Correlao Positiva entre Escolaridade e Renda; (b) Cor-
tar rendas anuais baixas. Um exemplo mais caracterstico de correlao negativa resulta relao Negativa entre Escolaridade e Reprovaes.
da relao entre escolaridade (anos de) e reprovao nos grupos minoritrios. A repro-
vao tende a diminuir medida que o nvel educacional aumenta. Portanto, sujeitos com
pouca educao formal tendem a apresentar maiores ndices de reprovao, enquanto
que os que freqentaram por mais tempo geralmente repetiram poucas vezes o ano.

CORRELAO CURVILINEA
Uma correlao positiva ou negativa representa um tipo de relao linear. Graficamente,
os pontos* do diagrama de disperso aglomerar-se-o em torno da linha (reta) imagin- oL-~-L~L-~-L~~

ria indicada na Figura 11. 2(a). Por outro lado, se uma correlao negativa estiver presente, 1234567
(Baixa) (Alta)
os pontos do diagrama de disperso circundaro a reta imaginria conforme indica a
Situao Scio-econmica
Figura 11.2(b).
Na maior parte dos casos, os pesquisadores buscam estabelecer correlaes li-
neares, sejam elas positivas ou negativas. importante notar, entretanto, que nem FIGURA I 1.3 Relao entre''Situao Scio-Econmica"(X) e "Tamanho da Famlia" (Y): Cor-
todas as relaes entre X e Y do origem, necessariamente, a uma linha reta.** Exis- relao Curvilnea.
tem muitas correlaes curvilneas, indicativas de que uma varivel aumenta medida
que a outra tambm aumenta, at ocorrer uma "reverso"; a partir da, uma das vari-
veis comea a decrescer, enquanto que a outra continua a crescer. Em outras palavras, COEFICIENTE DE CORRELAO
uma relao entre X e Y que comea positiva torna-se negativa; uma relao que comea O procedimento que permite trabalhar com correlaes no-lineares (curvilneas)
negativa torna-se positiva. Para ilustrar uma correlao curvilnea, consideremos a situa-se alm do escopo deste texto. Por essa razo, vamos voltar nossa ateno para
relao entre as variveis "nmero de crianas" (tamanho da famt1ia) e "situao scio- os chamados coeficientes de correlao linear, que expressam, numericamente , tanto a
-econmica". Como evidencia a Figura 11.3, os pontos do diagrama de disperso tendem fora quanto o sentido da correlao. Tais coeficientes de correlao oscilam entre
a formar uma curva em U-e no uma reta, semelhana dos exemplos anteriores. - 1,00 e + 1,00 conforme se segue:

- 1,00 ~--- correlao negativa perfeita


'* N.T.: Fala-se costumeiramente em "nuvem de pontos".
** N.T.: Na verdade, uma linha reta (perfeita) s resulta de uma funo matemtica do tipo
Y = a + bX. Nos demais casos, a linha interpolatriz que melhor se ajusta a todos os pontos da -0,95 +---- correlao negativa forte
nuvem, que "sugere" uma reta.
" - J31i>,LlOTECA
.., f. :.;. ~
.nJSI
212 TOMADA DE DECISES Correlao 213

-0,50 correlao negativa moderada L(zxzv)


r = N
- 0,10 correlao negativa fraca
onde
-0,00 ausncia de correlao
coeficiente de correlao (linear) de Pearson
escore z de um particular sujeito na varivel X, e dado por X -
+0,10 correlao positiva fraca S,v

+0,50 correlao positiva moderada Zy escore z de um particular sujeito na varivel Y, e dado por y -
S1

+0,95 correlao positiva forte N total de pares de dados (escores), isto , total de "duplas" X e Y.

+1,00 correlao positiva perfeita


Distribuio X Distribuio Y

Vemos, pois, que valores numricos negativos tais como -1 00 -0 95 -0-50 e -0 10


indicam correlao negativa, enquanto que 'valores num;ic;s p;sittvos,' como, 'po;
exemplo, + 1,00, +0,95, +0,50 e +O, 10, so indicativos de correlao positiva. Em
termos de grau de associao, quanto mais prximo de 1,00 em ambos os sentidos,
maior a fora da correlao. Como tal fora independente do seu sentido, podemos
dizer que - 0,10 e +0,10 so iguais quanto fora (ambos fracos) ; - 0,95 e +0,95
tambm so iguais quanto a ela (ambos fortes) .

Correlao Positiva

COEFICIENTE DE CORRELAO PARA DADOS INTERVALARES


Com o auxlio do coeficiente de correlao (linear) de Pearson (r), podemos determinar
a fora e o sentido da relao entre as variveis X e Y- desde que elas tenham sido
mensuradas no nvel intervalar. /0_r de Pea!.~on reflete a extenso em que cada__sqj.cito
-~Elostral consegue obter o mesmo escore z nas duas variveis (X e Y). No caso de cor-
rei--psitiv, ambos os escores z para um particular responden te tm o mesmo
sinal, positivo ou negativo, e localizam-se aproximadamente mesma distncia da mdia Respondente A
(aritmtica) de ca~a distribuio de escores. Assim, se o escore do sujeito A na varivel Respondente B
X cair acima de X, o seu e~core na varivel Y tambm cair acima de Y; se o escore Correlao Negativa
de B, em X, cair abaixo de X, o seu escore em Y tambm cair abaixo de Y. No caso
de correlao negativa, os escores z de um particular respondente tm sinais opostos,
o que indica que os zs so no s eqidistantes das respectivas mdias mas caem, com FIGURA 11.4 Intepretao Grfica de uma Correlao Positiva e de uma Negativa com Base no
relao a elas,~m lados opostos. Se o escore do sujei~ A, em X, cair acima de X (isto Escore z.
, se XA > X), o seu escore em Y cair abaixo de Y (ou seja YA < Y); se o sujeito
B cair abaixo de X em X (se X 8 < X ), ele cair acima de Y (isto , Y8 > Y) em Y. Para ilustrar a aplicao do r de Pearson, vamos usar a frmula acima na obten'o d
A interpretao da correlao positiva e da negativa entre escores z foi ilustrada na coeficiente de correlao (linear) entre a varivel X, nmero de anos completos do
Figura 11.4. freqncia escola atingido pelo pai, e a varivel Y, nmero de anos de freqncia
~ agora defmir o r de Pearson como sendo a mdia dos produtos dos escola completados pelo,
respectivo
'-
filho.
I r 1
Os dados da Tabela 11.1 respresentam essa
f!_JfPres z..r4!!J.ivos s variveis X e Y. Em smbolos: relao numa amostra aleatria de sete respondentes.
214 TOMADA DE DECISES Correlao 215

TABELA 11.1 Relao entre Nvel Educacional do Respondente e do Respectivo Pai. (Nvel Educa
cional Mensurado em Anos Completos de Freqncia Escola.) X-X Y- y
X X-X y Y- y ZxZy
sx sy
Anos de Escola
Criana Pais (X) Crianas ( Y)
D 16 5,57 1,85 11 1,57 0,79 1,46
A 12 12
E 8 - 2,43 - 0,81 10 0,57 0,29 - 0,24
B 10 8
F 9 - 1,43 - 0,48 8 - 1,43 - 0,72 0,34
c 6 6
G 12 1,57 0,52 11 1,57 0,79 0,41
D 16 11
E 8 10 ~ (zx zx> = 5,29
F 9 8
G 12 11
Para ilustrar o procedimento que permite obter zx, zy e zxzy acima, vam~ examinar
Para aplicar a frmula do r de Pearson, precisamos, antes, descobrir o valor de cada as respostas do sujeito A, mensura~as das variveis X e Y. J sabemos que X = 10,43
uma das seguintes estatsticas: X, Y, sx e sy. Assim: e que sx = 3,01. Como X- X = 12 - 10,43 = 1,57 para o sujeito amostrai
A, verificamos que sen zx = 1,57/3,01 = + 0,52. (Em outras palavras, os 12 anos
X x2 y y2 de escola do sujeito A caem aproximadamente a meio desvio padro acima da m-
dia da distribl!!_o.) De modo anlogo, sabemos que Y = 9,43 e que sy = 1,98.
12 144 12 144 Como Y - Y = 12 - 9,43 = 2,57 para o sujeito amostrai A, verificamos que
10 100 8 64 sen zy = 2,57/ 1,98 = + 1,30. (Em outras palavras, esses 12 anos de escola caem
6 36 6 36 - ~X ~y
X=- y aproximadamente a um e um tero desvios padres acima da mdia da distribuio.)
16 256 11 121
8 64 10 100 N N Para obtermos o zxzy relativo ao sujeito A, s multiplicar o escore z = +0,52
9 81 8 64 73 66 pelo escore z = + 1,30 (donde: 0,52 X 1,30 = 0,68). Como evidencia a ltima
12 144 11 121 coluna, direita, na tabela acima, a soma desses produtos de escores z 5,29.
- - 7 7
~X = 73 ~x2 = 825 ~y = 66 ~y2 = 650 Entrando com esses dados na frmula de Pearson, obtemos:
10,43 = 9,43

+ 0,75
= ~lY
2

Sx .J-1~2 - xz Sr ~- -yz
/

No exemplo acima, o r de Pearson igual a +0,75, o que indica uma correlao positiva
~8~5 - (10,43)2 = ~ 6~0 - (9,43)2 razoavelmente forte entre o nvel educaci_onal atingido pelos filhos e o nvel educacional
atingido pelos respectivos pais. Em outras palavras, os respondentes cujos pais consegui-
v'l17,86 - 108,78 = v'92,86 - 88,92 ram um nvel alto de escolaridade tambm apresentaram propenso a chegar a um nvel
v'9,8 $,94 alto de escolaridade; os respondentes cujos pais freqentaram a escola durante poucos
3,01 1,98 anos tambm demonstraram uma forte tendncia a freqentar a escola durante pouco
tempo.
Agora para cada sujeito amostrai, calculamos dois escores z: um relativo varivel X,
outro Y; depois, achamos o produto desses escores z: FRMULA PARA O CLCULO DO r DE PEARSON
O clculo do r de Pearson a partir de escores z ajuda a relacionar o tpico da correla-
Y- y
o com nossos estudos anteriores sobre escores padronizados e curva normal. Entre-
X-X y Y- Y
X X- X ZxZy tanto, a frmula do r de Pea,rson baseada em escores z, requer muitos clculos quo
sx sy
consomem bastante tempo. Felizmente, existe uma frmula para o clculo do r de
Pearson que trabalha de forma direta com escores brutos, eliminando-se, assim, a neces-
A 12 1,57 0,52 12 2,57 1,30 0,68
8 - 1,43 -0,72 0,10 sidade de obterem-se os produtos dos escores z para X e Y. A frmula alternativa para
B lO -0,43 - 0,14
c 6 - 4,43 - 1,47 6 -3,43 - 1,73 2,54 r de Pearson
216 TOMADA DE DECISES
<.."orrclao 217

a hiptese de que no existe correlao na populao. Com respeito ao Ociente de


correlao (linear) Pearson, a hiptese nula fixa que

onde r = O,

r coeficiente de correlao (linear) de Pearson


enquanto que a hiptese e periment (hiptese alternativa, Ha) estabelece que
N nmero de pares de escores brutos ("duplas" formadas de X e Y)
X escore bruto (na varivel X) r =I= O.
y escore bruto (na varivel Y)
semelhana do que fi mos em captulos anteriores, testamos a hiptese sele-
A fim de ilustrar o uso da frmula alternativa para o clculo do r de Pearson,
cionando um nvel de signifi ia igual a 0,05 ou 0,01,* aplicando, a seguir, a prova
vamos voltar aos dados da Tabela 11.1, onde se procurou estabelecer a relao entre
adequada. Para testarmos a igni cncia do r de Pearson, podemos calcular uma esta-
nmero de anos de escola cursados pelo pai (X) e o nmero de anos de escola cursados
tstica (razo) t com (N - ) grau de liberdade, sendoN o nmero de pares de escores.
pelo respectivo fillio (Y). A aplicao dessa frmula implica que calculemos primeiro A razo t pode ser obtida ediante a frmula:
_x2, y2 e XY, conforme se segue:
t = rvN- 2
X x2 y y2 XY
V1- r 2

onde
12 144 12 144 144
10 100 8 64 80
6 36 6 36 36 t razo t (t observado, calculado) para testar a significncia do r de
16 256 11 121 176 Pearson
8 64 10 100 80 N nmero de pares de escores (compostos de X e Y)
9 81 8 64 72 r o prprio r de Pearson (que est sendo posto prova).
12 144 11 121 132
.LY = 73 1:x2 = 825 1:Y = 66 1;}"2 = 650 1:XY = 720 Voltando ao exempl anterior, podemos testar a significncia de um coeficiente
de correlao igual a +O, 75 , resultante associao entre nveis educacionais de pais
Ento, o coeficiente de correlao (linear) de Pearson igual a e respectivos fillios. Assim:

7(720) - (73)(66) o,754VS


r = t =
v[7(825) - (73) 2 ][7(650) - (66) 2] ~h - (0, 754) 2
5040 - 4818 222 222
y(5775 - 5329)(4550 - 4356) vC446)(194) 1,69
2,58
0,656
222
294,15 = + 075
Ao consultar a Tabela (fim do livr ), verificamos que, para ser significante, a razo t
deve igualar-se a ou exceder 2,57, a nvel de significncia de 0,05, com 5 graus de '
Teste da Significncia o r de Pearson liberdade. Como o 1}6'sso t calculado ( = 2,58) maior do que o t tabelado (crtico),
O coeficiente de correi o (lipar) de Pearson d-nos uma medida precisa da fora e podemos rejeitar a"'niptese nula de que r = O e aceitar a hiptese experimental de
do sentido da correlao tente entre as variveis) na amostra estudada. Se tivermos que r =I= O. O nvel educacional do respondente e o nvel educacional de seu pai esto
extrado uma amostra ale 'ria de uma particular populao, podemos ainda querer realmente associados na populao.
verificar se a associao/ btida n~re X e Y existe de fato na populao, e no resulta
meramente de erro am~;ral (= a o do acaso).
ot< N.T.: Ou qualquer outro nvel de significncia, pois isso depende do. rigor com que o pesquisa-
Para testar a sim.ificncia de u a medida de correlao, geralmente estabelecemos dor deseja trabalhar.
218 TOMADA DE DECISES Correlao 219

Mtodo Simplificado para T:..::e::::st~~=~~="-="-'- Respondente X x2 y y2 XY


Felizmente, o processo ilustrado cima para testar significncia do r de Pearson, foi
A 10 100 1 lO
simplificado; assim, toma-se desne essrio-a no ser a ttulo de exerccio-calcular a
B 3 9 7 49 21
razo t . suficiente, pois, consultar Tabela F no fim do livro, onde figura uma lista c 12 144 2 4 24
de valores significantes do r de Pearso aos n eis de significncia de 0,05 e 0,01, associ- D 11 121 3 9 33
ados a graus de liberdade que vo de 1 90. e for feita uma comparao direta entre o E 6 36 5 25 30
nosso valor calculado de r e o valor tabel , o (Tabela F), obteremos o mesmo resultado F 8 64 4 16 32
G 14 196 1 1 14
que conseguiramos se, de fato, calculs e os a razo t. No caso de o coeficiente de
H 9 81 2 4 18
correlao de Pearson (calculado) ser enor gue o valor critico (tabelado), devemos I 10 100 3 9 30
aceitar a hiptese nula de que r = O; se por outr lado, o r calculado for igual a ou maior J 2 4 10 100 20
que o r crtico, rejeitamos a hiptes nula e acei os a hiptese experimental de que ~ - 85 ~x2 = 855 ~y = 38 ~y2 = 218 ~XY = 232
existe correlao na populao.
(1) (2) (3) (4) (5)
A ttulo de ilustrao, val)lOS voltar ao nos exemplo anterior, no qual um
coeficiente de correlao igual~/ +O, 754 foi testado r meio de uma razo t e consi-
derado estatisticamente signific . te. Ao consultar a Tab a F, verificamos que, ao nvel PASS02: resultados do passo 1 na frmula do r de Pearson:
de 0,05 e com 5 graus de liber ade, um r, para ser signifi ante e, assim, levar rejeio
da hiptese nula, deve ser, no minimo, igual a 0,754. Vemos, por esse exemplo, que esse
mtodo simplificado leva-nos mesma concluso a que chegamos quando, pelo processo
mais longo, calculamos o t.
[10(855) - (8 ) 2][~/1(218) - (38) 2]
Correlao: Uma Ilustrao
Para ilustrar passo a passo o procedimento que permite obter o coeficiente de correlao 2320 - 2<30 -910 -910
linear de Pearson (r), vamos examinar a relao entre X= anos completos de freqncia (8550 - 7225)( \ 0 - 1444) v (l325)('736) v 9752oo
escola e Y = nmero de reprovaes, na seguinte amostra aleatria de dez respondentes: -910
987,52 = -0, 9

Respondente Anos de Escola (X) Reprovaes (Y)a


O resultado encontrado indica a existncia de aprecivel correlao negativa entre
A 10 "educao" (X) e "reprraes" (Y).
B 3 7
c 12 2 PASSO 3: Achar os tfraus de liberdade.
D 11 3
E 6 5
F 8 4 gl
G 14 1
H 9 2 PASSO 4: Comp ar o r de Pearson obtido c m o r de Pearson crtico (Tabela F):
10 3
J 2 10
r = -0,92
r crtio,p 0,63
(a) Os nmeros dessa coluna indicam quantas reprovaes cada sujeito gl 8
teve em sua vida escolar. p 0,05

Como indicam os resultados acima, para que fosse possvel rejeitar a hiptese
Para calcular o r de Pearson, procede-se do seguinte modo:
nula de que r = O, ao nvel de significncia de 5% e com 8 graus de liberdade, seria
PASSOl: Calcular(l)~X,(2)~_x2 ,(3)~Y;(4)~y2 e (S)~XY necessrio que o nosso r calculado fosse, no mnimo, igual a 0,63. Como o r calcula-
do igual a - 0,92, rejeitamos a hiptese nula e aceitamos a hiptese experimental.
220 TOMADA DE DECISES Correlao 221

Em outras palavras, nossos resultados /ugerem a existncia de correlao entre "edu- Vimos, pginas as, que a fora de uma correlao entre X e Y aumenta medi-
cao" e "reprovao" na populao} ~ual nossa amostra foi retirada. . da que os pontos do diagrama de disperso concentram-se em torno de uma reta imagi-

( Requisitos para o Uso do Coeficiente de Correlao de Pearson


A fim de empregar-se corretamente o coeficiente de correlao de Pearson como medi-
nria. Podemos agora identificar essa curva* pelo nome de reta de regresso , que uma
reta interpolatriz obtida a paitir da nuvem de pontos do diagrama de disperso. O leitor
atento perceber que muitas so as retas que se "acomodam" aos pontos do diagrama,
da de associao entre as variveis X e Y, os seguintes reqisitos devem ser levados em mas uina e somente uma constitui a reta de regresso. Isso porque o ajustamento dessa
reta ao conjunto de pontos o melhor possvel, garantindo-se, assim, boas previses de
1. Correlao* linear-O r de Pearson s se aplica a correlaes lineares entre Y, a partir do conhecimento de X
XeY
2. Dados intervalares-As variveis X e Y devem ser merisuradas, no mnimo, a Previso de Y a partir de X
nvel intervalar, de sorte que seja possvel trabalhar com escores. Imaginem um estudo em que se procure estabelecer a correlao entre X= anos com-
3. Amostragem casual-Os sujeitos amostrais devem ter sido extrados aleatoria- pletos de freqncia escola e Y =renda mensal. Seja uma amostra de seis responden-
tes, onde r= + 1,00, isto , onde h correlao positiva perfeita:
mente de uma dada populao. Se assim no for, no ter nenhum sentido a
prova de significncia do coeficiente obtido.
Anos de Renda Mensal
4. Variveis distribufdas normalmente-Para que seja possvel testar a significn- Escola (X) em Cr$ (Y)
Respondente
cia do r de Pearson, necessrio que ambas as variveis, X e Y, tenham distri-
buio normal na populao. Quando as amostras so pequenas, qualquer A 18 30.000,00
\ descuido na observncia dessa normalidade de distribuio pode comprometer B 6 10.000,00
seriamente a validade do r de Pearson. Entretanto, esse requisito deixa de ter c 9 15.000,00
D 15 25 .000,00
importncia to grande quando o tamanho das amostras igual a ou maior 12 20.000,00
E
que 30. F 3 5.000,00
ANLISE DE REGRESSO
Como demonstra a Figura 11.5, podemos marcar os escores acima num grfico
l O estabelecimento de uma correlao entre duas variveis pode ter utilidade na previso
e traar por entre os pontos obtidos uma reta mediatriz. Essa mediatriz ser a reta de
) dos valores de uma delas (Y) a partir do conhecimento dos valores da outra (X). A tc-
regresso que une os escores de cada respondente da amostra. Tal linha (reta) de regres-
ica empregada em tais previses conhecida por anlise de regresso.
so permite fazer a seguinte previso: um sujeito que tenha cursado a escola durante
18 a~os poder ganhar Cr$30.000,00 mensais; um outro, que tenha freqentado apenas
* N.T.: No v o leitor confundir correlao com relao de causa e efeito. Duas variveis, X e Y, 3 anos, Cr$5.000,00 mensais e assim por diante:
podem estar correlacionadas, mas isso no significa que uma delas seja a causa da outra. Mais formal-
mente, se Y = f(X), nada obriga, alm da correlao, que exista relao causal. Exemplo: suponha-se J foi salientado anteriormente que h poucas correlaes perfeitas (+1,00 ou
que um pesquisador resolvesse estudar a associao existente entre as seguintes variveis: X= nmero - 1,00) que a natureza apresenta. Este fato muito importante porque, como regra
de palavras que uma criana conhece e Y =tamanho do p desta mesma criana. Admita-se, agora, o geral, as previses tornam-se mais acuradas medida que o coeficiente de correlao
seguinte quadro: aproxima-se de 1,00. Quando a correlao entre duas variveis for forte, mas no
Nmero do
perfeita, possvel, ainda assim, construir uma linha de regresso (previso) que se
Nmero de Calado "ajuste** bem" ao conjunto de pontos do diagrama. Isso verdadeiro mesmo que nem
Idade da Palavras (= tam do p) todos os pontos da nuvem caiam exatamente sobre a reta (o que, alis, o mais co-
Criana (em anos) Conhecidas (X) (Y) mum); no ficamos impedidos de fazer previses, mas devemos aceitar o fato de que a
1 10 17 previso ser tanto mais imprecisa quanto mais distante o ponto estiver da linha de
2 300 20 regresso. A Figura 11.6 ilustra o caso de uma correlao forte, mas no perfeita.
3 1.000 24
4 3.000 28
5 8.000 30 * N.T. : Curva um nome genrico. Por isso nada impede, como, alis, o presente caso, que,
na regresso linear, a curva seja uma reta.
f bvio que a correlao vai ser altssima e positiva, o que no significa que o tamanho do p possa
ser explicado pela dimenso do vocabulrio ou vice-versa. Mais coerente pensar numa relao trian- **N.T. : Esse ajuste conseguido graas aplicao de uma "lei" denominada "Lei dos M nimos
gular, onde a prpria idade responsvel tanto pelo crescimento do p quanto do vocabulrio. Quadrados". As equaes de regresso so conseq ncia direta dessa lei.
222 TOMADA DE DECISES Correlao 223

Equao de Regresso podemos, a partir da, estabelecer a equao de regresso conforme se segue :
A equao de regresso, em smbolos, resulta na seguinte frmula:
05
Y' =r G:) r(:;) X +
X- Y
y' = 0,85 ( ' )
0,4
X- 0,85 10 + 5.000

onde 1,06X - 1,06(10) + 5.000 1,06X - 10,6 + 5.000

y' _ valor terico (previsto) de Y (Nota: como se trata de uma previso, 1,06X + 4.989,4
Ypode ser diferente de Y)
O fim de prever (estimar) o valor de Y para cada X particular, basta entrarmos
r coeficiente de correlao linear de Pearson (r) para a relao entre
as variveis X e Y na frmula com os valores de X. Por exemplo: qual a renda mensal prevista para um
Sy desvio padro (amostrai) da varivel Y sujeito que tenha ficado 12 anos completos na escola?
sx desvio padro (amostrai) da varivel X
Cr$35.000
X = um p~rticular valor de X
x mdia aritmtica dos valores (amostrais) da varivel X 30.000

y .mdia aritmtica dos valores (amostrais) da varivel Y. ;;::;- 25.000
-;;;

Para ilustrar o uso da frmula de regresso na previso dos valores de Y, vamos
supor que entre as variveis X = anos de freqncia escola e Y = renda mensal te-
<= 20.000
"'
:::.1
oj
15.000
nhamos conseguido r = +0,85. "'
<:::

Cr$ 35.000
"'
~ 10.000

30.000 5.000

;;::;-
25.000
o
3 6 9 12 15 18
~
s:: 20.000 Anos de Escola (X)
"'
:::.1
oj
15.000
"'s:: FIGURA J 1.6 Linha (Reta) de Regresso Correspondente Relao entre oi Nmero de Anos Com
c.::"' 10.000 <
pletos de Freqncia Escola (X) e a Renda Mensal (Y), onde (r +1,00)

5.000
Entrando com os dados na equao de regresso, vem que:
o
3 6 9 12 15 18 y' 1,06(12) + 4.989,4
Anos de Escola (X) 12,72 + 4.989,4
5.002,12
FIGURA 1 1.5 Linha (Reta) de Regresso Correspondente Relao entre o Nmero de Anos
Completos de Freqncia Escola (X) e a Renda Mensal (Y), onde (r = +1 ,00) Portanto, a previso da renda mensal de algum que tenha 12 anos de escola de
Seja que: Cr$5.002,12.
Da mesma forma, podemos prever que um sujeito que tenha completado 6 anos
r +0,85 de escola ganhe Cr $4.995,76, pu seja:
sy 0,50
sx 0,40 y' 1,06(6) + 4.989,4
X = 10 anos 6,36 + 4.989,4
Y = Cr$5.000,00 Cr$4.995,76
224 TOMADA DE DECISES Correlao 225

Anlise de Regresso: Ilustrao PASS03:


0 estudo da anlise. de regresso pode ser ilustrado com maior profundidade retoman-
do-se um exemplo anterior em que foram examinadas as variveis X= nvel educa-
cional conseguido por pais e Y = nvel educacional conseguido pelos respectivos filhos.
Sx = Sy-
- v~yz
N
- Y-2
Como vims no incio deste captulo, tal relao, numa amostra de sete respondentes, = v'--P - (10,43) 2 = v~ - (9,43) 2
produziuum r de Pearson igual a O, 75. Recapitulemos:
= v' 117,86 - 108,79 = v'92,86 - 88,93
Educao V9,07 V3,93
Pais Respondentes = 3,01 = 1,98
Respondente (X) (Y)
PASSO 4: Entrar com os valores obtidos nos Passos 1, 2 e 3 na equao de regresso.
A 12 12
B
c
D
10
6
16
8
6 Y' =r(;;)X - r(:;) X + Y
11
E 8 10 1 98 1 98
F 9 8 0,75 .( ' ) X - 0,75 ( ' ) 10,43 + 9,43
G 12
3,01 3,01
11
0,75(0,66)X - 0,75(0,66)10,43 + 9,43 0,50X - 5,22 + 9,43
Podemos prever os valores de Y (educao dos filhos) a partir do conhecimento 0,50X + 4,21
dos valores de X (educao dos respectivos pais), segundo o seguinte procedimento:
PASSO 5: Determinar os valores de Y' para os vrios valores de X.
PASSO 1: Determinar o coeficiente de correlao linear de Pearson. [Exemplos]
1. Para um respondente cujo pai tenha completado 16 .anos de estudos:
r = --;:::==N==~=X=Y
=-=(=~=X=)(=~=Y='=)= =
V[N~X2 - (U)2 ][N~P - (~Y) 2 ] Y' 0,50X + 4,21 = 0,50(16) + 4,21 = 8,0 + 4,21 12,21
7(720) - (73)(66)
2. Para um respondente cujo pai tenha completado 6 anos de estudos:
v[7(825) - (73?J[ 7c6so) - (66) 2 ]

5.040 - 4.818 y' 0,50X + 4,21 = 0,50(6) + 4,21 = 3,0 + 4,21 = 7,21
. v(5.775 - 5.329)(4.550 - 4.356) Concluso: temos condies de prever (estimar) que respondentes cujos pais
tenham concludo 16 anos de estudos cursaram/cursaro 12,21 anos; por igual racio-
222 cnio, os filhos de pais que estudaram 6 anos freqentaram/freqentaro escola durante
v294,15 7,21 anos.*

PASSO 2: Calcular as mdias aritmticas amostrais para X e Y, isto , X e Y . * N.T.: Observem-se trs aspectos importantes:
1. Anlise de regresso no adivinhao. Tambm no um processo de " acertar a mosca" .
\
O leitor deve procurar perceber que o conjunto de pontos do diagrama de disperso define uma
- ~y tendncI1. A reta interpolatriz (isto , de regresso) apenas "sintetiza" essa tendnca e permito
X = ~X Y = N uma generalizao, sob a forma de equao, como se todos os pontos cassem sobre ela.
N 2. Do que ficou dito em (1) , acima, decorre que:
73 66 a) se Y = f(X) for funa matemtica, as previses sero pontuais, isto , por ponto, e a pre
7 7 ciso ser grande;
= 10,43 = 9,43 b) se Y = f(X) for funo estatz'stica, as previses sero intervalares, isto , os valores de
1
Y' pertencero a um intervalo. Da que (Y - Y) = erro de estimao.
226 TOMADA DE DECISES Correlao 227

COEFICIENTE DE CORRELAO PARA DADOS ORDINAIS rs coeficiente de correlao de postos


D diferena entre postos (relativa ao mesmo sujeito em ambas as
At aqui, estivemos trabalhando com o r de Pearson, que um coeficiente de correlao
variveis).
aplicvel apenas a dados que possam ser mensurados, no mnimo, ao nvel intervalar.
N nmero de respondentes (isto , tamanho da amostra).
Voltamos agora ao problema da determinao do grau de associao entre variveis
ordinais:___variveis s quais possvel atribuir postos ou "graduao" a partir da presena
de uma caracterstica particular. Vamos considerar os dados tal como figuram na Tabela 11.2 e aplicar a frmula
Tomemos um exemplo do campo social. Consideremos a relao entre a "situao correlacionai de Spearrnan:
scio-econmica" (X) e o "tempo despendido diante da TV" (Y). Imaginemos que nossa
TABELA I 1.2 Relao entre Situao Scio-Econmica e Tempo Gasto Diante da TV
amostra conste de oito respondentes e que, depois da atribuio de postos, tenha
resultado o seguinte quadro: Situao Tempo Gasto
Scio-Econmica Diante da TV
Situao Tempo Gasto Respondente X y D D2
Scio-Econmica (X) Diante da TV ( Y)
Respo.ndente Posto Posto A 1 2 - 1
B 2 1 1 1
A
B
c
D
3
4
2'. -'.
1

s1tuaao socw-
-econmica ;
2
1

~maior tempo diante


c
D
E
F
3
4
5
6
3
5
4
8
o
- 1

-2
1
o
1
1
4
mais alta da TV 7 6 1
E 5 4 G
F 6 8 H 8 7 1
G 7 6 DJ2 = 10
H 8 7

Como podemos observar, o respondente A recebeu o posto 1 com relao ao 6(10) 60 60


r.,= 1 - 8(64 - 1) 1 ---
8(63)
1
504
1 - 0,12 = + 0,88
nvel scio-econmico, mas posto 2 quanto ao tempo despendido diante da TV; o
respondente B recebeu posto 2 com respeito ao nvel scio-econmico e posto 1 quanto
ao tempo gasto diante do vdeo. Encontramos, portanto, uma correlao positiva forte (rs = +0,88), entre "situao
Para determinar o grau de associao entre essas duas variveis, podemos aplicar scio-econmica" e "tempo gasto diante do vdeo": respondentes que apresentam uma
o coeficiente de correlao de postos de Spearman (rs). Em smbolos: situao scio-econmica alta tendem a despender muito tempo diante da TV; res-
pondentes de baixo nvel scio-econmico tendem a ficar pouco tempo assistindo a
programas de TV.
N(N2 - 1)
Procedimento para Lidar com Postos Empatados (Espelhados)
onde Na prtica, nem sempre possvel atribuir postos ou ordenar nossos respondentes sem
que, em algum momento, ocorram postos empatados (espelhados). Poderamos desoo
brir, por exemplo, que dois ou mais respondentes despendem exatamente o mesm
3. A equao Y' = r ( sy) X -r ( sy) i+ Y conhecida tambm por equao de regresso
sx sx
tempo diante da televiso, ou que o desempenho acadmico de dois universitrios
semelhante ou, ainda, que diversos respondentes possuem o mesmo QI.
dos Y sobre os X. Entretanto, pode ocorrer que, dado um Y, o pesquisador resolva calcular o X
1
correspondente. Obviamente, o valor conseguido, semelhana de Y , ser um valor tambm aproxi-
Para ilustrar o procedimento que permite calcular o coeficiente de correlao de
1
mado, donde: (X - X) = erro de estimao. Nesse ltimo caso, quando se trata de buscar um X a postos, no caso de alguns deles estarem empatados, admita-se que estejamos interessados
partir de um Y conhecido, a equao denomina-se regresso dos X sobre os Y. Ei-la: no estabelecimento do grau de associao entre "posio acadmica" (X) e QI (Y).
Suponha-se tambm que nos seja possvel no s ordenar dez alunos graduandos (do
I sx sx - - melhor para o pior) como tambm mensurar seus Qls. A tabela resultante apresentaria
X =r(-)Y-r(-)Y+X
sy sy a seguinte disposio:
228 TOMADA DE DECISES Correlao 229

Tendo encontrado o "posto-posio" de cada QI, podemos dar continuidade ao


Classificao QI
y clculo do rs conforme mostra a Tabela 11.3.
Respondente X

TABELA I 1.3 Relao entre Classificao Acadmica e Ql


A 10 +- 110
B 9 ltimo lugar 90 Classificao
c 8 104
Acadmica QI
D 7 100 D2
Respondente (X) (Y) X - Y = D
E 6 110
F 5 110 10 6 4,0 16,00
1
G 4 132 10 - 1,0 1,00
2 9
H 3 115 3 8 8 o o
I 2 primeiro lugar 140
4 7 9 - 2,0 4,00
J 1 +- 140 o o
5 6 6
6 5 6 - 1,0 1,00
7 4 3 1,0 1,00
Antes de prosseguir com os clculos que levam obteno do rs-coeficiente de 8 3 4 - 1,0 1,00
Spearman-vamos atribuir postos aos Qls dos nossos dez graduandos: 9 2 1,5 0,5 0,25
10 1 1,5 -0,5 0,25
Posto ao 'DJ2 = 24,50
Respondente Q/ QI

A 110 7 Entrando agora, com os dados acima, na frmula, vem que :


B 90 10~
c
D
E
104
100
110
8
~ 7
os postos 5, 6 e 7
esto empatados rs 1 -
6(24,50)
10(100 - 1)
F 110 5

k--
147
G 132 3 1 - - 1 - 0,15 + 0,85
H 115 4 990
I 140 2 os postos 1 e 2
J 140 1 esto empatados O coeficiente de correlao de postos resultante indica que existe uma correlao
positiva bem forte entre X e Y. Em outras palavras, universitrios com QI alto tendem
a classificar-se bem em sua classe e universitrios com QI baixo tendem a classificar-se
. Como podemos observar, os sujeitos I e J obtiveram os Qls mais altos e esto, por
mal.
Isso, empatados (os postos 1 e 2 "pertencem" simultaneamente a ambos). Da mesma
forma, os sujeitos A, E e F esto empatados com relao mesma varivel- QI- e, com I
Prova de Significncia para o Coeficiente de ~peaiman (r s)
isso, os postos 5, 6 e 7 encontram-se "bloqueados".
Como proceder para testar a si ificnci do coeficiente de correlao de Spearman?
Para determinar a posio exata de cada sujeito, no caso de postos empatados,
Exemplo: como podemos saber se coe tciente obtido (rs = 0,85) entre X (classificao
devemos somar esses postos (o "valor" numrico deles) e dividir o total pelo nmero de
acadmica) e Y (QI) significante, , se a "informao" pode ser generalizada para
empates. Portanto, no caso de um QI = 140, em que ficaram bloqueados os postos 1 e
a populao toda? Para testar a s ficncia de um rs calculado, basta consultar a
2, o procedimento consiste em achar uma espcie de "mdia":
Tabela G, no fim do livro, onde e o rrolados, aos nveis de significncia de 5% e 1%,
+ 2 os r s criticas. Observe-se que, ne~ e caso, a consulta leva em conta apenas o nmero de
1,5 pares de escores (N) e no, c':j,6 noutros stes, os graus de liberdade. Neste problema,
2
N = 1O e, conforme a Tabela , para que u~ rs seja significante (ao nvel de 0,05),
Por igual raciocnio, relativamente ao QI 110, o procedimento : preciso que ele obedea se inte condio: rs ~ 0,648. Como o nosso rs observado
igual a 0,85 (portanto maior que o rs crtico), rejeitamos a hiptese nula de que r8 = O
5 + 6 + 7
6,0 e aceitamos a hiptese experimental de que "classificao acadmica" e " QI" so
3 variveis corre/acionadas no s na amostra como tambm na populao.
230 TOMADA DE DECISES 'orr /ao 231

Correlao de Postos: llustrao PASSO 2: Calcular "f.D 2 Para tanto, calcular as diferenas entre os p t s (colunas
Vamos resumir o procedimento que permite obter o coeficiente de correlao de postos X e Y); quadrar estas diferenas (D2 ) e somar os quadrados resultantes ("f.D 2 ):
utilizando, para isso, mais um exemplo. Seja o clculo da relao entre o "grau de
participao voluntria em as- X y D Dz
sociaes" (X) e o "nmero de Participao Voluntria
em Associaes (X) . Nmero de 1 1,5 - 0,5 0,25
amigos ntimos" (Y). Supo-
Respondente Posto Amigos (Y) 2 3,0 - 1,0 1,00
nha-se, ainda, u~a .amostr,a de UNIVERSIDADE fEDiiRAL
cinco respondep.tes, conforme A 1 participa 6
3 1,5 1,5 2,25 oo f'AkA
4 4,5 - 0,5 0,25 BIBLI OTECA CENTRAL
o quadro B 2 mais 4 5 4,5 0,5 0,25
c 3 6 ---
D 4 2
r.oz = 4,00
participa
E 5 menos 2
PASSO 3: Entrar com o resultado do Passo 2 na frmula do coeficiente de correlao
Para determinar o grau de associao entre X e Y, procedemos da seguinte ma- de postos de Spearman:
neira:
24
1 - 120
PASSO 1: Atribuir postos aos respondente tanto na varive) X quanto na Y. Como N (N 2 - 1)
demonstra o quadro acima, a distribuio de ostos com respeito varivel X- partici-
pao voluntria em associaes- obedece se inte regra: posto 1 para o respondente - 0,20 = + 0,80
que participa "mais" e 5 para o /
----------~--~~------------------
que participa "menos". Posto PASSO 4: Comparar o r 8 obtido (calculad ) com o t .tico na Tabela G.
Precisamos, tambm, a-
tribuir postos aos mesmos 1
respondentes sob a varivel 3 ~ postos 1 e 2 r 8 calculado 0,80
2 ..,_..-- "bloqueados" r 8 crtico 1,00
Y -nmero de amigos ntimos.
No exemplo em foco, ocorrem
4 "------postos 4 e 5 N 5
5 +---- " bloqueados" p 0,05
postos empatados, conforme a
demonstrao dada a seguir:
Volvendo Tabela G, no fim o livro, verificamos que, ao nvel de significncia
Para trabalhar com postos empatados, usamo a "mdia" dos empates: de 0,05 e com uma amostra de tamanho 5, necessitaramos de um r 8 observado igual
a 1,00 (correlao perfeita) para que fosse possvel rejeitar a hiptese nula. Portanto,
Para a primeira e segunda posies: 1,5 embora tenhamos conseguido uma forte correlao positiva na nossa amostra, somos
obrigados a aceitar a hiptese nula segundo a qual r 8 =O. Nossos resultados no podem
4 ser generalizados para a populao da qual a amostra foi extrada.
Para a quarta e quinta posies: 4,5
2
Requisitos Para o Uso do Coeficiente de Correlao de Postos de Spearman
Portanto: O coeficiente de correlao de postos de Spearman (r8 ) deve ser empregado somente
quando as seguintes condies podem ser satisfeitas:
X y
1. Correlao linear- O r 8 (coeficiente de correlao de postos de Spearman) s
1 1,5
detecta correlaes lineares entre X e Y, quaisquer que sejam essas variveis.
2 3,0
2. Dados ordinais-As variveis X e Y devem ser passveis de ordenao; como
3 1,5
alternativa, deve ser possvel atribuir-lhes postos.
4 4,5
3. Amostragem casual-Os sujeitos amostrais devem ter sido extrados aleatoria-
5 4,5
mente de uma dada populao.
Correlallo 233
232 TOMADA DE DECISES
Sempre que ocorrer acordo perfeito ou inverso perfeita, torna-se possfv I prever,
GAMA DE GOODMAN E K.RUSKAL com preciso total, o posto de um sujeito numa varivel a partir do conhecm nt d
A correlao pode ser interpretada em termos do grau em que os valores de uma vari- posto desse sujeito na outra varivel. No caso de acordo perfeito, por exemplo, a bem
vel podem ser previstos (ou adivinhados) a partir do conhecimento dos valores da outra que a pessoa que recebe posto 3 na varivel X tambm recebe o 3 em Y. Uma vez qu
varivel. Isso pode ser diretamente observado no coeficiente gama de Goodman e . a ocorrncia de correlao perfeita raramente ocorre na natureza, nossa capacidad
Kruskal (G), que uma alternativa ao coeficiente de correlao de postos (rs). Alis, para fazer previses acuradas sobre uma varivel a partir do conhecimento que tem
muitos pesquisadores do preferncia ao gama quando se trata de medir o grau de as- da outra vai depender da quantidade de acordos ou de inverses na ordenao de
sociao entre variveis mensuradas ao nvel ordinal. postos dos indivduos em ambas as variveis.

A frmula bsica para o clculo do gama :


Coeficiente Gama (G): llustrao
'i.fa - "i.{; Para ilustrar o uso de gama, vamos admitir que estivssemos estudando a relao entre
G (X), o tamanho da populao negra de reas metropolitanas dos Estados Unidos da
"i.fa +"i.(;
onde Amrica do Norte, e (Y), o respectivo nvel de discriminao em emprego. Tal estudo
poderia ser levado a efeito, por exemplo, analisando os dados relacionados com popu-
freqncia dos "acordos" laes e renda ora disponveis no U.S. Bureau ofthe Census. *
fa
f; freqncia das "inverses". Suponha-se que tenhamos sido capazes de ordenar e atribuir postos s seis maiores
reas metropolitanas dos EUA relativamente a X = tamanho da populao negra e
Podemos interpretar os acordos e as inverses como uma expresso do sentido Y =nvel de discriminao em emprego. Seja ento o quadro:
da correlao entre as variveis X e Y. Um acordo perfeito indica uma correlao posi-
tiva perfeita ( + 1,00): tal situao ocorre quando os sujeitos estudados receberam postos Tamanho da N(vel de
exatamente na mesma ordem em ambas as variveis. O quadro abaixo demonstra esse rea Populao Negra Discriminao em
Metropolitana (X) Emprego (Y)
fato muito bem: um sujeito recebe o posto 1 na varivel X e tambm o posto 1 na
varivel Y; um outro sujeito recebe o posto 2 na varivel X e tambm na Y e assim A 6 4
por diante. B 2
c 2 3
Postos D 5 5
E 4 6
Sujeitos X y
F 3

A
B 2 2 Vemos, assim, que a rea metropolitana A apresentou o menor nmero de negros e
c 3 3 classificou-se em quarto lugar com respeito discriminao; a rea metropolitana B
D 4 4 apresentou a maior populao negra e classificou-se em segundo lugar quanto discri-
E 5 5
minao e assim por diante.**
F 6 6

PASSO 1: Redistribuir os dados de forma que a varivel X fique perfeitamente orde-


Por outro lado, uma inverso perfeita in- nada (do posto menor ao maior). Para determinar o grau de associao entre o tamanho
Postos
dica uma correlao negativa perfeita ( -1 ,00), da populao negra (X) e a respectiva discriminao em emprego (Y), levamos, primeiro,
Sujeitos X y
de forma que os sujeitos estudados recebem a varivel X a uma tabela em que seus postos figurem de forma ordenada de 1 a 6;
postos em ordem rigorosamente inversa nas A 1 6 os postos da varivel Y apenas qcompanham os postos de X, o que fatalmente determina
duas variveis. Assim, um sujeito que receba o B 2 5
posto 1 em X receber o ltimo posto em Y; c 3 4
D 4 3 N.T.: Servio de Levantamento de Dados Demogrficos dos EUA.
um outro sujeito que receba o posto 2 em X 5 2 "" N.T.: Observe-se que o menor posto (em ambas as variveis) corresponde maior populao
E
receber o penltimo posto em Y e assim F 6 1 u ao maior nfvel discriminador.
por diante.
... . . ,.. . , ,. :.-.. .... : UNIVERSIDADE fEOi-RAL DO PARA
234 TOMADA DE DECISES
Dl6LIOTECA CENTRAL Correlao 235

uma ordem catica.* As freqncias dos acordos e das inverses na coluna desorde-
PASSO 3: Obter as freqncias das inverses. Para encontrar as freqncias das inver-
nada (Y) indicam o quanto essa coluna de postos difere de uma ordenao perfeita, seja
ses, novamente comeamos com o primeiro posto da coluna dos Ys (isto , o posto
ela positiva (1, 2, 3, 4, 5, 6) ou negativa (6, 5, 4, 3, 2, 1):
que c~rresponde rea metropolitana B). Desta vez, entretanto, para cada posto, o
procedimento ser o seguinte: contar o nmero de dados que, na tabela situam-se
a~ima de um particular posto e que, em valor numrico, so maiores do q~e ele. Ini-
Tamanho da Nz'vel de
rea Populao Negra Discriminao em
Metropolitana (X) Emprego (Y) Ciando com o posto que figura no topo da coluna Y, verificamos que, em termos de
tabela, no ocorre nenhum dado antes dele (isto , antes do posto 2); por isso, entramos
B 1 2 com um zero na coluna das inverses. Tomando, agora, o segundo posto na coluna dos
c 2 3
Ys (3), isto , o que corresponde rea metropolitana C, contamos o nmero de dados
F 3 1
E 4 6 que o antecedem e so maiores do que ele. Uma simples inspeo da tabela revela-nos
D 5 5
A 6 4 que antes do posto 3 s figura um dado: o relativo ao posto 2 (rea metropolitana B)
e que, sendo 2 < 3, s possvel entrar com um zero na coluna das inverses. Pros-
PASSO 2: Obter as freqncias dos acordos. Para obter tais freqncias ifa), comea- seguindo lista abaixo, o prximo posto o que corresponde rea metroplitana F
mos com o primeiro posto no topo da coluna dos Ys (isto , o posto que corresponde (posto 1). Como antes desse posto, 1, na coluna dos Ys, figuram os dados (postos)
rea metropolitana B). Para cada posto, contamos o nmero de dados situados acima 3 e 2, e sendo (3 > 1) e (2 > 1), entramos com o valor 2 na coluna das inverses. Ao
dele na tabela, porm que tenham menor valor numrico. O nmero de postos acima descer mais um pouco encontramos o posto 6, relativo rea metropolitana E. Obser-
do primeiro (sem levar em considerao seu valor numrico) sempre zero (uma vez vamos que, na tabela, trs dados precedem esse posto: 1, 3 e 2; porm, como nenhum
que, do ponto de vista estritamente "visual", no h nenhum posto antes do primeiro na deles supera, em valor numrico, o 6, novamente escrevemos zero na coluna das inverses.
lnbela). Como resultado, entramos com um zero na coluna "acordos" para a rea metro- O processo continua at que se esgotem todos os postos da coluna Y, dando origem aos
politana B. Observando o segundo posto (3) listado na coluna Y (rea metropolitana C), dois seguintes valores na coluna das inverses: 1 e 2 (o leitor poder fazer seus prprios
ntamos o nmero de postos que esto acima dele na tabela e que tm menor valor clculos para comprovar).
numrico. Vemos que apenas o posto 2 est, na tabela, acima dele (3). E, uma vez que
Tamanho da Ntvel de
se posto (2) menor que 3, entramos com o valor 1 na coluna de acordos. Em conti- rea Populao Negra Discriminao em
nuao ao processo, o prximo posto listado (para a rea metropolitana F) 1. Como Metropolitana (X) Emprego (Y) Inverses
o postos que esto acima dele, na tabela, so 3 e 2-e como ambos (3 e 2) so maiores
que l - entramos com um zero na coluna de acordos. O posto seguinte na coluna dos B 1 2 o
l' 6 e corresponde rea metropolitana E. Os postos que, na tabela, esto acima dele, c 2 3 o
F 3 1 2
o 1, 3 e 2 e estes, sem exceo, so menores que 6. Em outras palavras, se (1 < 6),
( l < 6) e (2 < 6), h 3 postos menores que 6 e, por isso, entramos com o valor 3 na
E 4 6 o
D 5 5 1
1 oluna de acordos. Procedendo de forma idntica com relao aos demais postos da A 6 4 2
1llluna Y (relativos s reas D e A), vamos encontrar duas vezes o valor 3, que deve ser
levado coluna de acordos. Assim:
Acordos Inverses
Tamanho da Ntvel de PASSO 4: Obter ":,fa e ":,fi Uma vez que
rea Populao Negra Discriminao em todos os acordos e todas as inverses B o o
M tropolitana (X) Emprego (Y) Acordos
tenham sido estabelecidos, somamos c 1 o
separadamente essas colunas, conforme
F o 2
B 2 o E 3 o
c 2 3 1 ubaixo: D 3 1
F 3 1 o A 3 2
E 4 6 3
D 5 5 3
':,fa = 10 ':,fi =5
A 6 4 3

catica estaria associada aos postos da varivel X. Por outro lado, entenda-se por ordem catica
N.T.: Se esse procedimento de ordenao tivesse sido feito com relao varivel Y , a ordem
uulquer seqncia numrica que no apresente urna lei de formao.
236 TOMADA DE DECISES "JNIVERS!nA11i: rrl~.. :. ':.. .l . co'I!Pt o 237
Bf6l .:J Te.": A ,:_:~_1\,1 ."ii;'AL
PASSO 5: Entrar com ':-fa e ':-fi na frmula do coeficiente gama: se, 8 interesse moderado e 11 pouco interesse. Observe-se que postos empatados ocor-
rem em todas as posies. Por exemplo, 29 respondentes empataram suas respostas na
G "if a - "i{; - 1O - 5 - 5 coluna classe alta, no ponto mais alto da varivel X.
== + 0,33
= "if a + "i{; - 1 O + 5 - 15 Observe-se que o quadro acima caracteriza uma tabela 3 X 3, onde existem 9 caselas (3
linhas X 3 colunas== 9 caselas). Para garantir que o sinal do coeficiente gama sej a fixado
Um coeficiente gama igual a +0,33 indica a presena de uma correlao positiva com o devido rigor (positivo ou negativo), a varivel X (nas colunas) deve ser sempre
fraca. Essa correlao baseia-se numa dominncia de acordos: o nmero de acordos , disposta em ordem decrescente da esquerda para a direita. Por exemplo, na tabela, a
aproximadamente, 33% maior do que o nmero de inverses entre o tamanho da popu- classe social (X) decresce da esquerda para a direita, " assumindo" os valores " alta" ,
lao negra (X) e a discriminao em emprego (Y) nos EUA.* "mdia" e "baixa". De modo anlogo, a varivel Y, nas linhas, deve decrescer de cima
para baixo. Assim, nessa tabela, a adeso voluntria a uma associao (Y) varia, no
Procedimento Para Postos Empatados (Espelhados) sentido descendente, assumindo os valores "alta", "moderada" e "baixa".
Como j foi visto com relao ao coeficiente de correlao de postos (de Spearman),
nem sempre possvel evitar postos empatados ao nvel ordinal de mensurao. Na PASSO 2: Calcular ':-fa- Para encontrar ':-fa, comece pela casela onde f== 15 (canto
esquerdo superior). Multiplique essa freqncia (15) pela soma de todas as outras
verdade, os pesquisadores se vem, com freqncia, s voltas com medidas ordinais,
freqncias do quadro que, com relao ao 15, esto direita e abaixo. Lendo da
brutas, que do origem a um nmero bem grande de postos empatados. Nos casos em que
esquerda para a direita, observamos que as freqncias que esto abaixo e a direita de
um nmero muito grande deles ocorrer, o coeficiente gama torna-se uma medida de 15 so: 1O, 8, 7 e 11. Repita-se este procedimento relativamente a todas as caselas que
associao particularmente til. A frmula bsica para o clculo do coeficiente gama admitam freqncias nas posies (simultneas) "abaixo e direita". Assim, trabalhan-
pode ser empregada mesmo quando h postos empatados, desde que as freqncias dos do da esquerda para a direita, vem que:
acordos e das inverses sejam calculadas mediante uma "adaptao".
Classe A/ Adeso alta 15{1 o + 8 + 7 + 11) 15(36) 540
Vamos ilustrar o procedimento de obteno do coeficiente gama numa situao Classe B/Adeso alta 8(8+11) 8{19) 152
de postos empatados. Suponha-se que um pesquisador quisesse examinar a relao entre Classe A/Adeso moderada 10(7 + 11) 1O( 18) 180
"classe social" e "adeso voluntria a uma associao". Suponha-se, ainda, que ele Classe B/Adeso moderada 10(11) 110
tivesse obtido os seguintes dados aps examinar questionrios distribudos a e respondi-
dos por 80 moradores de uma cidade: entre 29 respondentes da classe alta (A), 15 (Note-se que nenhuma outra casela da tabela admite clculos semelhantes aos que
demonstraram grande interesse, 1O interesse moderado e 4 pouco interesse em aderir acabamos de fazer, uma vez que para as freqncias 7 (l.a linha), 8 (2.a linha), 4, 7
voluntariamente a uma determinada associao; entre 25 respondentes da classe mdia e 11 {ltima linha) as posies simultneas "abaixo e direita" no tm sentido.)
(B), 8 demonstraram grande interesse, 10 interesse moderado e 7 pouco interesse; e,
para finalizar, entre 26 respondentes da classe baixa (C), 7 demonstraram grande interes- ':-fa a soma dos produtos acima. Portanto:

PASSO 1: Redispor os dados numa tabela de freqncias. 540 + 152 + 180 + 110
992
Classe Social (X)
Adeso Voluntria a Alta Mdia Baixa
(A) (B) PASSO 3: Calcular I:-[j. Para encontrar I:-[j, inverta-se o procedimento apresentado no
uma Associao (Y) (C)
Passo 2, comeando com a freqncia que figura no topo direito da tabela ( 7). Desta
Alta 15 8 7 vez, cada valor vai ser multiplicado pela soma de todas as freqncias que, com relao
Moderada 10 10 8 a ele, figuram abaixo e esquerda. Fazendo a leitura da direita para a esquerda, obser-
Baixa 4 7 11 vamos que as freqncias que esto esquerda e abaixo de 7 so: 1O, 1O, 7 e 4. Como
29 25 26 no passo anterior, repita-se este procedimento at esgotar todas as alternativas posicio-
N == 80 nais. Ento, trabalhando da direita para a esquerda, temos:
Classe C/ Adeso alta 7(10+ 10+ 7 +4) 7(31) 2 17
Classe B/ Adeso alta 8(10 + 4) 8(14) == 112
* N.T.: bom insistir no fato de que a preocupao do Autor foi ilustrar um procedimento Classe C/ Adeso moderada 8(7 +4) 8(11) 88
estatfstico e no criticar um quadro social eventualmente existente nos EUA. Alm disso, os dados
usados bem podem ser ficticios.
Classe B/ Adeso moderada 10(4) 40
238 TOMADA DE DECISES Correlao 239

(Note-se que nenhuma outra casela da tabela admite clculo semelhantes aos que fize- Consultando a Tabela B, no fim do livro, verificamos que o z deve igualar-se a
mos acima, uma vez que para as freqncias 15 (La linha), 10 (2.a linha), 11, 7 e 4 ou exceder 1,96, a fim de que seja possvel rejeitar a hiptese nula a 5%. Como o nosso
(ltima linha) as posies simultneas "abaixo e direita" no tm sentido.) z calculado (z = 1,03) menor que o z crtico (1,96), devemos aceitar a hiptese nula
de que G = O e rejeitar a hiptese experimental de que G i= O. A correlao que obti-
":.f; a soma dos produtos que acabamos de obter. Ento:
vemos no pode ser generalizada para a populao da qual a amostra foi extrada.
":.f; = 217 + 112 + 88 + 40
Requisitos Para o Uso de Gama
457
Os seguintes requisitos devem ser levados em conta a fim de que seja possvel o emprego
do coeficiente gama como medida de associao:
PASSO 4 : Entrar com os resultados dos Passos 2 e 3 na frmula do coeficiente gama.

1. Correlao linear-O coeficiente gama (G) s detecta relaes lineares entre


- 'i.{,, - 'i.{; - 992 - 457 - 535 -
0 37 XeY.
G - "i.f,, + 'i.{; - 992 + 457 - 1.449 - +
2. Dados ordinais - As variveis X e Y devem ser passveis de atribuio de postos
ou de ordenao.
Um G = +0,37 indica correlao positiva, moderadamente fraca, entre "classe
3. Amostragem casual- Para que seja possvel testar a hiptese nula de que G =O,
ocial" e "adeso voluntria". O resultado que acabamos de encontrar sugere uma
preciso que os sujeitos amostrais tenham sido extrados aleatoriamente de
dominncia de acordos: estes excedem as inverses em 37% (Note-se que se o gama
uma dada populao.
tivesse sido -0,3 7, o significado concreto desse coeficiente seria: correlao negativa,
moderadamente fraca e baseada em inverses.)

Prova de Significncia Para o Gama COEFICIENTE DE CORRELAO DE


Para testar a hiptese nula de que X e Y no esto associados na populao, basta trans- DADOS NOMINAIS DISPOSTOS NUMA TABELA 2 X 2
formar o G calculado (observado) em escore z, mediante a aplicao da seguinte frmula: No captulo anterior, comeamos a estudar um teste de significncia (para pr freqn-
cias prova) conhecido por qui-quadrado. Como simples extenso do teste de qui-qua-
drado, podemos agora estabelecer o grau de associao entre variveis que tenham sido
mensuradas a nvel nominal.
nde Vamos examinar, mais uma vez, a seguinte hiptese nula:

coeficiente gama calculado (observado) A proporo de fumantes de maconha entre alunos orientados para
freqncia de acordos a universidade igual dos no-orientados para a universidade. *
freqncia de inverses.
No Captulo 1O, essa hiptese nula foi testada numa amostra composta de 21
Na ilustrao acima, encontramos G = 0,3 7 (como indicador da correlao exis- sujeitos orientados para a universidade e de 15 no-orientados. A pesquisa revelou
t nte entre "classe social" e "adeso voluntria"). Para testarmos a significncia desse que 15 dos 21 orientados para a universidade e 5 dos 15 no-orientados eram fuman-
valor, entramos na frmula do z conforme se segue: tes de maconha (veja Captulo 10). Eis esse problema 2 X 2, de modo condensado, na
Tabela 11.4.
992 - 457
z (0,37) A relao entre " ser fumante de maconha" (X) e "orientao para estudos supe-
80(1 - 0,372 ) riores" (Y) foi testada mediante uma prova de qui-quadrado, conforme se segue:

(0,37)
535
80(0,86)
(0,37) flij;o 2 - 36[(15)(10} - (5)(6)]2
X - (15 + 5)(6 + 10)(15 + 6)(5 + 10)
36(150 - 30) 2
(20)(16)(21)(15) = 5 14

= (0,37) J7,78 = (0,37)(2,79) 1,03


* N.T.: Orientado para a universidade que tenciona prosseguir os estudos aps o 2.0 grau.
Correlao 241
240 TOMADA DE DECISES
2 2
Como o Xo maior que o Xc, rejeitamos a hiptese nula de que rf> = O e aceitamos a
TABELA 11.4 Uso de Maconha entre Estudantes Orientados e No-Orientados para a Universidade.
Dados Tirados da Tabela I 0.3 hiptese experimental de que as variveis X e Y esto, de fato, associadas na populao
da qual se extraiu a amostra de 36 estudantes.
Fumantes No-fumantes
Requisitos Para o Uso do Coeficiente Fi
O emprego do coeficiente fi, como medida de associao entre duas variveis- X e
Y - leva em conta os seguintes requisitos:
Orientados para 15 6 21
a Universidade
1. Dados nominais-S se trabalha com freqncias.
2. Tabela 2 X 2- fundamental que os dados possam ser dispostos numa tabela
No-orientados 2 X 2 (2 linhas por 2 colunas). Constitui erro empregar o coeficiente fi em
para a Universidade 5 10 15 tabelas de ordem superior a 2 X 2 (por exemplo: 3 X 3; 4 X 3 etc.).
3. Amostragem casual-A fim de que seja possvel testar a significncia dos coefi-
cientes fi, importante que a escolha dos elementos amostrais tenha sido
20 16 N = 36 aleatria.

Uma vez conseguido o valor do qui-quadrado observado (~ = 5,14), podemos


COEFICIENTES DE CORRELAO DE DADOS NOMINAIS
calcular o coeficiente fi ( rf>), que nada mais seno uma medida capaz de calcular o grau
DISPOSTOS EM TABELAS DE ORDEM SUPERIOR A 2 X 2
de associao em tabelas 2 X 2. Em smbolos:
At este ponto, ocupamo-nos apenas do coeficiente de correlao de dados nominais
dispostos em tabelas do tipo 2 X 2. Como vimos no Captulo 1O, h ocasies em que,
apesar de a varivel observacional ser nominal, comparam-se as freqncias de vrios
onde grupos ou categorias. Vamos ilustrar examinando a seguinte hi~tese nula:
rf> coeficiente fi A freqncia relativa com que aparecem os mtodos de educar
x2 qui-quadrado observado (calculado) chamados "permissivos", "moderados" e "autoritrios" a mesma
N tamanho da amostra (isto , nmero de sujeitos experimentais). para "liberais", "moderados " e "conservadores ".

Aplicando a frmula acima ao problema em foco, resulta que: Essa hiptese foi testada no Captulo 10 com os dados dispostos numa tabela 3 X 3. A
Tabela 11.5 reproduz esses dados.
J5,14 0,37
J36 A relao entre X e Y foi testada (no Captulo 1O) por qui-quadrado, de acordo
com o que se segue:
O coeficiente fi obtido (r/> = 0,37) indica a existncia de correlao moderada entre
orientao para a universidade e uso de maconha. (7 - 10,79)2 (1 o - 10,07)2 (15 - 11,14) 2
x2 + + +
10,79 10,07 11,14
Teste de Significncia para o CoefiCiente Fi
Sem nenhuma dificuldade, felizmente, o coeficiente fi pode ser testado por meio de (9- 10,11)2 (10- 9,44) 2 (11 - 10,45) 2
qui-quadrado cujos valores crticos esto registrados, em grande nmero, na Tabela E + + + +
10,11 9,44 10,45
(fim do livro), aos nveis de 0,05 e 0,01. Assim:
(14 - 9,10) 2 (8 - 8,49) 2 (5 - 9,40)2
~ 5,14 + + + +
2 9,10 8,49 9,40
Xc 3,84
gl 1 7,58
p o
242 TOMADA DE DECISES Correlao 243

-TABELA 11.5 Relao entre "Mtodos de Educar Filhos" e "Orientao Poltica". Dados Tirados Teste de Significncia Para o Coeficiente de Contingncia
da Tabela 10.4 Tal como procedemos no caso do coeficiente fi, a determinao da significncia do
coeficiente de contingncia faz-se mediante consulta direta Tabela E, no fim do
X livro. Relativamente situao que acabamos de examinar acima temos que:
Conservadores Moderados Liberais
2
Xo 7,58
y 2
Xc = 9,49
Permissivos 14 30 UNIVERSIDADE FEDiRAL DO PARA
gl 4
p BIBLIOTECA CENTRAL
0,05

Diante desses resultados (X~ < x~), somos levados a no rejeitar a hiptese nula de que
Moderados 10 10 8 28 C = O, descartando, por outro lado, a hiptese alternativa (experimental) de que C i= O.
Em outras palavras, a relao "mensurada" exprime uma circunstncia da particular
amostra utilizada e no da populao que lhe deu origem.

Autoritrios 15 11 5 31 Requisitos Para o Uso do Coeficiente de Contingncia


A fim de aplicar convenientemente o coeficiente de contingncia, o leitor deve ficar
atento para os seguintes requisitos:
32 30 27 N = 89
1. Dados nominais- No clculo de C s se exigem freqncias. Tais freqncias
podem ser dispostas numa tabela 2 X 2 ou de ordem superior.
No caso em foco, o que buscamos determiunar a correlao ou o grau de associa-
2. Amostragem casual-Para tornar factvel a prova de significncia do C (coefi-
o entre "orientao poltica" (X) e "mtodos de educar filhos" (Y). Numa tabela de
ciente de contingncia), todos os elementos amostrais devem ser selecionados
ordem superior a 2 X 2, essa correlao pode ser conseguida mediante uma simples
aleatoriamente de uma dada populao.
"ampliao" do teste de qui-quadrado, donde resulta o chamado coeficiente de contin-
gncia, notado C. O valor de C pode ser obtido pela aplicao da seguinte frmula:
Uma Alternativa Para o Coeficiente de Contingncia: V de Cramr
Apesar da grande popularidade que o coeficiente de contingncia tem entre os pesqui-
sadores, ele apresenta uma notria desvantagem: o nmero de linhas e de colunas numa
tabela de qui-quadrado exerce influncia sobre o valor mximo de C Em outras pala-
vras, o valor do coeficiente de contingncia nem sempre vai variar de O a 1, muito
onde embora, em nenhum caso, exceda 1. Sob certas condies, o valor mximo de C poder
ser 0,94; sob outras, 0,89 e assim por diante.
x2 qui-quadrado observado Para evitar-se essa desvantagem de C, podemos decidir pelo emprego de um coefi-
N tamanho da amostra ciente de correlao alternativo, cuja finalidade exprimir o grau de associao entre
C coeficiente de contingncia. variveis nominais em tabelas de ordem superior a 2 X 2. Conhecido por V de Cramr,
esse coeficiente no depende do tamanho (ordem) da tabela de x2 e apresenta os mes-
om os dados deste problema, resulta, aplicando a frmula de C, o seguinte: mos requisitos de C(coeficiente de contingncia). Em smbolos:

7,58
c 0,28
89 + 7,58
onde
nosso resultado, isto , C = 0,28, indica que a correlao entre "orientao poltica"
e "mtodos de educar filhos" bastante fraca. Essas duas variveis podem estar rela- v V de Cramr
cionadas, o que no impede que surjam inmeras excees. N tamanho da amostra
Correlao 245
244 TOMADA DE DECISES

2. Calcule o coeficiente de correlao de Pearson para os seguintes conjuntos de


k nmero de linhas ou de colunas. (Usar o nmero menor, seja ele
escores e verifique se a correlao significante.
qual for. Nas tabelas em que o nmero de linhas igual ao nmero
de colunas, tanto faz usar um como outro-por exemplo, numa y
X
tabela 3 X 3, k = 3; numa tabela 4 X 4, k = 4-mas no caso de
tabelas tal como uma 3 X 5, k = 3 obrigatoriamente.) 2 s
4
5 3
4

v
7,58
89(3 - 1) ~= 0,20 3. Calcule o coeficiente de correlao de Pearson para o seguinte conjunto de escores
e verifique se a correlao significante.

Concluso: O V de Cramr, igual a 0,20 neste exemplo, indica que existe uma relao X y
fraca entre as variveis X e Y.
3 8
4 9
RESUMO 1 s
Neste captulo, entramos em contato com coeficientes de corre1ao que expressam 6 10
2 4
numericamente o grau de associao entre as variveis X e Y. Com o auxlio do coefi-
ciente de correlao de Pearson (r), podemos determinar tanto a fora quanto o sentido
da relao entre variveis mensurveis, no mnimo, ao nvel intervalar. Podemos tambm 4. Calcule o coeficiente de correlao de Pearson para o seguinte conjunto de dados
usar o r de Pearson para prever valores de uma varivel (Y) a partir do conhecimento e indique se a correlao significante.
dos valores da outra varivel (X).
X y
Existem inmeras alternativas no-paramtricas para o r de Pearson. A fim de
determinar a correlao entre variveis mensuradas ao nvel ordinal, podemos aplicar 2 1
o coeficiente de correlao de postos de Spearman (rs)- O uso dessa medida e correla- s 5
o implica que as variveis X e Y tenham sido ordenadas ou, ento, que a elas tenham 1 2
sido atribudos postos. Quando ocorrer um nmero muito grande de postos empatados 6 8
4 4
(espelhados), o coeficiente gama de Goodman e Kruskal (G) constitui uma boa alterna-
tiva para o coeficiente de correlao de postos.
Mediante uma simples extenso do teste de significncia de qui-quadrado, pode- 5. Calcule o coeficiente de correlao de Pearson para o seguinte conjunto de escores
mos determinar o grau de associao entre variveis mensuradas ao nvel nominal. Para e verifique se a correlao significante.
um problema 2 X 2, empregamos o coeficiente fi (1>); para um problema de ordem
X y
superior a 2 X 2, podemos usar ou o coeficiente de contingncia (C) ou o V de Cramr.
10 2
PROBLEMAS 8 2
1. Os seis estudantes abaixo responderam a 6 4
perguntas relativas s suas atitudes com 3 9
y 1 10
relao a judeus (X) e a porto-riquenhos Alunos X
4 6
(Y). Calcule o coeficiente de correlao 5 5
de Pearson para esses dados e verifique A 1 2
B 6 5
se a correlao significante. c 4 3
D 3 3 6. Utilizando-se dos dados do Problema 1, estabelea a equao de regresso que
E 2 1 permite prever o valor de Y (atitude com respeito a porto-riquenhos) a partir dos
F L 4 seguintes valores de X (atitude para com judeus): (a) X= 5 ; (b) X= 2; (c) X = 9.
246 TOMADA DE DECISES Correlao 24 7
,
7. Utilizando-se dos dados do Problema 5, estabelea a equao de regresso que per- 11. Os cinco sujeitos abaixo foram "graduados" de 1 a 5 tanto na varivel X quan to na
mite estimar o valor de Y para os seguintes valores de X: (a) X= 10; (b) X = 2. Y. Tomando esses dados por base, calcule o coeficiente de correlao de p stos
indique se entre X e Y existe relao significante.
8. Os cinco estudantes abaixo foram ordenados segundo o tempo que levaram para
completar uma prova (Y). Por exemplo, quem terminou em primeiro lugar recebeu y
1, quem terminou em segundo, 2 e assim por diante. A seguir, as provas foram
avaliadas pelo professor, que atribuiu a esses alunos as notas (X) constantes do
X

1 4
u!vrwq~r'
-- -
........

hl- ':'.,
quadro abaixo. Teste a hiptese nula de que no existe relao entre X (notas) e 3 2
2 5
Y (tempos de prova), isto , calcule o rs (coeficiente de correlao de postos de
4 3
Spearman) e verifique se ele ou no significante. 5

X y
12. Cinco sujeitos foram avaliados relativamente a duas variveis: X e Y. Em ambas
53 1
receberam valores inteiros, de 1 a 5, que podem ser entendidos como postos.
91 2
70 3 Calcule o coeficiente gama e verifique se existe relao significante entre X e Y.
85 4
91 5 X y

9. Os oito sujeitos abaixo receberam postos em X e notas em Y. Calcule, para esses 2 3


1 2
dados, o coeficiente de correlao de postos e verifique se existe uma relao 3 1
significante entre essas variveis. 5 5
4 4
X y

1 32 13. Um pesquisador distribuiu postos em ordem decrescente li 106 estudantes relativa-


2 28 mente s duas variveis seguintes: consumo de bebidas alcolicas (X) e consumo
3 45
4 dirio de drogas (Y). Em ambas as variveis, o pesquisador dispunha de trs alter-
60
5 45 nativas: alto, moderado e baixo. Concludo o estudo, resultaram os dados frcqen-
6 60 ciais constantes da tabela abaixo. Determine, pois, com base neles, o grau em que
7 53 as variveis X e Y esto associadas, e teste se a relao encontrada significante.
8 55 Sugesto: determinar o coeficiente gama.

10. Sete sujeitos receberam postos tanto na varivel X quanto na Y. Para esses dados, Consumo de Alcool
calcule o coeficiente de correlao de postos de Spearman e verifique se existe A lto Moderado Baixo
relao significante entre essas variveis. Consumo de Drogas f f f
Alto (j) 5 7 20
X y Moderado (j) 10 8 15
Baixo (j) 15 6 10
1 7
3 6 N = 106
2 5
4 3
5 4
14. No Problema 2 do Captulo 1O, o x2 = 8,29 para a relao entre " comparecimento
7 2 s aulas" e "notas no exame final de Estatstica". Suponha que N = 58 e calcule
6 1 o coeficiente fi, com vistas a determinar o grau de associao existente entre essas
variveis.
248 TOMADA DE DECISES

15. Dado um problema 2 X 2, onde N = 138 e x2 = 4,02, calcule o coeficiente fi, a


fim 4e determinar o grau de associao entre as variveis X e Y.
12
16, Dado um problema 2 X 2, onde N = 150 e x2 = 3,90, calcule o coeficiente fi, a
fim de estabelecer o grau em que as variveis X e Y esto associadas. Aplicao
17. Tendo em mente estabelecer o grau de associao existente entre X e Y num
problema 4 X 3, com N = 100 e x2 = 8,05, calcule : (a) o coeficiente de contin-
gncia; (b) o V de Cramr. de Procedimentos
18. No Problema 5 do Captulo 10, N = 118 e x2 = 17,75. Qual o grau de associao
existente entre X e Y nesse problema 4 X 2? Calcule: (a) coeficiente de contingn-
cia; (b) V de Cramr. Estatsticos a
19. A fim de estabelecer o grau de associao entre X e Y num problema 3 X 3, onde
N = 138 e x2 = 10,04, calcule: (a) o coeficiente de contingncia; (b) o V de
Cramr. Problemas de Pesquisa
A terceira parte deste livro contm certo nmero de procedimentos estatsticos que
podem ser aplicados a vrios problemas de pesquisa na rea de cincias humanas. Os
Captulos 8, 9 e 10 apresentaram alguns procedimentos distintos para determinar se
diferenas amostrais (calculadas) eram estatisticamente significativas ou se, ao contr-
rio, resultavam de meros erros de amostragem. Os procedimentos apresentados no
Captulo 11 permitem determinar o grau de associao, a correlao entre duas variveis.
Cada procedimento estatstico, conforme foi salientado ao longo deste livro,
possui um conjunto de pressupostos que devem ser satisfeitos. para garantir-se sua apli-
cao adequada. Ao selecionar procedimentos, o pesquisador deve, portanto, considerar
certo nmero de fatores, tais como:
1 . O que procura testar? Diferenas significativas, grau de associao ou ambas as
coisas?
2. Relativamente varivel estudada, que nvel de mensurao foi conseguido:
nominal, ordinal, intervalar?
3. As variveis estudadas tm ou no distribuio normal na populao da qual
elas foram extradas?
4. A pesquisa implica o estudo de amostras independentes ou o estudo da mesma
amostra mensurada mais de uma vez?
O Captulo 12 apresenta algumas situaes hipotticas de pesquisa, onde os crit-
rios acima esto especificados. Sugere-se ao leitor que escolha o procedimento estatsti-
co que lhe parea mais adequado a cada situao, dentre os constantes da seguinte lista
(todos esses procedimentos foram estudados na Parte 111 do livro):
1. razo (estatstica) t
2. anlise de varincia
3. qui-quadrado
4. teste da mediana
S. anlise da varincia de Kruskal-Wallis
250 TOMADA DE DECISES Aplicao de Procedimentos Estat(sticos a Problemas de Pesquisa 25 I

6. dupla anlise da varincia de Friedman


7. r de Pearson XI x2
Escores dos Estudantes Escores dos Estudantes
8. correlao de postos de Spearman Para os Quais o Professor Para os Quais o Professor
9. gama de Goodman e Kruskal Tinha 25 Anos Tinha 65 Anos
I O. coeficiente fi
65 78
11. coeficiente de contingncia 38 42
12. V de Cramr 52 77
71 50
A Tabela 12.1 (pg. 252) situa cada procedimento estatstico em funo de alguns 69 65
pressupostos importantes que devem ser levados em conta para garantir-se sua correta 72 70
55 55
aplicao. Ao examinar as colunas da tabela, deparamo-nos com a primeira deciso vital, 78 51
relacionada com a seleo do procedimento estatstico: nosso intento verificar se 56 33
existe alguma relao entre as variveis? As provas de significncia discutidas nos Captu- 80 59
los 8, 9 e 1O permitem decidir se uma diferena amostrai calculada reflete uma real
diferena na populao. Ou, ser que, em lugar disso, o que buscamos medir a fora Que procedimento estatstico aplicaria o leitor para determinar se existe diferena
da relao entre duas variveis? Este um problema de correlao que pode ser solucio- significativa entre esses grupos de alunos relativamente sua disposio para assistir s
nado por meio dos procedimentos estatsticos apresentados no Captulo 11. Os subttu- conferncias?
los das colunas da Tabela 12.1 alertam o pesquisador que decide empregar uma prova de
significncia em vez de um procedimento correlacionai para um aspecto deveras impor- Situao de Pesquisa 2
tante: ele deve certificar-se de que est diante de amostras independentes ou, ento, de Um pesquisador, interessado em saber se a idade de um conferencista era capaz de
que seus 'dados resultam de vrias mensuraes da mesma amostra. influenciar a disposio de um grupo de universitrios para ouvi-lo, decidiu realizar o
As linhas da Tabela 12.1 dirigem nossa ateno para o nvel de mensurao seguinte experimento. Numa situao normal de sala de aula, foi dito a 30 alunos que
em que nossas vari.veis foram avaliadas. Se tivermos conseguido mensurar nossas vari- a administrao da escola desejava conhecer suas preferncias com respeito a uma srie
veis no nvel intervalar, nada nos impede de considerar o emprego de um procedimen- de conferncias previstas. Especificamente, pediu-se-lhes que <;lessem sua opinio quanto
to paramtrica como, por exemplo, t, F ou r. Se, entretanto, tivermos obtido nvel ao professor que "poderia ser convidado". O professor foi descrito a todos os alunos da
nominal ou ordinal de mensurao, nossa escolha fica limitada a algumas alternativas mesma forma exceto num particular: a um tero dos alunos foi dito que o conferencista
no-paramtricas. tinha 75 anos; a outro tero que ele tinha 50 anos; ao ltimo tero, que se tratava de
As solues para as situaes de pesquisa apresentadas a seguir podem ser encon- um jovem de 25 anos. Pediu-se, a seguir, que manifestassem sua disposio para com-
tradas no fim deste captulo. parecer s conferncias. Obtiveram-se os seguintes resultados (onde escores mais altos
indicam maior disposio):

SITUAES DE PESQUISA Escores dos Alunos aos Quais foi Dito


que o Professor Tinha
Situao de Pesquisa 1 25 Anos 50 Anos 75 Anos
Um pesquisador realizou um experimento com vistas a determinar se a idade do confe- X1 x2 x3
rencista exercia alguma influncia na disposio de um grupo de estudantes para ouvi-lo. 65 63 67
Numa situao normal de sala de aula, foi dito a 20 alunos que a administrao da 38 42 42
c cola desejava conhecer suas preferncias com relao a uma srie de conferncias 52 60 77
71 55 32
previstas. Especificamente, pediu-se-lhes que dessem sua opinio sobre o professor que 69 43 52
"poderia ser convidado". O professor foi descrito a todos os alunos da mesma forma 72 36 34
' ceto num aspecto: metade dos alunos foi dito que ele (o conferencista) tinha 65 55 69 45
unos, enquanto que outra metade a informao foi de que ele tinha 25 anos. Solici- 78 57 38
tou-se, em seguida, que manifestassem sua disposio para comparecer s conferncias. 56 67 39
80 79 46
Obtiveram-se os seguintes resultados (onde escores mais altos indicam maior disposio):
252 TOMADA DE DECISES Aplicao de Procedimentos Estat(sticos a Problemas de Pesquisa 253

TA BELA J 2. J Critrio para a Escollia de um Procedimento Estatstico Adequado y


X
Leitura ~
~
Aluno Soletrao
Testesde Significncia (Capftulos 8, 9, 1 O) Correlao
(Capitulo 11) F 51 45
~
Nfvelde Amostras Mesma Amsotra G 48 39 .~
Mensurao Independentes Medida Duas Vezes H 99 87 ~~
I 85 59 ~~
o
Nominal Qui-quadrado (no-pa- 56 ~ ~
ramtrica) para testar
Coeficiente fi (no-
-paramtrica para ta-
J 57
60 69 {'0 12
a independncia de
K
78 '1 ~
duas ou mais vari-
belas 2 X 2) L 77
69 ~~~
Contingncia e V de M 96
veis) Cramr (no-param- N 62 57 ~a., o
o 28 35 < ~
tricas para tabelas
p 43 47 ~
maiores que 2 X 2)
Q 88 73 ~
ordinal Teste da mediana (no- Dupla anlise da va- Correlao de postos R 72 76
-paramtrica para rincia de Friedman de Spearman (no- s 75 63
"comparar" duas (no-paramtrica para -paramtrica) T 69 79
amostras) "comparar" a mesma Gama de Goodman e
Anlise de varincia de amostra mensurada no Kruskal (no-param-
Kruskal-Wallis (no-pa- mnimo duas vezes)
Q!Jal o procedimento estatstico que o leitor aplicaria para determinar o grau
trica para lidar com de associao entre as variveis "soletrao" (X) e "habilidade para leitura" (Y)?
ramtrico para "com- um nmero grande de
parar" trs ou mais postos "espelhados")
amostras) Situao de Pesquisa 4
lntervalar Razo t (paramtrica Razo t (paramtrica r de Pearson (param- Para pesquisar a validade de um particular teste de leitura, um grupo de pesquisadores
para "comparar" duas para "comparar" a trico) ~plicou o referido teste a uma mostra de 20 alunos cuja habilidade para ler havia sido
amostras) mesma amostra medida previamente avaliada pelo professor da classe. Os escores, _bem cpmo as avaliaes
Anlise de varincia (pa- duas vezes) individuais feitas pelo professor, figuram, relativamente a cada aluno, na lista abaixo:
ramtrico para "com-
parar" trs ou mais
y
amostras)
X Avaliao
Aluno Escore-leitura pelo Professor
Que procedimento estatstico aplicaria o leitor para determinar se h diferena 18
A 28
significativa entre esses grupos de estudantes relativamente sua disposio para assistir B 50 17
s conferncias? c 92 1
D 85 6
E 76 5
Situao de Pesquisa 3 F 69 10
Para estudar a relao entre soletrao e habilidade para ler, um pesquisador aplicou a G 42 11
53 12
um grupo de 20 alunos, selecionados aleatoriamente numa populao de graduandos, H
80 3
I
testes especficos para mensurar essas variveis. Obtiveram-se os seguintes resultados J 91 2
(onde escores mais altos indicam maior habilidade): K 73 4
L 74 9
M 14 20
X y 29 19
N
Aluno Soletrao Leitura o 86 7
p 73 8
A 52 56 39 16
Q
B 90 81 R 80 13
c 63 75 s 91 15
D 81 72 T 72 14
E 93 50
254 TOMADA DE DECISES Aplicao de Procedimentos Estatfsticos a Problemas d e P squlsa 255

Qual procedimento estatstico adotaria o leitor para determinar o grau de associa- Que procedimento estatstico escolheria o leitor para determinar o grau de as-
o entre os escores-leitura e as avaliaes feitas pelo professor? sociao entre desempenho acadmico e srie escolar?

Situao de Pesquisa 5 Situao de Pesquisa 8


Para pesquisar diferenas regionais relacionadas com "auxlio a estranhos", um pesqui- Para investigar a influncia da frustrao sobre o preconceito, pediu-se a 10 sujeito
sador espalhou 400 chaves nas proximidades de caixas de correios localizadas no nor- que atribussem adjetivos negativos, tais como preguioso, sujo e imoral, a membros
deste, sul, centro-oeste e oeste dos Estados Unidos da Amrica do Norte . Cada uma das de um grupo minoritrio (uma medida de preconceito). Essa atribuio de adjetiv~s
chaves estava etiquetada com o nome e endereo do respectivo "perdedor" (dono). fez-se em dois momentos distintos: antes e depois de terem esses sujeitos experimentrus
O nmero de chaves devolvidas de cada regio (como medida indicativa de "disposio sido submetidos a uma srie de exames difceis e demorados. Entendeu o pesquisador
para ajudar") figura na tabela abaixo: que os exames assim concebidos teriam condies de criar a situao frustrante_deseja-
da. Obtiveram-se os seguintes dados, onde escores mais altos representam mawr pre-
Regio conceito:
Nordeste Sul Centro-oeste Oeste
Escores Relacionados com
f f f f Preconceito
Devolvidas 55 69 82 61 Sujeitos Antes do Depois do
No-devolvidas 45 31 18 39 Exame Exame
- x. x2
100 100 100 100
A 22 26
Que procedimento estatstico aplicaria o leitor para determinar se essas diferenas B 39 45
c 25 24
regionais so estatisticamente significativas? 43
D 40
E 36 36
F 27 29
Situao de Pesquisa 6 G 44 47
Para examinar a relao entre "autoritarismo" e "preconceito", um pesquisador colheu H 31 30
medidas de autoritarismo (com um instrumento especial) e de preconceito (uma lista I 52 52
de adjetivos negativos atribuveis a negros norte-americanos). A amostra pesquisada J 48 59
consistiu em 950 adultos norte-americanos sorteados aleatoriamente. Obtiveram-se os
seguintes resultados: entre 500 respondentes autoritrios, 350 eram "preconceituosos" Qual procedimento estatstico usaria o leitor para determinar se existe uma
e 150 "tolerantes"; entre 450 no-autoritrios, 125 eram "preconceituosos" e 325 diferena estatisticamente significante entre os escores de preconceito em funo da
"tolerantes". frustrao?
Que procedimento estatstico usaria o leitor para estudar o grau de associao
entre as variveis "autoritarismo" e "preconceito"? Situao de Pesquisa 9
Para pesquisar-se a relao entre o status ocupacional real de um respondente e sua
classe social subjetiva (isto , a classe social que o prprio respondente se atribui), um
Situao de Pesquisa 7 pesquisador pediu a 6 77 sujeitos que indicassem suas ocupaes, bem como a classe
Para investigar a relao Srie Escolar social a que eles. pertenciam. Entre 190 respondentes de ocupaes de status superior
entre "srie escolar" e de- ]_a 2.a 3.a 4.a (liberais-tcnicos-executivos), 56 identificaram-se como de "classe alta" , 122 com
sempenho acadmico", de "classe mdia" e 12 como de "classe baixa"; entre 221 respondentes de ocupaes
f f f f
pesquisadores estudaram de status mdio (vendedores-burocratas-operrios qualificados), 42 percebiam-se na
os registros de 186 univer- A - ou ljllelhor 6 5 7 10
B- aB 10 16 19 18 "classe alta", 163 na "mdia" e 16 na "baixa"; entre 266 com ocupaes de status
sitrios selecionados alea- C- a C+ 23 20 15 7 baixo (trabalhadores semi e no-qualificados), 15 perceberam-se na classe "alta", 202 na
toriamente dentre a tota- C ou pior 15 7 6 2
lidade de alunos de certa "mdia" e 49 na "baixa".
54 48 47 37 Que procedimento estatstico aplicaria o leitor para determinar o grau de as-
universidade. Obtiveram-se (N= 186)
os seguintes resultados: sociao entre status ocupacional e classe social subjetiva?
256 TOMADA DE DECISES
Aplicao de Procedimentos Estatz'sticos a Problemas de Pasqui80 257
Situao de Pesquisa 1O
Situao de Pesquisa 12
Para investigar a relao entre as variveis "opo profissional" e "salrio inicial" em Um pesquisador interessado em saber se a idade de um conferencista era capaz de
graduandos", pesquisadores entrevistaram um grupo de universitrios recm-formados. influenciar a disposio de um grupo de universitrios para ouvi-lo, decidiu realizar
S se preocuparam, os pesquisadores, com trs opes ocupacionais-engenharia, profis-
o seguinte experimento. Numa situao normal de sala de aula, foi dito a 1~0 alunos
ses liberais e administrao-com o fato de que o respondente estivesse na situao de
que a administrao da escola desejava conhecer suas preferncias com respeito a _ u~na
"primeiro emprego': Os resultados, obtidos de entrevistas com 21 respondentes, figuram
srie de conferncias previstas. Especificamente, pediu-se-lhes que dessem sua optmo
na tabela abaixo:
quanto ao professor que "poderia ser convidado" . O tal professor foi ento de~cr~to
Salrios Iniciais (em Cr$) a todos os alunos da mesma forma exceto num particular: metade dos alunos f01 dJto
que ele tinha 65 anos, enquanto que outra metade, que ele tinha 25. Pediu-se, a seguir,
Engenharia Prof Liberais Administrao que manifestassem sua disposio para comparecer s conferncias. O~tiveram-se os
189.000 seguintes resultados: relativamente aos que achavam que o professor tinha 65 anos,
126.000 189.000
221.400 171.000 162.000
22 manifestaram desejo de comparecer, enquanto que 43 expressaram m vontade; com
252.000 180.000 144.000 relao aos que supunham o professor com 25 anos, 38 dispuseram-se a comparecer,
171.000 198.000 167.400 enquanto que 27 mostraram-se pouco inclinados a assistir s suas confern~tas. .
162.000 153.000 189.000 Que procedimento estatstico usaria o leitor para determinar se extste dtferena
153.000 135.000 180.000
t35.000 significativa entre o comportamento de "adeso" desses dois grupos de estudantes,
126.000 126.000
quando a suposta varivel controladora da "disposio" a idade do conferencista?

Que procedimento estatstico usaria o leitor para determinar se existe uma dife- SOLUES DAS PESQUISAS PROPOSTAS
rena significativa entre esses grupos de respondentes com respeito aos seus salrios
iniciais?
Soluo da Situao de Pesquisa 1
(Razo t ou Teste da Mediana)
Situao de Pesquisa 11 A situao de pesquisa 1 consiste em uma comparao entre >S escores de duas amostras
independentes de alunos. A razo t (Captulo 8) empregada quando se trata de fa_zer
Para investigar a influncia da varivel "opo profissional" sobre a varivel "salrio
comparaes entre duas mdias (aritmticas) resultantes de dados mensurados ao mvel
Inicial" em graduandos, pesquisadores entrevistaram um grupo de universitrios recm-
intervalar. O teste da.mediana(Captulo 10) uma alternativa no-paramtrica que pode
-formados em profisses liberais ou administrao. So os seguintes os resultados co-
lhidos desses 16 respondentes: ser aplicada sempre que suspeitarmos que os escores no tm distribuio normal na
populao ou, ento, quando o nvel intervalar de mensurao no foi atingido.
Salrios Iniciais (em Cr$)
Soluo da Situao de Pesquisa 2
Prof Liberais Administrao (Anlise de Varincia ou Prova de Kruskl-Wallis)
126.000 135.000
A situao de pesquisa 2 representa uma comparao de escores de trs amostras inde-
171.000 162.000 pendentes de alunos. A razo F (anlise de varincia-Captulo 9) empregada em
180.000 144.000 comparaes entre trs ou mais mdias independentes- desde que o nvel interva!ar
198.000 167.400 tenha sido conseguido. A prova de Kruskal-Wallis (Captulo 10) uma alternattva
153.000 189.000 no-paramtrica que pode ser aplicada sempre que tenhamos boas razes para su~peitar
135.000 180.000
126.000 126.000
(a) da distribuio no-normal dos escores na populao e (b) do fato de o mvel de
144.000 mensurao em que foram colhidos os dados ser, no mximo, ordinal.
167.400
Soluo da Situao de Pesquisa 3
(r de Pearson)
Que procedimento estatstico empregaria o leitor para determinar se existe uma A situao de pesquisa 3 um problema de correlao, uma vez que a soluo co~s~ste
diferena significativa entre os salrios iniciais correspondentes a essas duas amplas
na determinao do grau de associao entre X (habilidade para soletrar) e Y (h~btlida
ttcgorias de trabalho e as respectivas opes profissionais?
de para ler). O r de Pearson (Captulo 11) pode ser empregado para o estabelecimento
258 TOMADA DE DECISES
Aplicao de Procedimentos Estat(sticos a Problemas de Pesquisa 259

da correlao linear entre as variveis X e Y, desde que elas tenham sido-ambas-mensu- Soluo da Situao de Pesquisa 7
radas, no mnimo, ao nvel intervalar de mensurao. Se X e Y no tiverem distribuio (Gama de Goodman e Kruska[)
norm~l na populao, devemos considerar uma alternativa no-paramtrica, tal como 0 A situao de pesquisa 7 um problema de correlao que consiste na determinao
coeficiente de correlao de postos de Spearman,(Captulo 11). do grau de associao entre X (escala conceitual) e Y (srie escolar). O coeficiente gama
de Goodman e Kruskal (Captulo 11) emprega-se para o estabelecimento de uma cor-
Soluo da Situao de Pesquisa 4 relao linear entre X e Y quando a ambas as variveis foram atribudos postos, com
(Coeficiente de Correlao de Postos de Spearman) vrios deles empatados. No problema em foco, a escala conceitual foi graduada de A a D
A situao de pesquisa 4 um problema de correlao, uma vez que requer 0 clculo ou pior e a srie escolar, por seu turno, da l.a 4.a. Ambas as variveis (X e Y) deram
d~ grau de associao entre X (escores-leitura) e Y (avaliao da habilidade para leitura, origem a "medidas" que, transformadas em postos, resultaram em numerosos empates
feita pelo professor). O coeficiente de correlao de postos de Spearman (Captulo 11) (postos empatados ou "es~elhados"). Por exemplo, 54 alunos cursavam a primeira
pode ser empregado na deteco de uma relao linear entre as variveis X e Y-se 0 srie; 48 estavam na segunda, e assim por diante. O coeficiente de contingncia (C) ou
nvel em que essas variveis foram mensuradas tiver sido, no mximo, o ordinal. O r de o V de Cramr (Captulo 11) representam alternativas para o coeficiente gama, cujo
Pearson no pode ser empregado, pois ele implica a mensurao de X e Y a nvel inter- clculo pressupe s dados de nvel nominal.
vaiar, no mnimo. No caso em foco, aos escores-leitura (X) devem ser atribudos postos
de 1 a 20 antes da aplicao da frmula de Spearman. Soluo da Situao de Pesquisa 8
(Razo t ou Teste de Friedman)
A situao de pesquisa 8 corresponde a uma comparao do tipo "antes e depois",
Soluo da Situao de Pesquisa 5 onde a mesma amostra foi mensurada duas vezes, porm em momentos diferentes.
(Qui-quadrado) A razo t (Captulo 8) pode ser empregada na comparao de duas mdias resultantes
A_ s!,tuao d~, ~esquisa 5 :~?siste em uma comparao entre as freqncias (" devolu- da mesma amostra, desde que o modelo experimental admita mensuraes em mo-
ao versus nao-devoluao ) observadas em quatro grupos regionalmente divididos mentos distintos e que os dados resultantes dessas mensuraes sejam, no mnimo, de
(nor~este, sul, ~entro-oeste e oeste). A prova de significncia chamada qui-quadrado nvel intervalar. O teste de Friedman (Captulo 1O) uma alternativa no-paramtrica
(Capitulo 10) e usada em comparaes entre freqncias oriundas de duas ou mais (dupla anlise de varincia) que se ajusta bem a modelos experimentais do tipo "antes
amostras. Para o teste de qui-quadrado no se requer mais do que nvel nominal de e depois", e pode ser usado sempre que haja razes para suspeitar de distribuio no-
mensurao. Os da~os deste problema podem ser dispostos numa tabela 2 X 4, isto , -normal dos escores na populao, ou quando o nvel de mensurao dos dados no
numa tabela de 2 lmh~s e 4 colunas. Observe-se que o grau de associao entre "taxa tenha alcanado o intervalar.
de devoluo" (X) e "regio" (Y) pode ser expresso pelo chamado coeficiente C de
contingncia ou pelo V de Cramr (Captulo 11). Soluo da Situao de Pesquisa 9
(Gama de Goodman e Kruska[)
Soluo da Situao de Pesquisa 6 A situao de pesquisa 9 um problema de correlao que implica o clculo do grau
(Coeficiente "fi') de associao entre X (status ocupacional) e Y (classe scio-econmica subjetiva).
A situa~o ~e pesquisa 6 um ~roblema de correlao, onde o grau de associao entre O coeficiente gama (Captulo 11) ajusta-se particularmente bem ao problema de de-
X (autont~smo) e Y (preconceito) deve ser buscado. O coeficiente "fi" (Captulo 11) tectar a correlao linear entre duas variveis sujeitas atribuio de postos com a
uma medida de associao passvel de ser empregada quando as freqncias (ou os ocorrncia de grande nmero de empates. Na situao presente, tanto o "status ocupa-
dados de nvel nominal) podem ser dispostos numa tabela do tipo 2 X 2 (2 linhas cional" quanto a "classe scio-econmica subjetiva" foram ordenados segundo o critrio
e 2 colunas).
Neste problema, tal tabela assumiria a seguinte forma: Status Ocupacional (X)
Classe Scio-Econmica
Subjetiva A lto Mdio Baixo
Nfvel de Autoritarismo (Y) f f f
Nfvel de
Preconceito Autoritrio No-autoritrio Alta 56 42 15
Mdia 122 163 202
Preconceituoso 350 120 Baixa 12 16 49
Tolerante 150 325 N = 950 190 221 266
260 TOMADA DE DECISES

"altd.; "mdio" e "baixo", gerando-se, assim, muitos postos empatados (por exemplo, UUVERSmAnr f'Et:rR;:;t ~~{')
221 respondentes apresentaram ocupaes de "status mdio"). Para que se possa calcular BlBLIOTECA ...:" , :I't~ AL
o coeficiente gama, os dados devem ser dispostos numa tabela freqencial, de dupla
entrada, como exemplificado no fmal da pgina anterior.
O coeficiente de contingncia (C) e o V de Cramr constituem alternativas para
o coeficiente gama, que pressupe s dados de nvel nominal.

Soluo da Situao de Pesquisa 10


(Anlise de Varincia ou Prova de Kruskal-Wallis)
A situao de pesquisa 10 consiste em uma comparao entfe os escores de trs amostras
independentes de respondentes. A razo F (Captulo 9) pode ser usada quando se trata
de comparar trs ou mais mdias aritmtics independentes, desde que os dados tenham
sido colhidos no nvel intervalar (no mnimo). A anlise de varincia de Kruskal-Wallis
(Captulo 1O) uma alternativa no-paramtrica que pode ser empregada sempre que
" normalmente distribudos na populao
suspeitarmos de que (a) os escores no estejam
da qual provieram; (b) o nvel intervalar de mensurao no tenha sido alcanado.

Soluo da Situao de Pesquisa 11


(Razo t ou Prova de Mediana)
A situao de pesquisa 11 requer uma comparao entre os escores de duas amostras
independentes de sujeitos. A razo t (Captulo 8) usada na comparao de duas
mdias (aritmticas) quando os dados foram colhidos no nvel intervalar. A prova da
mediana (Captulo 10) uma alternativa no-paramtrica que pode ser aplicada quando
APNDICES
no tivermos razes para admitir normalidade de distribuio dos escores (na populao)
ou quando o nvel intervalar de mensurao no tiver sido atingido.

Soluo da Situao de Pesquisa 12


(Qui-quadrado)
A situao de pesquisa 12 consiste numa comparao entre as freqncias ("disposio"
versus "m vontade") de dois grupos de estudantes (aqueles aos quais se disse que a
idade do professor era 65 anos versus os que achavam que ele tinha 25). O teste (de
significncia) de qui-quadrado (Captulo 10) permite comparar as freqncias resultan-
tes de duas ou mais amostras, sempre que os dados tenham sido colhidos no nvel
nominal ou, ento, resultem de contagem. Os dados dessa situao podem ser levados a
uma tabela 2 X 2, isto , de 2linhas e 2 colunas. Assim:

Condio Experimental:
Foi Dito aos Alunos
Disposio para Que o Professor Tinha
Comparecer 65Anos (j) 25Anos (f)

Sim 22 38
No 43 27 N = 130
Apndice A
Apndice A Reviso de Fundamentos de Matemdtl '11
'"
Multiplicando----+ 63,41 2,6 0,0003 0,5
Multiplicador----+ X 0,05 X 1,4 X 0,03 X 0,5
Produto 3,1705 3,64 0,000009 0,25
Elimine sempre, antes de dividir, as casas decimais do divisor. Isso se con
caminhando com a vrgula para a direita tantas casas quantas sejam necessrias p 11 1
tomar o divisor um nmero inteiro. Proceda de forma anloga com relao ao dlvld 11
do, movendo a vrgula para a direita tantas casas quantas tenham sido "saltadas" no
divisor (isto , se a vrgula caminhou duas casas no divisor, deve caminhar tamb Ht
Reviso de Fundamentos duas casas no dividendo). Com esse recurso fica automaticamente determinado o nm
rode casas decimais da resposta.* Exemplos:
de Matemtica Dividendo --* 2,44
= 122
2,44,.
->---- - 244
122
Divisor --* 0,02 t 2
0,02
Quociente \ . __ ~:-
Os estudantes de Estatstica que necessitem de uma reviso de alguns tpicos funda-
mentais de lgebra e aritmtica podero encontrar, neste apndice, problemas com
nmeros decimais, nmeros negativos e razes quadradas. Discutiram-se outros proble- 0,88 o,_~~ 8,8
mas de Matemtica, no corpo do texto, medida que foram surgindo. Por exemplo, o 2,2 2,2**
0,4 0,4 4
Captulo 1 identifica, define e compara os trs nveis de mensurao; o Captulo 2 ' ...:~
discute porcentagens, propores, razes e taxas; o Captulo 4 introduz a noo de
somatrio {L). 10,10
1,01
10
..
. NMEROS DECIMAIS 1.010
1().,100
Ao somar ou subtrair nmeros decimais, tenha o cuidado de escrev-los uns debaixo 0,10
dos outros, fazendo coincidir a posio das vrgulas. Por exemplo, para somar 3. 21 O, 76,
2,541 e 98,3 procede-se assim: Operaes aritmticas freqentemente produzem respostas com notao decimal;
por exemplo, 2,034; 24,7; 86,001 e assim por diante. A questo que se pe agora tem
3.210,76 relao com o nmero de casas decimais que devemos adotar nas nossas respostas. Uma
2,541 regra simples de seguir consiste em realizar todas as operaes com trs casas decimal
98,3 adicionais e arredondar o resultado de forma que ele contenha duas casas mais do qu
as constantes dos dados originais.
3.311,601 Ilustrando: se os dados originarem-se de um conjunto de nmeros inteiro p
exemplo, 12, 9, 49 ou 15), realizamos as operaes com trs casas decimais (at6 mil
Para subtrair 34,1 de 876,62, o procedimento anlogo: simos) e expressamos nossa resposta com duas decimais (isto , em centsimos)."' ''"" P t'
exemplo:
876,62
- 34,1
842,52
* N.T.: O nmero de casas decimais da resposta vai ser determinado pelo nmero dil cosus cl '
Ao multiplicar nmeros decimais, cuide para que sua resposta tenha tantas casas cimais do dividendo aps aplicao do procedimento.
decimais quantas correspondam soma das existentes no multiplicando e no multi- ** N.T.: Uma casa decimal na resposta porque 8,8 tem uma casa depois da vrgula.
plicador. Exemplo: '"** N.T.:Essa regra "prtica" contraria a orientao dada pelo prprio Autor, linhas atrs, sobre
264 APNDICES A pndice A Reviso de Fundamentos de Matemdtlco h

3,889 3,89 Os seguintes nmeros foram arredondados para o centsimo mais prximo:
1,224 1,22
7,761 7,76 3,328 3,33
4,8 23 4,82
O arredondamento para determinada casa decimal faz-se geralmente do seguinte 3,065 3,07
modo: abandona-se o ltimo dgito se ele for menor que 5: 3,055 3,06

Menor que 5

i NMEROS NEGATIVOS
Ao somar um conjunto de nmeros negativos, certifique-se de que o sinal menos ( )
26,234 = 26,23
14,891 = 14,89 no foi esquecido no resultado. Exemplo:
1,012 = 1,01
- 20 -3
Entretanto, se o dgito abandonado (o ltimo) for igual a ou maior que 5, adiciona-se -12 -9
uma unidade ao primeiro dgito que sobra (no sentido da direita para a esquerda: -6 -4
-38 -16
5 ou mais*
I Para somar um conjunto de nmeros dotados de sinal* (alguns com + , outro.
26,236 = 26,24 com - ), agrupam-se primeiro todos os negativos e depois todos os positivos; da de cor
14,899 = 14,90 rem dois resultados, um negativo (isto , uma soma negativa) e um positivo (uma soma
1,015 = 1,02 positiva); subtrai-se, a seguir, um resultado do outro, mantendo o sinal do nmero d
maior valor absoluto.** Exemplos :
Os seguintes nmeros foram arredondados para o inteiro mirls prximo:
-6 +4 -6 +6
3,1 3 +4 +2 - 1 - 10
3,5 4 +2 -3
+6 -4
4,5 5 - 1 -10
4,8 5 -3
-4
Os seguintes nmeros foram arredondados para o dcimo mais prximo:
3,11 3,1 Para subtrair um nmero negativo, d-lhe antes sinal + (mais) e siga o proc dl
3,55 3,6 menta indicado para a adio. O resto recebe o sinal do nmero de maior valor ab olu
4,45 4,5 to. Exemplos:
4,17 4,2
24 -6 recebe sinal + e , por isso, adicionado ao 24. Como o nm m
-(- 6) de maior valor absoluto positivo, o resto (resultado) tamb 111 v 1
diviso de nmeros aproximados. Trabalhar com nmeros aproximados obedece a regras rtgidas e
no apenas prticas. Entretanto, sugere-se ao leitor uma regra deveras prtica: esquecer o procedi-
---m ser positivo (30).
mento acima!
* N.T. : Melhor seria adotar a seguinte regra : se for mais de 5, "forar" o dgito anterior de uma
* N.T.: Nmeros dotados de sinal chamam-se nmeros relativos. Ex.: - 5; +8 ; - 0,2 ote. lhll
+;_..J3 ;
li II
unidade; se for exatamente 5, manter o dgito anterior se ele for par e 'for-lo " de uma unidade
se for impar. Exemplos: mero relativo pode ser fracionrio como tambm irracional: -0,8; + +y',6 i' I .,
1,015 -+ 1,02
1,025 -+ 1,02 * * N.T.: Valor absoluto de um nmero relativo o prprio nmero desprovido de sinal. Eu I n, 11

1,035 -+ l ,04 valor absolu to de - 2 2 e o valor absoluto de +2 tambm 2.


26b APNDICES Apndice A Reviso de Fundamentos de Matemtica 11 I

-6 -24 recebe sinal + e , por isso, subtrado. Como o nmero de Exemplos:


- (-24) maior valor absoluto positivo, o resto tambm vai ser positivo
I8 (18). 74,53 (4) dgitos 2 = (2) dgitos
7,45 (2) dgitos 2 = (1) dgito
- 24 -6 recebe sinal + e , por isso, subtrado. Como o nmero de
- (- 6) maior valor absoluto negativo, o resto tambm vai ser negativo Se o nmero de dgitos da parte inteira for um nmero mpar, da resultn ll dl'
-(18) (-18). um "quebrado" na diviso, adicione-se uma unidade a esse nmero e proceda-s 011
forme indicao acima. Exemplos:
Obs.: Quando um nmero positivo, ele dispensa o sinal. Ento +2 = 2.
Ao multiplicar (ou dividir) dois nmeros relativos que tm o mesmo sinal, d y555,5 = 23,57 (3) dgitos 7 2 = 1,5 dgitos
sempre sinal + (mais) ao resultado. Exemplos: Ento, 3 + I = 4 e 4 7 2 = (2) dgitos
v'5,555 = 2,36 (I) dgito 7 2 = 0,5 dgito
+40 Ento, 1 + I = 2 e 2 7 2 = (1) dgito
(+8) X (+5) = +40 = +5
+8
Pode-se achar a raiz quadrada de qualquer nmero menor que I de acordo 111
-40 o seguinte procedimento:
(-8) X (- 5) +40 +5
-8 I. Arredondar o nmero para o centsimo mais prximo.

No caso de os nmeros terem sinais contrrios, o resultado ser sempre negativo. v'0,328 v',33
Exemplos: v'0,823 V0,82
+40 v'0,065I ...;0,07
(- 8) X (+5) --40 -5 y'0,035 = v',4
-8

2. Localizar (Tabela A) a raiz quadrada do nmero resultante como se fosse Ulll


CLCULO DE RAZES QUADRADAS MEDIANTE O USO DA TABELA A inteiro. Para tanto, basta ignorar a vrgula.
Com o auxlio da Tabela A (fim do livro), pode-se facilmente encontrar a raiz quadrada
(Vn) de qualquer nmero inteiro (n) de 1 a 1.000. v'33 5,74
Para calcular a raiz quadrada aproximada de nmeros decimais, bem como de v'82 9,06
nmeros maiores que 1.000, pode ser til comear com a coluna de quadrados (n 2 ), Ta- V7 2,65
bela A. A raiz quadrada de qualquer nmero multipliada por si mesma deve reproduzir v'4 0,26
o nmero original.* Como resultado, n, na Tabela A, , de fato, a prpria raiz quadrada
de n 2 3. Deslocar a vrgula uma casa para a esquerda e arredondar.
Tendo em mente tirar o mximo de proveito da coluna n 2 em clculos aproxima-
dos de razes quadradas, devemos determinar o nmero de dgitos que precedem a v'0,33 = 0,57
vrgula na resposta. Uma regra prtica, neste caso, a seguinte: contar o nmero de dgi- V0,82 0,91
tos que compem a parte inteira(do nmero cuja raiz quadrada vai ser extrada) e dividi-lo .J0,07 0,27
por 2; o resultado corresponde ao nmero de dgitos da parte inteira da resposta.
v',4 0,2

* N.T.: Isso s verdade se o nmero for quadrado perfeito. Caso contrrio, jamais se consegue
uma reproduo do nmero original. Exemplos:
a) y'i44 == 12. Ento (12) X (12) == 144
b).V2 == 1,4142 aprox. (Veja Tabela A). Ento (1 ,4142) X (1 ,4142) == 1,9999616
F.:-;:,~AL
Ul'lllVERSIDAJE
13JBL!OT8:A

TABELA A (continuao)

Apndice 8 n n2 -v;; n
n

36 1296 6.0000 .027778 . 16<1


TABELA A Quadrados, Razes Quadradas e Inversos dos Nmeros de 1 a 1.000": 37 1369 6.0828 .027027 . 164
38 1444 6.1644 .026316 .16
39 1521 6.2450 .025641 . 1601
40 1600 6.3246 .025000 . 158 1
n n2 v li -nI v li 41 1681 6.4031 .024390 . 15
42 1764 6.4807 .023810 .154
43 1849 6.5574 .023256 .152
1 1.0000 1.000000 1.0000 44 1936 6.6332 .022727 . 1508
1 45 2025 6.7082 .022222 . 14 I
2 4 1.4142 .500000 .7071
3 9 1.7321 .333333 .5774 .1474
.5000 46 2116 6.7823 .021739
4 16 2.0000 .250000 47 2209 6.8557 .021277 . 1459
5 25 2.2361 .200000 .4472
48 2304 6.9282 .020833 .1 44
.4082 49 2401 7.0000 .020408 .142
6 36 2.4495 .166667 so 2500 7.0711 .020000 . 1414
7 49 2.6458 .142857 .3780
8 64 2.8284 .125000 .3536 51 2601 7.1414 .019608 .1400
9 81 3.0000 .111111 .3333 52 2704 7.2111 .019231 . 1387
10 100 3.1623 .100000 .3162 53 2809 7.2801 .018868 . 1374
54 2916 7.3485 .018519 .1361
11 121 3.3166 .090909 .3015 55 3025 7.4162 .018182 . 1348
12 144 3.4641 .083333 .2887
13 169 3.6056 .076923 .2774 56 3136 7.4833 .017857 .13 6
14 196 3.7417 .071429 .2673 57 3249 7.5498 .01,7544 . 132
15 225 3.8730 .066667 .2582 58 3364 7.6158 .017241 .131
59 3481 7.6811 .016949 .1 302
16 256 4.0000 .062500 .2500 60 3600 7.7460 .016667 .1291
17 289 4.1231 .058824 .2425
324 4.2426 .055556 .2357 61 3721 7.8102 .016393 . 1280
18 .016129
19 361 4.3589 .052632 .2294 62 3844 7.8740 .1270
400 4.4721 .050000 .2236 63 3969 7.9373 .015873 . 1260
20
64 4096 8.0000 .015625 . 12 o
21 441 4.5826 .047619 .2182 65 4225 8.0623 .015385 .1 240
22 484 4.6904 .045455 .2132
.2085 66 4356 8.1240 .015152 . 12 I
23 529 4.7958 .043478 67 8. 1854 .014925
.041667 .2041 4489 .1222
24 576 4.8990 68 4624 8.2462 .01 4706 . 12 1
25 625 5.0000 .040000 . 2000
69 4761 8.3066 .014493 . 12
26
27
28
676
729
784
5.0990
5.1962
5.2915
.038462
.037037
.035714
.1961
.1925
.1890
.1857
70
71
72
4900
5041
5184
8.3666
8.4261
8.4853
.014286
.014085
.013889
.JJC
.II H7
. 11 711
29 841 5.3852 .034483 73 5329 8.5440 .013699 .I 170
30 900 5.4772 .033333 .1826 74 5476 8.6023 .013514 .lltl
75 5625 8.6603 .013333 . 11
31 961 5.5678 .032258 .1796
32 1024 5.6569 .031250 .1768 76 5776 8.7178 .013158 . 114 r
33 1()89 5.7446 .030303 .1741 77 5929 8.7750 .012987 . I 14()
34 1156 5.8310 .029412 .1715 78 6084 8.8318 .012821 .li I
35 1225 5.9161 .028571 .1690 79 6241 8.8882 .012658 . 11 2
80 6400 8.9443 .012500 .I li H
81 6561 9.0000 .0 12346 .1111
82 6724 9.0554 .012195 .JJ()II
* Tendo em mente preservar as tabelas da edio original, foram elas reproduzidas neste livro foto- 83 6889 9.1104 .012048 .l<WII
84 7056 9.1 652 .011905 . JQI)I
graficamente, o que implica os seguintes cuidados da parte do leitor : 8S 7225 9.2195 .011765 .I OH
a) em lugar de ponto leia-se vtrgula e
b) aos nmeros iniciados por ponto acrescente-se um zero.
270 APNDICES Af/ mil 11
CJNIVERSIDAOE FEOiflAL
.,
.IUBL!OT.ECA c .. PO PARA
EiNTRAt
TABELA A (continuao) tABELA A (continuao)

I
n n2 v' li -n1 -v;;
n2 .v; -
n ,
86 7396 9.2736 .011628 .1078 13 18496 11.6619 .007353 .0 8 7
87 7569 9.3274 .011494 .1072 131 18769 11.7047 .007299 .08 4
88 7744 9.3808 .011364 .1066 131 19044 11.7473 .007246 .08$ 1
89 7921 9.4340 .011236 .1060 13, 19321 11.7898 .007194 .0 84H
90 8100 9.4868 .011111 .1054 140 19600 11.8322 .007143 .084$

91 8281 9.5394 .010989 .1048 141 19881 11.8743 .007092 .0842


92 8464 9.5917 .010870 . 1043 14) 20164 11.9164 .007042 .0839
93 8649 9.6437 .010753 .1037 14) 20449 11.9583 .006993 .0836
94 8836 9.6954 .010638 .1031 144 20736 12.0000 .006944 .083
95 9025 9.7468 .010526 .1026 145 21025 12.0416 .006897 .0830

96 9216 9.7980 .010417 .1021 146 21316 12.0830 .006849 .0828


97 9409 9.8489 .010309 .1015 141 21609 12.1244 .006803 .0825
98 9604 9.8995 .010204 .JOIO 148 21904 12.1655 .006757 .0822
99 9801 9.9499 .010101 .1005 14, 22201 12.2066 .006711 .081 9
100 10000 10.0000 .010000 .1000 150 22500 12.2474 .006667 .0816

101 10201 10.0499 .009901 .0995 151 22801 12.2882 .006623 .0814
102 10404 10.0995 .009804 .0990 15) 23104 12.3288 .006579 .0811
103 10609 10.1489 .009709 .0985 15) 23409 12.3693 .006536 .0808
104 10816 10.1980 .009615 .0981 154 23716 12.4097 .006494 .0806
105 11025 10.2470 .009524 .0976 155 24025 12.4499 .006452 .0803

106 11236 10.2956 .009434 .0971 156 24336 12.4900 .006410 .0801
107 11449 10.3441 .009346 .0967 151 24649 12.5300 .006369 .0798
108 11664 10.3923 .009259 .0962 158 24964 12.5698 .006329 .0796
109 11881 10.4403 .009174 .0958 159 25281 12.6095 .006289 .0793
110 12100 10.4881 .009091 .0953 160 25600 12.6491 .006250 .0791

111 12321 10.5357 .009009 .0949 161 25921 12.6886 .006211 .0788
112 12544 10.5830 .008929 .0945 161 26244 12.7279 .006173 .0786
113 12769 10.6301 .008850 .0941 163 26569 12.7671 .006135 .0783
114 12996 10.6771 .008772 .0937 164 26896 12.8062 .006098 .0781
115 13225 10.7238 .008696 .0933 165 27225 12.8452 .006061 .0778

116 13456 10.7703 .008621 .0928 16 27556 12.8841 .006024 .0776


117 13689 10.8167 .008547 .0925 161 27889 12.9228 .005988 .0774
118 13924 10.8628 .008475 .0921 168 28224 12.9615 .005952 .0772
119 14161 10.9087 .008403 .0917 169 28561 13.0000 .005917 .0769
120 14400 I 0.954ft .008333 .0913 170 28900 13.0384 .005882 .0767
121 14641 11.0000 .008264 .0909 29241 13.0767 .005848 .0765
171 .0762
122 14884 11.0454 .008197 .0905 172 29584 13.1 149 .005814
123 15129 11.0905 .0081 30 .0902 29929 13.1529 .005780 .0760
173 .0758
124 15376 11.1355 .008065 .0898 174 30276 13.1909 .005747
125 15625 11.1803 .008000 .0894 30625 13.2288 .005714 .0756
175
126 15876 11.2250 .007937 .0891 30976 13.2665 .005682 .0754
176 .0752
127 16129 11.2694 .007874 .0887 177 31329 13.3041 .005650
128 16384 I 1.3137 .007813 .0884 31684 13.3417 .005618 .0750
178 .0747
129 16641 11.3578 .007752 .0880 179 32041 13.3791 .005587
130 16900 11.4018 .007692 .0877 32400 13.4164 .005556 .0745
180
131 17161 11.4455 .007634 .0874 32761 13.4536 .005525 .0743
181 .0741
132 17424 11.4891 .007576 .0870 182 33124 13.4907 .005495
133 17689 11.5326 .007519 .0867 33489 13.5277 .005464 .0739
183 .0737
134 17956 11.5758 .007463 .0864 184 33856 13.5647 .005435
135 18225 11.6190 .007407 .0861 34225 13.6015 .005405 .0735
185
Apndice B 275
274 APNDICES

TABELA A (continuao)
TABELA A (continuao)

1
n n2 v' li -n1 n n2 v' li -
n v' li
v'Ti

16.9115 .003497 .0591 336 112896 18.3303 .002976 .0546


286 81796 337 113569 18.3576 .002967 .0545
287 82369 16.9411 .003484 .0590
16.9706 .003472 .0589 338 114244 18.3848 .002959 .0544
288 82944 339 114921 18.4120 .002950 .0543
289 83521 17.0000 .003460 .0588
84100 17.0294 .003448 .0587 340 115600 18.4391 .002941 .0542
290
.003436 .0586 341 116281 18.4662 .002933 .0542
291 84681 17.0587 342 116964
17.0880 .003425 .0585 18.4932 .002924 .0541
292 85264 343 117649 18.5203 .002915 .0540
293 85849 17.1172 .003413 .0584
17.1464 .003401 .0583 344 118336 18.5472 .002907 .0539
294 86436 345 119025 18.5742 .002899 .0538
295 87025 17.1756 .003390 .0582
17.2047 .003378 .0581 346 119716 18.6011 .002890 .0538
296 87616 347 120409 18.6279 .002882 .0537
297 88209 17.2337 .003367 .0580
17.2627 .003356 .0579 348 121104 18.6548 .002874 .0536
298 88804 349 121801 18.6815 .002865 .0535
299 89401 17.2916 .003344 .0578
.003333 .0577 350 122500 18.7083 .002857 .0535
300 90000 17.3205
.003322 .0576 351 123201 18.7350 .002849 .0534
301 90601 17.3494 352 123904 18.7617
17.3781 .003311 .0575 .002841 .0533
302 91204 353 124609 18.7883 .002833 .0532
303 91809 17.4069 .003300 .0574
.0574 354 125316 18.8149 .002825 .0531
304 92416 17.4356 .003289 355 126025 18.8414
17.4642 .003279 .0573 .002817 .0531
305 93025
.0572 356 126736 18.8680 .002809 .0530
306 93636 17.4929 .003268 357 127449 18.8944
.003257 .0571 .002801 .0529
307 94249 17.5214 358 128164 18.9209 .002793 .0529
308 94864 17.5499 .003247 .0570
.0569 359 128881 18.9473 .00~786 .0528
309 95481 17.5784 .003236 360 129600 18.9737 .002778
.003226 .0568 .0527
310 96100 17.6068
.0567 361 130321 19.0000 .002770 .0526
311 96721 17.6352 .003215 362 131044 19.0263 .002762
17.6635 .003205 .0566 .0526
312 97344 363 131769 19.0526 .002755 .0525
313 97969 17.6918 .003195 .0565
.0564 364 132496 19.0788 .002747 .0524
314 98596 17.7200 .003185 365 133225 19.1050 .002740 .0523
315 99225 17.7482 .003175 .0563
.0563 366 133956 19.1311 .002732 .0523
316 99856 17.7764 .003165 367 134689 19.1572 .002725 .0522
317 100489 17.8045 .003155 .0562
.0561 368 135424 19.1833 .002717 .0521
318 101124 17.8326 .003145 369 136161 19.2094 .002710 .0521
319 101761 17.8606 .003135 .0560
.0559 370 136900 19.2354 .002703 .0520
320 102400 17.8885 .003125
321
322
323
103041
103684
104329
17.9165
17.9444
17.9722
.003115
.003106
.003096
.0558
.0557
.0556
.0556
371
372
373
374
137641
138384
139129
139876
19.2614
19.2873
19.3132
19.3391
.002695
.002688
.002681
.002674
.0519
.0518
.0518
.0517
324 104976 18.0000 .003086 375 140625 19.3649 .002667 .0516
325 105625 18.0278 .003077 .0555
.0554 376 141376 19.3907 .002660 .0516
326 106276 18.0555 .003067 377 142129 19.4165 .002653 .o515
327 106929 18.0831 .003058 .0553
.0552 378 142884 19.4422 .002646 .0514
328 107584 18.1108 .003049 379 143641 19.4679 .002639 .0514
329 108241 18.1384 .003040 .0551
.0550 380 144400 19.4936 .002632 .0513
330 108900 18.1659 .003030
.0550 381 145161 19.5192 .002625 .0512
331 109561 18.1934 .003021 382 145924 19.5448 .002618 .0512
332 110224 18.2209 .003012 .0549
.0548 383 146689 19.5704 .002611 .0511
333 110889 18.2483 .003003 384 147456 19.5959 .002604 .0510
334 111556 18.2757 .002994 .0547
.0546 385 148225 19.6214 .002597 .0510
335 112225 18.3030 .002985
276 APNDICES A pndice O 11

TABELA A (continuao)
TABELA A (continuao)

1
n n2 v'li -
n n2 v'li n
n v'ii
v'ii
436 190096 20.8806 .002294 .0479
386 148996 19.6469 .002591 .0509 437 190969 20.9045 .002288 .0478
387 149769 19.6723 .002584 .0508 438 191844 20.9284 .002283 .0478
388 150544 19.6977 .002577 .0508 439 192721 20.9523 .002278 .0477
389 151321 19.7231 .002571 .0507 440 193600 20.9762 .002273 .0477
390 152100 19.7484 .002564 .0506
441 194481 21.0000 .002268 .0476
391 152881 19.7737 .002558 .0506 442 195364 21.0238 .002262 .0476
392 153664 19.7990 .002551 .0505 443 196249 21.0476 .002257 .0475
393 154449 19.8242 .002545 .0504 444 197136 21.0713 .002252 .0475
394 155236 19.8494 .002538 .0504 445 198025 21.0950 .002247 .0474
.395 156025 19.8746 .002532 .0503
446 198916 21.1187 .002242 .0474
396 156816 19.8997 .002525 .0503 447 199809 21.1424 .002237 .0473
397 157609 19.9249 .002519 .0502 448 200704 21.1660 .002232 .0472
398 158404 19.9499 .002513 .0501 449 201601 21.1896 .002227 .0472
399 159201 19.9750 .002506 .0501 450 202500 21.2132 .002222 .0471
400 160000 20.0000 .002500 .0500
451 203401 21.2368 .002217 .0471
401 160801 20.0250 .002494 .0499 452 204304 21.2603 .00221 2 .0470
402 161604 20.0499 .002488 .0499 453 205209 21.2838 .002208 .0470
403 162409 20.0749 .002481 .0498 454 206116 21 .3073 .002203 .0469
404 163216 20.0998 .002475 .0498 455 207025 21.3307 .002198 .0469
405 164025 20.1246 .002469 .0497
456 207936 21.3542 .002193 .0468
406 164836 20.1494 .002463 .0496 457 208849 21.3776 .022188
20.1742 .0468
407 165649 .002457 .0496 458 209764 21.4009 .002183 .0467
408 166464 20.1990 .002451 .0495 459 210681 21.4243 .OOZ179 .0467
409 167281 20.2237 .002445 .0494 460 211600 21.4476 .002174
168100 20.2485 .0466
410 .002439 .0494
461 212521 21.4709 .002169 .0466
411 168921 20.2731 .002433 .0493 462 213444 21.4942 .002165
169744 20.2978 .0465
412 .002427 .0493 463 214369 21.5174 .002160 .0465
413 170569 20.3224 .002421 .0492 464 215296 21.5407 .002155 .0464
414 171396 20.3470 .002415 .0491 465 216225 21.5639 .002151
20.3715 .0464
415 172225 .002410 .0491
466 21 7156 21.5870 .002146 .0463
416 173056 20.3961 .002404 .0490 467 218089 21.6102 .002141
20.4206 .0463
417 173889 .002398 .0490 468 219024 21.6333 .002137 .0462
418 174724 20.4450 .002392 .0489 469 219961 21.6564 .002132
175561 20.4695 .0462
419 .002387 .0489 470 220900 21.6795 .002128 .0461
420 176400 20.4939 .002381 .0488
471 221841 21.7025 .002123 .0461
421 177241 20.5183 .002375 .0487 472 222784 21.7256 .002119 .0460
422 178084 20.5426 .002370 .0487 473 223729 21.7486 .002114 .0460
423 178929 20.5670 .002364 .0486 474 224676 21.7715 .002110 .0459
424 179776 20.5913 .002358 .0486 475 225625 21.7945 .002105
180625 20.6155 .0459
425 .002353 .0485
476 226576 21.8174 .002101 .0458
426 181476 20.6398 .002347 .0485 477 227529 21.8403 .002096 .0458
427 182329 20.6640 .002342 .0484 478 228484 21.8632 .002092 .0457
428 183184 20.6882 .002336 .0483 479 229441 21 .8861 .002088 .0457
429 184041 20.7123 .002331 .0483 480 230400 21.9089 .002083 .0456
430 184900 20.7364 .002326 .0482
481 231361 21.9317 .002079 .0456
431 185761 20.7605 .002320 .0482 482 232324 21.9545 .002075
20.7846 .0455
432 186624 .002315 .0481 483 233289 21.9773 .002070 .0455
433 187489 20.8087 .002309 .0481 484 234256 22.0000 .002066
20.8327 .0455
434 188356 .002304 .0480 485 235225 22.0227 .002062 .0454
435 189225 20.8567 .002299 .0479
278 APNDICES Apndice B 279

. ~ .. ~-- .. UNfVERSIDADE FEDiRAL DO PARA


lilB>LIOT'ECA CENTRAL
TABELA A (continuao) TABELA A (continuao)

n2 vil I
- -I n n2 v Ti -nI
n
n v fi v fi
486 236196 22.0454 .002058 .0454 !36 287296 23.1517 .001866 .0432
487 237169 22.0681 .002053 .0453 !37 288369 23.1733 .001862 .0432
488 238144 22.0907 .002049 .0453 !38 289444 23.1948 .001859 .0431
489 239121 22.1133 .002045 .0452 !39 290521 23.2164 .001855 .0431
490 240100 22.1359 .002041 .0452 540 291600 23.2379 .001852 .0430

491 241081 22.1585 .002037 .045I 541 292681 23.2594 .OOI848 .0430
492 242064 22.1811 .002033 .0451 542 293764 23.2809 .001845 .0430
493 . 243049 22.2036 .002028 .0450 543 294849 23.3024 .OOI842 .0429
494 244036 22.2261 .002024 .0450 !44 295936 23.3238 .001838 .0429
495 245025 22.2486 .002020 .0449 545 297025 23.3452 .001835 .0428

496 246016 22.2711 .002016 .0448 546 298116 23.3666 .001832 .0428
497 247009 22.2935 .002012 .0449 547 299209 23.3880 .001828 .0428
498 248004 22.3159 .002008 .0449 548 300304 23.4094 .001825 .0427
499 249001 22.3383 .002004 .0448 549 JOi401 23.4307 .OOI82I .0427
500 250000 22.3607 .002000 .0447 550 302500 23.452I .OOI818 .0426

501 25IOOI 22.3830 .001996 .0447 551 30360I 23.4734 .001815 .0426
502 252004 22.4054 .001992 .0446 552 304704 23.4947 .OOI812 .0426
503 253009 22.4277 .OOI988 .0446 553 305809 23.5160 .001808 .0425
504 254016 22.4499 .001984 .0445 554 306916 23.5372 .001805 .0425
505 255025 22.4722 .001980 .0445 555 308025 23.5584 .001802 .0424

506 256036 22.4944 .001976 .0445 556 309136 23.5797 .001799 .0424
507 257049 22.5167 .001972 .0444 557 310249 23.6008 .001795 .0424
508 258064 22.5389 .001969 .0444 558 3I1364 23.6220 .OOI792. .0423
509 259081 22.5610 .OOI965 .0443 559 3I248I 23.6432 .OOI789 .0423
510 260100 22.5832 .001961 .0443 560 313600 23.6643 .OOI786 .0423

511 26112I 22.6053 .OOI957 .0442 561 3I472I 23.6854 .001783 .0422
512 262144 22.6274 .OOI953 .0442 562 3I5844 23.7065 .001779 .0422
513 263I69 22.6495 .OOI949 .0442 563 3I6969 23.7276 .OOI776 .0421
514 264196 22.6716 .001946 .0441 564 318096 23.7487 .001773 .0421
515 265225 22.6936 .OOI942 .044I 565 3I9225 23.7697 .OOI770 .042I

516 266256 22.7I56 .OOI938 .0440 566 320356 23.7908 .OOI767 .0420
517 267289 22.7376 .001934 .0440 567 32I489 23.8II8 .OOI764 .0420
518 268324 22.7596 .001931 .0439 568 322624 23.8328 .001761 .0420
519 269361 22.7816 .001927 .0439 569 32376I 23.8537 .OOI757 .04I9
520 270400 22.8035 .001923 .0439 570 324900 23.8747 .001754 .0419

521 2~1 22.8254 .001919 .0438 571 326041 23.8956 .001751 .0418
522 272484 22.8473 .001916 .0438 572 327184 23.9165 .001748 .0418
523 273529 22.8692 .001912 .0437 573 328329 23.9374 .001745 .0418
524 274576 22.8910 .001908 .0437 574 329476 23.9583 .001742 .0417
525 275625 22.9129 .001905 .0436 575 330625 23.9792 .001739 .0417

526 276676 22.9347 .OOI90I .0436 576 331776 24.0000 .OOI736 .04I7
527 277729 22.9565 .001898 .0436 577 332929 24.0208 .001733 .04I6
528 278784 22.9783 .001894 .0435 578 334084 24.04I6 .001730 .04I6
529 279841 23.0000 .001890 .0435 579 335241 24.0624 .001727 .0416
530 280900 23.0217 .OOI887 .0434 580 336400 24.0832 .001724 .04I5

531 28196I 23.0434 .OOI883 .0434 581 337561 24.1039 .00172I .04I5
532 283024 23.0651 .OOI880 .0434 582 338724 24.I247 .0017I8 .0415
533 284089 23.0868 .OOI876 .0433 583 339889 24.1454 .OOI715 .0414
534 285156 23.1084 .001873 .0433 584 34I056 24.1661 .0017I2 .0414
535 286225 23.130I .001869 .0432 S8S 342225 24.I868 .001709 .0413
280 APNDICES A pndice E lll l

TA BELA A (continuao)
TABELA A (continuao)

1 1 1
n n2 vi -n -vil n n2 v li -
n vil
586 343396 24.2074 .001706 .0413 636 404496 25.2190 .001572 .0397
587 344569 24.2281 .001704 .0413 637 405769 25.2389 .001570 .0396
588 345744 24.2487 .001701 .0412 638 407044 25.2587 .001567 .0396
589 346921 24.2693 .001698 .0412 639 408321 25.2784 .001565 .0396
590 348100 24.2899 .001695 .0412 640 409600 25.2982 .001563 .0395
591 349281 24.3105 .001692 .0411 641 410881 25.3180 .001560 .0395
592 350464 24.3311 .001689 .0411 642 412164 25.3377 .001558 .0395
593 351649 24.3516 .001686 .0411 643 413449 25.3574 .001555 .0394
594 352836 24.3721 .001684 .0410 644 414736 25.3772 .001553 .0394
595 354025 24.3926 .001681 .0410 645 416025 25.3969 .001550 .0394
596 355216 24.4131 .001678 .0410 646 417316 25.4165 .001548 .0393
597 356409 24.4336 .001675 .0409 647 418609 25.4362 .001546 .0393
598 357604 24.4540 .001672 .0409 648 419904 25.4558 .001543 .0393
599 358801 24.4745 .001669 .0409 649 421201 25.4755 .001541 .0393
600 360000 24.4949 .001667 .0408 650 422500 25.4951 .001538 .0392
601 361201 24.5153 .001664 .0408 651 423801 25.5147 .001536 .0392
602 362404 24.5357 .001661 .0408 652 425104 25.5343 .001534 .0392
603 363609 24.5561 .001658 .0407 653 426409 25.5539 ~001531 .0391
604 364816 24.5764 .001656 .0407 6S4 427716 25.5734 .001529 .0391
60S 366025 24.5967 .001653 .0407 655 429025 25.5930 .001527 .0391
606 367236 24.617i .001650 .0406 656 430336 25.6125 .001524 .0390
607 368449 24.6374 .001647 .0406 657 431649 25.6320 .001522 .0390
608 369664 24.6577 .001645 .0406 658 432964 25.6515 .001520 .0390
609 370881 24.6779 .001642 .0405 659 434281 25.6710 .001517 .0390
610 372100 24.6982 .001639 .0405 660 435600 25.6905 .OOJ515 .0389
611 373321 24.7184 .001637 .0405 661 436921 25.7099 .001513 .0389
612 374544 24.7386 .001634 .0404 662 438244 25.7294 .001511 .0389
613 375769 24.7588 .001631 .0404 663 439569 25.7488 .001508 .0388
614 376996 24.7790 .001629 .0404 664 440896 25.7682 .001506 .0388
615 - 378225 24.7992 .001626 .0403 665 442225 25.7876 .001504 .0388
616 379456 24.8193 .001623 .0403 666 443556 25.8070 .001502 .0387
617 380689 24.8395 .001621 .0403 667 444889 25.8263 .001499 .0387
618 381924 24.8596 .001618 .0402 668 446224 25.8457 .001497 .0387
619 383161 24.8797 .001616 .0402 669 447561 25.8650 .001495 .0387
620 384400 24.8998 .001613 .0402 670 448900 25.8844 .001493 .0386
621 385641 24.9199 .001610 .0401 671 450241 25.9037 .001490 .0386
622 386884 24.9399 .001608 .0401 672 451584 25.9230 .001488 .0386
623 388129 24.9600 .001605 .0401 673 452929 25.9422 .001486 .0385
624 389376 24.9800 .001603 .0400 674 454276 25.9615 .001484 .0385
625 390625 25.0000 .001600 .0400 675 455625 25.9808 .001481 .0385
626 391876 25.0200 .001597 .0400 676 456976 26.0000 .001479 .0385
627 393129 25.0400 .001595 .0399 677 458329 26.0192 .001477 .0384
628 394384 25.0599 .001592 .0399 678 459684 26.0384 .001475 .0384
629 395641 25.0799 .001590 .0399 679 461041 26:0576 .001473 .0384
630 396900 25.0998 .001587 .0398 680 462400 26.0768 .001471 .0383
631 398161 25.1197 .001585 .0398 681 463761 26.0960 .001468 .0383
632 399424 25.1396 .001582 .0398 682 465124 26.1151 .001466 .0383
633 400689 25.1595 .001580 .0397 683 466489 26.1343 .001464 .0383
634 401956 25.1794 .001577 . .0397 684 467856 26.1534 .001462 .0382
635 403225 25.1992 .001575 .0397 685 469225 26.1725 .001460 .0382
282 APNDICES
Apndice D 11 I

TABELA A (continuao) TABELA A (continuao)


(
n nZ I I I
vn -n n nZ vil -
v fi n v fi
\

\~
686 470596 26. 1916 .001458 736 541696 27.1293 .001359
687 .0382
471969 26.2107 .001456 .0382 737 543169 27.1477 .001357 .0368
688 473344 26.2298 .001453 .0381 738 544644 27.1662 .001355 .0368
689 474721 26.2488 .001451 739 546121 27.1846 .001353 .0368
690 .0381
476100 26.2679 .001449 .0381 740 547600 27.2029 .001351 .0368
I
691 477481 26.2869 .001447 741 549081 27.2213 .001350 '.0367
692 .0380
478864 26.3059 .001445 .0380 742 550564 27.2397 .001348 .0367
693 480249 26.3249 .001443 743 552049 27.2580 .001346 .0367
694 .0380
481636 26.3439 .001441 .0380 744 553536 27.2764 .001344 .0367
695 483025 26.3629 .001439 .0379 745 555025 27.2947 .001342 .0366
696 484416 26.3818 .001437 746 556516 27.3130 .001340 .0366
697 .0379
485809 26.4008 .001435 .0379 747 558009 27.3313 .001339 .0366
698 487204 26.4197 .001433 748 559504 27.3496 .001337 .0:366
699 .0379
488601 26.4386 .001431 .0378 749 561001 27.3679 .001335 .0365
700 490000 26.4575 .001429 750 562500 27.3861 .001333 .0365
.0378
701 491401 26.4764 .001427 751 564001 27.4044 .001332 .0365
702 .0378
492804 26.4953 .001425 .0377 752 565504 27.4226 .001330 .0365
703 494209 26.5141 .001422 753 567009 27.4408 .001328 .0364
704 .0377
495616 26.5330 .001420 .0377 754 568516 27.4591 .001326 .0364
705 497025 26.5518 .001418 755 570025 27.4773 .001325 .0364
.0377
706 498436 26.5707 .001416 756 571536 27.4955 .001323 .0364
707 .0376
499849 26.5895 .001414 .0376 757 573049 27.5136 .001321 .0363
708 501264 26.6083 .001412 758 574564 27.5318 .001319 .0363
709 .0376
502681 26.6271 .001410 .0376 759 576081 27.5500 .001318 .0363
710 504100 26.6458 .001408 760 577600 27.5681 .001316 .0363
.0375
711 505521 26.6646 .001406 761 579121 27.5862 .001314 .0363
712 .0375
506944 26.6833 .001404 .0375 762 580644 27.6043 .001312 .0362
713 508369 26.7021 .001403 763 582169 27.6225 .001311 .0362
714 .0375
509796 26.7208 .001401 .0374 764 583696 27.6405 .001309 .0362
715 511225 26.7395 .001399 765 585225 27.6586 .001307 .0362
.0374
716 512656 26.7582 .001397 766 586756 27.6767 .001305 .0361
717 .0374
514089 26.7769 .001395 .0373 767 588289 27.6948 .001304 .0361
718 515524 26.7955 .001393 768 589824 27.7128 .001302 .0361
719 .0373
516961 26.8142 .001391 .0373 769 591361 27.7308 .001300 .0361
720 518400 26.8328 .001389 770 592900 27.7489 .001299 .0360
.0373
721 519841 26.8514 .001387 771 594441 27.7669 .001297 .0360
722 .0372
521284 26.8701 .001385 .0372 772 595984 27.7849 .001295 .0360
723 522729 26.8887 .001383 773 597529 27.8029 .001294 .0360
724 .0372
524176 26.9072 .001381 .0372 774 599076 27.8209 .001292 .0359
725 525625 26.9258 .001379 775 600625 27.8388 .001290 .0359
.0371
726 527076 26.9444 .001377 776 602176 27.8568 .001289 .0359
727 .0371
528529 26.9629 .001376 .0371 777 603729 27.8747 .001287 .0359
728 529984 26.9815 .001374 778 605284 27.8927 .001285 .0359
729 .0371
531441 27.0000 .001372 .0370 779 606841 27.9106 .001284 .0358
730 532900 27.0185 .001370 .001282
.0370 780 608400 27.9285 .0358
731 534361 27.0370 .001368 781 609961 27.9464 .001280 .0358
732 .0370
535824 27.0555 .001366 .0370 782 611524 27.9643 .001279 .0358
733 537289 27.0740 .001364 783 613089 27.9821 .001277 .0357
734 .0369
538756 27.0924 .001362 .0369 784 614656 28.0000 .001276 .0357
735 540225 27.1109 .001361 785 28.0179 .001274 .0357
.0369 616225
284 APNDICES Apndice B K

TABELA A (continuao)
TABELA A (continuao)

I I
n n2 .;; - - I
n .;; n n2 vli -
n .;;
786 617796 28.0357 .001272 .0357 .0346
787 619369 28.0535 .001271 836 698896 28.9137 .001196
.0356 .001195 .0346
788 620944 28.0713 .001269 .0356 837 700569 28.9310
702244 28.9482 .001193 .0345
789 622521 28.0891 .001267 .0356 838 .0345
790 624100 28.1069 839 703921 28.9655 .001192
.001266 .0356 .001190 .0345
840 705600 28.9828
791 625681 28.1247 .001264 .0356 .0345
792 627264 841 707281 29.0000 .001189
.28.1425 .001263 .0355 .001188 .0345
793 628849 28.1603 .001261 .0355 842 708964 29.0172
710649 29.0345 .001186 .0344
794 630436 28.1780 .001259 .0355 843 .0344
795 632025 28.1957 .001258 844 712336 29.0517 .001185
.0355 .001183 .0344
845 714025 29.0689
796 633616 28.2135 .001256 .0354 .0344
797 635209 28.2312 .001255 846 715716 29.0861 .001182
.0354 .001181 .0344
798 636804 28.2489 .001253 .0354 847 717409 29.1033
719104 29.1204 .001179 .0343
799 638401 28.2666 .001252 .0354 848 .0343
800 640000 28.2843 .001250 849 720801 29.1376 .001178
.0354 .001176 .0343
850 722500 29.1548
801 641601 28.3019 .001248 .0353 .0343
802 643204 28.3196 851 724201 29.1719 .001175
.001247 .0353 .001174 .0343
803 644809 28.3373 .001245 .0353 852 725904 29.1890
727609 29.2062 .001172 .0342
804 646416 28.3549 .001244 .0353 853 .0342
648025 28.3725 854 729316 29.2233 .001171
80S .001242 .0352 .001170 .0342
855 731025 29.2404
806 649636 28.3901 .001241 .0352 .0342
807 651249 28.4077 .001239 856 732736 29.2575 .001168
.0352 .001167 .0342
808 652864 28.4253 .001238 .0352 857 734449 29.2746
736164 29.2916 .001166 .0341
809 654481 28.4429 .001236 .0352 858 .0341
810 656100 28.4605 .001235 859 737881 29.3087 .001164
.0351 .001163 .0341
860 739600 29.3258
811 657721 28.4781 .001233 .0351 .0341
812 659344 28.4956 .001232 .0351 861 741321 29.3428 .001161
743044 29.3598 .001160 .0341
813 660969 28.5132 .001230 .0351 862 .0340
814 662596 28.5307 .001229 .0351 863 744769 29.3769 .001159
746496 29.3939 .001157 .0340
815 664225 28.5482 .001227 ,0350 864 .0340
865 748225 29.4109 .001156
816 665856 28.5657 .001225 .0350 .0340
817 667489 28.5832 .001224 866 749956 29.4279 .001155
.0350 .001153 .0340
818 669124 28.6007 .001222 .0350 867 751689 29.4449
753424 29.4618 .001152 .0339
819 670761 28.6182 .001221 .0349 868 .0339
820 672400 28.6356 .001220 .0349 869 755161 29.4788 .001151
756900 29.4958 .001149 .0339
870
821 674041 28.6531 .001218 .0349 .0339
822 675684 28.6705 .001217 871 758641 29.5127 .001148
.0349 .001147 .0339
823 677329 28.6880 .001215 .0349 872 760384 29.5296
29.5466 .001145 .0338

824 678976 28.7054 .001214 .0348 873 7621 29


874 763876 29.5635 .001144 .0338
825 680625 28.7228 .001212 .0348 .0338
875 765625 29.5804 .001143
826 682276 28.7402 .001211 .0348 .0338
827 683929 28.7576 .001209 .0348 876 767376 29.5973 .001142
769129 29.6142 .001140 .0338
828 685584 28.7750 .001208 .0348 877 .0337
829 687241 28.7924 .001206 .0347 878 770884 29.6311 .001139
879 772641 29.6479 .001138 .0337
830 688900 28.8097 .001205 .0347 .0337
880 774400 . 29.6648 .001136
831 690561 28.8271 .001203 .0347 .0337
832 692224 28.8444 .001202 .0347 881 776161 29.6816 .0011 35
882 777924 29.6985 .001134 .0337
833 693889 28.8617 .001200 .0346 .0337
834 695556 28.8791 .001199 .0346 883 779689 29.7153 .001133
781456 29.7321 .001131 .0336
835 697225 28.8964 .001198 .0346 884 .0336
88S 783225 29.7489 .001130
286 APNDICES Apndice B H/

... ,~ ~ t>
' -9NIVER~IDA3E fEOiRAL DO PAR.&
TABELA A (continuao) TABELA A (continuao) BIBUOTECA CENTRAL

n n2 vil -n n nZ -v;, n -v;;


vil
886 784996 29.7658 .001129 .0336 936 876096 30.5941 .001068 .0327
887 786769 29.7825 .001127 .0336 937 877969 30.6105 .001067 .0327
888 788544 29.7993 .001126 .0336 938 879844 30.6268 .001066 .0327
889 790321 29.8161 .001125 .0335 939 881721 30.6431 .001065 .0326
890 792100 29.8329 .001124 .0335 940 883600 30.6594 .001064 .0326

891 793881 29.8496 .001122 .0335 941 885481 30.6757 .001063 .0326
892 795664 29.8664 .001121 .0335 942 887364 30.6920 .001062 .0326
893 797449 29.8831 .001120 .0335 943 889249 30.7083 .001060 .0326
894 799236 29.8998 .001119 .0334 944 891136 30.7246 .001059 .0325
895 801025 29.9166 .001117 .0334 945 893025 . 30.7409 .001058 .0325

896 802816 29.9333 .001116 .0334 946 894916 30.7571 .001057 .0325
897 804609 29.9500 .001115 .0334 947 896809 30.7734 .001056 .0325
898 806404 29.9666 .001114 .0334 948 898704 30.7896 .001055 .0325
899 808201 29.9833 .001112 .0334 949 900601 30.8058 .001054 .0325
900 810000 30.0000 .001111 .0333 950 902500 30.8221 .001053 .0324

901 811801 30.0167 .001110 .0333 951 904401 30.8383 .001052 .0324
902 813604 30.0333 .001109 .0333 952 906304 30.8545 .001050 .0324
903 815409 30.0500 .001107 .0333 953 908209 30.8707 .001049 .0324
904 817216 30.0666 .001106 .0333 954 910116 30.8869 .001048 .0324
905 819025 30.0832 .001105 .0332 955 912025 30.9031 .001047 .0324

906 820836 30.0998 .001104 .0332 956 913936 30.9192 .001046 .0323
907 822649 30.1164 .001103 .0332 957 915849 30.9354 .001045 .0323,
908 824464 30.1330 .001101 .0332 958 917764 30.9516 .001044 .0323
909 826281 30.1496 .001100 .0332 959 919681 30.9677 .001043 .0323
910 828100 30.1662 .001099 .0331 960 921600 30.9839 .001042 .0323

911 829921 30.1828 .001098 .0331 961 923521 31.0000 .001041 .0323
912 831744 30.1993 .001096 .0331 962 925444 31.0161 .001040 .0322
913 833569 30.2159 .001095 .0331 963 927369 31.0322 .001038 .0322
914 835396 30.2324 .001094 .0331 964 929296 31.0483 .001037 .0322
915 837225 30.2490 .001093 .0331 965 931225 31.0644 .001036 .0322

916 839056 30.2655 .001092 .0330 966 933156 31.0805 .001035 .0322
917 840889 30.2820 .001091 .0330 967 935089 31.0966 .001034 .0322
918 842724 30.2985 .001089 .0330 968 937024 31.1127 .001033 .0321
919 844561 30.3150 .001088 .0330 969 938961 31.1288 .001032 .0321
920 846400 . 30.3315 .001087 .0330 970 940900 31.1448 .001031 .0321

921 848241 30.3480 .001086 .0330 971 942841 31.1609 .001030 .0321
922 850084 30.3645 .001085 .0329 972 944784 31.1769 .001029 .0321
923 851929 30.3809 .001083 .0329 973 946729 31.1929 .001028 .0321
924 853776 30.3974 .001082 .0329 974 948676 31.2090 .001027 .0320

925
926
927
855625
857476
859329
30.4138
30.4302
30.4467
.001081
.001080
.001079
.0329
.0329
.0328
975
976
977
950625
952576
954529
31.2250
31.2410
31.2570
.001026
.001025
.001024
.0320
.0320
.0320
928 861184 30.4631 .001078 .0328 978 956484 31.2730 .001022 .0320
929 863041 30.4795 .001076 .0328 979 958441 31.2890 .001021 .0320
930 864900 30.4959 .001075 .0328 980 960400 31.3050 .001020 .0319

931 866761 30.5123 .001074 .0328 981 962361 31.3209 .001019 .0319
932 868624 30.5287 .001073 .0328 982 964324 31.3369 .001018 .0319
933 870489 30.5450 .001072 .0327 983 96628P 31.3528 .001017 .0319
934 872356 30.5614 .001071 .0327 984 968256 31.3688 .001016 .0319
935 874225 30.5778 .001070 .0327 985 970225 31.3847 .001015 .0319
288 APNDICES
A pndice B 21.1'

TABELA A (continuao)
ABELA B Porcentagem da rea sob a Curva Normal Entre X e z. /;~1 o .....
n n2
v fi n -v;; .00 .OI .02 .03 .04 .05 .06 .07 .08 .09

986 972196 31.4006 0.0 00.00 00.40 00.80 01.20 0 1.60 01.99 02.39 02.79 03.19 03.59
.001014 .0318 O. I 03.98 04.38 04.78 05.17 05.57 05.96 06.36 06.75 07. 14 07.53
987 974169 31.4166 .001013
988 .0318 0.2 07.93 08.32 08.71 09.10 09.48 09.87 10.26 10.64 11.03 11.41
976144 31.4325 .001012 .0318
989 978121 31.4484 .001011
0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15. 17
990 .0318 0.4 15.54 15.9 1 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79
980100 31.4643 .001010 .0318
991 982081 31.4802 .001009 0.5 19. 15 19.50 19.85 20.19 20.54 20.88 21.23 21.57 21.90 22.24
992 .0318
984064 31.4960 .001008 0.6 22.57 22.9 1 23.24 23.57 23.89 24.22 24.54 24.86 25. 17 25.49
.0318
993 986049 31.5119 .001007 0.7 2~80 26. 11 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.52
994 .0317
988036 31.5278 .001006 .0317 0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78 31.06 31.33
995 990025 31.5436 .001005 0.9 31.59 31 .86 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89
.0317
996 992016 31.5595 .001004 1.0 34. 13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
997 .0317
994009 31.5753 .001003 .0317 1.1 36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.30
998 996004 31.5911 .001002 1.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97 40.15
999 .0317
998001 31.6070 .001001 .0316 1.3 40.32 40.49 40.66 40.82 40.99 41. 15 41.31 41.47 41.62 41.77
1000 1000000 31.6228 .001000 1.4 41.92 42.07 42.22 42.36 42.5 1 42.65 42.79 42.92 43.06 43.19
.0316
1.5 43.32 43.45 43.57 43.70 43.83 43.94 44.06 44.18 44.29 44.41
1.6 44.52 44.63 44.74 44.84 44.95 45.05 45.15 45.25 45.35 45.45
1.7 45.54 - 45.64 45.73 45.82 45.9 1 45.99 46.08 46. 16 46.25 46.33
1.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.06
1.9 47.13 47. 19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.61

2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48. 12 48.17
2.1 48.21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.57
2.2 48.61 48.64 48.68 48.7 1 48.75 48.78 48.81 48.84 48.87 48.90
2.3 48.93 48.96 48.98 49.0 1 49.04 49.06 49.09 49. 11 49.13 49. 16
2.4 49.18 49.20 49.22 49.25 49.27 49.29 49.31 49.32 49.34 49.36

2.5 49.38 49.40 49.41 49.43 49.45 49.46 49.48 49.49 49.5 1 49.52
2.6 49.53 49.55 49.56 49.57 49.59 49.60 49.61 49.62 49.63 49.64
2.7 49.65 49.66 49.67 49.68 49.69 49.70 49.71 49.72 49.73 49.74
2.8 49.74 49.75 49.76 49.77 49.77 49.78 49.79 49.79 49.80 49.8 1
2.9 49.81 49.82 49.82 49.83 49.84 49.84 49.85 49.85 49.86 49.86

3.0 49.87

4.0 49.997

FONTE : Karl Pearson, Tables for Statisticil1ns and Biometricil1ns, Cambridge Univer-
sity Press, London, pp. 98 - 111, com a permisso de Biometrika Trustees.
-
/ 290 APNDICES Apndice B 291

TABELA D Valores de F aos Nveis de Significncia de 0,05 e 0,01.


TABELA C Valores de t aos Nveis de Significncia de 0,05 e 0,01.

(g1 para o numerador) p = .05


g1 .05 .0 1

I
g1 I 2 3 4 5 6 8 12
12.706 63.657
2 4.303 9.925
3 3. 182 5.841 I 16 1.4 199.5 2 15.7 224. 6 230.2 234.0 238.9 243.9
4 2.776 4.604 2 18.5 1 19.00 19. 16 19.25 19.30 19.33 19.37 19.41
5 2.57 1 4.032 3 10. 13 9.55 9.28 9. 12 9.0 1 8.94 8.84 8.74
4 7.7 1 6.94 6.59 6.39 6.26 6. 16 6.04 5.91
6 _ 2..1 3.707 5 6.61 5.79 5.4 1 5.19 5.05 4.95 4.82 4.68
7 2.365 3.499
8 2.306 3.355 6 5.99 5. 14 4.76 4.53 4.39 4.28 4. 15 4.00
9 2.262 3.250 7 5.59 4.74 4.35 4.12 3.97 3.87 3.73 3.57
10 2.228 3. 169 8 5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.28
9 5. 12 4.26 3.86 3.63 3.48 3.37 3.23 3.07
11 2.201 3. 106 lO 4.96 4. 10 3.7 1 3.48 3.33 3.22 3.07 2.9 1
12 2. 179 3.055
13 2.160 3.0 12 '! li 4.84 3.98 3.59 3.36 3.20 3.09 2.95 2.79
14 2. 145 2.977 12 4.75 3.88 3.49 3.26 3. 11 3.00 2.85 2.69
15 2.13 1 2.947 13 4.67 3.80 3.41 3.18 3.02 2.92 2.77 2.60
~
.... 14 4.60 3.74 3. 11
o 3.34 2.96 2.85 2.70 2.53

~
'O
16 2. 120 2.92 1 .!'".~ <'l
~
15 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.48
17 2. 11 0 2.898 " 16
18 2. 10 1 2.878 o 4.49 3.63 3.24 3.0 1 2.85 2.74 2.59 2.42
19 2.093 2.861 ~ 17 4.45 3.59 3.20 2.96 2.8 1 2.70 2.55 2.38
20 2.086 2.845 "'o
'O 18
19
4.41 3.55 3. 16 2.93 2.77 2.66 2.5 1 2.34
4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31
<'l
21 2.080 2.83 1 ....
<'l
20 4.35 3.49 3. 10 2.87 2.71 2.60 2.45 2.28
22 2.074 2.8 19 P.
23 2.069 2.807 :? 2 1 4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.25
24 2.064 2.797 22 4.30 3.44 3.05 2.82 2.66 2.55 2.40 2.23
25 2.060 2.787 23 4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20
24 4.26 3.40 3.01 2.78 2.62 2.51 2.36 2. 18
26 2.056 2.779 25 4.24 3.38 2.99 2.76 2.60 2.49 2.34 2. 16
27 2.052 2.77 1
28 2.048 2.763 26 4.22 3.37 2.98 2.74 2.59 2.47 2.32 2. 15
29 2.045 2.756 27 4.2 1 3.35 2.96 2.73 2.57 2.46 2.30 2. 13
30 2.042 2.750 28 4.20 3.34 2.95 2.7 1 2.56 2.44 2.29 2. 12
29 4. 18 3.33 2.93 2.70 2.54 2.43 2.28 2. 10
40 2.02 1 2.704 30 4. 17 3.32 2.92 2.69 2.53 2.42 2.27 2.09
60 2.000 2.660
120 1.980 2.6 17 40 4.08 3.23 2.84 2.6 1 2.45 2.34 2. 18 2.00
")() 1.960 2.576 60 4.00 3.15 2.76 2.52 2.37 2.25 2. 10 1.92
120 3.92 3.07 2.68 2.45 2.29 2.17 2.02 1.83
")() 3.84 2.99 2.60 2.37 2.2 1 2.09 1.94 1.75

FONTE: R. A . F isher and F. Yates, Statistical Tables for Biological, Agricultura/,


j
and Medicai Research, 4th ed, Oliver & Boyd, Edinburgh, Table V, com a permisso
dos autor es e d o editor.

li

...
' .J
Apndice D 11
292 APNDICES

TABELA D (continuao )
TABELA E Qui-quadrado. Valores Crticos aos Nveis de Significncia de 0,05 e 0,0 I ,

(gl para o numerador) P =.O I gl .05 .OI

gl 2 3 4 5 6 8 12 I 3. 841 6.635
2 5.991 9.2 10
I 4052 4999 5403 5625 5764 5859 5981 6106 3 7.815 I 1.345
2 98.49 99.0 ! 99. 17 99.25 99.30 99.33 99.36 99.42 4 9.488 13.277
3 34.12 30.8 1 29.46 28.7 1 28.24 27.91 27.49 27.05 5 11.070 15.086
4 21.20 !8.00 !6.69 15.98 15.52 15.21 14.80 14.37
5 16.26 13.27 12.06 11.39 10.97 10.67 10.27 9.89 6 12.592 16.8 12
7 14.067 18.475
6 13.74 10.92 9.78 9. 15 8.75 8.47 8.!0 7.72 8 15.507 20.090
7 12.25 9.55 8.45 7.85 7.46 7. 19 6.84 6.47 9 16.91 9 21.666
8 11.26 8.65 7.59 7.01 6.63 6.37 6.03 5.67 10 18.307 23.209
9 10.56 8.02 6.99 6.42 6.06 5.80 5.47 5.! 1
lO 10.04 7.56 6.55 5.99 5.64 5.39 5.06 4.71 li 19.675 24.725
!2 21.026 26.2 17
li 9.65 7.20 6.22 5.67 5.32 5.07 4.74 4.40 13 22.362 27.688
12 9.33 6.93 5.95 5.41 5.06 4.82 4.50 4. 16 14 23.685 29.141
13 9.07 6.70 5.74 5.20 4.86 4.62 4.30 3.96 15 24. 996 30.578
-;:;- 14 8.86 6.5 1 5.56 4.69 4.46 4. 14 3.80
o 5.03
"O 15 8.68 6.36 5.42 4.89 4.56 4.32 4.00 3.67 !6 26.296 32.000
.s"' 17 27.587 33.409
E 16 8.53 6.23 5.29 4.77 4.44 4.20 3.89 3.55 18 28.869 34.805
o 19 30. !44 36. 19!
<:: 17 8.40 6. 11 5. 18 4.67 4.34 4.10 3.79 3.45
Q)
"O 18 8.28 6.0 ! 5.09 4.58 4.25 4.01 3.7 1 3.37 20 31.410 37.566
o 19 8.18 5.93 5.0 1 4.50 4. 17 3.94 3.63 3.30
21 32.671 38.932
"'....o. 20 8.10 5.85 4.94 4.43 4. !0 3.87 3.56 3.23
40.289
"' 8.02 5.78 4.87 4.04 3.81 3.5 1 3. 17
22
23
33.924
35. 172 41.638
: 2 1 4.37
42.980
22 7.94 5.72 4.82 4.31 3.99 3.76 3.45 3. 12 24 36.415
23 7.88 5.66 4.76 4.26 3.94 3.7 1 3.4 1 3.07 25 37.652 44.3 14
24 7.82 5.6 1 4.72 4.22 3.90 3.67 3.36 3.03
25 7.77 5.57 4.68 4. 18 3.86 3.63 3.32 2.99 26 38.885 45.642
27 40.1 13 46.963
26 7.72 5.53 4.64 4. 14 3.82 3.59 3.29 2.96 28 41.337 48.278
27 7.68 5.49 4.60 4.11 3.78 3.56 3.26 2.93 29 42.557 49.588
28 7.64 5.45 4.57 4.07 3.75 3.53 3.23 2.90 30 43. 773 50.892
29 7.60 5.42 4.54 4.04 3.73 3.50 3.20 2.87
30 7.56 5.39 4.51 4.02 3.70 3.47 3.17 2.84
FONTE: R . A. Fisher and F . Yates, Statistical Tables for Biological, Agricultura[,
40 7.31 5.1 8 4.3 1 3.83 3.5 1 3.29 2.99 2.66 and Medicai Research, 4th ed, Oliver & Boyd , Edinbu rgh, Table IV, com a permisso
60 7.08 4.98 4.13 3.65 3.34 3. 1/ 2.82 2.50 dos autores e do editor.
120 6.85 4.79 3.95 3:48 3. 17 2.96 2.66 2.34
6.64 4.60 3. 78 3.32 3.02 2.80 2.51 2. 18
""
294 APNDICES Apndice IJ 41
~

TABELA F Valores de r aos Nveis de Significncia de 0,05 e 0,01 .


TABELA H Nmeros Aleatrios.

gl .05 .OI Nmero de Colunas


Fileira 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
I .99692 .999877
2 .95000 .990000 1 9 8 9 6 9 9 o 9 6 3 2 3 3 8 6 8 4 4 2
3 .8783 .95873 2 3 5 6 1 7 4 1 3 2 6 8 6 o 4 7 5 2 o 3
4 .8 114 .9 1720 3 4 o 6 1 6 9 6 1 5 9 5 4 5 4 8 6 7 4 o
5 .7545 .8745 4 6 5 6 3 1 6 8 6 7 2 o 7 2 3 2 1 5 o 9
5 2 4 9 7 9 1 o 3 9 6 7 4 1 5 4 9 6 9 8
6 .7067 .8343 6 7 6 1 2 7 5 6 9 4 8 4 2 8 5 2 4 1 8 o
7 .6664 .7977 7 8 2 1 3 4 7 4 6 3 o 7 5 o 9 2 9 o 6 1
8 .6319 .7646 8 6 9 5 6 5 6 o 9 o 7 7 1 4 1 8 3 1 9 3
9 .602 1 .7348 9 7 2 1 9 9 8 o 1 6 1 6 2 3 6 9 5 5 8 4
lO .5760 .7079 10 2 9 o 7 3 o 8 9 6 3 3 8 5 5 6 5 2 o 9
11 9 3 5 4 5 7 4 o o
3 1 o 4 3 3 9 5 3 2
li .5529 .6835 12 9 7 5 7 9 4 8 6 7
8 6 1 6 8 2 5 5 5 3
12 .5324 .6614 13 4 1 7 8 6 8 1 o 5 8 8 6 1 6 8 2 9 o 4
13 .5 139 .6411 14 5 o 8 3 3 4 5 4 4 2 5 3 o 4 9 6 1 2 3
14 .4973 .6226 15 3 5 o 2 9 4 1 o o 3 9 o 5 8 6 o 9 9 6
15 .4821 .6055 16 o 3 8 2 3 5 1 o 1 o 6 8 5 2 4 8 o 3 8
17 1 7 2 9 1 2 7 8 4 7 o 3 3 1 5 8 2 7 3
16 .4683 .5897 18 5 o 5 7 9 5 8 7 8 9 3 5 3 4 4 6 1 1 3
17 .4555 .5751 19 7 7 3 3 5 3 6 1 3 2 8 5 4 1 4 8 3 9 o
18 .4438 .5614 20 1 o 9 1 3 8 2 5 3 o 3 8 o 9 3 3 o 4 5
19 .4329 .5487 21 1 3 8 5 1 8 5 9 4 1 9 3 9 3 6 5 9 8 4
20 .4227 .5368 22 8 6 4 7 8 7 5 9 4 1 9 3 9 3 6 5 9 8 4
23 o 6 9 6 5 1 o 3 2 6 7 7 4 9 6 o 3 4 o
25 .3809 .4869 24 7 6 7 4 7 o 8 3 8 7 3 2 5 1 2 4 2 9 7
30 .3494 .4487 25 3 2 3 8 1 3 1 8 7 4 5 9 o o 2 4 1 2 1
35 .3246 .4 182 26 9 2 1 6 4 2 3 8 7 6 2 6 2 6 4 8 1 o 1
40 .3044 .3932 27 3 7 4 2 2 8 1 7 8 o 6 o o o 3 2 2 9 7
45 .2875 .3721 28
29
o
7
7
4
8
2
o
3
8
3
5
2
1
6
5
o o
2 6
6
5
5
8
2
7
2
5
3
3
6
-o3 5
9
9
o
6
4
50 .2732 .3541 30 1 8 2 7 5 9 5 3 6 5 2 9 9 1 1 7 3 4 3
60 .2500 .3248 FONTE: E. A. Fisher and F . Yates, Statistical Tables 31 4 3 1 8 7 o 6 o 8 6 5 o 1 o 4 o 6 1 5
70 .23 19 .3017 for Biological, Agricultura/, and Medicai Research, 4th 32 8 5 8 o 6 1 4 1 2 o 4 4 1 4 7 6 3 5 1
80 .2172 .2830 ed, Oliver & Boyd, Edinburgh, Table VI, com a permisso 33 4 5 8 5 o 4 5 8 3 9 2 8 7 8 9 o 8 4 3
90 .2050 .2673 34 5 o 2 5 4 9 2 2 1 1 o o 5 4 8 7 6 4 o
dos autores e do editor. 35 o 8 1 7 o 6 3 3 4 7 6 2 6 8 9 3 4 1 4
36 2 5 9 3 4 6 o 7 5 2 o o 9 6 o 8 2 2 5
37 2 1 3 1 3 7 8 9 8 4 9 3 8 o 2 2 1 8 1
38 3 8 8 6 8 5 1 3 3 4 6 7 2 6 3 4 8 6 7
TABELAG Valores de r8 aos Nveis de Significncia de 0,05 e 0,01. 39 o 9 9 8 5 9 8 4 4 2 2 1 1 o 1 7 6 1 3
40 2 2 3 5 3 9 7 4 4 2 1 4 o 5 8 2 3 o 8
N .05 .OI

5 1.000
6 .886 1.000
7 .786 .929
8 .738 .881
9 .683 .833
lO .648 .794
12 .59 1 .777
14 .544 .7 14
16 .506 .665 FONTE: E. G . 01ds, The Annals of Mathematical Sta-
18 .475 .625
.450 .59 1
tistics, " Distribution of the Sum of Squares of Rank
20
22 .428 .562 Differences for Smal! Numbers of Individuais," 1938,
24 .409 .537 vol. 9 e "The 5 Percent Significance Leveis for Sums
26 .392 .5 15 of Squares of Rank Differences and a ..:::orrection,"
28 .377 .496
.364 .478 1949, vol. 20, com a permisso do Institute o f Math
30
ematical Statistics.
296 APNDICES Apndlc IJ 11
1

TABELA H (continuao)
TABELA I Pontos Percentuais da Amplitude t.
Nmero de Colunas
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Fileira k = Nmero de Mdias
0971191273518404106031 3 4 5 6 7 8 9 10 11
8 3 7 7 9 1 4 9 9 5 9 2 o 1 6 1 2 6 6 7 o 2
256378338439390098352 3 5 .05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17
470866596273590180969 4 .01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 10.48
098735688120232643197 5
518847017682163218183 6 6 .05 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65
I37869541738 715656436 7 .01 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30
59015286557818712404I 8 7 .05 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30
22552I869898058994I34 9 .01 4.95 5.92 6.54 7.01 7.37 7 .68 7.94 8.17 8.37 8.55
I 3 4 2 8 5 O 7 9 8 4 3 5 8 O 9 4 6 6 O 5 IO
268664715I64676087352 11 8 .05 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05
8 6 O 1 4 2 9 8 6 8 O 7 6 5 I 9 I 3 7 O 3 12 .01 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86 8.03
9 5 7 o 9 8 7 6 9 o 6 5 4 o 3 6 5 6 3 5 o I3 9 .05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 5.87
2 2 3 4 7 8 o 2 o 8 o 3 4 9 2 5 7 7 8 6 4 14 .01 4.60 5.43 5.96 6.35 6.66 6 .91 7.13 7.33 7.49 7.65
2 4 6 I O 5 O 6 I 4 9 4 7 3 9 I 7 6 4 5 8 15 10 .05 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72
6 3 4 8 1 6 9 5 6 2 o 4 6 1 6 8 1 9 9 1 1 16 .01 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21 7.36
9 o 5 1 3 6 1 9 5 4 1 2 5 4 2 9 5 6 2 4 o 17
3 6 7 o 3 5 3 7 4 1 7 5 4 8 3 7 4 8 5 7 2 18 11 .05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61
4 3 6 6 3 6 3 o o 9 4 2 2 5 1 8 9 5 1 9 7 19 .01 4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13
1 o 6 9 o 2 7 3 9 8 4 o 6 9 8 2 3 2 8 o 4 20 12 .05 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39 5.51
9 1 3 5 7 9 6 2 4 3 4 6 4 9 1 3 1 7 5 2 2 21 .01 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81 6.94
6 4 2 2 2 1 4 5 2 2 8 3 2 1 2 6 6 o 1 8 9 22
7 2 6 9 o 7 5 3 2 5 6 2 7 6 3 8 1 4 1 5 1 23 13 .05 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43
828244429198344104696 24 .01 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67 6.79
7 3 1 4 3 o
4 7 1 3 7 4 8 6 7 3 2 6 6 2 25 o 14 .05 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36
O 6 4 5 8 3 1 4 8 1 8 3 I 6 4 3 O 2 8 7 3 26 .01 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6 .41 6.54 6.66
4 2 2 8 3 2 1 9 3 o 1 7 5 9 o 9 1 2 5 8 2 27 4.37 4.59 4.78 4.94 5.08 5.20 5.31
2 9 8 7 2 o 6 4 o 2 7 1 3 1 6 8 7 o 9 2 5 28 15 .05 3.01 3.67 4.08
o 8 o 5 6 8 2 4 3 6 1 3 5 2 3 5 9 8 6 2 1 29 .01 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55
o 1 7 6 1 5 7 9 o 3 5 3 4 2 4 8 5 6 4 o 6 30 16 .05 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26
5 1 9 8 5 2 4 5 1 7 5 3 2 4 6 7 9 9 6 7 2 31 .01 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35 6.46
o 3 6 6 3 7 8 6 9 7 2 8 9 7 2 9 4 8 6 32 o o 17 .05 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21
5 o o o 2 o 8 9 o 1 o 6 2 o 4 6 9 6 5 4 9 33 .01 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27 6.38
1 9 4 4 2 6 4 2 4 I O 2 7 9 6 8 7 5 6 9 3 34
o o 5 3 8 3 2 7 5 o 4 7 6 4 6 3 o 4 7 5 3 35 18 .05 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.17
6 2 6 2 O 6 O I 4 8 9 6 5 9 7 3 6 7 6 5 4 36 .01 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6.31
6 3 9 O 3 5 O 9 I 2 O 5 9 7 3 2 5 9 3 O 2 37 19 .05 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14
9 7 3 3 5 4 o 6 4 9 4 7 9 1 4 3 9 7 7 1 8 38 .01 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14 6.25
1 9 6 2 9 4 2 9 7 o 3 8 9 5 7 o 6 9 7 2 5 39
5 9 4 5 8 6 2 3 o 6 2 9 8 6 3 o 4 1 o 7 6 40 20 .05 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11
.01 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19
FONTE: N. M. Downie and R. W. Heath, Basic Statistical Methods, 3rd ed., Harper 24 .05 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01
& Row, New York, 1970. Reimpresso com a permisso da Harper & Row. .01 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92 6.02
30 .05 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92
.01 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85
I 40 .05 2.86 3.44 3.~ ~w ~~ 4.~ ~~ 4.~ 4.73 4.82
.01 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69
60 .05 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73
.01 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45 5.53
120 .05 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64
.01 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30 5.37
00
.05 2.77 3.31 3.63. 3.86 4.03 4.17 4.29 4.39 4.47 4.55
.01 3 .64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16 5.23

FONTE: E. S. Pearson and H. O. Hart!ey,Biometrika TablesforStatisticians,


Vol. 1. 3rd ed., Cambridge Press, New York, 1966, com a permisso dos
Biometrika Trustees.
Lista de Frmulas .,~

Apndice C N + 1
Posio da mediana = - - -
2
-
X =-
lX 4
N

x = X-X

-
X=-
l{X 47
N
LISTA DE FORMULAS PGINAS

-N~---F"-r-e-qu_
5
correspondente ao
limite inferior .. -n-c-ia_a_c_u_m_u_l-ad-a amplitude do
+ intervalo anterior ao
17 Mediana = real do intervalo
que contm a mediana
X intervalo
mediano ( ) mediano
freqncia absoluta

% = (100) ~ 18 do intervalo mediano

DM = llxl 61
N
19
64

Razo de sexo= (100) /homens 19


/mulheres (T = ~~ - ){2 66

Taxa de nascimento
__ ( .0QQ:'I
1 ,
f nascimentos reais
f nascimentos potenciais
20 (T = ~lt;2 - .X:? 67

X-X 90
(1 00) tempo2/- tempo 1/ z =
Taxa de mutao = 21 (T
tempo 1/
X = ZfT +X 91
escore menor + escore maior
Ponto mdio = 25 Nmero de vezes que o
2
dado ou evento pode ocorrer
Probabilidade 92
fa 27 Nmero total de dados
c% = (100) N
ou eventos

z=
X- M 112
limite inferior

Posto percentil = (::ri;l+


intervalo
crtico
escore - do intervalo
crtico
tamanho do
intervalo crtico
(
% no i_n~ervalo )
cnttco
cr-.\-
s
- -r====
yN- 1
113

28 Intervalo de confiana de 95% = X (1,96) ax 115


Lista de Frmulas 301
300 . APNDICES

Intervalo de confiana de 99% = X (2,58) a.x 117

_ -JP(1 - P ) 120
qa~
a-p - N
DHS =
'
Intervalo de confiana de 95% =P (1,96) ap 121
~ = I (fo - f e)
2

fe 1714
135 N(AD - BC)2
2 =
(A + B )(C + D)(A + C )(B + "D)
139

140
2 - NCIAD - BCI - N /2)2
167
X - (A + B)(C + D)(A + C )(B + D)
146

150
1 7

159 H= 12 ~ [ CIR ;)2] - 3(N + 1) 20


N (N + 1) L- n
160 I (zxzy)
r = ----'-="=-.!.:... 2tl
N
SStota1 = SSe + SSd 161
N I XY - CI X)(I Y)
161 r = -
y'-c[N~IX~
2= 2]
_ =;CI~X;:;:);:;;=2]~[N;=;;I~Y~2;=_~(I;:;:;Y~)~ 21

2
S S total = -" 2 total -
~x (IXtotal) 161
N t = r v'N- 2 217
total
V1=r2
162
222

163

164 G = I fa - Iti
Ifa + Iti
164
2 IH
302 APNDICES

-K2 _.
cf>- -
N .
.
240
Apndice D
Classificao de Classes Scio-Econmicas no Brasil
242
Itens e pontuao levados em conta na classificao scio-econmica dos indivduos no
- ~ x2
V- N(k- 1) 243
Brasil (veja Cap. 3):

Eletrodomsticos Pontos
Geladeira 1
Enceradeira 1
TV (Preto e branco) 1
TV (Cores) 3
Batedeira 3
Liqidificador 1
Mquina de lavar 3
Aspirador de p 3

Empregadas
1 4
mais de 1 6

Automvel
1 de preo eqivalente ao do VW sedan
(do ano) 4
Mais de 1 automvel ou 1 de valor supe-
rior ao VW 1300 Sedan (do ano) 6

Escolaridade do Chefe da Casa


Primrio incompleto o
1 grau Primrio completo 1
{ Ginasial incompleto 1
Ginasial completo 2
Colegial incompleto 2
{ Colegial completo 4
Universitrio incompleto 4
{ Universitrio completo 8

Fazendo-se X = soma de p_ontos de um particular sujeito (S), vem:

se X ~ 22 - -- - - - + S E classe A;
se 8 ~X~ 21 SE classe B;
se 4 ~X~ 7 SE classe C;
se X < 4 ~ S E classe D.
Respostas aos Problemas Pares 111

Captulo 5 Captulo 9
2. (a) Classe A=5, Classe B =3, (b) Clas- 2. F =46, 33 , gl =i, rej eitar a hiptes~

Respostas se A =1,67, Classe B =0,83, (c) Clas-


se A =1,89, Classe B =0,96
4. 2,70
nula a 0,05
4. F =4,23, gl =lc , rejeitar a hiptese 1111111
a 0,05
12
6. 1,19 6. F= 8. 16 gl = .l. , rejeitar a hiptcst
20

aos
8. 1,40 nula a o,'o5
10. (a) 14, (b) 2,47, (c) 3,25
Captulo 10
2. x2 =8,29, gl =1' rejeitar a hiptese
Captulo 6 nula a 0,05

Problemas Captulo 2
2. (a)71%,(b)74%,(c)P=0,71,
2. (a) +0,38 , (b) -1 ,15 , (c) -1 ,69, (d) +2,08,
(e) O, (f) 0,77, (g) +2,69
4. (a)5,37%,(b) P=0,05,(c)7,14%,
(d) P=0,07, (e) P =0,43, (f) P =0,86 ,
4.

6.
x2
x2
=1,50, gl =1, aceitar a hiptese nula
a 0,05
=17 ,77, gl =4, rejeitar a hiptese
nula a 0,05
(d) p =0,74
(g) p =0,18 8. x2 =2,24 , gl =2, aceitar a hiptese

Pares
4 . 156,25
6. 85,71 crianas nascem vivas para cada nula a 0,05
1000 mulheres em idade compatvel 10. Mdn=6,X2 =19,57,gl =1,rejeitar a
Captulo 7 hiptese nula a 0,05
com gravidez
2. (a) 2,40-<'---'> 3,46, (b) 2,23-<'---'> 3,63 12. X2 p =I 0,20, gl =2, rejeitar a hiptese
8. Intervalo de Classe f 4. (a) 5,10 -<'---'>6,48, (b) 4 ,89 -<'---'>6 ,69 nu la a 0,05
6. (a) 4,24-<'---'> 5,7 6, (b) 3,99 -<'---'>6 ,0 1 14. H =1 0,64, gl =2, rejeitar a hiptese
10-12 11 8. (a) 0,04, (b) 0,24 -<'---'>0,40 nula a 0,05
7-9 16
4-6 9
1- 3 4 Captulo 11
Captulo 8 2. r =-0,64 , gl =2, no significante
N=40
2. t = 1 ,4 7, gl =6, aceitar a hiptese nula a O 05
a 0,05 4. r= +0,93, gl =3, significante a 0,05
a. 3 4 . t =2,03 , gl =16, aceitar a hiptese nula 6. Y'=0,52X+ 1,0l;(a) Y'=3,61,
b. 9,5-12,5 a 0,05 (b) Y' =2 ,05 , (c) Y' =5 ,69
6,5- 9,5 6. t =0,67, gl = 8, aceitar a hiptese nula 8. rs =-0,53, N =5, no significante ,.?-'.
3,5- 6,5 a 0,05 a 0,05
0,5- 3,5 8. t =4,32, gl =10, rejeitar a hiptese nula 10. rs =-0,89,N =7, significante a 0,05
c. 11 a 0,05 12. G =+0,60 , z = 0,82, no significante
8 10. t =3,12, gl =5, rejeitar a hiptese nula a 0,05
5 a 0,05 14. cjJ:0 ,37
2 12. t =6,0, gl =4, rejeitar a hiptese nula 16 . cjJ-0,17
d. fa
a 0,05 18. (a) C =0,36, (b) V =0,39
40
29
13
4
e. c%
100
72,5
32,5
10,0
10. (a) 84,82, (b) 29,64

Captulo 4
2. (a) 17,00 e 153,00 (bimodal), (b) 85,00,
(c) 87,12 ~
4. (a) 1, (b)(l,.s), (c) 3
6. (a) 3 e 6, (b) 4, (c) 4,1
8. (a) 6, (b) 4,5, (c) 4,17
10. (a) 12, (b) 7, (c) 7,86
12. (a) +1,0, (b) -0,5, (c) +3,3 , (d) O
14. (a) A~ b-)-4.,..(G)-4,B-
16. (a) 6, (b) 6, (c) 6,26
18. (a) 85,5, (b) 82,4 (c) 80,39
r
Refer4n in/i UI

Referncias Fried, Robert, Introduction to Statistics, Oxford University, 1969.


Guilford, Jay P., Fundamental Statistics in Psychology and Edu tl /iull ,
McGraw-Hill, New York, 1956.
Hagood, Margaret J., and Daniel O. Price, Statistics for Sociologists, ll oll ,
Rinehart and Winston, New York, 1952.
Hammond, Kenneth R., and James E. Householder, Introduction to th tu
tistical Method, Knopf, New York, 1963.
Huff, Darrell, How to Lie with Statistics, Wiley, New York, 1966.
Loether, Herman J., and Donald G. McTavish, lnferential Statistics for So I
ologists, Allyn and Bacon, Boston, 1974.
McNemar, Quinn, Psychological Statistics, Wiley, New York, 1962.
Meyers, Lawrence S., and Neal E. Grossen, Behavioral Research, Freeman,
San Francisco, 1974.
Mueller, John H., Karl F . Schuessler, and Herbert L. Costner, Statistical
Reasoning in Sociology, Houghton Mifflin, Boston, 1970.
Palumbo, Dennis J. , Statistics in Political and Behavioral Science, Ap-
pleton, New York, 1969.
Popham, W. James, and Kenneth A. Sirotnik, Educational Statistics,
Anderson, Theodore R., and Morris Zelditch, Jr., A Basic Course in Sta- Harper & Row, New York, 1973.
tistics, Holt, Rinehart and Winston, New York, 1968. Runyon, Richard P., and Audrey Haber, Fundamentais of B ehavioral Sta-
Blalock, Hubert M., Social Statistics, McGraw-Hill, New York, 1960. tistics, Addison-Wesley, Reading, Mass., 1971.
Campbell, Stephen K., Flaws and Fallacies in Statistical Thinking, Siegel, Sidney, Nonparametric Statistics for the B ehavioral Sciences,
Prentice-Hall, Englewood Cliffs, N.J., 1974. McGraw-Hill, New York, 1956.
Champion, Dean J., Basic Statistics for Social Research Chandler San Spence, Janet T., Benton J. Underwood, Carl P. Duncan, and John W.
Francisco, 1970. ' ' Cotton, Elementary Statistics, Appleton, New York, 1968.
Chase, Clinton 1., Elementary Statistical Procedures, McGraw-Hill, New Walker, Helen Mary, and Joseph Lev, Elementary Statistical Methods, Holt,
York, 1967. Rinehart and Winston, New York, 1958.
Cohen, Lillian, Statistical Methods for Social Scientists, Prentice-Hall, Eng- Wallis, Wilson A., and Harry Roberts, The Nature o(Statistics, Free Press,
lewood Cliffs, N.J., 1954. New York, 1965.
Courts, Frederick A., Psychological Statistics, The Dorsey Press, Home- Welkowitz, Joan , Robert B. Ewen, and J acob Cohen, Introductory Statistics
wood, Ill., 1966. for the Behavioral Sciences, Academic, New York, 1971.
Dixon, Wilfrid J., and Frank J. Massey, Introduction to Statistical Analysis, Williams, Frederick, Reasoning with Statistics, Holt, Rinehart and Win-
McGraw-Hill, New York, 1957. ston, NewYork, 1968.
Dornbusch, Sanford M., and Calvin F. Schmid, A Primer of Social Statis- Winer, B. J ., Statistical Principies in E xperimental Design, McGraw-Hill,
tics, McGraw-Hill, New York, 1955. New York, 1962.
Downey, Kenneth J., Elementary Social Statistics, Random House, New
York, 1975.
Downie, Norville M., and R. W. Heath, Basic Statistical Methods, Harper &
Row, New York, 1974.
Edwards, A. L., Experimental Design in Psychological Research, Holt, Rine-
hart and Winston, New York, 1960.
Edwards, Allen L., Statistical Methods for the Behavioral Sciences, Holt,
Rinehart and Winston, New York, 1967.
Ferguson, George A:, Statistical Analysis in Psychology and Education,
McGraw-H ill, New York, 1966.
Freeman, Linton C., Elementary Applied Statistics, Wiley, New York, 1965.
Freund, John E., Modern Elementary Statistics, Prentice-Hall, Englewood
Cliffs, N.J., 1960.
nuvem de pontos, 210 H

ndice
Distribuio amostrai de diferenas, 129-136 Hiptese,
caractersticas, 129 alternativa, 128
teste de hipteses, 133 experimental, 128-129
Distribuio amostrai de mdias, 107-108 nula, 127-128
caractersticas, 108-109 probanda, 128
como curva normal, 110-111 teste de, 2
Distribuio cumulativa, 26-27 Histograma, 36-37
Distribuio de freqncias,
assimtricas, 40
cumulativas, 26-27 Intervalo de confiana,
dados agrupados, 22-25 clculo, 115
dados nominais, 15 definio, 114
dados ordinais e intervalares, 21-22 noventa e cinco por cento, 115
A Correlao, 208 forma, 40 noventa e nove por cento, 117
coeficiente, 212 simtrica, 40 propores, 119
Amostra, coeficiente de contingncia, 242-243 Intervalo de classe, 22-23
aleatria, 102 coeficiente fi, 240-241 E amplitude, 29
casual, 102-106 coeficiente V de Cramr, 243 definio, 22
definio, 100 curvilnea, 21 O Erro amostra!, 106 limites, 22-25
no-casual, 1O1 de postos, 226 Erro padro da diferena, 138-140 nmero de, 25
randmica, 102 fora da, 208 Erro padro da mdia, 112-114
pontos mdios, 25
Amostras no-casuais, 101 r de Pearson, 212,215 Erro padro da proporo, 120
tamanho, 22
Amplitude, sentido, 209 Erros alfa e beta, 138
clculo, 60 Cramr (V), 243 Escore padro. Ver escore Z
comparada com outras medidas de Escore Z, 89-91 K
~-
variabilidade, 71 Curva normal, 81 clculos, 90-91
definio, 60 rea, 84-86 definio, 89 Kruskal-Wallis (teste de), 200-202
Anlise de varincia, 157-174 caractersticas, 8 2 relativo a diferenas entre mdias, 134-
comparao mltipla de mdias, 170-172 e o mundo real, 82-84 -135
estatstica F, 165 requisitos, 151 L
exigncias, 172 Estatstica, fun es da, 6-13 Linha de rgresso, 221
F crtico, 166 D Estatstica F, 165 equao, 222-223
F observado, 166 exigncias, 172
lgica, 157-158 Decimais, 262-265 frmulas, 165
quadrado mdio, 163-165 Decis, 31 graus de liberdade, 166
razo F, 165 Desvios, 61 Estatsticas no-paramtricas, 175-176 M
soma dos quadrados, 158-159 afastamento, 61 Experimental (hiptese), 128-1 29
Aplicaes das estatsticas, 249-260 clculo, 46
A~metri~40-41 definio, 46, 61 F Mdia,
discrepncia, 46 clculo, 45-4 7
Y Desvio mdio, Fi (coeficiente), 240 comparada com outras medidas de
B clculo, 61-63 tendncia central, 45-4 7
comparado com outras medidas de de dados agrupados numa distribuio
Bicaudal, 82 variabilidade, 71 G de freqncias, 53-54
Binomial, de dados agrupados numa distribuio de dados isolados, 4 7
distribuio, 98 de freqncias, 72-75 Gama de Goodman e Kruskal, definio, 45
definio, 61 frmula, 232 Mediana,
,1. Desvio padro , postos empatados, 236 clculo, 43-44
clculo, 67-68 requisitos, 23 9 comparada com outras medidas de
c comparado com outras medidas de significncia, 238-239 tendncia central, 47-52
variabilidade, 71 Grfico de barras, 35-36 de dados agrupados numa distribuio
Coeficiente de contingncia, 242 de dados isolados, 67-68 construo do, 36 de freqncias, 52-53
Coeficiente de correlao de postos, 242 definio, 63-74 Grficos setoriais, 35 de dados isolados, 44-45
frmula, 226 frmula para dados brutos, 66-67 Graus de liberdade, 143-144 definio, 43
postos empatados, 227 para dados agrupados numa distribui- qui-quadrado, 179 Mtodos de amostragem, 101
postos espelhados, 227 o de freqncias, 72-73 r de Pearson, 179 Moda,
procedimentos, 227 significado, 69-70 razo F, 165 comparada com outras medidas de
significncia, 229 Diagrama de disperso, 208 razo t, 151 tendncia central, 4 7-5 2
310 Indice

de dados'W;. upado~
/87n"'
f l.o
de freqncias, 51 .u.:..~,o . ...l..
definio, 42 d-efin'a-&?
distribuies bimod1S, 3 Razo t, 143 ~
amostn c. , !1-' .ho, 140-142
N amostr s 11 atnanr ~iferentes, 146-
-148
Nvel de confiana, 136-137
Nvel de mensurao, 3-6
intervalar, 6
estatstica t, 143
graus de liberdade, 143-144
mesma amostra mensurada duas vezes,
nominal, 4 148-151
ordinal, 5 , reguisitos, 151
Nvel de significncia, 136-138 . :'"'
Nvel intervalar oe mensurao, 6
Nvel nominal de mensurao, 4 . !, .
Nula (hiptese), 127-128 s
Nmeros negativos, 265-266 .. . ~:
Significncia (nvel). Ver nvel de confiana,
o Soma de quadrados,
clculos, 161
Ordinal (nvel de mensurao), 5 definio, 158
dentrodos grupos, 160'
p entre grupos, 160
Paramtricos (t~t~s), 17 5-176 ~ total, 161
Pearsqn (coefiCiente de correlao linear),
- frmula;~15-2"l6 T
graus de 'liberda.cie, 217 ; . Taxa
requisitos, 218 clculo, 20
significncia, 216-218 . definio, 20
Pesquisa, 2-4 Taxa de mudana,
Poder, 176 clculo, 21 .
Polgono de freqncia, 37-39 . definio, 21
,, construo, ~9 . ., Tendncia ceil trai, 4 2 .
Poigono de freqncias acumuladas, 38-19 comparao' de medid~s, 4 7
ogiva de Galtpn,, mdia 45 .. . .
;:. media~a, 43 .... ,..
Porcentagem,
moda,'42 . . .
_,..,:,_ clcjllo~~ -- "" '< Teste da mediana,-;')4-1% Y
-.i'~ fli
~~~~'!* .. . .f:
' 1if
~ : ' ~ Teste de Friedman (dupla anJise de varin-
.P?sto percenti, 27-31 cia) 197-200
Tukey (DHS de), 172o174
Q . ~
QuadrJ!fiq ndi0;l63_:J65 . ; u : -
Quarti's/29-30 ' < / <: '" "': Uiicaudal,, 97
Qui-qadrado, 176 : .
clculo, 177-180 v
comparao de diversos grupos, 187-
-192 Variabilidade, 59
crtico, 179 amplitude, 60
de aderncia (prova de), 181 comparao de medidas, 71
de homogeneidade (prova de), 177 desvio mdio, 61-63
frmula para clculo, 1.84-185 desvio padro, 63-71
freqncias esperadas, 180-181 .
freqncias esperadas 'pequenas, 185 y
freqncias tericas, 180-181 . Yates (correo de), 185 N Cham. 31 O I L66E
graus de liberdade, 179 correo de continuidade, 186
observado, 178
requisitos, 192-19,3 Ttulo BSTAili'ISTICA APb.ICAE>A A CIENCIAS
teste de significncia, 176 z
Z (escala), 95
R
Razes quadradas, 266-267
Randmica (amostra), 102c103
11111111111
aleatri (amostra), 102-103 UFPA- BC 8'71674 020892
casual (amostra), 102-103

S-ar putea să vă placă și