Sunteți pe pagina 1din 35

UFRJ - Introduo Estatstica

Professor Otvio Figueiredo (otavio@ufrj.br) 1

1 - RESUMO DE DADOS

1.1 - Introduo

O que a Estatstica ?

Segundo o Dicionrio de Lngua Portuguesa Aurlio:

1 Parte da matemtica em que se investigam processos de obteno, organizao e


anlise de dados sobre uma coleo de seres quaisquer, e mtodos de tirar concluses e
2
fazer predies com base nesses dados. Conjunto de elementos numricos relativos a
um fato social.

Para muitas pessoas, a palavra estatstica faz lembrar longas colunas de nmeros, grficos
misteriosos e diagramas assustadores, que mostram de que forma o governo est gastando
o dinheiro dos impostos. No passado, esta palavra referia-se exclusivamente informaes
numricas de que os governos necessitavam para planejar sua conduta. Os estatsticos
eram pessoas que coletavam grandes quantidades de informaes numricas. Alguns
estatsticos ainda realizam este tipo de trabalho, mas existem outros que auxiliam a conduzir
e interpretar experimentos cientficos e pesquisas profissionais. As mudanas no significado
da palavra estatstica acompanharam as mudanas ocorridas no tipo de trabalho realizado
pelos estatsticos. A palavra estatstica pode ser utilizada para designar dados numricos,
como, por exemplo, estatsticas esportivas ou estatsticas financeiras. Entretanto, a palavra
pode tambm se referir estatstica como uma disciplina prpria da mesma forma que a
matemtica ou a economia.

Um documento da Comisso de Servio Civil dos Estados Unidos diz que Estatstica a
cincia que coleta, classifica e avalia numericamente fatos que serviro de base para
inferncias. um conjunto de tcnicas para se obter conhecimento preciso a partir de
informaes incompletas; um sistema cientfico para coleta, organizao, anlise,
interpretao e apresentao de informaes que possam ser colocadas sob forma
numrica.

A seguinte definio bem mais simples: A Estatstica trata de idias e mtodos que
visam a aperfeioar a obteno de concluses a partir de informaes numricas, na
presena de incerteza. Apesar desta definio no ser to abrangente quanto a anterior,
ela enfatiza o aspecto da estatstica que mais ir nos interessar neste curso, qual seja, o de
como utilizar informaes incompletas para tomar decises vlidas e tirar concluses
satisfatrias.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 2

Princpios bsicos

Se a vida fosse estvel e rotineiramente repetitiva ou, ainda, se o objeto ao qual se destinam
as concluses de uma pesquisa pudesse ser estudado em sua plenitude, certamente pouca
necessidade teria da Estatstica.

Ocorre, entretanto, que o conhecimento humano se amplia atravs da observao ou da


experimentao e que estas prticas podem produzir resultados diferentes, mesmo que
repetidas sob idnticas condies. Os lanamentos de uma mesma moeda podero no
fornecer os mesmos resultados ou, ainda, indivduos colocados sob um mesmo esquema de
treinamento tendem a reagir de maneira distinta.

Nestes casos, duas idias so de fundamental importncia. Primeiramente, embora as


observaes sejam variveis, sempre possvel associar a elas a idia de regularidade e
expressar essa regularidade matematicamente, ou seja, mesmo que exista uma variabilidade
inerente, possvel conhecer a forma como os valores ocorrem ou se distribuem. Por outro
lado, devido variabilidade inerente aos indivduos, os pontos de interesse da Estatstica
so referentes aos conjuntos ou grupos de indivduos ou, melhor dizendo, estuda-se os
indivduos atravs dos conjuntos.

Ao coletar os dados referentes s caractersticas de um grupo de objetos ou indivduos,


muitas vezes impossvel ou impraticvel observar todo o grupo, j que ele muito grande.
Em vez de examinar todo o grupo, denominado populao ou universo, examina-se uma
pequena parte ou subconjunto chamada amostra.

Uma medida usada para descrever uma caracterstica da populao chamada de


parmetro que uma constante da populao que est sendo considerada. J uma medida
descritiva dos dados de observao da amostra denominada de estatstica que uma
varivel, pois apresenta valores diferentes para diferentes amostras de uma populao.

A parte da estatstica que cuida da apresentao dos dados observados por meio de uso de
tabelas, de grficos e de medidas dentre as quais se destacam as medidas de posio e de
disperso a Estatstica Descritiva ou Anlise Exploratria de Dados.

Quando uma amostra representativa de uma populao, i.e., possui as mesmas


caractersticas bsicas da mesma, concluses importantes sobre a populao podem ser
inferidas de sua anlise. A parte da estatstica que trata das condies sob as quais essas
inferncias so vlidas chama-se Inferncia Estatstica ou Analise Confirmatria. A base
matemtica da inferncia a Probabilidade que a linguagem para abordar os problemas
permitindo quantificar o grau de incerteza das decises estatsticas. A inferncia estatstica
envolve questes de dois tipos: a estimao de parmetros populacionais e os testes de
hipteses.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 3

A Estatstica, mesmo sendo um importante instrumento auxiliar na pesquisa e na


interpretao dos fenmenos, tem as suas limitaes quanto ao uso.

A Estatstica no serve para corrigir erros grosseiros nem tcnicas defeituosas. Como toda
informao est contida nos dados, se esses so viciados, ser falsa qualquer concluso
que deles se tire.

A Estatstica no substitui o julgamento crtico. Ela fornece critrios que auxiliam na tomada
de decises, mas no dispensa a anlise crtica do pesquisador.

1.2 - Estatstica Descritiva

Em qualquer trabalho de levantamento de informaes, o interessado se v s voltas com o


problema de analisar e entender um conjunto de dados relevante ao seu particular objeto de
estudo. O significado desse conjunto de dados, muitas vezes, s compreendido ou
visualizado quando esto apresentados ou sumarizados numa forma eficiente.

Convm ressaltar que a organizao dos dados de maneira prtica e racional para o melhor
entendimento do problema em questo, deve ser precedida de uma crtica dos dados
objetivando a eliminao de erros capazes de provocar futuros enganos de apresentao e
anlise, e dessa forma, retirando ou corrigindo os valores estranhos ao levantamento.

Esta organizao dos dados denomina-se srie estatstica, que pode ser apresentada por
meio de tabelas ou grficos.

Estas notas tem por objetivo mostrar a importncia da organizao, resumo e apresentao
dessa srie estatstica, buscando dessa forma alguma regularidade ou padro ou ainda uma
lei de comportamento (modelo) presente nas observaes.

1.2.1 - Coleta, Crtica e Tabulao de dados

Aps a definio do problema a ser estudado e o estabelecimento e execuo do


planejamento da pesquisa ou investigao, o passo seguinte a coleta de dados. Para isto,
deve ser preparado um esquema onde essa coleta de dados seja facilitada de forma a
minimizar possveis erros neste momento.

Coletados os dados, procede-se a uma reviso crtica dos dados com a finalidade de
verificar a exatido das informaes, como tambm de obter quaisquer esclarecimentos
complementares, corrigir informaes porventura ainda precrias, ou ainda, se for o caso,
promover nova indagao a respeito de determinados aspectos.

Consequentemente acompanhando as crticas, feita a tabulao dos dados, isto , separar


e grupar adequadamente os dados estatsticos a fim de serem apresentados aos
interessados. Isto d origem as chamadas Sries Estatsticas.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 4

1.2.2 - Tipos de Dados

De um modo geral, para cada elemento investigado, tem-se associado um resultado (ou
mais de um resultado) correspondendo realizao de uma certa varivel (variveis). Pode-
se conceituar varivel como sendo uma caracterstica mensurvel de acordo com alguma
escala; e dados como aquele conjunto de nmeros coletados. Todo dado um valor de uma
varivel.

A classificao de um dado pode ser:

Tipo de dado Exemplo


falhas: triviais, srias, desastrosas;
ordinal
qualitativo classes de renda: alta, mdia, baixa
nominal ou conforme ou no-conforme;
categrico tipo sanguneo: A, B, AB, O
Nmero de acidentes no trnsito;
discreto
quantitativo Nmero de alunos matriculados na Universidade
Peso de um homem;
contnuo
Distncia percorrida por um carro de entregas

Os dados qualitativos so aqueles que apresentam uma qualidade ou atributo do elemento


pesquisado, podendo ser: ordinais, apresentando ordenao nos seus dados; ou nominais
(ou categricos), no apresentando nenhuma ordenao.

J os dados quantitativos so aqueles que apresentam nmeros resultantes de uma


contagem ou mensurao, podendo ser: discretos, formando um conjunto finito ou
enumervel de nmeros, resultantes frequentemente de uma contagem; ou contnuos,
formando um intervalo de nmeros reais que tomam um nmero infinito (no enumervel) de
valores, resultantes de uma mensurao.

Para cada tipo de dado, existem tcnicas mais apropriadas para resumir as informaes e
tambm para analis-las.

1.2.3 - Unidade de Medida dos Dados

Em toda apresentao de dados fundamental estar especificada a unidade de medida


destes dados, podendo ser expressa na forma mais conveniente (por extenso ou em
smbolos), desde que seja compreensvel por si mesma ou venha claramente definida.

Esse item vital e de extrema importncia na apresentao de dados visto que sua medio
pode ser expressa em diversas unidades diferentes. Seu conhecimento permitir a
compreenso bsica do fenmeno que o dado est descrevendo.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 5

1.3 - Tabelas

Na apresentao de dados por meio de tabelas, convm lembrar algumas normas gerais
para a sua construo de forma a fornecer o mximo de informaes de maneira clara e
concisa.

Toda tabela apresenta alguns elementos importantes a serem destacados, como:

o ttulo deve ser conciso e adequado, precedendo a tabela, informando o fato observado,
como tambm, se possvel, local ou poca em que ocorreu;

o corpo da tabela o conjunto de linhas e colunas onde esto discriminados os dados;

o cabealho a parte superior da tabela onde se especifica o contedo das colunas;

a fonte dos dados deve ser informada no rodap da tabela, quando necessria;

as notas explicativas devem ser colocadas no rodap da tabela, destinando-se a


esclarecer o contedo da tabela;

as chamadas de esclarecimentos so smbolos ou nmeros existentes no corpo da tabela,


sendo especificadas no rodap da mesma, destinando-se a esclarecer algo sobre este
dado especfico;

informar a unidade de medida dos resultados;

a tabela deve ser delimitada no alto e na base por traos horizontais e no deve ser
delimitada nas margens. facultativo o uso de traos verticais na separao das colunas
no corpo da tabela;

quando uma tabela tiver de ocupar mais de uma pgina, deve-se sempre repetir o
cabealho da tabela nas pginas seguintes, acrescentando no ttulo a palavra
"continuao". facultativo informar no rodap da tabela a palavra "continua";

quando uma tabela possuir muitas linhas e poucas colunas, poder ser disposta em duas
ou mais partes, lado a lado, separando-se as partes por um trao duplo;

quando os nmeros forem muito extensos, para maior facilidade de percepo,


conveniente arredond-los para centenas, milhares ou milhes, informando a unidade
utilizada; e

a separao da parte inteira da parte decimal de um nmero deve ser sempre feita por
uma vrgula, lembrando-se que, em situaes que utilizam-se pacotes em lngua inglesa,
o sistema ingls de escrita de nmeros, troca a vrgula pelo ponto.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 6

Exemplo:

Durante o perodo de janeiro a maro de 1998, as associaes de comerciantes dos bairros


da Barra da Tijuca, Botafogo, Icara e Ipanema divulgaram o valor em milhes de reais das
compras realizadas. Respectivamente nos bairros da Barra da Tijuca, Botafogo, Icara e
Ipanema foram : em janeiro 22,7, 19,3, 10,8, 13,0, em fevereiro 35,0, 21,7, 20,6, 23,6 e
finalmente em maro 34,0, 20,0, 22,5 e 21,5.

Sendo assim tabulou-se os dados da seguinte forma:

Valor comercializado em milhes de reais


em alguns dos principais bairros do Estado do Rio de Janeiro no 1o trimestre de 1998
Ms/1998
Bairro Janeiro Fevereiro Maro Total
Barra da Tijuca 22,7 35,0 34,0 91,7
Botafogo 19,3 21,2 22,0 62,5
Icara 10,8 20,6 22,5 53,9
Ipanema 13,0 23,1 11,5 47,6
Total 65,8 99,9 90,0 255,7
Fonte: Associao dos Comerciantes dos Bairros

1.3.1 - Distribuio de Freqncia

A distribuio de frequncia consiste num arranjo tabular dos dados por valores ou por
classes de valores, juntamente com as frequncias correspondentes, j que, quando se
resume grandes massas de dados, costuma-se distribu-los segundo os prprios valores
determinando o nmero de ocorrncias pertencentes a cada um dos valores, ou distribu-los
em classes de valores determinando a frequncia de cada classe, ou melhor, o nmero de
ocorrncias pertencentes a cada uma das classes.

A distribuio de frequncia ou tabela de frequncia uma maneira de dispor o conjunto de


dados obtidos, de modo a se ter uma idia global de sua distribuio. Sua utilizao ,
normalmente recomendada, quando o conjunto de dados a ser analisado consiste de um
nmero relativamente grande de ocorrncias.

As variveis, onde o uso de distribuio de frequncia indicado para o resumo e


organizao dos dados, so sempre de natureza quantitativa ou qualitativa de carter
ordinal.

Se a varivel for qualitativa ordinal ou quantitativa do tipo discreta, em geral, o resumo dos
dados ser obtido atravs da elaborao da Distribuio de Frequncia por valores.
Entretanto, quando estas variveis apresentarem um nmero grande de diferentes valores,
estes podero ser agrupados em classes, e assim, resumidos numa Distribuio de
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 7

Frequncia por classes de valores.

Para as variveis quantitativas contnuas o uso da Distribuio de Frequncia por classes


de valores sempre o mais conveniente.

1.3.1.1 - Distribuio de Freqncia por valores

1. Determinar os diversos valores que ocorreram para a varivel de interesse e posicion-


los segundo sua ordem natural.

2. Construir uma tabela, onde cada coluna dever ter, respectivamente, os seguintes
enunciados: valores observados da varivel de interesse, Frequncia simples absoluta
(freqncia ni), Frequncia simples relativa (freqncia fi) e/ou Porcentagem.

onde: Freqncia simples absoluta - nmero de vezes que cada valor ocorreu;
Freqncia simples relativa - a freqncia simples absoluta de cada valor
n
dividida pelo nmero total de dados obtidos fi = i
n
Porcentagem - 100 x fi

3. Colocar ttulo na tabela contendo as informaes necessrias, tais como: o estudo sob
avaliao, quando e onde foi realizado, a resposta de interesse e a unidade de medida.

4. Colocar informaes complementares, se necessrio, tais como: a Fonte, onde se indica


a entidade responsvel pelo fornecimento dos dados e as Notas, destinadas a fornecer
esclarecimentos de natureza geral. Estas devem se situar de preferncia abaixo da
tabela.

1.3.1.2 - Distribuio de Freqncia por classes de valores

1. Determinar o maior e o menor valor da srie de valores e em seguida calcular a amplitude


total (R) definida por:
R=Maior valor - Menor valor

2. Determinar o nmero de intervalos de classe de acordo com sua familiaridade com os


dados e experincia anterior. Entretando deve-se observar que com um pequeno nmero
de classes, perde-se informao, e com um nmero grande de classes foge-se ao objetivo
de resumir os dados. Normalmente sugere-se o uso de 5 a 15 classes de igual amplitude.
Outra sugesto seria utilizar a soluo abaixo:
k=5, para n 25 e
k n , para 25 < n 400
k=20, para n > 400
onde: k - nmero de intervalos;
n - nmero total de dados.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 8

3. Determinar a amplitude dos intervalos de classe (A) atravs da diviso da amplitude total
(R) pelo nmero de intervalos de classe (k), i.e.,
R
A=
k
Utilizar o menor valor da srie ou arredonda-lo para um valor apropriadamente menor,
obtendo assim o valor inferior da 1a classe. A seguir adicionar a este no a amplitude do
intervalo de classe (A), encontrando o limite inferior da prxima classe e assim
sucessivamente at que o no de classes seja alcanado. Este procedimento faz com que
cada classe seja mutuamente exclusiva.

Utiliza-se para a representao dos intervalos de classe as seguintes notaes:

|-- incluso do limite inferior e excluso do limite superior.


|--| incluso de ambos os limites.

4. Construir uma tabela, onde cada coluna dever ter, respectivamente, os seguintes
enunciados: Classe de valores <varivel de interesse>, Ponto mdio da classe,
Frequncia simples absoluta (freqncia ni), Frequncia simples relativa (freqncia fi)
e/ou Porcentagem.

onde: Ponto mdio - (Limite Inferior + Limite Superior) / 2


Freqncia simples absoluta - nmero de vezes que cada valor ocorreu;
Freqncia simples relativa - a freqncia simples absoluta de cada valor
dividida pelo nmero total de dados obtidos fi = n i
n
Porcentagem - 100 x fi

5. Colocar ttulo na tabela contendo as informaes necessrias, tais como: o estudo sob
avaliao, quando e onde foi realizado, a resposta de interesse e a unidade de medida.

6. Colocar informaes complementares, se necessrio, tais como: a Fonte, onde se indica


a entidade responsvel pelo fornecimento dos dados e as Notas, destinadas a fornecer
esclarecimentos de natureza geral. Estas devem se situar de preferncia abaixo da
tabela.

Exemplo
1.3.1.1 - Distribuio de Freqncia por valores
Quatro moedas foram lanadas 4 vezes, em cada lance, foi anotado o nmero de caras.
CKKK-(1); CCCK-(3); KKCC-(2); CCKK-(2); KKCK-(1); KKKC-(1); CKKK-(1); CCCK-(3);
KKKK-(0); CKCK-(2); KKKC-(1); CCKC-(3); CKCC-(3); KCCC-(3); CKKK-(1); KCCC-(3);
CKKC-(2); CKKK-(1); KKCC-(2); KCCC-(3); CKCC-(3); CCKC-(3); KKKC-(1); CKKC-(2);
CCCK-(3); KKKK-(0); CKKC-(2); KKKC-(1); CKKC-(2); CCCC-(4); KKKC-(1); KCKK-(1);
KKCC-(2); KCKK-(1); CKCK-(2); CCKK-(2); KCKC-(2); CKCC-(3); CKKC-(2) e CKCK-(2)
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 9

Siga o roteiro do texto:


Estudo da distribuio de freqncia do nmero de caras obtidos em 40 lanamentos de 4
moedas no viciadas - 0, 1, 2, 3, 4

DISTRIBUIO DE FREQNCIA DO NMERO DE CARAS OBTIDOS


EM 40 LANAMENTOS DE 4 MOEDAS NO VICIADAS
Freqncia Simples
o
N de Caras Absoluta Relativa Porcentagem
0 2 0.050 5,0
1 12 0.300 30,9
2 14 0.350 35,0
3 11 0.275 27,5
4 1 0.025 2,5
Total 40 1.000 100,0
Nota: Os dados que geraram a tabela so fictcios

1.3.1.2 - Distribuio de Freqncia por classes de valores

Os graus finais de clculo de 80 estudantes do Curso de Vero da Universidade Federal do


Rio de Janeiro esto relacionados abaixo.
68; 84; 75; 82; 68; 90; 62; 88; 76; 93; 73; 79; 88; 73; 60; 93; 71; 59; 85; 75;
61; 65; 75; 87; 74; 62; 95; 78; 63; 72; 66; 78; 82; 75; 94; 77; 69; 74; 68; 60;
96; 78; 89; 61; 75; 95; 60; 79; 83; 71; 79; 62; 67; 97; 78; 85; 76; 65; 71; 75;
65; 80; 73; 57; 88; 78; 62; 76; 53; 74; 86; 67; 73; 81; 72; 63; 76; 75; 85 e 77

Siga o roteiro do texto:


Estudo da distribuio dos graus dos alunos do curso de vero de clculo da UFRJ
Menor valor 53 e maior valor 97 - R=44

NOTAS DOS ALUNOS DE CLCULO DO CURSO DE VERO DE 1998 DA UFRJ


No da Classe Ponto Freqncia Simples
Classe de Notas Mdio Absoluta Relativa Porcentagem
1 50 |-- 60 55 3 0,0375 3,75
2 60 |-- 70 65 21 0,2625 26,25
3 70 |-- 80 75 33 0,4125 41,25
4 80 |-- 90 85 15 0,1875 18,75
5 90 |-- 100 95 8 0,1000 10,00
Total - - 80 1,0000 100,00
Fonte: Universidade Federal do Rio de Janeiro
Nota: Os dados que geraram a tabela so fictcios
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 10

Outra soluo:

Como n=80 k n k 9
Amplitude dos intervalos = 44/9 5
53 a 58, 58 a 63, , 93 a 98

NOTAS DOS ALUNOS DE CLCULO DO CURSO DE VERO DE 1998 DA UFRJ


No da Classe Ponto Freqncia Simples
Classe de Notas Mdio Absoluta Relativa Porcentagem
1 53 |-- 58 55,5 2 0.0250 2,50
2 58 |-- 63 60,5 10 0.1250 12,50
3 63 |-- 68 65,5 8 0.1000 10,00
4 68 |-- 73 70,5 9 0.1125 11,25
5 73 |-- 78 75,5 20 0.2500 25,00
6 78 |-- 83 80,5 12 0.1500 15,00
7 83 |-- 88 85,5 7 0.0875 8,75
8 88 |-- 93 90,5 5 0.0625 6,25
9 93 |-- 98 95,5 7 0.0875 8,75
Total - - 80 1.0000 100,00
Fonte: Universidade Federal do Rio de Janeiro
Nota: Os dados que geraram a tabela so fictcios

1.4 - Representao Grfica


A representao grfica uma das possibilidades de apresentao de dados estatsticos
sob uma forma ilustrada, produzindo uma viso mais clara e imediata dos resultados.
1.4.1 - Grfico de Coluna
Este grfico utilizado para permitir uma visualizao, por meio de retngulos verticais, dos
resultados obtidos a partir de um determinado processo, com o objetivo de :
- Dar nfase a comparao de resultados;
- Mostrar como est constitudo um valor total.

Em geral, utilizado para sries especificativas e geogrficas. No aconselha-se o emprego


deste tipo de grfico para sries do tipo temporal. O grfico de colunas pode ser usado para
esse tipo de representao apenas quando o nmero de perodos cronolgicos for pequeno.
O grfico de colunas proporciona a visualizao dos resultados atravs de retngulos em
posio vertical e de mesma largura, marcados em um grfico de dois eixos: um horizontal e
um vertical. Os fatores associados a varivel de interesse so colocados no eixo horizontal,
enquanto que no eixo vertical determinada a escala dos resultados correspondente aos
valores que a varivel de interesse assumir.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 11

Cabe ressaltar que, no existe nenhuma regra quanto aos espaos entre as colunas.
Recomenda-se, contudo, obedecer a um princpio geral de que, havendo poucas colunas,
estas devem ser mais estreitas do que os espaos entre elas e, havendo muitas colunas, os
espaos devem ser mais estreitos do que a largura das colunas.
Conforme o objetivo desejado, as colunas podem ser ordenadas em sequncia alfabtica,
cronolgica ou numrica, sendo que a mais comum a ordem numrica, ou seja, pela
importncia de cada resultado. Desta maneira, a reduo do comprimento das colunas
comea da esquerda para a direita, dando aparncia mais esttica.
Deve-se lembrar que, no aconselhvel escrever dados numricos no topo ou no interior
das colunas, visto que alm de fugir ao objetivo de um grfico, pode produzir uma iluso de
tica bastante prejudicial.

Dentre as variaes de confeco de grficos de colunas, destacam-se as descritas a


seguir.

1.4.1.1 - Grfico de Colunas Simples


Sua aplicao permite comparao dos resultados de tratamentos de um s tipo de fator.
o mais usado devido a sua simplicidade e objetividade.
As colunas que so colocadas no eixo horizontal, representam os tratamentos do fator
associado varivel de interesse e consistem em retngulos de mesma largura, paralelos
ao eixo vertical, que apresentam como altura, o comprimento desde o eixo horizontal at os
respectivos resultados assumidos pela varivel de interesse. Como pode ser visto na figura
a seguir, os dados so de uma mesma poca, mas de locais diferentes, dando-se
preferncia a ordem decrescente.
PRODUO DE SOJA (Toneladas)
SAFRA DE 1984 - REGIO SUDESTE

15000
TONELADAS

10000

5000

0
SP MG RJ ES
LOCAL
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 12

A seguir, encontram-se as instrues para construo do grfico de colunas simples.


1. Traar um grfico de dois eixos: um horizontal e um vertical. No eixo horizontal, colocar
os tratamentos do fator associado varivel de interesse, ordenando na sequncia de
preferncia. Marcar as bases dos retngulos, que devem ser de mesmo tamanho.
Ressalta-se que, havendo poucas colunas, estas devem ser mais estreitas do que os
espaos intermedirios e havendo muitas colunas, os espaos devem ser mais estreitos
do que a largura das colunas. No eixo vertical, marcar a escala correspondente aos
valores que a varivel de interesse pode assumir. Dever ter como limite inferior zero ou
o valor abaixo do mnimo possvel e como limite superior um valor acima do mximo que
dever ser marcado, colocando sua unidade de medida.
2. A partir das bases marcadas para os retngulos no eixo horizontal, determinar as alturas
dos mesmos, traando a partir deste eixo, linhas paralelas ao eixo vertical at atingir os
respectivos resultados assumidos pela varivel de interesse.
3. Colocar ttulo no grfico, contendo as informaes necessrias, tais como: o estudo sob
avaliao, quando e onde foi realizado, a resposta de interesse e a unidade de medida.
Colocar legenda, se necessrio, com os smbolos e descries correspondentes s
informaes contidas no grfico.
4. Colocar informaes complementares, se necessrio, tais como: a Fonte, onde se indica
a entidade responsvel pelo fornecimento dos dados e as Notas, destinadas a fornecer
esclarecimentos de natureza geral. Estas devem se situar, de preferncia, abaixo do
grfico.

1.4.1.2 - Grfico de Colunas Composto


Sua utilizao permite que a comparao entre os resultados de tratamentos de diferentes
fatores seja feita ao mesmo tempo. importante, porm, no exagerar o nmero de fatores,
para no comprometer sua apresentao. Como pode ser visto a seguir, a apresentao
pode ser feita de duas formas, relacionadas ao objetivo da comparao.
a) Colunas Agrupadas
utilizado, quando o objetivo principal possibilitar uma anlise de variaes dos
resultados dos tratamentos dos diversos fatores.
Neste caso, as colunas, que representam os fatores associados varivel de interesse, so
colocadas no eixo horizontal e consistem em retngulos de mesma largura, paralelos ao eixo
vertical. Ao colocar os fatores no eixo horizontal, alguns podem vir descritos sob a forma de
legenda, sendo seus tratamentos diferenciados no grfico por meio de cores ou hachuras e
os grupos de colunas devem estar separados entre si. As colunas tem como altura, o
comprimento desde o eixo horizontal at os respectivos resultados assumidos pela varivel
de interesse nos tratamentos dos diversos fatores.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 13

Tem-se o exemplo a seguir, para este tipo de grfico.


TELEVISES VT VIDEO
NMERO DE DEFEITOS NA VERSO 19
DEZEMBRO DE 1997

NMERO DE DEFEITOS
60
50
40
30
20
10
0
A B C D
TIPO DE DEFEITO

FBRICA: Rio de Janeiro So Paulo Manaus

TIPO DE DEFEITO: A: Arranho no Gabinete


B: Gabinete danificado
C: Arranho no Video
D: TV no funciona

A seguir, encontram-se as instrues para construo do grfico de colunas composto com


colunas agrupadas:
1. Traar um grfico de dois eixos: um horizontal e um vertical. No eixo horizontal, para cada
fator, marcar as bases das colunas referentes aos tratamentos, escolhendo o fator que
ser descrito na legenda, cujos tratamentos sero diferenciados por meio de cores ou
hachuras. Estas bases devem ser de mesmo tamanho, estando agrupadas conforme o
outro fator especificado no prprio eixo, sendo necessrio que os grupos de colunas
estejam separados entre si. No eixo vertical, marcar a escala correspondente aos valores
que a varivel de interesse pode assumir. Dever ter como limite inferior zero ou o valor
abaixo do mnimo possvel e como limite superior um valor acima do mximo que dever
ser marcado, colocando sua unidade de medida.
2. A partir das bases marcadas para os retngulos no eixo horizontal, determinar as alturas
dos mesmos, traando a partir deste eixo, linhas paralelas ao eixo vertical at atingir os
respectivos resultados assumidos pela varivel de interesse.
3. Colocar ttulo no grfico, contendo as informaes necessrias tais como: o estudo sob
avaliao, quando e onde foi realizado, a resposta de interesse e a unidade de medida.
Colocar legenda com os smbolos e descries correspondentes s informaes contidas
no grfico.
4. Colocar informaes complementares, se necessrio, tais como: a Fonte, onde se indica
a entidade responsvel pelo fornecimento dos dados e as Notas, destinadas a fornecer
esclarecimentos de natureza geral. Estas devem se situar, de preferncia, abaixo do
grfico.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 14

1.4.2 - Histograma

O histograma a ferramenta utilizada para representar graficamente a distribuio de


frequncia de uma determinada caracterstica medida.
Esta ferramenta tem como objetivos:
Identificar o padro de distribuio da caracterstica medida (varivel quantitativa), tal
como, verificar se os dados adquiridos num processo esto distribudos mais a direita ou
mais a esquerda de um ponto de especificao;
Informar rpida e concisamente a variabilidade da distribuio de frequncia de uma
varivel;
Permitir uma melhor visualizao do comportamento dos dados.
Cabe lembrar que, para utilizar o histograma deve-se dispor de uma grande quantidade de
dados, ou seja, recomenda-se ter um nmero total de observaes maior que 30.
O histograma uma representao grfica da frequncia com que certos dados ocorrem
(distribuio de frequncia) atravs de uma srie de retngulos justapostos, onde as bases
dos retngulos so definidas pelas amplitudes de cada intervalo de classe e as alturas so
proporcionais s frequncias relativas referentes a cada intervalo de classe correspondente.
O nico cuidado a tomar de que a rea total da figura seja igual a 1, correspondendo
soma total das propores. Desta forma, a altura de cada retngulo ser determinada,
dividindo-se a frequncia da respectiva classe pelo intervalo de classe. Estas alturas so
conhecidas por densidades de frequncias e indicam qual a concentrao por unidade
da varivel.
Quando os intervalos de classe so iguais comum que nos histogramas, as frequncias
no sejam divididas pelo intervalo de classe j que o aspecto do grfico no se altera, seno
por uma modificao na escala vertical. J quando os intervalos de classes so desiguais
fundamental que as alturas dos retngulos correspondam s frequncias das respectivas
classes, divididas pelas suas amplitudes de classe, a fim de que as reas dos retngulos
coincidam com as frequncias relativas das classes, no distorcendo assim, a compreenso
da distribuio dos dados.
Para a distribuio de frequncia por valores possvel construir um histograma usando um
artifcio de considerar os valores obtidos como sendo os pontos mdios das bases dos
retngulos que formam o histograma.
Esta tcnica apresenta uma visualizao dos dados que permite ver melhor 3 propriedades
deste conjunto de dados obtidos num determinado processo: a forma da distribuio, a
visualizao da tendncia central e a disperso.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 15

O contorno externo de um histograma, isto , a linha mais forte da figura seguinte, chama-se
Poligonal Caracterstica do conjunto de dados obtidos num processo, fornecendo uma idia
da variao do processo analisado. A rea sob a poligonal caracterstica corresponde a
frequncia total, uma vez que se compe de retngulos cujas reas equivalem s
frequncias de cada classe.

FREQ.

CLASSE DE VALORES

Muitas vezes, porm, representa-se a distribuio dos dados do processo, de um modo mais
parecido com o diagrama de curvas, tendo-se, ento, o Polgono de Frequncia, que
obtido com a ligao dos pontos mdios de cada intervalo de classe, como pode ser visto
nas figuras a seguir.

Nota-se, que o Polgono de Frequncia fechado, tomando-se uma classe anterior


primeira e uma classe posterior ltima, j que ambas possuem frequncia zero.
A seguir, encontram-se as instrues para a construo do histograma.
1. Construir uma tabela de distribuio de frequncia. Cabe lembrar que, para a construo
do histograma, bastam as seguintes informaes nesta tabela: nmero das classes,
intervalos de classe e frequncia simples absoluta.
2. Calcular os pontos mdios referentes a cada classe, somando o limite inferior e o limite
superior e dividindo este resultado por 2. Os resultados determinados devem ser
colocados na tabela construda no item anterior (1).
3. Traar um grfico com dois eixos: um horizontal e um vertical. Colocar no eixo horizontal
(eixo X) as bases dos retngulos que correspondem aos intervalos de classe. A
descrio das classes deve ser colocada neste eixo, e corresponder ao valor do ponto
central de cada classe (no centro da base de cada retngulo) ou dos prprios limites dos
intervalos (em cada lado do retngulo).
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 16

4. Estabelecer a medida de frequncia que ser utilizada no histograma. Como se sabe,


as reas dos retngulos tm que ser proporcionais s frequncias das classes, ou coincidir
com suas frequncias relativas, logo:
Se todos os intervalos tiverem a mesma amplitude, as alturas dos retngulos so
proporcionais s frequncias das classes e, pode-se considerar as prprias
frequncias simples como sendo os valores das alturas, sem perda nenhuma de
informao.
Se os intervalos de classe no tiverem a mesma amplitude, dever se considerar as
densidades de frequncias como sendo os valores das alturas dos retngulos. Estas
densidades podem ser obtidas, tomando-se a frequncia simples de cada classe e
dividindo-a pela respectiva amplitude de classe.
5. Colocar no eixo vertical (eixo Y) a escala correspondente s frequncias ou densidades
de frequncias, abrangendo a menor e a maior frequncia ou densidade de frequncia
obtidas. Construir os retngulos, traando linhas perpendiculares s classes (bases),
eixo X, at atingir as respectivas frequncias ou densidades de frequncias, eixo Y.
6. Determinar a curva Polgono de Frequncia, marcando e ligando os pontos mdios
correspondentes a cada intervalo de classe.
7. Colocar ttulo no grfico, contendo as informaes necessrias tais como: o estudo sob
avaliao, quando e onde foi realizado, a resposta de interesse e a unidade de medida.
8. Verificar a estrutura dos dados quanto condio de simetria:
SIMTRICA

ASSIMTRICA ASSIMTRICA
POSITIVA NEGATIVA

9. Colocar informaes complementares, se necessrio, tais como: a Fonte, onde se indica


a entidade responsvel pelo fornecimento dos dados e as Notas, destinadas a fornecer
esclarecimentos de natureza geral. Estas devem se situar, de preferncia, abaixo do
grfico.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 17

1.5 - Ramo e folhas

Ao se estudar uma determinada caracterstica quantitativa em uma investigao qualquer ou


de um determinado processo, um dos maiores interesses do usurio conhecer sua
distribuio atravs do conjunto de dados por ela assumido. Para se ter uma idia da forma
da distribuio da caracterstica sob estudo, tradicionalmente elabora-se a sua distribuio
de frequncia que representada graficamente gera um histograma. possvel, entretanto,
realizar uma anlise elementar de dados que, de uma forma alternativa, responde ao mesmo
tipo de questo, sem grandes pretenses de rigor matemtico, atravs da tcnica conhecida
como Diagrama Ramo-e-Folha (Stem-and-leaf).
Algumas informaes que podem ser obtidas a partir da construo do Diagrama Ramo-e-
Folha so relativas a:
Ocorrncia inesperada de valores pouco provveis;
Forma assimtrica, os dados numa escala se apresentando mais numa direo que em
outra;
Aparecimento de possveis grupos de valores bem separados;
Posio onde os valores esto centrados; e
Quo espalhados os valores se apresentam.
Esta tcnica bastante til quando o conjunto de dados no muito grande, mas nada
impede que seja utilizada para conjuntos maiores de dados. Alm disso, ela apresenta uma
vantagem sobre o histograma que o fato de no perder informaes sobre os dados em si,
visto que os valores numricos so apresentados no diagrama.
Basicamente, o Diagrama Ramo-e-folha, tcnica apresentada por Tukey (1977) em seu livro
sobre anlise exploratria, representa um conjunto de dados a partir de sua ordenao,
formando grupos atravs da decomposio em duas partes dos valores numricos obtidos:
a primeira chamada ramo, colocada esquerda de uma linha vertical e est associada
aos dgitos mais esquerda dos nmeros. Estes so os dgitos onde a maior variao dos
dados ocorre; e
a segunda chamada folha colocada direita desta linha vertical e est associada aos
demais dgitos dos nmeros.
Quando se escolhe os dgitos que iro ser o ramo e aqueles que sero as folhas, poder se
desprezar alguns nmeros direita quando a informao contida nestes dgitos no for
relevante. Neste caso, isto ser feito truncando-se o nmero ou arredondando-o. Para maior
clareza, isto dever ser informado no diagrama. Ao se desprezar dgitos direita, os
nmeros que aparecem no diagrama passam a ter novo significado. Desta forma, o que uma
unidade passa a representar tambm precisa ser informado.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 18

Por exemplo, para o nmero 179,3 os possveis ramos e folhas para folhas de 1 dgito
apresentam-se a seguir. Nota-se que nas duas primeiras opes alguns dgitos
direita foram desprezados.
Ramo Folha Representao
1 7 (Truncado) 1 | 7 = 170 ou Multiplique por 10
17 9 (Truncado ou Arredondado) 17 | 9 = 179
179 3 179 | 3 = 179,3 ou Multiplique por 10
1

1793 0 1793 | 0 = 179,3 ou Multiplique por 10


2

A idia central do diagrama ramo-e-folha dar parte da informao logo no incio de cada
linha e o resto ao longo da linha, com os dados arrumados em grupos to prximos quanto
faa sentido. Cada linha um ramo e cada pedao da informao em um ramo uma folha.
Por exemplo, o ramo (linha) a seguir estar representando a srie de nmeros 11, 16,
17, 17 sendo cada nmero indicado por seu ltimo dgito (folha):
1 1677.
A forma mais comum e mais prtica de diagramas de ramo-e-folha a de folhas de 1
dgito. Entretanto, caso se deseje preservar mais dgitos nas folhas, pode-se utilizar folhas
de 2 dgitos ou mais, tomando-se apenas o cuidado de separar claramente as diversas
folhas. Para isso, pode-se usar vrgulas, brancos, etc.

Por exemplo, a seguinte srie:


9,15 ; 9,36 ; 9,79 ; 9,82 ; 8,24 ; 8,63 e 8,87
poder ser representada da seguinte forma:
8 24, 63, 87
9 15, 36, 79, 82
Um cuidado que deve ser tomado na construo do diagrama ramo-e-folha, que as folhas
de todos os ramos devem ser colocadas alinhadas para que no haja distoro no aspecto
global da distribuio.
Na definio do nmero de linhas do diagrama ramo-e-folha recomenda-se evitar as
seguintes situaes:
Nmero muito pequeno de ramos com muitas folhas cada (nmero de folhas muito maior
que 20 em alguns dos ramos), de tal forma que no se poder avaliar o diagrama
corretamente j que os dados estaro muito agrupados;
Nmero excessivo de ramos com poucas folhas cada, tornando a apreciao do diagrama
cansativa devido ao espalhamento dos dados.
Para a primeira situao comum passar a subdividir cada ramo do diagrama em 2 ou 5
ramos e represent-los com o dgito ou grupo de dgitos que representava o ramo inicial.
Usualmente, estas duas formas so chamadas, respectivamente, de verso 2 linhas e
verso 5 linhas.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 19

Por exemplo, suponha-se o seguinte ramo:


3 000001223334445556666667889
Ele poder ser representado em 2 ramos da seguinte forma: o primeiro ramo apresenta
os resultados que vo de 30 a 34 e o segundo ,os de 35 a 39.
3 00000122333444
3 5556666667889
Ou em 5 ramos da seguinte forma: o primeiro ramo representa os resultados 30 e 31, o
segundo, os resultados 32 e 33, o terceiro, os resultados 34 e 35, o quarto, os
resultados 36 e 37, e o ltimo, os resultados 38 e 39:
3 000001
3 22333
3 444555
3 6666667
3 889
Obs.: Em alguns casos quando o nmero total de observaes for muito grande, a subdiviso do ramo
acaba no resolvendo o problema, pois acaba se criando um nmero muito grande de ramos
ainda com muitas folhas cada, inviabilizando uma interpretao clara. Neste caso, o indicado
representar os dados atravs de histograma.

Para a segunda situao, recomenda-se reduzir um dgito no ramo e aplicar a verso 5


linhas. Se persistir o espalhamento, usar a verso 2 linhas e depois a verso simples.
Por exemplo, suponha-se o seguinte diagrama ramo-e-folha:
21 3
22 1
23
24 8
25 00
26 7
27 0538
28 59
29 12357
30 3
31 4567
32 056
33 003358
34 2
35 456
36 7
21 3 = 213
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 20

Ele poder ser representado reduzindo-se o ramo para 1 dgito, desprezando-se com
truncamento o ltimo dgito que representava as folhas e utilizando-se a verso de 5
linhas:
2 1
2 2
2 455
2 67777
2 8899999
3 01111
3 222333333
3 4555
3 6
3
[Truncado] 2 1 = 210

A construo do diagrama ramo-e-folha no tem uma regra fixa e varia conforme o conjunto
de dados. Quando se faz um diagrama ramo-e-folha, pode-se escolher entre trabalhar com
folhas de 1 dgito, folhas de 2 dgitos, etc, assim como, verso simples, verso 2
linhas, ou verso 5 linhas. Na realidade, estas escolhas so feitas em parte por
convenincia, em parte devido aos objetivos do trabalho e, em parte por necessidade,
dependendo muito da experincia que o usurio tem com as variveis envolvidas.
Entretanto, devem ser sempre preservadas sua linguagem e idias bsicas.
A seguir encontram-se as instrues para a construo do diagrama ramo-e-folha.
1. Ordenar os dados sob estudo de forma crescente. Definir se alguns dgitos direita
sero desprezados, a forma que isto ser feito (atravs de truncamento ou
arredondamento) e aplicar o que decidir sobre os dados.
2. Dividir cada observao em duas partes: ramo (primeira parte) e folha (segunda parte),
selecionando o tipo de ramo mais adequado a ser utilizado. Neste ponto, pode-se definir
se ir se trabalhar com folhas de 1 dgito, folhas de 2 dgitos, etc.
3. Escrever os ramos (primeira parte) de cima para baixo em ordem crescente no lado
esquerdo de uma linha vertical. Colocar as folhas (segunda parte) ao lado direito da
linha vertical em ordem crescente da esquerda para a direita, sempre alinhadas com as
demais folhas dos outros ramos para no haver distoro na visualizao.

4. Verificar se o diagrama no apresenta alguma das caractersticas a seguir. Caso


apresente, redefinir os ramos e folhas de acordo com o apresentado na DESCRIO da
tcnica e retornar ao procedimento 5:
Nmero muito pequeno de ramos com muitas folhas cada (nmero de folhas muito
maior que 20 em alguns dos ramos).
Nmero excessivo de ramos com poucas folhas cada.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 21

5. Colocar ttulo contendo informaes necessrias tais como: o estudo sob avaliao, a
resposta de interesse e a unidade de medida.
6. Colocar, de preferncia abaixo do diagrama, o que cada unidade apresentada
representa, e no caso de se ter desprezado dgitos direita, informar o tipo de
tratamento que o dado recebeu (truncado ou arredondado).
Importante: Nos casos em que o nmero total de observaes for muito grande e se criar um
diagrama com um nmero muito grande de ramos com muitas folhas cada, o
indicado representar os dados atravs de histograma.

2.1 - Medidas de Posio

Os dados estatsticos podem ser sintetizados sob a forma de tabelas de frequncia e


grficos, fornecendo muito mais informao sobre o comportamento de uma varivel do que
a prpria srie original dos dados.
Contudo, muitas vezes, deseja-se resumir ainda mais esses dados, apresentando uma ou
mais medidas relevantes para representar a srie toda. Essas medidas descritivas so
funes dos valores observados e podem ser classificadas em: medidas de posio, de
disperso.
As medidas de posio, como o prprio nome j diz, do idia de posio, localizao e
tendem a ser valores representativos (ou tpicos) de um conjunto de dados. Sero
abordadas as seguintes medidas de posio: mdia, mediana, moda e outras separatrizes
(quartis, decis e centis).
As medidas de posio tm como objetivos:
Representar o ponto central de um conjunto de dados (mdia, mediana e moda);
Dividir o conjunto de dados em partes iguais (separatrizes);
Estabelecer em torno de que valores representativos os dados se distribuem.
As medidas de posio podem representar medidas de tendncia central ou simplesmente
dividir os dados em partes iguais (separatrizes). Quando os valores das medidas de posio
tendem a se localizar em um ponto central, dentro de um conjunto de dados ordenados
segundo suas grandezas, elas tambm so denominadas de medidas de tendncia central.
o caso da mdia, mediana e moda. Quando as medidas de posio tendem simplesmente
a dividir o conjunto de dados em partes iguais, elas so denominadas de separatrizes:
mediana, quartis, decis e centis.

Mdia
Existem vrios tipos de mdia, cada uma delas apresentando vantagens e desvantagens,
dependendo dos dados e fins desejados.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 22

Mdia Aritmtica Simples


A mdia aritmtica simples a mdia mais utilizada e comumente chamada de mdia,
sendo definida como o resultado da diviso da soma de todos os valores observados pelo
nmero total de observaes. usualmente simbolizada por X (leia-se X barra).

Formas de clculo:

a) Srie de valores
n

X + X 2 + ... + X n
Xi
i =1
X= 1 =
n n
onde: Xi - i-simo valor da varivel de interesse
n - nmero total de observaes
b) Distribuio de frequncia por valores
c

X n + X 2 n 2 + ... + X c n c Xn i i
X= 1 1 = i =1
c
n1 + n 2 + ... + n c
n i =1
i

onde: Xi - i-simo valor da varivel de interesse


ni - frequncia simples absoluta do i-simo valor
c - nmero total de valores distintos da varivel de interesse
c) Distribuio de frequncia por classes de valores
c

Pm1n1 + Pm 2 n 2 + ... + Pm c n c Pm n i i
X= = i =1
c
n1 + n 2 + ... + n c
n
i =1
i

onde: Pmi - ponto mdio da classe i


ni - frequncia simples absoluta da classe i
c - nmero total de classes
A mdia apresenta as seguintes propriedades:
- Somando-se ou subtraindo-se ou multiplicando-se ou dividindo-se a cada termo da mdia
uma mesma quantidade, a mdia aritmtica ficar, respectivamente, aumentada ou
diminuda ou multiplicada ou dividida dessa quantidade.
n
- A soma dos desvios a partir da mdia X nula, i.e., (X i X) = 0 onde X i cada valor
i =1
do conjunto de n dados.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 23

- A soma dos quadrados dos desvios de um conjunto de dados em relao a qualquer


nmero K, um mnimo quando K = X . Isto significa que a soma dos quadrados (SQ) dos
desvios tomados em relao a um valor qualquer sempre exceder a SQ dos desvios
tomados em relao mdia aritmtica. Esta propriedade fornece um critrio para
obteno de medidas mais representativas de um conjunto de dados chamado de critrio
de mnimos quadrados.
Alm das propriedades, outras vantagens da mdia aritmtica so:
- Fcil interpretao e clculo;
- Participao de todos os valores observados;
- Assume somente um valor determinado;
- Admite tratamento algbrico, i.e., o conhecimento das mdias de diversas sries permite
calcular a mdia da reunio das mesmas;
- Apresenta potencial de uso para propsitos de inferncias.
A desvantagem que deve ser usada somente em distribuies simtricas ou ligeiramente
assimtrica, visto que, influenciada por valores discrepantes e mais que discrepantes
(outliers) de uma distribuio.
Mediana
A mediana, como j foi visto, alm de ser uma medida de tendncia central tambm uma
separatriz. Ela determina o meio de uma distribuio dividindo-a em 2 partes iguais, tendo
assim, 50% dos dados do processo sua direita como sua esquerda. usualmente
simbolizada por Md. Esquematicamente, a mediana pode ser assim representada:

50% 50%

Md

a) Srie de valores
- Ordenar os dados obtidos de forma crescente.
- Determinar o nmero total de observaes obtidas.
- Determinar o valor da mediana, da seguinte forma:
n +1
Se n for mpar, a mediana o valor que se encontra na posio .
2
Se n for par, a mediana a mdia aritmtica simples dos valores que se encontram nas
n n
posies e +1.
2 2
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 24

b) Distribuio de frequncia por valores


- Construir na tabela as frequncias acumuladas abaixo de.
- Somar as frequncias simples absolutas (n).
- Determinar o valor da mediana, da seguinte forma:
n +1
Se n for mpar, a mediana o valor correspondente a freqncia localizada atravs
2
da coluna de freqncias acumuladas
Se n for par, a mediana a mdia aritmtica simples dos valores correspondentes as
n n
freqncias e +1 localizadas atravs da coluna de freqncias acumuladas
2 2
c) Distribuio de frequncia por classes de valores
c1) Forma de clculo 1
a forma de clculo mais grosseira.
- Proceder da mesma maneira de clculo da Distribuio de frequncia por valores
substituindo o valor pelo Ponto mdio (Pmi) da classe.
c2) Forma de clculo 2
mais precisa do que a forma c1. Sendo assim, deve ser usada sempre que possvel.
- Construir na tabela as frequncias acumuladas abaixo de.
- Somar as frequncias simples absolutas (n).
- Achar a classe onde encontra-se a mediana, da seguinte forma:
Localizar na coluna de freqncias acumuladas, a freqncia igual ou imediatamente
n +1
superior a .
2
- Determinar o valor da mediana atravs da seguinte expresso:
h(P Fa )
Md = L i +
ni
onde: n - soma das frequncias simples absolutas
n +1
P= - posio que contm a mediana
2
Li - limite inferior da classe que contm a mediana
h - amplitude da classe que contm a mediana
Fa - frequncia acumulada at a classe anterior que contm a mediana
ni - frequncia simples absoluta da classe que contm a mediana
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 25

As vantagens do uso da mediana so:


No influenciada por valores extremos de uma distribuio, podendo ser usada em
distribuies assimtricas.
Pode ser calculada nas distribuies de frequncia por classes de valores que apresentam
classes de limites indeterminados (primeira e/ou ltima).
A desvantagem do seu uso que ela no admite tratamento algbrico, i.e., o conhecimento
das medianas de diversas sries no permite calcular a mediana da reunio das mesmas.

Moda

A moda o valor de maior ocorrncia de um conjunto de dados obtidos de um processo. Ela


usualmente simbolizada por Mo.
Em uma distribuio de dados, a moda pode no existir e, quando existe, pode no ser
nica. Dessa forma, esta medida pode ter as seguintes classificaes:
Amodal - quando no existir valor dominante.
Unimodal - quando existe somente 1 valor dominante.
Bimodal - quando existem 2 valores dominantes.
Multimodal - quando existem mais de 2 valores dominantes.
a) Srie de valores
- Determinar o(s) valor(es) da moda observando o(s) valor(es) que ocorre(m) o maior
nmero de vezes.

b) Distribuio de frequncia por valores


- Determinar o(s) valor(es) da moda observando o(s) valor(es) que apresenta(m) a maior
frequncia simples absoluta.

c) Distribuio de frequncia por classes de valores


Neste caso, no se torna possvel determin-la com rigor matemtico, recorrendo assim s
frmulas de aproximao. Existem vrias formas para o clculo da moda sendo abordadas a
seguir as 3 mais comuns.

c1) Moda Bruta


a forma de determinao mais grosseira.
- Determinar o valor da moda como sendo o valor do ponto mdio da classe de maior
frequncia simples absoluta.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 26

c2) Frmula de Czuber


Aplicada somente quando os 3 intervalos de classe a serem utilizados na frmula
apresentarem a mesma amplitude. Quando essa condio atendida, a mais
recomendvel dentre as 3 formas.
- Considerar como classe modal aquela com maior frequncia.
- Determinar o valor da moda atravs da expresso:
h(n i ni1 )
Mo = L i +
2n i (n i+1 + n i1 )
onde: Li - limite inferior da classe modal
h - amplitude da classe modal e das classes anterior e posterior ao da classe
modal, devendo ser a mesma
ni - frequncia simples absoluta da classe modal
ni-1 - frequncia simples absoluta da classe imediatamente anterior classe modal
ni+1 - frequncia simples absoluta da classe imediatamente posterior classe modal
Esquematicamente, a moda pode ser representada das seguintes formas:

Amodal Unimodal Bimodal Multimodal


As vantagens da moda so:
No influenciada por valores extremos, o que possibilita ser empregada nas distribuies
assimtricas.
Pode ser calculada nas distribuies de frequncia por classes de valores que apresentam
classes de limites indeterminados (primeira e/ou ltima), desde que no recaia na classe
modal.
A desvantagem do seu uso no admitir tratamento algbrico.
Relao entre Mdia, Mediana e Moda
Em distribuies unimodais absolutamente simtricas, a mdia, a moda e a mediana so
iguais. Numa distribuio tipicamente assimtrica, as posies relativas da mdia, mediana
e moda so as seguintes: a mdia se situa prxima da cauda mais longa da distribuio, a
moda se situa afastada da cauda mais longa, e a mediana fica entre a mdia e a moda.
Para as distribuies simtricas ou ligeiramente assimtricas, existe a relao aproximada a
seguir, descoberta por Pearson:
Mo = 3Md -2 X
Essa expresso, por ser aproximada e s indicada quando a assimetria fraca, no deve
ser utilizada como meio habitual de obteno de um dos trs valores.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 27

Outras Separatrizes

Assim como procurou-se o ponto que divide a distribuio de dados em 2 partes iguais
definindo-a como mediana, por extenso, pode-se procurar valores que dividem o conjunto
de dados em 4 partes iguais chamando-os de quartis, como tambm em 10 partes iguais
chamando-os de decis ou ainda em 100 partes iguais chamando-os de centis.

Quartis
Os quartis so os 3 pontos que dividem um conjunto de dados em 4 partes iguais. Estes
valores so denominados e representados da seguinte forma: 1o Quartil ( Q1 ), 2o Quartil ( Q2 )
e 3o Quartil ( Q3).
Esquematicamente, os quartis podem ser assim representados:

Observa-se que o 1o Quartil ( Q1 ) precedido de 25% dos valores e sucedido por 75%; o 2o
Quartil ( Q2 ) tem abaixo de si 50% dos valores e acima de si tambm 50% e por esta razo
coincide com a mediana (Md); e o 3o Quartil ( Q3) precedido de 75% dos valores e seguido
por 25% dos valores.
Decis
Os decis so os 9 pontos que dividem um conjunto de dados em 10 partes iguais. Estes
valores so denominados e representados da seguinte forma: 1o Decil ( D1), 2o Decil ( D2 ), ...,
9o Decil ( D9 ).

Esquematicamente, os decis podem ser assim representados:


10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9

Observa-se que o 5o decil corresponde ao valor da mediana j que tem abaixo de si 50%
dos valores e acima, tambm 50%.
Centis
Os centis so os 99 pontos que dividem um conjunto de dados em 100 partes iguais. Estes
valores so denominados e representados da seguinte forma: 1o Centil ( C1 ), 2o Centil ( C2 ),
..., 99o Centil ( C99 ).
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 28

Esquematicamente, os centis podem ser assim representados:


1% 1% 1% ... 1% 1% 1%
C1 C2 C3 C 97 C 98 C 99

Observa-se que o 50 o centil corresponde ao valor da mediana, j que tem tanto abaixo como
acima de si, 50% dos valores. O emprego dos centis vantajoso quando se quer ter uma
diviso percentual da distribuio.

Frmulas de clculo
SEPARATRIZES FRMULAS DE POSIO
QUARTIL n +1 2(n + 1) 3(n + 1)
PQ1 = ; PQ2 = ; PQ3 =
( Q1 a Q 3 ) 4 4 4
DECIL n+1 2(n + 1) 5(n + 1) 8(n + 1) 9(n + 1)
PD1 = ; PD2 = ;...; P D5 = ;...; P D8 = ; PD9 =
( D1 a D 9 ) 10 10 10 10 10
CENTIL n+1 2(n + 1) 50(n + 1) 98(n + 1) 99(n + 1)
PC1 = ; PC2 = ;...; PC50 = ;...; PC 98 = ; PC99 =
( C1 a C 99 ) 100 100 100 100 100
onde: n o nmero total de observaes, para srie de valores ou soma das frequncias
simples absolutas, para distribuio de frequncias por valores ou por classes de
valores.
OBS: Caso alguma posio do quadro anterior seja um valor inferior a 1 ou superior a n,
deve-se assumir, respectivamente, o valor 1 ou n.
a) Srie de valores
1. Ordenar os dados obtidos de forma crescente.
2. Determinar o nmero total de observaes obtidas.
3. Determinar a posio da separatriz no conjunto de dados, segundo quadro anterior das
frmulas das posies, sabendo que n o nmero total de observaes.
4. Determinar o valor da separatriz, da seguinte forma:
quando a posio for um nmero inteiro, o valor que se encontra nesta posio o valor
da separatriz.
quando a posio no for um nmero inteiro, toma-se a parte decimal chamando-a de d
e calcula-se o valor da separatriz com base nos 2 valores mais prximos a posio
determinada, um inferior e outro superior, com a seguinte expresso:
Separatriz = Valor inferior + d (Valor superior - Valor inferior)

b) Distribuio de frequncia por valores


1. Construir na tabela as frequncias acumuladas abaixo de.
2. Somar as frequncias simples absolutas.
3. Determinar a posio da separatriz no conjunto de dados segundo quadro anterior das
frmulas das posies, sabendo que n o nmero total de observaes.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 29

4. Localizar na coluna de frequncias acumuladas, a frequncia igual ou imediatamente


superior ao resultado obtido no item anterior. O valor correspondente a essa frequncia
ser o valor da separatriz.

c) Distribuio de frequncia por classes de valores


1. Construir na tabela as frequncias acumuladas abaixo de.
2. Somar as frequncias simples absolutas.
3. Determinar a posio da separatriz no conjunto de dados segundo quadro anterior das
frmulas das posies, sabendo que n o nmero total de observaes.
4. Localizar na coluna de frequncias acumuladas, a frequncia igual ou imediatamente
superior ao resultado obtido no item anterior, obtendo assim, a classe onde a separatriz
est localizada.
5. Determinar o valor da separatriz atravs da seguinte expresso:
h(P Fa )
Separatriz = L i +
ni
onde: n - soma das frequncias simples
P - posio da separatriz desejada segundo quadro anterior das frmulas das
posies em funo de n
L i - limite inferior da classe que contm a separatriz
h - amplitude da classe que contm a separatriz
Fa - frequncia acumulada at a classe anterior que contm a separatriz
ni - frequncia simples absoluta da classe que contm a separatriz
2.2 - Medidas de disperso
As medidas de disperso, tambm conhecidas como medidas de variabilidade, como o
prprio nome j diz, do a idia da disperso ou variao existente nas observaes de um
conjunto de dados, geralmente utilizando como referncia uma medida de tendncia central.
Sero abordadas nesta notas as seguintes medidas de disperso: desvio mdio absoluto,
varincia e desvio-padro.
As medidas de disperso tm como objetivos:
Indicar o grau que os dados numricos tendem a dispersar-se em torno de um determinado
valor, em geral, a mdia.
Verificar a representatividade, em geral, da mdia de um conjunto de dados, visto que pode
existir uma flutuao muito grande desses dados em torno dessa mdia.
Comparar dois ou mais conjuntos de dados com unidades e/ou grandezas diferentes.
A sumarizao de um conjunto de dados somente atravs das medidas de posio, esconde
toda a informao sobre a variabilidade do conjunto de dados. Em qualquer conjunto de
dados, os valores numricos no sero idnticos, apresentando, dessa forma, desvios de
grandeza varivel.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 30

Pode-se observar que a mdia por si s no suficiente para descrever adequadamente um


conjunto de dados, visto que dois conjuntos podem ter a mesma mdia, mas diferir muito na
magnitude da variao dos dados observados. Portanto, uma descrio mais completa dos
dados quando se emprega alm de uma medida de posio, uma medida de disperso.
Desvio Mdio Absoluto
Na criao de uma medida que resuma a variabilidade de uma srie de valores e permita
comparar conjuntos de diferentes valores, frequentemente se utiliza um critrio que mede a
concentrao dos dados em torno de sua mdia. Uma dessas medidas o desvio mdio
absoluto.
O princpio bsico analisar os desvios das observaes em relao mdia das
observaes, i.e., determinar os desvios X i X . fcil de ver (vide propriedades de X na
item 2.91 - Mdia) que, para qualquer conjunto de dados, a soma desses desvios zero.
Sendo assim, pode-se optar por considerar o total dos valores absolutos dos desvios,
n
X i X . Como o uso deste total pode causar dificuldades quando se estiver comparando
i =1
conjuntos com nmeros diferentes de observaes, melhor expressar esta medida como
mdia, definida por:
n

X i X
DM = i =1

n
Resumindo, ento, o desvio mdio absoluto de um conjunto de dados a mdia dos valores
absolutos dos desvios de cada valor em relao a sua mdia. simbolizado por DMA e
expresso na mesma unidade de medida dos dados originais.
a) Srie de valores
n

X i X
DM = i =1

n
onde: Xi - i-simo valor da varivel de interesse
n - nmero total de observaes
X - mdia
b) Distribuio de frequncia por valores
c

X i X ni
DM = i =1
c

n
i =1
i

onde: Xi - i-simo valor da varivel de interesse


ni - frequncia simples absoluta do i-simo valor
c - nmero total de valores distintos da varivel de interesse
X - mdia
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 31

c) Distribuio de frequncia por classes de valores


c

Pm i X ni
DM = i =1
c

n
i =1
i

onde: Pmi - ponto mdio da classe i


ni - frequncia simples absoluta da classe i
c - nmero total de classes
X - mdia

Varincia
O princpio que orienta a criao da varincia o mesmo utilizado na criao do desvio
mdio absoluto. S que aqui, para contornar o fato da soma dos desvios em relao mdia
( )
n 2
ser zero, opta-se por considerar o total dos quadrados dos desvios,
i =1
X i
X . Ao se dividir,

ento, este total pelo nmero de observaes, tem-se a varincia definida por:

(X )
N 2
i X
VAR = i =1

N
Resumindo, ento, a varincia de um conjunto de dados definida como sendo a mdia dos
quadrados dos desvios de cada valor em relao a sua mdia. simbolizada por 2 para o
caso de populao.
Contudo, a sua utilizao como medida descritiva ocasiona alguma dificuldade visto que se
trata, por definio, de uma mdia quadrtica, no possuindo a mesma unidade de medida
dos dados originais. Por exemplo, se a unidade de medida g, a varincia ser expressa em
g2.
A varincia a medida de disperso mais conhecida e utilizada na estatstica,
especialmente para propsitos de inferncia.
a) Srie de valores
n
(X i X) 2
i =1
VAR =
n1
onde: Xi - i-simo valor da varivel de interesse
n - nmero total de observaes
X - mdia
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 32

b) Distribuio de frequncia por valores


c
(X i X) 2 ni
i =1
VAR = c
ni 1
i=1
onde: Xi - i-simo valor da varivel de interesse
ni - frequncia simples absoluta do i-simo valor
c - nmero total de valores distintos da varivel de interesse
X - mdia
c) Distribuio de frequncia por classes de valores
c
(Pmi X ) 2 ni
i= 1
VAR = c
ni 1
i =1

onde: Pmi - ponto mdio da classe i


ni - frequncia simples absoluta da classe i
c - nmero total de classes
X - mdia
Desvio-Padro
O desvio padro de um conjunto de dados o valor positivo da raiz quadrada da varincia.
A vantagem do uso do desvio-padro em relao a varincia a de permitir uma
interpretao direta da variao dos dados, visto que expressa na mesma unidade de
medida dos dados originais.
DP = VAR
onde: VAR - varincia
Tal medida apresenta a seguinte propriedade:
Quando os dados se distriburem segundo uma curva normal, o desvio-padro indica os
limites provveis dentro dos quais se situam certas propores das observaes do
conjunto de dados. Assim, verificam-se as seguintes relaes:
a) 68,27% das observaes esto includas entre ( X -DP) e ( X +DP), isto , um desvio
padro de cada lado da mdia.
b) 95,45% das observaes esto includas entre ( X -2DP) e ( X +2DP), isto , dois desvios
padres de cada lado da mdia.
c) 99,73% das observaes esto includas entre ( X -3DP) e ( X +3DP), isto , trs desvios
padres de cada lado da mdia.
Esquematicamente, tem-se:

X - DP X X + DP X - 2DP X X + 2DP X - 3DP X X + 3DP


UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 33

Coeficiente de Variao

C.V.: = 100 ( X / DP) %

2.4 - Desenho Esquemtico


A mediana, os quartis, reunidos aos valores extremos do conjunto de dados formam um
conjunto de medidas, conhecido como o "Esquema dos cinco nmeros", que permite que se
tenha uma boa idia do comportamento da distribuio. A informao contida neste conjunto
acrescida de critrios para identificao de valores que se destacam dos demais
(discrepantes), pode ser traduzida graficamente atravs da tcnica conhecida como
Desenho Esquemtico.
O Desenho Esquemtico tambm conhecido como "Box-Plot", ou ainda, Grfico de Caixa,
tem como objetivo:
- Representar graficamente o Esquema dos cinco nmeros;
- Identificar comportamentos mdios, comportamentos discrepantes, revelando tendncias e
resumindo informaes contidas nos dados de forma bem prtica;
- Substituir o histograma quando tiver uma quantidade pequena de resultados; e
- Permitir a comparao entre muitas distribuies diferentes.
O Desenho Esquemtico uma visualizao da distribuio dos resultados a partir do
conhecimento da Mediana (tambm chamada de 20 quartil), do 10 e 30 quartis e dos pontos
de mnimo e mximo dos dados, representados de tal forma a facilitar a identificao de
possveis valores que se destacam dos demais e que so chamados de pontos
discrepantes.
A escolha destas medidas de posio foi devida ao fato de serem resistentes, ou seja, no
serem afetadas por mudanas ocorridas numa pequena poro dos dados, nem por
resultados discrepantes. Para a construo do Desenho Esquemtico, ento, tornou-se
necessria a criao de uma regra que estabelecesse o que se deveria considerar como
resultado discrepante num conjunto de dados. Para fazer isso, precisaria-se erguer uma
"barreira" ou "cerca" a partir da qual os valores seriam considerados "discrepantes" e at
"mais que discrepantes". Foi sugerida, ento, por Tukey (1977), a regra emprica a seguir
descrita:
- Considerar como medida de disperso, a distncia entre quartis (DEQ ou dj), tambm
conhecida como amplitude interquartlica, que a diferena entre o 30 e o 10 quartis;
- Definir como "Cerca Interna", o afastamento de 1,5 DEQj para fora dos 10 e 30 quartis;
- Definir como "Cerca Externa", o afastamento de 3 DEQj para fora dos 10 e 30 quartis;
- Definir os valores mais remotos acima e abaixo do conjunto, mas que estejam ainda dentro
da cerca interna, como "Adjacentes";
- Considerar os valores entre as Cercas Interna e Externa como "Discrepantes"; e
- Considerar os valores fora da Cerca Externa como "Mais que discrepantes".
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 34

O prximo passo, ento, fazer a representao grfica atravs da construo de um


retngulo a partir do 10 e 30 quartis, de onde saem para cima e para baixo retas traadas at
os pontos chamados de adjacentes, assinalando-se, tambm a Mediana. O tamanho dessas
retas d uma idia da disperso e se a distribuio simtrica ou no. Obtem-se, neste
momento, uma figura que representa o conjunto dos dados, com exceo dos discrepantes e
mais que discrepantes que devero ser representados individualmente por diferentes
smbolos.
A seguir, encontram-se as instrues para a construo do Desenho Esquemtico.
1. Ordenar os resultados de forma crescente. Determinar o mnimo (Min ou Ei) e o mximo
(Mx ou Es) dos resultados e a mediana (Md), o 10 quartil ( Q1 ) e o 30 quartil ( Q3 ).
2. Montar o esquema dos 5 nmeros da forma a seguir:
ESQUEMA DOS CINCO NMEROS
n
Md
Q1 Q3
Min Mx
Onde: n o total de resultados
Md a mediana
Q1 o valor do 10 quartil
Q3 o valor do 30 quartil
Min e Mx so valores de mnimo e mximo, respectivamente
3. Determinar a distncia entre quartis (DEQ), definida por:
DEQ = Q3 - Q1
4. Determinar as chamadas cercas internas e externas, atravs dos seguintes clculos:
CERCA NOTAO EQUAO
INTERNA INFERIOR CII Q1 - 1,5 DEQ
SUPERIOR CIS Q3 + 1,5 DEQ
EXTERNA INFERIOR CEI Q1 - 3 DEQ
SUPERIOR CES Q3 + 3 DEQ
5. Traar um eixo vertical, correspondendo a escala de resultados, tendo como limite
inferior o menor valor dentre o mnimo observado e o da cerca externa inferior (CEI)
obtido e, como limite superior o maior valor dentre o mximo observado e o da cerca
externa superior (CES) obtido.
6. Marcar os valores obtidos para mediana, 10 quartil e 30 quartil, no eixo vertical,
construdo anteriormente.
7. Desenhar um retngulo paralelo ao eixo vertical traado, cuja base corresponde ao 10
quartil e o topo ao 30 quartil, traando, tambm, a linha da mediana em seu interior. A
altura deste retngulo correponde distncia entre quartis e a largura, a uma distncia
arbitrria.
UFRJ - Introduo Estatstica
Professor Otvio Figueiredo (otavio@ufrj.br) 35

8. Determinar o adjacente inferior (AI) e o adjacente superior (AS), sabendo que:


Adjacente Inferior - o menor valor, entre os resultados, que satisfaz a relao x CII
Adjacente Superior - o maior valor, entre os resultados, que satisfaz a relao x CIS
9. Unir, atravs de uma reta, o adjacente inferior (AI) ao 10 quartil ( Q1 ) ,e o adjacente
superior (AS) ao 30 quartil ( Q3 ).
10. Marcar os valores obtidos para as cercas internas e externas, utilizando uma linha
tracejada e transversal ao eixo vertical.
11. Verificar e marcar no grfico a existncia de pontos discrepantes, que correspondem aos
valores que estiverem entre as cercas externa e interna, ou seja, um valor (x) que
satisfaa uma das seguintes condies:
CEI X < CII ou CIS < X CES
Se um ponto discrepante, sua notao geralmente representada por .
12. Verificar e marcar no grfico a existncia de pontos mais que discrepantes, que
correspondem aos valores que estiverem fora das cercas externas, ou seja, um valor (x)
que satisfaa uma das seguintes condies:
X < CEI ou X > CES
Se um ponto mais que discrepante, sua notao geralmente representada por +.
13. Analisar o padro da distribuio dos resultados, a partir do grfico construdo, que
ficar sob a seguinte forma:
+ Ponto mais que discrepante
CES

Ponto discrepante
CIS

AS

Q3

Md

Q1 _

AI
CII

Ponto discrepante
CEI

+ Ponto mais que discrepante

S-ar putea să vă placă și