Sunteți pe pagina 1din 116

Aula 01

Apresentação

Introdução ao estudo da Estatística

Números aproximados e arredondamento


de dados.
Tabela 1: Normativa da ABNT-NBR 5891-em
conformidade com a Resolução nº 886/66 da Fundação
IBGE

Condições Procedimentos Exemplos


(arredondamento para o
décimo)

O último algarismo a permanecer 1,83 = 1,8


<5 fica inalterado

Aumenta-se de uma unidade o 1,37 = 1,4


>5 algarismo a permanecer.

(i) Se ao 5 seguir em qualquer casa 1,7500001 = 1,8


=5 um algarismo diferente de zero,
aumenta-se uma unidade no
algarismo a permanecer.
(ii) Se o 5 for o último algarismo ou 1,75 = 1,8
=5 se ao 5 só seguirem zeros, o último
algarismo a ser conservado só será 1,25 = 1,2
aumentado de uma unidade se for
ímpar.
Exemplos no Excel
Aula 02
• Introdução Histórica
• Passos da metodologia estatística
• Divisões da estatística
• Definições básicas da estatística
Introdução Histórica
• Estatística deriva de STATU- em latim estado

• Na antiguidade a estatística já era observada de forma rudimentar e


imprecisa.

• Fins: militares e tributários.


-contagem de habitantes;
-óbitos;
-nascimentos;
- Avaliação de bens e riquezas
- Armamento
- Números de guerreiros
Passos da metodologia estatística
• Definição dos objetivos
• Planejamento e elaboração da coleta de
dados
• Classificação dos dados e apresentação
dos valores numéricos
• Analise dos resultados
• Elaboração do relatório com as
conclusões
Definição da estatística
• Estatística é um conjunto de métodos e
processos quantitativos que serve para estudar
e medir fenômenos coletivos. Pode nos auxiliar
na tomada de decisões ou para tirarmos
conclusões em situações de incerteza, a partir
de informações numéricas.
A Teoria Estatística moderna se
divide em dois grandes campos:
• Estatística Descritiva – (coleta, organização e
descrição)
Num conjunto de métodos que ensinam a reduzir uma quantidade
de dados bastante numerosa por um número pequeno de medidas,
substitutas e representantes daquela massa de dados.

• Estatística Indutiva – ( analise e interpretação de


dados)
Consiste em inferir (deduzir ou tirar conclusões a respeito das)
propriedades de um universo a partir de uma amostra. O processo
de generalização, que é característico do método indutivo, está
associado a uma margem de incerteza. A medida da incerteza é
tratada mediante técnicas e métodos que se fundamentam na
Teoria das Probabilidades.
Definições básicas da estatística
• População

• Amostra

• Variáveis
População ou universo estatístico
• é o conjunto da totalidade de indivíduos que
apresentam características em comum, cujo
comportamento se quer inferir(analisar)
• Pode ter número finito ou infinito de elementos
• Exemplo de população:pessoas, animais,
minerais, vegetais...
Amostra
• Subconjunto da população, porem permite
a obtenção de dados representativos da
população
- tempo
-praticidade
- economia
-motivos geográficos
Variáveis
• Conjuntos de resultados (ou
características) possíveis de um fenômeno
-Podem ser classificados em:
Qualitativas Quantitativas
Qualitativas (ou categóricas)
• Nominais: não existe
ordenação nas categorias

• Ordinais: existe uma


ordenação nas categorias
Quantitativa
• Contínua: pode
assumir valores decimais

• Discreta: Assume apenas


os valores de um conjunto
enumerável
Organograma das variáveis

Variáveis

Qualitativa Quantitativa

Nominal Ordinal Contínua Discreta


Aula 03
• Técnicas de amostragem
-casual ou aleatória simples
-Proporcional estratificada
-Estratificada uniforme
-Sistemática
Técnicas de amostragem
• Serve para garantir ( tanto quanto
possível) o sucesso da pesquisa e dos
resultados

Vantagens:
– Economia
– tempo
– confiabilidade de dados
– operacionalidade ( ex: dados em menor escala)
Amostragem casual ou aleatória
simples
• Todos os elementos da população estão
disponíveis
• Qualquer elemento da população tenha
mesma probabilidade de ser selecionado
• A seleção ocorre por meio de sorteio
Amostragem proporcional
estratificada
• A população e dividida em estratos
proporcionais
• Cada estrato é um subconjunto da
população
Estratificada uniforme
• Não utiliza critérios de proporcionalidade
• É utilizado quando quer-se obter
estimativas separadas para cada extrato
Sistemática
• Tipo de amostragem aleatória, porem, é
utilizada quando os elementos da
população encontram-se ordenados
Método para a seleção dos elementos
de uma amostra sistemática de uma
população
• Intervalos de seleção(I)
I=N/n, onde N=população e n= amostra
• Primeiro elemento(m)
Aleatório no intervalo [0;I]
• Próximos elementos
m+I, m+2I, m+3I,......
• Último elemento
....,m+(n-1)I
Exemplo
• N=21
• n=3
• .
I=
N =21/3=7
n
• sorteio entre 1 e 7=2
• Primeiro: m=2 Bret
• Segundo: m+I=2+7=9 Irene
• Terceiro: m+2I=2+14
Philippe
Aula 03
• Tabelas

• Séries estatísticas
Tabelas
É um conjunto de observações a respeito de
determinado assunto, organizadas e
distribuídos num quadro.

Título
Cabeçalho(variável A) Cabeçalho(variável B)

Conjunto de linhas Conjunto de linhas


indicando os valores da indicando os valores da
variável A variável B

Fonte
Series estatísticas
• Tabela estatística que apresenta um
conjunto de dados em função do(a):
- época – temporal
- Local – geográfica
- Espécie - Específica
- Distribuição de freqüência *
Séries temporais, cronológicas,
históricas, evolutivas (ou marchas)
Expectativa de vida das mulheres
Brasileiras

Ano Idade das • Fato: expectativa de vida das


mulheres mulheres brasileiras (constante)
1980 65,7

1991 70,9 • Local: Brasil (constante)

2000 74,4 • Tempo: 1980, 1991, 2000


(variável)
Fonte : IBGE
Séries geográficas, espaciais,
territoriais ou de localização
Taxa de desemprego por região
( ago/2009)
Região Taxa de
desemprego(%)
• Fato: Taxa de desemprego
Salvador 14,4 (constante)
Recife 10,9

São Paulo 9,1


• Local: Salvador,Recife, São
Belo Horizonte 7,5 Paulo, Belo Horizonte, Rio de
Janeiro, Porto Alegre
Rio de Janeiro 5,6 (variável)
Porto Alegre 5,4
• Tempo:ago/2009
média 8,1
(constante)
Fonte : IBGE
Séries específicas ou categóricas
Receita liquida das empresas de
tecnologia no Brasil ( 2007)

Empresa Receita liquida( em


US$ milhões ) • Fato: empresas de
Hp 2283 tecnologia (variável)

Ibm 2004

Samsung 934
• Local: Brasil (constante)
Positivo 815

LG 751 • Tempo:2007
Microsoft 496 (constante)
Del 533

Fonte : Anuário informática hoje


Séries conjugadas ou tabela de
dupla entrada
Números de publicações científicas
Países UE Numero de publicações
1990 2000 2006
Reino 60224 91262 102828
Unido
Alemanha 48140 77365 91717
França 35136 54768 63449
Itália 19016 37693 52392
Fonte : GPEARI
Gráficos estatísticos
• Diagramas: Gráficos geométricos em duas dimensões

• Gráfico polar ou radar: para representar series temporais


cíclicas

• Cartogramas: ilustrações relativas a cartas geográficas

• Pictogramas: representação gráfica ilustrada por figuras


Diagramas
• Gráficos geométricos em duas dimensões. Utiliza-se, em geral, o sistema
cartesiano

• Linhas ou curvas

• Colunas ou barras

• Colunas (barras) múltiplas

• Setores
Linhas ou Curva
colunas
Colunas múltiplas
Barras
Setores
Gráfico polar ou radar
• Conjunto de pontos agrupados por categoria em um círculo de 360 graus. Os valores
são representados pelo comprimento do ponto, conforme medido do centro do
círculo. Quanto mais distante o ponto está do centro, maior é o seu valor. São
exibidos rótulos de categoria no perímetro do gráfico
Cartograma
Pictograma
DISTRIBUIÇÃO DE
FREQUÊNCIA
(dados não agrupados em intervalos de classe)

• Dados primitivos ou brutos


• Rol
• Classe
• Frequência ( fi )
• Frequência relativa ( fri )
• Frequência relativa percentual ( fri %)
• Frequência acumulada ( Faci )
• Frequência relativa acumulada ( Fraci )
• Frequência relativa acumulada percentual(Fraci %)
Dados primitivos ou brutos
• São dados coletados durante a pesquisa que
ainda não foram coletados

Estado civil dos consumidores do estabelecimento X(variável qualitativa)

sol Sep Cas Cas Sol Cas Viu Cas


Viu Sep Sol Cas sol Sep cas Sol
Cas sep cas Sol Viu Cas Cas Viu
Cas Sol Cas Viu Cas Sep Sep Sol
Sep Sol Sep Sol Cas Sol Cas Sep
Sol sep Cas Sep cas Sol Viu Cas
Cas sep cas Sol Cas Viu Cas Sep
Rol
• Ordenação dos valores obtidos( dados brutos)
em ordem(crescente ou decrescente)de
grandeza numérica ou qualitativa.

Cas, Cas, Cas, Cas, Cas, Cas, Cas, Cas, Cas,


Cas, Cas, Cas, Cas, Cas, Cas, Cas, Cas, Cas,
Cas, Cas, Sol, Sol, Sol, Sol, Sol, Sol, Sol, Sol,
Sol, Sol, Sol, Sol, Sol, Sol, Sep, Sep, Sep, Sep,
Sep, Sep, Sep, Sep, Sep, Sep, Sep, Sep, Sep,
Viu, Viu, Viu, Viu, Viu, Viu, Viu
Classe
• Subdivisão em categorias
4 classes:
-Casado
-Solteiro
-Separado
-Viúvo
Frequência, frequência simples ou
frequência absoluta ( fi )

• Número de vezes que o elemento aparece na


amostra ou o número de elementos
pertencente a uma classe

Classe (i) Estado civil (xi) Frequência (fi)


1 Solteiro 13
2 Casado 22
3 Viúvo 4
4 Separado 17
Total=56
Frequência relativa ( fri )

• É o quociente entre a freqüência absoluta da


classe considerada e o numero total de
dados coletados na pesquisa.
Classe (i) Estado civil Frequência Frequência
(xi) (fi) relativa (fri)
fi 1 Solteiro 13 13/56=0,2321
fri = 2 Casado 22 22/56=0,3929
n 3 Viúvo 4 4/56=0,0714

4 Separado 17 17/56=0,3036

Total=56 56/56=1,0
Frequência relativa percentual ( fri %)

É o produto da frequência relativa por 100

Classe (i) Estado civil Frequência Freq. relativa Freq. Rel.


(xi) (fi) (fri) percentual.
(fri%)
1 Solteiro 13 0,2321
23,21
2 Casado 22 0,3929
39,21
3 Viúvo 4 0,0714
7,14
4 Separado 17 0,3036
30,36
Total=56 1,0
100,0
Frequência acumulada ( Faci )
• É a soma das frequências absolutas desta
classe com as frequências absolutas das
classes anteriores
i
→ Faci = ∑ f i
Faci = f1 + f 2 + ... + f i 
1

Classe (i) Estado civil Frequência Freq. Freq. Rel. Freq.


(xi) (fi) relativa (fri) percentual. acumulada(
(fri%) faci)
1 Solteiro 13 0,2321 23,21 13
2 Casado 22 0,3929 39,21 22+13=35
3 Viúvo 4 0,0714 7,14 4+35=39
4 Separado 17 0,3036 30,36 17+39=56
Total=56 1,0 100,0
Frequência relativa acumulada ( Fraci )
• É a soma das frequências relativas desta classe
com as frequências relativas das classes
anteriores
i
→ Fraci = ∑ fri
Fraci = fr1 + fr2 + ... + fri 
1

Classe Estado civil Frequênc Freq. Freq. Rel. Freq. relativa


(i) (xi) ia (fi) relativa (fri) percentua acumulada(faci)
l. (fri%)
1 Solteiro 13 0,2321 23,21 0,23
2 Casado 22 0,3929 39,21 0,39+0,23=0,62
3 Viúvo 4 0,0714 7,14 0,7+0,62=0,69
4 Separado 17 0,3036 30,36 0,3+0,69=1,0
Total=56 1,0 100,0
Frequência relativa percentual
acumulada ( Fraci %)
• É o produto da frequência relativa acumulada
por 100
Class Estado civil Frequênc Freq. Freq. Rel. Freq. Freq.
e (i) (xi) ia (fi) relativa percentual. relativa relativa
(fri) (fri%) acumulad acumulada(f
aci %)
a(faci)

1 Solteiro 13 0,2321 23,21 0,23


23
2 Casado 22 0,3929 39,21 0,62
62
3 Viúvo 4 0,0714 7,14 0,69
69
4 Separado 17 0,3036 30,36 1,0
100
Total=56 1,0 100,0
Distribuição de freqüência de
dados numéricos não agrupados
em intervalos de classe
• Número de peças com defeito por caixa

2 1 1 0 2
0 0 0 1 0
1 0 0 2 1
1 0 0 1 1
0 2 1 0 0
1 2 0 1 0
2 1 1 0 2
0 0 0 1 0
1 0 0 2 1
1 0 0 1 1
0 2 1 0 0
1 2 0 1 0

Classe Peças Frequên Frequên (fri%) (Faci) (Fraci) (Fraci %)


(i) com cia (fi) cia
defeito relativa
por (fri)
caixa
(xi)
1 0 14 0,4667 46,67 14 0,4667 46,67
2 1 11 0,3667 36,67 25 0,8364 83,64

3 2 5 0,1667 16,67 30 1 100


total 30 1 100
Distribuição de freqüência de
dados numéricos agrupados em
intervalos de classe
• Número de classes (k)
• Amplitude amostral (AA)
• Amplitude de intervalo de classe (h)
• Limite superior e inferior do intervalo de classe
• Determinação dos intervalos de classe
• Determinação das frequências dos intervalos de
classe
• Amplitude total (AT)
Número de classes (k)

• Pode ser estabelecido pelo estatístico


• Para uniformizar este valor existem algumas sugestões:

k=1+3,322 log n
ou

k= n

Sendo n o numero de elementos coletados


• k=1+3,322 log n (Sturges)
k=1+3,322 log 50
k=1+3,322 log (5*10)
k=1+3,322 (log5 + log 10)
k=1+3,322 (0,7 + 1)
K=1+5,64=6,64=7

ou

• k= 40 =6,3=7
Amplitude amostral (AA)

• É a diferença entre o maior e o menor


valor observado nos valores coletados
AA= Xmáx – X mín

AA= 55,88 – 16,18


AA=39,7
Amplitude de intervalo de classe
(h)
• É a razão entre a amplitude de classe e o
número de classe
AA A − Amín
h= = máx
k k

AA 55,88 − 16,18
h= =
k 7

h = 5,6714    → 5,68
convenientemente
Limite superior e inferior do
intervalo de classe
• Extremidade dos valores que compõem um intervalo de
classe
• Simbologias adotadas:
Tipo de intervalo Símbolos da
representação
Tipo 1 Tipo 2 Tipo 3
Fechado a esquerda e fechado a direita ├──┤ [a,b] [a,b]
Aberto a esquerda e aberto a direita ─── ]a,b[ (a,b)
Fechado a esquerda e aberto a direita ├── [a,b[ [a,b)
Aberto a esquerda e fechado a direita ──┤ ]a,b] (a,b]

• Assim a representação dos intervalos de classe será:


li ├── Li
Amplitude total(AT)
• É a diferença entre o maior e o menor
valor observados nos intervalos de classe
da tabela de distribuição de frequência.

• AT=(Li - li)

da tabela de distribuição de frequência


Ponto médio de uma classe (xi)
• É a posição média da distribuição de
valores do intervalo de classe, divide o
intervalo em duas partes.

+
l i Li
xi =
2
Exemplo
• Com o objetivo de elaborar um relatório, o
gerente de produção realizou o levantamento
dos salários de todos os operários da linha de
produção da empresa. Os dados estão
registrados na tabela próxima .
Dados salariais dos operários da
empresa (valores em reais)
1800 960 1220 950 1410 1600 1450 1510 1060 980

1330 1190 1130 1800 1390 1740 1660 1400 1760 1840

1270 990 1380 1550 1020 1730 1210 1100 1000 1580

980 1650 1500 950 1800 1620 1280 1300 1220 1440

1510 1660 1200 1330 1700 980 1050 1340 1850 1000
• a) Identifique a variável em estudo e classifique-a.
• b)Elabore uma tabela com os dados organizados
(rol).
• c) Qual o numero de dados coletados na
pesquisa?
• d) Calcule o número de classes(k).
• e) Calcule a amplitude amostral (AA).
• f) Calcule a amplitude do intervalo de classes(h).
• G) Elabore a tabela de distribuição de frequência.
• H) Determine a amplitude total (AT)
• i) Elabore uma tabela discriminando o ponto
médio de cada intervalo de classe(xi), os valores
da fi, fri, fri%, faci, fraci, fraci%,
Resolução
• a) Identifique a variável em estudo e classifique-a.
Variável quantitativa contínua

• b)Elabore uma tabela com os dados organizados (rol).

950 980 1050 1200 1280 1380 1450 1580 1660 1800

950 990 1060 1210 1300 1390 1500 1600 1700 1800

960 1000 1100 1220 1330 1400 1510 1620 1730 1800

980 1000 1130 1220 1330 1410 1510 1650 1740 1840

980 1020 1190 1270 1340 1440 1550 1660 1760 1850
Resolução
• c) Qual o numero de dados coletados na pesquisa?
50 dados coletados

• d) Calcule o número de classes(k).

k = n = 50 = 7classes
ou

k = 1 + 3,222 * log n = 1 + 3,222 * log 50 = 7classes


Resolução
• e) Calcule a amplitude amostral (AA).
AA=Xmáx-Xmín=1850-950=900 reais

• f) Calcule a amplitude do intervalo de


classes(h).
h= AA/k = 900/7 =128,75 reais
Por coerencia é arredondado para 130 reais
Resolução
• g) Elabore a tabela de distribuição de frequência.

Classes i Intervalos de classe Número de


(reais) operários

1 950├── 1080
2 1080 ├── 1210
3 1210 ├── 1340
4 1340 ├── 1470
5 1470 ├── 1600
6 1600 ├── 1730
7 1730 ├── 1860
Rol
950 980 1050 1200 1280 1380 1450 1580 1660 1800

950 990 1060 1210 1300 1390 1500 1600 1700 1800
960 1000 1100 1220 1330 1400 1510 1620 1730 1800
980 1000 1130 1220 1330 1410 1510 1650 1740 1840
980 1020 1190 1270 1340 1440 1550 1660 1760 1850

distribuição de frequência
Classe Intervalos de classe Número de
si (reais) operários
1 950├── 1080 12
2 1080 ├── 1210 4
3 1210 ├── 1340 8
4 1340 ├── 1470 7
5 1470 ├── 1600 5
6 1600 ├── 1730 6
7 1730 ├── 1860 8
Resolução
• h) Determine a amplitude total (AT) Cla Intervalos de Número
sse classe (reais) de
si operários

950 980 1050 1200 1280 1380 1450 1580 1660 1800 1 950├── 1080 12

950 990 1060 1210 1300 1390 1500 1600 1700 1800 2 1080 ├── 1210 4
3 1210 ├── 1340 8
960 1000 1100 1220 1330 1400 1510 1620 1730 1800
4 1340 ├── 1470 7
980 1000 1130 1220 1330 1410 1510 1650 1740 1840
5 1470 ├── 1600 5
980 1020 1190 1270 1340 1440 1550 1660 1760 1850
6 1600 ├── 1730 6
7 1730 ├── 1860 8

• AT = 1860 - 950 = 910 reais


Elabore uma tabela discriminando o ponto médio
de cada intervalo de classe(xi), os valores da fi, fri,
fri%, faci, fraci, fraci%,

classes Intervalo fi xi fri fri% Faci Fraci Fraci


de classes %
1 950├─ 1080 12 1015 0,24 24 12 0,24 24
2 1080 ├─ 1210 4 1145 0,08 8 16 0,32 32
3 1210 ├─ 1340 8 1275 0,16 16 24 0,48 48
4 1340 ├─ 1470 7 1405 0,14 14 31 0,62 62
5 1470 ├─ 1600 5 1535 0,1 10 36 0,72 72
6 1600 ├─ 1730 6 1665 0,12 12 42 0,84 84
7 1730 ├─ 1860 8 1795 0,16 16 50 1 100
total 50 1 100
Representação Gráfica de uma
Distribuição de Frequência
• Histograma
• Polígono de frequência
• Polígono de frequência acumulada
Histograma
• Diagrama de colunas justapostas
• Cada retângulo está relacionado com uma
classe da distribuição
• Não há separação entre os retângulos
• A base de cada retângulo está
relacionado com um intervalo de classe e
a largura de cada retângulo é dada pela
amplitude de cada intervalo
• O eixo da ordenadas corresponde a
frequência
i xi fi
1 2├─ 4 10

2 4 ├─ 6 5

3 6 ├─ 8 8
Propriedades
• A área do histograma é proporcional a
soma das frequências
• Com a frequência relativa se obtém um
gráfico de área “unitária”
• Possibilita a comparação entre duas ou
mais distribuição de frequência
Construção do histograma
i xi fi fri

1 2├─ 4 10 0,44
2 4 ├─ 6 5 0,22
3 6 ├─ 8 8 0,34
total 23 1

20+10+16 = 46 0,88+0,68+0,44=2
Polígono de frequência ( configuração linear)

( variável quantitativa contínua)

i xi X(médio) i fi

1 2├─ 4 3 10
2 4 ├─ 6 5 5
3 6 ├─ 8 7 8
total 23
Polígono de frequência acumulada
(Ogiva de Galton)
(intervalo de classe)

i xi X(médio) fi faci
i

1 2├─ 4 3 10 10
2 4 ├─ 6 5 5 15
3 6 ├─ 8 7 8 23
4 8├─ 10 9 1 24
5 10 ├─ 12 11 1 25
6 12 ├─ 14 13 5 30
total 30
Polígono de frequência acumulada
(Ogiva de Galton)
(sem intervalo de classe)

i Xi fi faci

1 2 10 10
2 4 5 15
3 6 8 23
4 8 1 24
5 10 1 25
6 12 5 30
6 14 2 32
total 32
Formas das curvas de frequência
• Em forma de sino: simétrica e assimétrica
• Em forma de Jota: Jota e Jota invertido
• Em forma de U

• Distribuição retangular
Medidas de posição
• Medidas de posição de tendência central:
-média
-mediana
-moda

• Medidas de posição de separatrizes:


Mediana, quartis, decis e percentis
Média
• Média aritmética simples ( para dados não agrupados)
n

__
x + +...+ x
∑x i
1 x2 i =1
x= n
=
n n
-Exemplo: Calcule a média dos salários abaixo (R$):
1000, 1200, 1300, 900, 1000, 1400

1000 + 1200 + 1300 + 900 + 1000 + 1400 6800


= = 1133,3
6 6
Média
• Média aritmética ponderada ( para dados agrupados)
__
p1. x1 + p2. x2 + p3 x3...+ pn xn
x=
p+p +p
1 2 3
+ ... + p n

-Exemplo: Calcule a média das 3 notas (9, 3 e 7), sendo que as


mesmas tem pesos 2, 1 e 4 respectivamente:

2.9 + 1.3 + 4.7 18 + 3 + 28 49


= = =7
2 +1+ 4 7 7
Média:Aplicação na estatística
(dados não agrupados)
• Foi realizada uma pesquisa 0 0 0 0 1 1 1 1 1 1
em 50 residências para saber
o número de computadores 1 1 1 1 1 1 1 1 1 1
em cada casa. A tabela
representa os dados 1 1 1 2 2 2 2 2 2 2
organizados desta pesquisa.
Calcular a média aritmética.
2 2 2 2 2 2 2 2 2 3
3 3 3 3 3 3 3 3 4 4
resolução
n __ + +...+ x
∑x
i =1
i
x= x1 x2

n
n
=
__
86
n x= 0 + 0 + 0 + 0 +1+1+1+1+1+1+......+ 3+ 4 + 4
= = 1,7
50 50
Média: Aplicação na estatística
(dados agrupados sem intervalos de classe)
Nº de Nº de
• Foi realizada uma pesquisa computadores residências
xi.fi
em 50 residências para saber (xi)
(fi)

o numero de computadores 0 4 0
em cada casa. A tabela 1 19 19
representa esta pesquisa. 2 16 32
Calcular a média aritmética 3 9 27
ponderada dessa distribuição. 4 2 8
total 50 86

resolução
__
x .f
1
+ x2 . f + x3 . f + x4 .
f + x5 . f
x= 1 2 3 4 5

__
x=
∑ x .f i i
f 1
+ f 2
+ f 3
+ f +f 4 5

__
0.4 + 1.19 + 2.16 + 3.9 + 4.2 86
∑f i
x=
4 + 19 + 16 + 9 + 2
=
50
= 1,7
Média: Aplicação na estatística
(dados agrupados com intervalos de classe)
altura Nº de Ponto médio
• Uma nova técnica de das alturas xi.fi
(xi) pés
adubação foi testado em 109 (fi)
pés de milho. Foram medidas 150├ 157 7 153,5 1074,5
as alturas das plantas(em cm) 157 ├ 164 19 160,5 3049,5
com dois meses e os 164├171 25 167,5 4187,5
resultados apresentados na 171├178 26 174,5 4537
tabela.Calcule a média das 178├185 21 181,5 3811,5
alturas dos pés de milho. 185├192 8 188,5 1508
192├199 3 195,5 583,5
resolução total 109 18754,5
__
x=
∑x .f
i i __
x .f
1
+ x2 . f + x3 . f + ... + x7 . f
x= 1 2 3 7

∑f i f 1
+ f 2
+ f 3
+ ... + f 7
__
7.153,5 + 19.160,5 + ... + 3.195,5 18754,5
x= = = 172,06
7 + 19 + ... + 3 109
Moda
É o valor que ocorre com maior número de
ocorrência ( serie não agrupada)

Exemplo: Dada a serie estatística constituída pelos dados brutos:


4,5,7,10,2,12,8,7,5,2,10,8,11,7,3,9,6,8

Organizado os dados em ordem crescente:


2,2,3,4,5,5,6,7,7,7,7,8,8,8,9,10,10,11,12

O valor modal desta serie é 7, pois é o valor com maior número de


repetições
Moda: Aplicação na estatística
(dados não agrupados)
• Foi realizada uma pesquisa em 50
residências para saber o numero
0 0 0 0 1 1 1 1 1 1
de computadores em cada casa. 1 1 1 1 1 1 1 1 1 1
A tabela representa esta
pesquisa. Calcular a moda dessa 1 1 1 2 2 2 2 2 2 2
situação.
2 2 2 2 2 2 2 2 2 3
Resolução
3 3 3 3 3 3 3 3 4 4
O número que repete mais vezes é 1
, portanto o valor modal é 1.
Moda: Aplicação na estatística
(serie agrupada sem intervalo de classe)
i Nº de Nº de
• Foi realizada uma pesquisa computadores residências
em 50 residências para saber (xi)
(fi)
o numero de computadores
em cada casa. A tabela 1 0 4
representa esta pesquisa. 2 1 19
Calcular a moda dessa
3 2 16
distribuição de frequência.
4 3 9
5 4 2
total 50

resolução

O número que repete mais


vezes é 1 (19 vezes), portanto
o valor modal é 1.
Moda
(dados agrupados com intervalos de classe)

 
• Fórmula de Czuber: = +  d 1 .
M 0 l M 0  +  hM 0
 d1 d 2 

l + Lm 0
• Moda bruta: = m0
M 0
2
Moda: Aplicação na estatística
(dados agrupados com intervalos de classe)
• Uma nova técnica de adubação altura Nº de
foi testado em 109 pés de milho. (xi) pés
Foram medidas as alturas das (fi)
plantas(em cm) com dois meses e 150├ 157 7
os resultados apresentados na
tabela.Calcule a moda das alturas 157 ├ 164 19
dos pés de milho. 164├171 25
171├178 26
178├185 21

• Fórmula de Czuber: 185├192 8


192├199 3

  total 109

= +  d 1 .
M 0 l M 0  +  hM 0
 d1 d 2 
altura Nº de
pés
Fórmula de Czuber: (xi)
(fi)

  150├ 157 7
d
M = l M +  + . hM
0
1 157 ├ 164 19

d d  164├171 25
0 0
1 2
Sendo 171├178 26
178├185 21
• lm0 = limite inferior da classe modal
185├192 8
• d1 = diferença entre a frequência da classe
192├199 3
modal e a frequência anterior a classe modal
total 109
• d2 = diferença entre a frequência da classe modal
e a frequência postreior a classe modal
• hm0 = amplitude da classe modal
 26 − 25 
M0 = 171 + 
 (26 − 25) + (26 − 21) .7 =
 

 1  7
171 +  .7 = 171 + = 171 + 1,16 = 172,16
1+ 5  6
Moda bruta
altura Nº de
• É a média entre os limites (xi) pés
(fi)
inferior e superior 150├ 157 7
157 ├ 164 19
164├171 25

= l m 0 + Lm 0 171├178 26

M 0
2
178├185
185├192
21
8
192├199 3
total 109

171 + 178 349


M 0 = 2 = 2 = 174,5
Mediana
• É uma medida de posição, é uma
separatriz pois divide o conjunto de dados
coletados (após serem ordenados) em
duas partes iguais
Exemplo 1:
Dados os números:1,2,3,4,5 a mediana é o 3 pois divide o conjunto em
duas partes iguais

Exemplo 2:
Dados os números: 1,2,3,4,5,6,7,8 a mediana está entre os números 4
e 5 pois existem três números antes do 4 e três números após o 4
Exemplo 1: (número impar de elementos)
Dados os números:1,2,3,4,5 a mediana é o 3 pois
divide o conjunto em duas partes iguais
Fórmula da posição:
n +1
Pmd = 2

Exemplo 2: (número par de elementos)


Dados os números: 1,2,3,4,5,6,7,8 a mediana
está entre os números 4 e 5 pois existem três
números antes do 4 e três números após o 4
Fórmula da posição:

n n
Pmd = entre 2 e 2 + 1
Mediana: Aplicação na estatística
(dados não agrupados)

• Foi realizada uma pesquisa em


50 residências para saber o
0 0 0 0 1 1 1 1 1 1
numero de computadores em 1 1 1 1 1 1 1 1 1 1
cada casa. A tabela representa
esta pesquisa. mediana dessa 1 1 1 2 2 2 2 2 2 2
situação.
• Resolução:
n 50
Pmd 2 = 2 = 25
= 2 2 2 2 2 2 2 2 2 3
O número que se encontra na
3 3 3 3 3 3 3 3 4 4
25ª posição e o 2
n 50
P md
= +1 = + 1 = 26
2 2
O número que se encontra na
26ª posição e o 2
A media entre 2 e 2 é 2
Mediana: Aplicação na estatística
(dados agrupados sem intervalos de classe)
i Nº de Nº de intervalos
• Foi realizada uma pesquisa em 50 comput
(Fa
residências para saber o numero de adores residê c i)
(xi) ncias
computadores em cada casa. A tabela (fi)
representa esta pesquisa. Calcular a
1 0 4 4 Do 1º ao 4º termo
mediana dessa distribuição.
2 1 19 23 Do 4º ao 23º termo
Resolução: 3 2 16 39 Do 23º ao 39º
termo
n 50 4 3 9 48 Do 39º ao 48º
Pmd = 2

→ = 25
2
termo
5 4 2 50 Do 48º ao 50º
termo
O vigésimo quinto elemento pertence a 3ª
total 50
classe( 2 computadores por
residência)
Interpretação: 50 % das residências tem
2 ou menos computadores e 50 %
das residências tem 2 ou mais
computadores e
Mediana: Aplicação na estatística
(dados agrupados com intervalos de classe)
altura Nº de Faci intervalo
• Uma nova técnica de (xi) pés
adubação foi testado em 109 (fi)
pés de milho. Foram medidas 150├ 157 7 7 Do 1º ao 7 º
elemento
as alturas das plantas(em cm)
157 ├ 164 19 26 Do 7º ao 26º
com dois meses e os
164├171 25 51 Do 26º ao 51º
resultados apresentados na
171├178 26 77 Do 51º ao 77º
tabela.Calcule a mediana das
178├185 21 98 Do 77º ao 98º
alturas dos pés de milho.
185├192 8 106 Do 98º ao 106º
192├199 3 109 Do 106º ao 109º
• Resolução
total 109
n 109
P md
= = 54,5
2 2
• Entre o 51º e o 77º (4º classe)
Fórmula de interpolação altura Nº de
pés
Faci intervalo
(xi)
(fi)
n 
 2 − F ant 
150├ 157 7 7 Do 1º ao 7 º
elemento
M d
= l md +  . hmd 157 ├ 164 19 26 Do 7º ao 26º
 f md  164├171 25 51 Do 26º ao 51º
  171├178 26 77 Do 51º ao 77º
178├185 21 98 Do 77º ao 98º

• Onde: 185├192 8 106 Do 98º ao 106º


192├199 3 109 Do 106º ao
lmd=limite inferior do intervalo 109º
Fant= Freq. acum. da classe total 109
anterior
fmd= frequência da classe modal
n= número de elementos  109 
 2 − 51
hmd= amplitude da classe = 171 +  .7 = 171,94
mediana
M d
 26 
Lmd=limite inferior do intervalo  
Medidas de dispersão ou de
variabilidade
Servem para verificar a representatividade
das medidas de posição.
Os estudos anteriores não são suficientes para estudos comparativos ou
conclusões qualitativas.
Quanto maior for a variação dos dados menor a representatividade da média.

• Amplitude total
• Variância e desvio total
• Coeficiente de variação
Amplitude total
• Para serie simples: AT = X máx − X mín
Ex: (1,3,4,4,5,7,9) → AT= 9-1=8

• Em gráficos: δ T
= X máx
− X mín

δ T
= 5000 − 2700 = 2300

• Para dados agrupados: A =L


T máx
− l mín
x f

= 11 − 2 = 9
2├5 14
5├8 10 A T
8├11 21
Variância e desvio padrão
• O desvio padrão é a raiz da variância e
consequentemente a a variância é o
quadrado do desvio padrão.

Des = Var ou Var = (des) 2

nota: A variância pode ser notada como S2 e o desvio padrão como S.

Exemplo: Se a variância de um conjunto de dados é 36, o desvio


padrão é a raiz de 36 que é igual a 6
Variância e desvio padrão
(para dados não agrupados)

• Para uma população

∑ ∑ ∑ ( x − x) ∑d
2 2 2
( x − x) 2

var = i
= d i des = i
= i

n n n n

• Para uma amostra

∑ ∑d ∑ ( x − x) ∑d
2 2
( x − x) 2 2

var = i
= i des = i
= i

n −1 n −1 n −1 n −1
Variância e desvio padrão
(para dados agrupados)

• Para uma população

var =
∑ (x − M
i e
) 2
. f ∑ xi M e .
( − ) 2
f
des =
i i

∑f i ∑f i

• Para uma amostra

∑ (x − M ) . f 2
∑ xi M e .
( − ) 2
f
des =
(∑ f )− 1
i e i
var =
(∑ f )− 1
i

i i
Dispersão absoluta e relativa

Dispersão absoluta: serie com maior valor de


desvio padrão

Dispersão relativa: razão entre a dispersão


absoluta e a média

disp.abs.
disp.rel. =
média
Coeficiente de variação de
Pearson

• É a razão entre o desvio padrão e a média


aritmética

des
cv =
média
Aplicação: Determine o desvio padrão e o
coeficiente de variação da quantidade de
quartos alugados no hotel
Mês Quartos (x) X-méd (X-méd)2

jan 760 452,22-760=307,7 (307,7)2 = 94727

fev 690 452,22 – 690= 237,7 56538

mar 380 452,22 – 380= 72,2 5216

abr 280 452,22 – 280= 172,2 29660

mai 320 452,22 – 320=132,2 17482

jun 300 452,22 – 300= 152,2 23161

jul 710 452,22 – 710= 257,7 66449

ago 270 452,22 – 270= 182,2 33204

set 360 452,22 – 360=92,2 8504

total 4070 334955,6


méd .quartos =
∑ quartos 4070
= = 452,2
Mês Quart X-méd (X-méd)2 total meses 9
os (x)
jan 760 452,22- (307,7)2
760=307,7 = 94727

∑ xi
fev 690 452,22 – 56538
690= 237,7 ( − x ) 2
334955,6
mar 380 452,22 – 5216 var = = = 37217,2
380= 72,2 n 9
abr 280 452,22 – 29660
280= 172,2
mai 320 452,22 –
320=132,2
17482 Des = Var →
jun 300 452,22 – 23161
300= 152,2 → des = 37217,2 = 192,9
jul 710 452,22 – 66449
710= 257,7
ago 270 452,22 – 33204
270= 182,2
des 192,9
set 360 452,22 –
360=92,2
8504
cv = = = 0,42 = 42%
total 4070 334955,6
média 452,2
Comparação entre dois Hotéis
Mês Quartos ocupados
Hotel A Hotel B
jan 760 420
fev 690 450
mar 380 510
abr 280 460
mai 320 470
jun 300 440
jul 710 480
ago 270 430
set 360 410
média 452,22 452,22
Desvio padrão 192,2 31,53
Coef. de variação 42,6 % 6,97 %
Exercícios
1.Dada a série: 10;5;8;9;3;9, calcule: A média, a
mediana,a moda, a variância, o desvio padrão e
o coef. de variação.

2.Numa prova de estatística as notas de 6 moças


e seis rapazes foram:
Moças: 3,5; 4,0; 6,0; 8,5; 8,0; 10,0
Rapazes: 4,5; 5,5; 6,0; 6,5; 7,5; 9,0
Pede-se:
a)Calcular a media, o desvio, e o coef. De var de
cada grupo
b) Qual grupo apresenta maior dispersão das
notas
3. A tabela abaixo refere-se as diárias com
café da manha de uma cidade praiana.

i Valor da diária(R$) Nº de diárias


1 40,00├ 80,00 5
2 80,00├ 120,00 16
3 120,00├ 1600,00 21
4 160,00├ 200,00 27
5 200,00├ 240,00 18
6 240,00├ 280,00 10
7 280,00├ 320,00 6

Calcule a variância, o desvio padrão e o


coeficiente de variação de Pearson
Resolução
i Valor da diária(R$) Nº de diárias Pto medio x. f (x.f)^2

1 40,00├ 80,00 5

2 80,00├ 120,00 16

3 120,00├ 1600,00 21

4 160,00├ 200,00 27

5 200,00├ 240,00 18

6 240,00├ 280,00 10

7 280,00├ 320,00 6

total

S-ar putea să vă placă și