Documente Academic
Documente Profesional
Documente Cultură
CERENA
Centro de Recursos
Naturais e Ambiente
Objectivos
Bibliografia
Eco, Umberto (2005) Como se faz uma tese em cincias humanas. 12 edio, Editorial
Presena. Lisboa. 238 p.
Guimares, Rui Campos; Cabral, Jos A. Sarsfield (1998) Estatstica. McGraw Hill.
Murteira, Bento J. (1993) Anlise exploratria de dados. Estatstica descritiva. McGraw Hill.
Pereira, Alexandre ; Poupa, Carlos (2003) Como escrever uma tese, monografia ou livro
cientfico: usando o Word. 3 edio, Edies Slabo. Lisboa. 226 p.
Escolar Editora.
FACULDADE
DE
ARQUITECTURA
A razo pela qual um cientista decide estudar um determinado fenmeno e no outro, prende-se com o
interesse pessoal que esse fenmeno lhe desperta e com a preparao acadmica que tem, ainda que, por
vezes, tambm seja influenciado pelas necessidades da sociedade, uma vez que, um certo trabalho cientfico
tem, em determinadas ocasies, um carter social marcante.
Assim, por exemplo, para determinar a velocidade de propagao do som em diferentes meios, os cientistas constataram em
primeiro lugar que essa velocidade dependia da massa especfica do meio (aspecto qualitativo) e logo depois puderam, com
equipamento adequado, medir a velocidade do som em diferentes meios (aspecto quantitativo), obtendo que,
no ar se propaga a 340 m/s, na gua a 1 500 m/s, no ferro a 5 130 m/s, etc.
Problema
Observao
Instrumentos
e Tcnicas
Pesquisa
Hiptese(s)
Experimentao
Anlise
de Dados
Resultados
Concluses
Esta observao deve ser realizada vrias vezes (deve ser repetida reiterada);
minuciosa (deve-se tentar apreciar o maior nmero possvel de detalhes),
rigorosa (deve ser realizada com a maior preciso possvel) e
sistemtica (deve ser efectuada de forma ordenada).
Anote tambm:
Ser que observando do alto de uma montanha o tamanho desse arco
aumenta ou diminui?
O raio mdio da circunferncia altera-se?
Se eu estiver num avio ter ele, ainda, a forma de um arco?
A formulao de hipteses
Depois de observar o fenmeno e de reunir documentao suficiente sobre
observaes j efectuadas por outros, o investigador deve procurar uma
argumentao que permita explicar e justificar cada uma das caractersticas
de tal fenmeno.
hiptese cientfica.
Trabalho de laboratrio
Efectuando-se a montagem acima e dirigindo o feixe de luz proveniente da fonte para o balo cheio
de gua (e isso pode ser substitudo por um bolbo de lmpada incandescente da qual se extraiu seu
miolo), poder observar projectado sobre a tela, uma a seguir outra, as cores que formam o arcoris.
temperatura (C)
28
26
22
20
20
FACULDADE
DE
ARQUITECTURA
Hipteses
Metodologia
Amostragem
Instrumentao
Anlise de Dados
Resultados
Discusso de resultados
Concluses
Referncias Bibliogrficas
TITLE
ABSTRACT
INTRODUCTION
OBJECTIVES
REVIEW OF THE
RESEARCH / STATE OF
THE ART
HYPOTHESES
METHODOLOGY
SAMPLING
INSTRUMENTATION
DATA ANALYSIS
RESULTS
DISCUSSION / IMPLICATIONS
CONCLUSIONS
REFERENCES
A Dissertao
Capa;
A primeira pgina deve ser uma cpia da capa. As pginas seguintes devem respeitar a sequncia
indicada:
a) Resumo em portugus com cerca de 200 palavras e cerca de 5 palavras chave;
b) Resumo em ingls com cerca de 200 palavras e cerca de 5 palavras chave;
c) Agradecimentos (opcional);
d) ndices;
e) Glossrio de termos e abreviaturas;
f)
Texto da dissertao;
g) Referncias bibliogrficas;
h) Anexos.
A capa e a primeira pgina no so numeradas. O texto referido nas alneas f) a h) do nmero
anterior deve ser numerado, com numerao rabe, sequencialmente comeando no
nmero 1
As pginas referidas nas alneas a) a e) devem ser numeradas sequencialmente com numerao
romana.
A Dissertao Capa
Ttulo
ndices
ndice do trabalho, de figuras, de fotografias, de quadros, de tabelas,
de frmulas, etc.
1. Introduo
1.1. Enquadramento (inclui estrutura do trabalho)
1.2. Objectivo(s)
1.3. Metodoglogia
2. Estado da Arte
...
...
...
5. Discusso de resultados
6. Concluses
7. Desenvolvimentos futuros
8. Referncias bibliogrficas
9. Anexos
Texto do trabalho
Dividido em captulos e sub-captulos. Os ttulos dos captulos e sub-captulos
em que se estrutura e organiza hierarquicamente o trabalho no devem
ir alm de quatro nveis, considerando o ttulo de cada captulo principal
como correspondendo ao nvel 1;
Estilo narrativo a utilizar deve ser coerente do princpio ao fim do trabalho;
Estilo Plural Magesttico (ns);
Estilo Impessoal (fez-se, procurou-se, conclui-se, etc.)
Estilo de carcter narrativo (o autor referiu, o autor concluiu, etc.)
Estilo pessoal (pretendo, procurei, conclu, etc.)
As afirmaes directas devem ser documentadas, remetendo para as fontes;
A seleco e oportunidade das citaes um importante factor de avaliao
de um trabalho cientfico.
Texto do trabalho
Palavras ou expresses estrangeiras isoladas devem ocorrer em itlico;
Evitar linguagem pleonstica;
Forma pleonstica
Forma correcta
antdoto contra
coincidir com
subir para cima
entrar para dentro
breve alocuo
monoplio exclusivo
principal protagonista
sob o ponto de vista
antdoto para
coincidir em
subir para
entrar
alocuo
monoplio
protagonista
do ponto de vista
Texto do trabalho
Citaes:
autor;
ano de publicao;
pgina(s).
Exemplos:
(Nemsio, 1970: 24)
(Ribeiro, 1999: 212)
(Escofier e Pags, 2002)
(Pereira et al., 1993a)
(Pereira et al., 1993b)
Referncias Bibliogrficas
Por ordem alfabtica dos apelidos.
de livros:
exemplos:
autor./,
ttulo./,
volume./,
n de edio,
tradutor,
coleco,
editor,
local de publicao,
data,
pgina(s).
Referncias Bibliogrficas
Por ordem alfabtica dos apelidos.
de artigos de livros:
autor./,
ttulo do artigo,
ttulo da publicao./,
volume./,
n de edio,
tradutor,
editor,
local de publicao,
data,
pgina(s).
exemplos:
Bersani, Leo. Realism and the Fear of Desire, in Realism.
Ed. por Lilian R. Furst, Longman, Londres e Nova Iorque, 1992, 240-60.
Derrida, Jacques. On commence et comment finit un corps
enseignant, in Politiques de la philosophie. Ed. por Dominique Grisoni,
Bernard Grasset, Paris, 1976, 55-97.
Pereira, H.G.; Brito, G.; Albuquerque, T.; Ribeiro, J. Geostatistical
estimation of a summary recovery index for marble quarries.
Geostatistics Tria 92, vol. 2, Amlcar Soares ed.,
Kluwer Academic Publishers, 1993, 1029-1040.
AA. VV. Geostatistical estimation of a summary recovery index
for marble quarries. Geostatistics Tria 92, vol. 2, Amlcar Soares eds.,
Kluwer Academic Publishers, 1993, 1029-1040.
Referncias Bibliogrficas
Por ordem alfabtica dos apelidos.
de artigos de revistas ou jornais:
autor./,
ttulo do artigo,
ttulo da publicao./,
volume,
n de srie,
tradutor,
editor,
local de publicao,
data,
pgina(s).
exemplos:
Derrida, Jacques. Signature Event Context, Glyph. Vol.1, The Johns
Hopkins University Press, Baltimore, 1977, 172-97.
Loureno, Eduardo. Um Rio de ntimo Sossego, Pblico (09-07-1994).
Sen, Z. Cumulative semivariogram models of regionalized variables.
Math. Geol., vol. 21, n 8, 1989, 891-903.
Referncias Bibliogrficas
Por ordem alfabtica dos apelidos.
de sites da WWW:
autor, instituio./
endereo./,
data de consulta.
exemplos:
Wikipedia. http://pt.wikipedia.org/wiki/Azulejo
(consultado em Outubro de 2007)
Instituto Cames. http://www.instituto-camoes.pt/cvc/azulejos/index.html
(consultado em Outubro de 2007)
Ponte, Carlos Alberto Bicudo (2002). Aproveitamento de Recursos
Geotrmicos para Produo de Electricidade nos Aores. Boletim
de Minas, Vol. 39 - n 3/4. Instituto Geolgico e Mineiro. Lisboa.
in http://e-geo.ineti.pt/geociencias/publicacoes/ (consultado em Maro de 2005)
Instrues especficas
Instrues especficas
Instrues especficas
Instrues especficas
Instrues especficas
FACULDADE
DE
ARQUITECTURA
INTRODUO
ESTATSTICA
JORGE MANUEL TAVARES RIBEIRO
2008, 2009
FA - UTL, LISBOA
O que a Estatstica?
A palavra Estatstica tem a sua origem no latim status designao esta que significa
Estado, no sentido poltico do termo. Segundo diversos autores, o termo Estatstica foi
usado pela primeira vez em 1589 pelo historiador italiano Girolami Ghilini num estudo
civile, politica, statistica e militare scienza.
A obteno de dados
A Amostragem a disciplina que se ocupa das questes
associadas obteno de amostras convenientes,
nomeadamente no que respeita dimenso, que deve ser
adequada para a obteno de estimativas populacionais
com a preciso que interessa.
O Planeamento de Experincias a disciplina complementar da
Amostragem, no que respeita obteno dos dados. Com efeito, quando
se pretende estabelecer relaes entre variveis mais importante ainda
produzir os dados que devem ser analisados, ou pelo menos controlar
tudo quanto se possa controlar, aleatorizar o que no for possvel
controlar.
O tratamento inicial
O tratamento inicial compreende a ordenao, o clculo
de caractersticas amostrais, o agrupamento em classes,
as representaes grficas em suma, aquilo que constitui um dos
ramos da Estatstica a estatstica descritiva (ou estatstica dedutiva) e anlise
exploratria de dados.
O outro ramo da Estatstica a inferncia estatstica (ou estatstica indutiva) que tem por base a Teoria das
Probabilidades, permite induzir do que se verifica numa amostra para a populao de que esta foi extrada, i.e.
tomar decises sobre hipteses, estimar parmetros populacionais a partir das caractersticas amostrais
relevantes, comparar populaes, relacionar uma varivel resposta com variveis controladas, etc., constituindo
um instrumento de previso da evoluo futura de um fenmeno em estudo.
Classificaes da Estatstica
ESTATSTICA DESCRITIVA ou DEDUTIVA
ESTATSTICA
ESTATSTICA INDUTIVA ou INFERNCIA ESTATSTICA
Variveis
CARACTERSTICAS
VARIVEIS
Var.
QUANTITATIVAS CONTNUAS: podem assumir um valor qualquer numa gama de valores de uma
escala (Processos de Medio)
Nominal
ESCALAS
Ordinal
Intervalo
Qualitativas
Quantitativas
Absoluta
X
A obteno de informao
Inquirindo um nmero restrito de pessoas, com a condio
de que estas tenham sido correctamente escolhidas,
possvel obter as mesmas informaes, com uma certa
margem de erro (erro quantificvel), que se pode tornar
suficientemente pequeno.
A Amostra deve apresentar caractersticas idnticas s da populao, i.e.,
deve ser representativa.
A amostra representativa se os elementos que a constituem forem escolhidas por um processo tal que todos
os elementos da populao tenham a mesma probabilidade de fazer parte da amostra.
Dimensionamento de amostras
Recolher e tratar uma amostra grande de mais para os resultados que se
pretendem obter, constitui um evidente desperdcio de recursos;
Recolher uma amostra cuja dimenso no suficiente para se poderem tirar
concluses, constitui um erro.
Dimensionamento de amostras
EXEMPLO:
Edifcios a recuperar num bairro
p z / 2
z / 2 z 0.025 1.96
Y N Y
N
Y a proporo real
Y N Y
1.96
0.03
3
N
Dimensionamento de amostras
EXEMPLO:
A proporo de edifcios a recuperar num bairro ser estimada a partir de um grupo de
edifcios constitudo para esse efeito.
Para determinar uma estimativa de p pode-se recolher uma amostra piloto de dimenso
fixada arbitrariamente. Admita-se que a partir de uma amostra de n = 30 edifcios se obteve
y = 3 edifcios a necessitar de recuperao.
Ento
y 3
p
0.1
n 30
0.1 N N 0.1 N
1.96
0.03
3
N
N 384.16
ou
N 385
FACULDADE
DE
ARQUITECTURA
AMOSTRAGEM
QUESTIONRIOS E INQURITOS
JORGE MANUEL TAVARES RIBEIRO
2008
FA - UTL, LISBOA
Questionrios Objectivos
Estimar certas grandezas absolutas:
despesas ao longo de um certo perodo de tempo, percentagem de pessoas com uma
determinada opinio, percentagem de pessoas que lem um certo jornal ou que
compram um determinado produto, etc.
Questionrios Elaborao
Questionrios Execuo
Um questionrio deve parecer uma troca de palavras to natural quanto
possvel e as questes encadearem-se umas nas outras sem repeties
nem despropsitos.
Se necessrio garantir uma certa coerncia no contedo das questes
e na sucesso dos temas, a variedade na forma das questes , em
geral, bem recebida, evitando uma impresso de monotonia, a qual
constitui um dos principais perigos dos questionrios longos.
Questionrios entre 45 60 min.
Questionrios < 10 min.
As justificaes das respostas, sob a forma de porqu, provocam
facilmente a irritao das pessoas.
Evitar que uma resposta possa ser dada por razes muito diferentes;
Deseja a nacionalizao das grandes empresas?
substituir por
FACULDADE
DE
ARQUITECTURA
ESTATSTICA
Univariada, Bivariada, Multivariada
ENQUADRAMENTO
que tem
importncia muito relevante
para
resolver problemas prticos?
ENQUADRAMENTO
Identificao
da
Comp.
Incl.
N Int.
Curv.
Abert.
0102001
22.5
38.5
3.8
4.77
39.0
0102002
24.2
36.5
2.5
3.22
21.5
.
.
.
.
.
.
.
.
.
.
.
.
0403114
62.4
44.5
Rochas ornamentais
descontinuidade
.
.
Local
e
.
.
.
perodo
de .
.
. IBO
amostragem
16.8
2.21
AN2
0403115
73.1
45.9
17.5
.
.
.
OD .
.
.
.
pH.
11.9
8.0
19.8
38
4.07
Cond
.
.
.
CQO
.
1200
42
17.0
5
97
.
.
.
.
.
.
.
.
.
.
.
.
NA7
58
indivduos
24.6
8.1
798
NM8
110
01A 7.7
19
1
333
Doena
infecciosa
.
.
.
.
Identificao
.
.
. dos
.
271
.
.
.
CMPR
.
Fosf.
Cu
Fe
0.96
0.01
0.96
0.22
gua
superficial
1
169
0.88
AF3
7.3
Sulf.
2
8.2
.
.
.
.Nit.
41
.
.
.
DIAG
.
33
0.19
.
.
.
TEMP
.
.
.
.
.
.
.
. FSTR .
25
54
2
15
24
0.21
1
.
.
.
STAY
.1
0
.
.
.
.
CD45
RO/4
CD25
CD25/3
CVIRAL
1.43
1
.
1.2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
02A
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
54A
55A
ENQUADRAMENTO
ENQUADRAMENTO
Sustentabilidade das intervenes de
reabilitao em edifcios pombalinos
ENQUADRAMENTO
Caracterizao
da habitao em Maputo
ENQUADRAMENTO
Sustentabilidade das intervenes de reabilitao em edifcios pombalinos
Localizao geogrfica
ENQUADRAMENTO
ZPT
Bengalena Island
MGNN
MHT
ABZ
Xefina Pequena
MJHZ
GD
3F
BGM
25Ja
25Jb
IGa NSL
Aeroporto
Xefina Grande
IGb
Jard
MVa
Esturio
do Espirito Santo
U7
LC
MATOLA
Catembe
MAPUTO
APb
APa
CHMd
CHMc
XPM
MLG
Main Road
10 Km
MKD
Railway
Airport
Water
Maputo City
MVb
FPLM
PCNb
MXQd
PCNa
MFL MHGb
Coop Somm
MHGa
Cta
Ctb
PCTb
Ctc
PCTa
AMa
AMb
Ferr
HLa
MXQa
MXQb
Urb
MXQc
CHMb
CHMa
CS
LL
HLb
Machava
Bairros Boundaries
4 Km
ENQUADRAMENTO
Meses secos
Meses hmidos
FACULDADE
DE
ARQUITECTURA
ESTATSTICA
Estatstica Univariada
Distribuies de Frequncia
DADOS QUALITATIVOS
Distribuio dos dados por um conjunto de diferentes Categorias ou Classes:
Tabelas de Frequncia;
Diagramas de Barras;
Diagramas Circulares.
Exemplo: Numa amostra constituda por 120 edifcios, constatou-se que 100 estavam em bom estado de conservao,
15 necessitavam de obras de recuperao e 5 eram para demolir.
Tabela de Frequncias Absolutas e Relativas
Diagramas de Barras
Diagrama Circular
Categorias
fA
fr (%)
120
Obras de recuperao
A demolir
Totais
100
83.3
15
12.5
4.2
120
100.0
4%
13%
Bom estado de
conservao
A necessitar de
recuperao
Freq. Absolutas
100
Bom estado
80
60
40
20
A demolir
83%
Nk
k 1
N
fr k
N
ou
A necessitar de
recuperao
A demolir
A necessitar de
recuperao
A demolir
90
N
f r (%) k 100
N
360 f
A
N
80
em que:
A ngulo;
f frequncia;
N nmero de dados
Bom estado de
conservao
70
60
50
40
30
20
10
0
Bom estado de
conservao
Codificao
DADOS QUALITATIVOS
QUADRO DE DADOS QUALITATIVOS
Distribuies de Frequncia
DADOS QUANTITATIVOS
Agrupamento dos dados em Classes ou Categorias, juntamente com as
frequncias correspondentes
Representaes Tabular ou Grfica;
Estatsticos;
Representao Grfica de Estatsticos
Estatsticos
bsicos
IBO
OD
(%)
T
(C)
pH
Cond
(S/cm)
CQO
(mg/l)
Sulf.
(mg/l)
Nit.
(mg/l)
Fosf.
(mg/l)
Cu
(mg/l)
Fe
(mg/l)
Mdia
4.26
80.9
16.8
7.9
1763.0
15.5
487.7
35.524
0.140
0.008
0.259
Mediana
4.0
87.0
16.8
7.7
1470.0
10.0
297.0
4.500
0.100
0.000
0.180
Mnimo
1.0
23.0
5.7
5.9
155.0
0.0
9.4
0.000
0.000
0.000
0.000
Mximo
5.0
131.0
29.2
11.6
7780.0
138.0
3190.0
202.000
1.700
0.094
2.250
1 Quartil
4.0
66.0
12.9
7.3
343.0
5.0
35.0
0.300
0.000
0.000
0.080
3 Quartil
5.0
95.0
20.9
8.2
2750.0
21.0
940.0
51.500
0.200
0.013
0.350
Amplitude
4.0
108.0
23.5
5.7
7625.0
138.0
3180.6
202.000
1.700
0.094
2.250
1.0
29.0
8.0
0.9
2407.0
16.0
905.0
51.200
0.200
0.013
0.270
0.84
457.5
33.5
0.9
327.8
2.9x10
2819.82
0.043
-4
0.093
0.916
21.390
5.784
0.962
1524.38
18.106
537.973
53.102
0.207
0.014
0.304
-1.361
-0.519
0.051
1.667
0.995
3.035
1.456
1.602
3.889
2.895
3.121
Amplitude
entre quartis
Varincia
Desvio
padro
2.3x10
2.0x10
Coeficiente
de
Assimetria
Distribuies de Frequncia
Intervalos e limites de classe
Exemplo: Consumo mensal de energia elctrica (em kWh) de uma srie de 180 edifcios de uma cidade.
502.25
498.35
500.36
499.20
503.76
499.19
500.24
498.65
500.86
497.72
499.38
499.83
.
.
.
.
.
.
.
.
.
.
.
.
TABELA DE FREQUNCIAS
Intervalo da classe
Limite superior
Limite inferior
AMPLITUDE DA CLASSE:
fA
f Aa
fr (%)
f ra (%)
497.00 499.00
499.00 501.00
501.00 503.00
503.00 505.00
505.00 507.00
39
88
31
16
6
39
127
158
174
180
21.7
48.9
17.2
8.9
3.3
21.7
70.6
87.8
96.7
100.0
Totais
180
Consumo (kWh)
pm
100.0
POLGONO DE FREQUNCIAS
RELATIVAS ACUMULADAS
70
60
50
40
120
30
20
10
0
495-497 497-499 499-501 501-503 503-505 505-507 507-509
(g)
Consumo Peso
(kWh)
60
50
40
Freq. Absolutas
80
100
80
60
40
20
30
0
495
20
497
499
501
503
505
507
509
(g)
ConsumoPeso
(kWh)
10
0
495-497
497-499
499-501
501-503
503-505
505-507
507-509
Peso (g)
Consumo (kWh)
Curvas de Frequncia
simtrica
assimtrica positiva
forma J
forma J invertido
bimodal
assimtrica negativa
forma U
multimodal
Populao () ou Amostra X
Dados no agrupados
Sendo a amostra constituda por N dados:
x x
x x xN
x 1 2
N
i 1
Dados agrupados
Sendo a amostra constituda por N
dados agrupados em k classes,
correspondendo a cada classe a
respectiva frequncia absoluta (fA) ou
frequncia relativa (fr):
f
i 1
Ai
pmi
f
i 1
f pm f pm
N
f
A
Ai
ou
k
N 1
2 2
M Linf
N
f AaA
c 2
f AM
em que:
f AaA - frequncia absoluta acumulada da classe anterior classe que contm a mediana;
f AM - frequncia absoluta da classe que contm a mediana.
Mod Linf
d1
c
d1 d 2
assimtrica positiva
assimtrica negativa
Mdia M Mod
em que:
Linf limite inferior da classe que contm a moda;
c
d1
Mod
M Mdia
Mdia M Mod
Mdia Geomtrica
MG
x1 x 2 x 3 x N x1 x 2 x 3 x N
Mdia Harmnica
MH
1
N
1
1
N i 1 x i
N
1
x
Medidas de Localizao
Quantis: quartis, decis e percentis
1 Quartil, Q1
Posio:
2 Quartil, Q2 M
Posio:
3 Quartil, Q3
Posio:
D1 ; D2 ; D3 ; ... ; D9,
N 1
4 2
2N 1
4 2
3N 1
4 2
Medidas de Localizao
Quantis: quartis, decis e percentis
Quando os dados se referem a uma varivel contnua e se apresentam agrupados, os valores dos
quantis podem ser aproximados por expresses idnticas da mediana, com as devidas adaptaes.
Exemplo da expresso para o 3 quartil:
Q 3 Linf
3N
f AaA
c 4
f AQ3
7N
fAaA
D7 Linf c 10
fAD7
em que:
P83 Linf
em que:
83 N
f AaA
100
c
f AP83
em que:
a
AA
a
AA
Medidas de Disperso
Descrevem o grupo de dados em termos da variabilidade existente no grupo
Amplitude Total
R Mx. min .
Amplitudes Modificadas
Elimina-se uma certa percentagem de dados em cada um dos extremos da distribuio de
dados ordenados. O processo de clculo inicia-se pela localizao e determinao dos
valores dos quantis adequados, seguindo-se o clculo da diferena entre os respectivos
quantis. As amplitudes modificadas mais usadas so:
R 50 Q 3 Q1 P75 P25
R 80 D9 D1 P90 P10
R 90 P95 P5
Medidas de Disperso
Desvio Mdio
Mdia do valor absoluto da diferena entre cada valor do
conjunto de dados e a mdia aritmtica da totalidade dos dados.
xx
DM
N
DM
pm x
N
ou
DM
pm x
Medidas de Disperso
Varincia
Populao
ou Amostra
s2
s
2
2
x x
N 1
x2 N x2
N 1
x x
N 1
Medidas de Disperso
Desvio Padro
Populao
ou Amostra
N 1
x x
N 1
Coeficiente de Variao
Magnitude relativa do desvio padro quando comparado com a mdia da distribuio.
s
v
x
Medidas de Assimetria
Coeficientes de Assimetria
Medem o afastamento da simetria
Assimetria = 0
Assimetria > 0
Assimetria < 0
3 x M
A
s
Distribuio simtrica
Distribuio assimtrica positiva
Distribuio assimtrica negativa
Coeficiente de Assimetria:
N
N xi x
i 1
N 1 N 2 s 3
Medidas de Kurtose
Coeficientes de Kurtose
Medida da concentrao dos dados, dando indicao sobre a intensidade das
frequncias na vizinhana dos valores centrais.
Coeficiente de Kurtose:
k
2
N N 1 x i x
i 1
N 1 N 2 N 3 s 4
N 1
3
N 2 N 3
ou
Q3 Q1
2 P90 P10
k < 0.263
Distribuio leptocrtica
k = 0.263
Distribuio mesocrtica
k > 0.263
Distribuio platicrtica
leptocrtica
mesocrtica
platicrtica
FACULDADE
DE
ARQUITECTURA
ESTATSTICA
Estatstica Bivariada
OBJECTIVO
REPRESENTAES GRFICAS
Histogramas tridimensionais
Diagramas de disperso (Scattergrams)
Diagramas Q-Q
MEDIDAS DE ASSOCIAO
Covarincia
Coeficiente de Correlao
- de Pearson
- de Spearman
TABELAS
Tabelas de contingncia
HISTOGRAMAS TRIDIMENSIONAIS
Diagrama de barras em que as classes em que as variveis foram divididas so colocadas
por ordem ao longo do eixo dos x e dos y e o volume das barras proporcional ao nmero
de valores (frequncia) em cada classe.
Moinho
180
Frequncia
150
120
90
60
47
42
30
37
32
0
23
27
28
33
38
22
43
Teor em S (%)
48
53
Teor em Fe (%)
DIAGRAMAS DE DISPERSO
Representao grfica que permite estudar o comportamento conjunto de duas variveis.
47
Teor em Fe (%)
43
39
35
31
27
23
25
30
35
40
45
Teor em S (%)
50
55
DIAGRAMAS Q-Q
Diagrama bidimensional em que os eixos representam cada uma das variveis e as coordenadas
dos pontos so dados pelos valores quantis.
Moinho
53
Teor em Fe (%)
50
47
Mximo
44
Mediana
41
3 Quartil
1 Quartil
38
35
32
29
26
Mnimo
23
23
27
31
35
39
43
Teor em S (%)
47
51
55
MEDIDAS DE ASSOCIAO
Covarincia
1 n
Cov( X ,Y ) Cov XY ( xi mx )( yi my )
n i =1
Propriedades
Cov( X , Y )
Cov(X, Y) = Cov(Y, X)
Cov(a+bX, c+dY) = bd Cov(X, Y)
Cov(X, -Y) = -Cov(X,Y)
Cov(X, X) = Var(X)
Cov(X, c) = 0
Cov( X , Yi ) Cov( X , Yi )
MEDIDAS DE ASSOCIAO
Coeficiente de correlao de Pearson
Cov ( X ,Y )
XY
Var ( X ) Var (Y )
Propriedades
1 XY 1
A covarincia e o coeficiente de correlao medem a intensidade da relao linear
(eventualmente) existente entre duas variveis aleatrias.
|XY| = 1
XY = Cov(X, Y) = 0
TABELAS DE CONTINGNCIA
Quadro que cruza duas variveis qualitativas. O elemento genrico n(i, j) d o nmero de
ocorrncias simultneas das modalidades de duas variveis.
p Soma
n(i, j)
n(i)
k
Soma
n(j)
n n( i, j )
i
n( i ) n( i , j )
Variveis independentes
n i , j n j
n i
n
Medida da independncia
independncia
n i , j n i, j
*
n* i, j
n ( j ) n( i , j )
i
n* i, j
n i n j
n
TABELAS DE CONTINGNCIA
TABELAS DE CONTINGNCIA
n* i, j
Medida da independncia
n i n j
n
2
i
n i , j n i, j
*
n* i, j
Quadrado da contingncia
Coeficiente de contingncia
n
2
n
2
EXEMPLOS DE APLICAO
Comp.
Incl.
N Int.
Curv.
Abert.
correlao
Comp.
1.00
Incl.
-0.17
1.00
N Int.
0.56
0.02
1.00
Curv.
0.19
0.07
0.20
1.00
Abert.
-0.03
-0.02
-0.02
-0.01
1.00
EXEMPLOS DE APLICAO
IBO
OD
(%)
T
(C)
pH
Cond
(S/cm)
CQO
(mg/l)
Sulf.
(mg/l)
Nit.
(mg/l)
Fosf.
(mg/l)
Cu
(mg/l)
Fe
(mg/l)
1.00
0.23
1.00
-0.09
-0.12
1.00
-0.48
0.04
0.14
1.00
-0.35
-0.32
0.47
0.09
1.00
0.04
-0.19
0.18
0.22
0.24
1.00
-0.36
-0.19
0.34
0.09
0.94
0.09
1.00
-0.56
-0.43
0.16
0.02
0.59
-0.08
0.56
1.00
-0.09
0.07
-0.05
0.26
-0.01
0.11
-0.02
-0.13
1.00
-0.33
0.05
-0.10
0.07
-0.07
-0.08
0.01
0.05
0.05
1.00
0.31
0.18
-0.08
-0.14
-0.19
0.10
-0.18
-0.36
0.13
0.13
1.00
EXEMPLOS DE APLICAO
1500
640
0.96
560
0.93
480
900
0.90
400
TInt
Come
Tur
1200
320
0.87
0.84
240
600
0.81
160
300
0.78
80
0
200
400
600
TA
Turistas Adultos
r = 0.98
800
1000
200
400
600
Bebe
Comer Beber
r = 1.00
800
1000
0.75
12.0
12.4
12.8
13.2
13.6
14.0
14.4
14.8
15.2
MeDe
15.6
FACULDADE
DE
ARQUITECTURA
Estatstica
Regresso Linear e Correlao
2005, 2008
FA - UTL, LISBOA
MODELOS
SUCESSES CRONOLGICAS ou SRIES CRONOLGICAS ou SRIES TEMPORAIS:
Sequncia de valores referidos a perodos ou momentos de tempo
Exemplos:
Nmero de pessoas a trabalhar em arquitectura nos ltimos 20 anos;
Valores de temperatura nos ltimos 30 anos em Lisboa
Componentes do modelo:
Tendncia, Tt;
Sazonalidade, st;
Movimentos oscilatrios ou cclicos, ct;
Residual ou errtica, et
MODELOS
SUCESSES CRONOLGICAS ou SRIES CRONOLGICAS ou SRIES TEMPORAIS:
Modelo Aditivo
xt Tt st ct et
Componentes do modelo:
Tendncia, Tt;
Sazonalidade, st;
Movimentos oscilatrios ou cclicos, ct;
Residual ou errtica, et
xt Tt st ct et
Modelo Multiplicativo
ln x ln T ln s ln c ln e
t
Modelo Misto
xt Tt ct st et
x T s c e
t
MODELOS
Modelo Logstico
1 xi
xi1 xi r xi
k
xi populao no incio do perodo i
r taxa de crescimento
k capacidade de carga do sistema a ser estudado.
A capacidade de carga o nvel da populao em que as taxas de
nascimento e morte de uma espcie coincidem, resultando numa
populao estvel ao longo do tempo
MODELOS
MTODOS DE ANLISE DE DADOS
Descritivos
Anlise em
Componentes Principais (ACP)
Anlise Factorial
das Correspondncias (AFC)
Explicativo
Classificativos
Regresso simples
Classificao Automtica
Regresso mltipla
Anlise Discriminante
.. .. .
.. ..
.
.
. . ..
..
..
.
... .. .
..
.
.
.
.. ...
.
.
.. ... .. ....
X
relao curvilnea
directa
... .
.
.
.. ..... .. .. ... .
. ... ..... ..
.. .
X
no h relao
...
.
.
.
.....
.
.
.
.. ... ..
Se o diagrama de disperso
revelar uma relao que de
modo geral linear, ento
constri-se uma linha que
seja a recta que melhor se
ajusta aos dados.
A construo e localizao
dessa recta determinada
pelo MTODO DOS
MNIMOS QUADRADOS.
1200
1200
1000
1000
800
800
TP
TP
Grfico em que so representados os pontos referentes aos pares de valores observados para as variveis
dependente e independente, y e x respectivamente.
600
600
400
400
200
200
200
400
600
800
1000
0
12.0
1200
12.4
12.8
13.2
4500
15.2
4000
14.8
3500
14.4
3000
14.0
2500
MeDe
15.6
13.6
2000
13.2
1500
12.8
1000
12.4
500
12.0
0.75
0.78
0.81
0.84
0.87
TInt
13.6
14.0
14.4
14.8
15.2
15.6
MeDe
And
0.90
0.93
0.96
0.99
0
1.4
2.1
2.8
3.5
4.2
LInt
4.9
5.6
6.3
7.0
Y b X a
X Y n X Y
b
X n X
2
a Y b X
A equao da recta assim obtida tem a propriedade de passar sempre pelo ponto
X ;Y .
possveis de y.
O ERRO PADRO DE ESTIMAO
sY , X
Y Y
n2
Y a Y b X Y
2
ou
sY , X
n2
Y t sY , X
Se
com
n 30
n2
graus de liberdade
Y z sY , X
Regresso Linear
Modelos No Lineares, mas Linearizveis
Modelo Exponencial
y ab
Linearizvel
ln y ln a x ln b
y a xb
Modelo Potncia
y ax
Linearizvel
ln y ln a b ln x
y a bx
Regresso Linear
Modelos No Lineares, mas Linearizveis
1
y ab
x
1
y
a bx
x
y
b ax
Linearizvel fazendo
1
x
x
Linearizvel fazendo
1
y
y
Linearizvel fazendo
1
y
y
1
x
x
HIPTESES:
A relao entre as duas variveis linear;
Y2 , X
Y2
Populao :
2 1
Y2 , X
Amostr a :
Y2
r 2 1
sY2 , X
sY2
r2
a Y b X Y n Y
Y n Y
2
Assim, como este coeficiente varia entre 0 e 1, obtm-se a percentagem de variao numa
varivel que explicada estatisticamente pela variao na outra varivel.
Inversamente, 1 r 2 , a percentagem que no se pode explicar pelo relacionamento entre as
duas variveis, devendo ser considerada como devida a outros factores no includos no estudo.
Populao :
Amostr a :
n X Y X Y
n X
n Y
r r2
.
.
.
.
..
.
.
.
.
...
X
r=+1
-1
r2 = 1
+1
r=0
... .
.
.
.. ..... .. .. ... .
. ... ..... ..
.. .
r2 = 0
r2 0,36
r2 = 1
r + 0,6
r=1
....
. ......
.........
Os valores prximos de +1 e de 1
denotam relacionamentos (quase)
perfeitos, sendo o respectivo tipo
(directo ou inverso) indicado pelo sinal
(positivo ou negativo),
enquanto valores prximos de 0
revelam ausncia de relacionamento
entre as variveis.
r
+ 0,90
r2 0,81
O valor do coeficiente de
correlao amostral pode ser
utilizado como estimativa do
verdadeiro coeficiente de
correlao, , da populao.
Contudo, mais conveniente
expressar o coeficiente
amostral conjuntamente com
um intervalo de confiana para
o verdadeiro valor.
FACULDADE
DE
ARQUITECTURA
Estatstica
Estatstica Multivariada
2005, 2008
FA - UTL, LISBOA
Caracterizao
da habitao em Maputo
Tipos de variveis:
Quantitativas
Qualitativas
Descritivos
Anlise em
Componentes Principais (ACP)
Anlise Factorial
das Correspondncias (AFC)
Explicativo
Regresso
Classificativos
Classificao Automtica
Anlise Discriminante
INTERPRETAO GEOMTRICA
DE UM QUADRO DE DADOS
Rp
P2
P1
P2
I1
I2
Rn
I2
P1
3
I2
I1
P2
P1
I1
Eixo Factorial
Maximizar a diferena de mdias dos grupos relativamente
varincia dentro dos grupos
Eixo Factorial
para indivduos pertencentes a um mesmo grupo, a nova varivel deve fornecer valores
que sejam o mais prximos possvel;
para indivduos pertencentes a grupos distintos, a nova varivel deve fornecer valores
que sejam o mais diferentes possvel.
Matriz
de
Inrcia
Anlise em Rp
Maximizando
u1 ' u1 1
obtm-se
1
valor prprio de
T T
T' Tu 1 1 u 1 0
Matriz
de
Inrcia
Anlise em Rp
Maximizando
u1 ' u 2 0
obtm-se
u2 ' u2 1
2
valor prprio de
T T
T' Tu 2 2 u 2 0
Anlise em Rp
No caso geral os p eixos factoriais obtm-se resolvendo a equao matricial:
T' Tu u 0
Vectores
Prprios
de T T
Valores
Prprios
de T T
Anlise em Rn
No caso da anlise da nuvem em Rn os eixos factoriais obtm-se
resolvendo a equao factorial seguinte:
TT' v v 0
FRMULAS DE TRANSIO
Vectores
Prprios
de T T
Valores
Prprios
de T T
1
T u
1
T' v
0.9
0.6
0.3
F2
Caracterizao
da habitao em Maputo
0.0
-0.3
TCCP
-0.6
-0.9
-1.2
-1.6
-1.2
-0.8
-0.4
-0.0
0.4
0.8
1.2
1.6
F1
14
12
10
1.2
LC
PCNa
Somm
0.9
0.6
10
F2
Ferr
MXQb
PCNb
0.3
MFL
MXQa
AMb Ctb
MHGb
Cta PCTa
Jard
Ctc PCTb
CHMa
AMa
MHGa
MLG
APa
CHMd
IGa
Urb APb
HLb
IGb
CHMb
BGM
CS MXQc U7 MKD
25Jb 25Ja
MHT
LL
MVa
3F
HLa MXQd
ZPT FPLM
NSL
MGNN
MVb MLHZ
ABZ
0.0
-0.3
-0.6
-0.9
-1.6
CHMc XPM
GD
-1.2
-0.8
-0.4
-0.0
F1
0.4
Coop
0.8
1.2
1.6
Caracterizao
da habitao em Maputo
Zimpeto
Magoanine
Mahotas
Bagamoio
Laulane
Costa do Sol
Ferroviario
Inhagoia "B"
Aeroporto
Maxaquene "D"
Polana Canico "B"
Luis Cabral
Xipamanine
Mafalala
Sommershield
Alto Mae "B"
Polana Cimento "A"
0
4 Km
CLASSIFICAO AUTOMTICA
OBJECTIVO:
Construo automtica de grupos de amostras (indivduos, objectos) ou variveis
(propriedades), no interior dos quais existe elevada proximidade (de acordo com um critrio
definido a priori).
A proximidade entre os elementos de cada grupo deve ser maior do que em relao a
qualquer elemento exterior.
TIPOS DE MTODOS
No hierrquicos
Os grupos resultam de uma partio da
matriz inicial em classes, conduzindo a uma
estrutura em rede.
Os elementos dos grupos so realocados
dinamicamente em cada fase.
Hierrquicos
Os grupos formados em cada fase vo
sendo sucessivamente imbricados uns nos
outros, conduzindo a uma estrutura em
rvore.
Os grupos formados em cada fase do algoritmo
nunca mais se desfazem.
CLASSIFICAO AUTOMTICA
Classificao No Hierrquica
CLASSIFICAO AUTOMTICA
Classificao Ascendente Hierrquica
CLASSIFICAO AUTOMTICA
Classificao Ascendente Hierrquica
CLASSIFICAO AUTOMTICA
Classificao Ascendente Hierrquica
Caracterizao
da habitao em Maputo
0.00
0.20
0.40
0.60
0.80
1.00
1.20
1.40
1.60
1.80
2.00
+---------+---------+---------+---------+---------+---------+---------+---------+---------+---------+----
c) b) a)
AMa
-----------|
|---|
PCTb -----------|
|-|
| |
MHGa ---------------| |--------|
|
|
PCTa -----------------|
|
|-------|
AMb ----------------|
|
|
|-----|
|
|
MHGb ----------------|
|
|
|
|---|
|-----|
Cta -------------|
|
|
|
|--------|
|
|
Ctb -------------|
|
|-|
|
| |
CHMa ----------------------------------|
| |
| |---------------------|
Ctc ----------------------------------------| |
|
|
|
Coop -------------------------------------|
|
|
|----|
|
Somm -------------------------------------|
|
|
APa -------------------------------|
|
|--------------|
|
APb -------------------------------|
|
|
|
|
CHMb -----------------------------|
|
|
|-------|
|----|
|
CHMc -------------------|
|
|
|
|
|
|---------|
||
|
|
|
CHMd -------------------|
||
|
|
|
||
|
|
|
MFL -------------------------------------||-------|
|
|
|
|
|
MKD -----------------------------|
|
|--|
|
|--------|
| |
|
XPM -----------------------------|
| |
|
| |
|
MXQa -----------------------|
| |
|
|-------------------|
| |
|
MXQb -----------------------|
|
| |
|
|-------| |
|
Urb ---------------------------|
|
|-----|
|
|-----|
|
|
|
|
IGb ---------------------------|
|---------|
|
|
|
|
|
|
|
IGa ---------------------------------|
|
|
|
|
|
|
MLG ------------------------------------------------|
|
|
|
|
|
|
|
U7
----------------------------------|
|-----|
|
|
|------------||
|
|
NSL ----------------------------------|
||
|
|
|
|
|
Jard -----------------------------------------------|
|
|
|
|
MXQc -----------------------------------------|
|
|
|-|
|
|
MXQd --------------|
| |
|
|
|--------------------------| |
|
|
HLa --------------|
|----|
|
|
|
|
|
|
3F
---------------------------|
|
|
|
|
|---------------|
|
|---|
LL
---------------------------|
|-|
|
| |
|
FPLM ----------------|
| |
|
|------------|
| |
|
MVb ----------------|
|------------------| |---|
|
|
|
|
|
MLHZ -----------------------------|
|
|
|
|
|
|
MGNN --------------------------|
|
|
|
|-----------------------|
|
|
25Ja --------------------------|
|
|
|-|
|
ABZ -------------------------------|
| |
|
|----------|
| |
|
ZPT -------------------------------|
|
| |
|
|------|
| |
|
CS
---------------------------|
|
|
| |
|
|--------------|
|
| |
|
MHT ---------------------------|
|----| |
|
|
|
|
HLb -------------------------------------|
|
|---|
|-----------|
|
MVa -------------------------------------|
|
|
PCNa -------------------------------------|
|
|----------|
|
BGM ---------------------------|
|
|
|
|---------|
|
|
25Jb ---------------------------|
|
|
|-------|
PCNb --------------------------|
|
|-----|
|
Ferr --------------------------|
|-----|
|
|
|
|
LC
--------------------------------|
|---------|
|
GD
--------------------------------------|
c) b)
a) Two clusters
a)
CLASSIFICAO AUTOMTICA
Classificao Ascendente Hierrquica
Zimpeto
Zimpeto
Magoanine
Magoanine
Mahotas
Albazine
Mahotas
Albazine
G. Dimitrov
G. Dimitrov
Bagamoio
Bagamoio
Laulane
Laulane
Costa do Sol
Costa do Sol
Ferroviario
Ferroviario
Inhagoia "B"
Inhagoia "B"
Jardim
Jardim
Maxaquene "D"
Polana Canico "B"
Luis Cabral
Maxaquene "D"
Polana Canico "B"
Luis Cabral
Xipamanine
Xipamanine
Mafalala
Mafalala
Malanga
Malanga
Sommershield
Sommershield
I
II
Airport
"Bairros" Boundaries
I
II
III
IV
Airport
"Bairros" Boundaries
4 Km
Zimpeto
Magoanine
Albazine
Mahotas
G. Dimitrov
Bagamoio
Laulane
Costa do Sol
Ferroviario
Inhagoia "B"
"CEMENT CITY"
Jardim
Caracterizao
da habitao em Maputo
Maxaquene "D"
Polana Canico "B"
Luis Cabral
Xipamanine
Mafalala
Malanga
Sommershield
Alto Mae "B"
Central "C"
"CANIO CITY"
4 Km
Contactos
e-mail: jribeiro@fa.utl.pt
Tel.: 21 361 5049
Gabinete: 4.1.17