Documente Academic
Documente Profesional
Documente Cultură
Rio de Janeiro
Dezembro de 2008
DESCOBERTA DE CONHECIMENTO EM BANCO DE DADOS DE SAÚDE
ATRAVÉS DA INTEGRAÇÃO DE MINERAÇÃO DE DADOS GEOGRÁFICOS E
REDES COMPLEXAS
Aprovada por:
______________________________________________________
Prof. Nelson Francisco Favilla Ebecken, D.Sc.
______________________________________________________
Prof. Beatriz de Souza Leite Pires de Lima, D.Sc.
______________________________________________________
Prof. Alexandre Gonçalves Evsukoff, Dr.
______________________________________________________
Prof. Hélio José Côrrea Barbosa, PhD.
______________________________________________________
Prof. Gilberto Carvalho Pereira, D.Sc.
iii
Ao Marcos, Camila e Cintia.
iv
AGRADECIMENTOS A
Camila e Cintia, minhas filhas, pela compreensão e pelas inúmeras horas em que estive
ausente;
Luiz Pereira Calôba, pela dedicação em disciplinas de Redes Neurais Artificiais, que
muito me ajudou e motivou, meu agradecimento especial;
v
Resumo da Tese apresentada à COPPE/UFRJ como parte dos requisitos necessários
para a obtenção do grau de Doutor em Ciências (D.Sc.)
Dezembro/2008
vi
Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the
requirements for the degree of Doctor of Science (D.Sc.)
December/2008
vii
SUMÁRIO
CAPÍTULO 1 .................................................................................................................. 1
INTRODUÇÃO .............................................................................................................. 1
1.1 Introdução .......................................................................................................... 1
1.4 Contribuição....................................................................................................... 3
CAPÍTULO 2 .................................................................................................................. 8
REVISÃO BIBLIOGRÁFICA ...................................................................................... 8
2.1 Introdução .......................................................................................................... 8
CAPÍTULO 3 ................................................................................................................ 22
PROPOSTA DE METODOLOGIA PARA DEFINIÇÃO DE PRIORIDADES .... 22
3.1 Introdução ........................................................................................................ 22
viii
3.2 Objetivo ........................................................................................................... 22
CAPÍTULO 4 ................................................................................................................ 37
PROPOSTA DE ÍNDICE DE INFLUÊNCIA ESPACIAL ...................................... 37
4.1 Introdução ........................................................................................................ 37
ix
4.6 Resumo ............................................................................................................ 50
CAPÍTULO 5 ................................................................................................................ 51
APLICAÇÃO DO ÍNDICE EM TAREFAS DE MINERAÇÃO DE DADOS ........ 51
5.1 Introdução ........................................................................................................ 51
CAPÍTULO 6 ................................................................................................................ 75
ANÁLISE DA EPIDEMIA PELO VIRUS HIV ........................................................ 75
6.1 Introdução ........................................................................................................ 75
x
6.4.2 Séries Temporais .............................................................................................. 77
6.5.1 Metodologia...................................................................................................... 77
CAPÍTULO 7 ................................................................................................................ 99
ANALISE DA EPIDEMIA COM A ABORDAGEM DE REDES COMPLEXAS 99
7.1 Introdução ........................................................................................................ 99
xi
7.4.4 Medidas de Centralidade ................................................................................ 105
xii
8.6 Resumo .......................................................................................................... 146
xiii
LISTA DE FIGURAS
Figura 4.4 Mapa temático de taxa de notificações de AIDS por bairro, 1997, 44
município do Rio de Janeiro
entrada
xiv
Statistica.
Figura 5.6 Taxa de contaminação por bairro, 1982 a 1992, município do Rio 60
de Janeiro.
Figura 5.8 Valor do IF por bairro, 1982 a 1999, município do Rio de Janeiro. 61
econômico-sociais.
Figura 5.11 Total de casos de aids por categoria de exposição, 1982 a 2005, 64
xv
Figura 5.12d Notificações de aids em heterossexuais, 1982 a 1988, município 67
do Rio de Janeiro.
Figura 5.17 Percentual de chefes de família do bairro com renda de até dois 72
salários mínimos, 2005, município do Rio de Janeiro.
Figura 6.2 Bairros com dez maiores variações do IF, 1982 a 1999, município 77
do Rio de Janeiro.
pelo vírus HIV e IF, por bairro, 1983, município do Rio de Janeiro.
xvi
pelo vírus HIV e IF, 1984, município do Rio de Janeiro.
Figura 6.5a Taxa de contaminação da aids por bairro, 1988, município do Rio 81
de Janeiro e retas na direção 90º e 225º a partir do centróide de Copacabana.
Figura 6.5b Taxa de contaminação da aids por bairro, 1999, município do Rio 81
de Janeiro e retas na direção 90º e 225º a partir do centróide de Copacabana..
dominantes.
xvii
Figura 6.16b Correlação cruzada entre a série de óbitos e série de pacientes na 92
faixa etária de 35 a 39 anos, após a retirada de tendência e da sazonalidade,
1985 a 2005, município do Rio de Janeiro
Figura 7.1a Rede reduzida de bairros e unidades, visão global, 1982 a 1999, 102
município do Rio de Janeiro.
Figura 7.1b Rede reduzida de bairros e unidades, visão contextual, 1982 a 103
1999, município do Rio de Janeiro.
Figura 7.2b Rede formada por unidades hospitalares utilizadas e bairros de 106
Figura 7.4 Valor de k-core por bairro, município do Rio de Janeiro. 109
Figura 7.5 Rede estrela de pacientes que residem no município do Rio de 110
xviii
Figura 7.6 Cronologia de notificações de aids, 1982 a 1985, município do Rio 112
de Janeiro.
Janeiro.
Janeiro.
Janeiro.
Figura 7.13 Curva de contágio (bairros com notificações), 1982 a 1996, 123
Figura 7.14 Rede de bairros por ordem de contaminação e valor de exposição, 125
Figura 7.15 Limiar médio e freqüência acumulada de bairros com o primeira 127
Figura 7.16 Rede de bairros com ocorrência da epidemia, 1982 a 1985, 130
Figura 7.17 Rede de bairros com ocorrência da epidemia, 1982 a 1987, 130
Figura 7.18 Rede de bairros, 1982 a 1987, município do Rio de Janeiro. 131
xix
Figura 7.19 Medida de intermediação da rede de bairros contaminados 131
Janeiro.
Janeiro.
Figura 7.22 Valor de limiar por vértice da rede de bairros, município do Rio de 133
Janeiro.
Figura 8.1 Gráfico Bipartite, de interação entre bairro-unidade, sem considerar 140
o tempo.
Figura 8.3 Distância média dos pares (eixo y) que compartilham Pc pacientes 142
(eixo x).
Figura 8.5a Rede de bairros e unidades hospitalares, 1985, município do Rio 145
Figura 8.5b Rede de bairros e unidades hospitalares, 1988, município do Rio 145
xx
de Janeiro, visualização com NetDraw.
Figura 8.6 Total de interações entre bairros (lista parcial) e respectivas 146
Figura 8.7 Unidade de saúde mais utilizada por bairro, a tonalidade cinza 146
xxi
LISTA DE TABELAS
Tabela 4.1 Estrutura de árvore com informações de relação espacial por objeto 46
Tabela 5.5 Tabela de bairros com maiores reduções da razão de sexos, 1989 e 70
1999.
xxii
Tabela 6.5 Resultado parcial da RNA para predição da taxa de contaminação 97
para cinco bairros.
Tabela 7.1 Distribuição de freqüência de distância (total de vértices) entre uma 112
notificação de aids e a anterior, 1982 a 1985, município do Rio de Janeiro.
Tabela 7.3 Bairros com os maiores valores de limiar e respectiva taxa de 129
contaminação no ano da primeira ocorrência de aids.
xxiii
LISTA DE SÍMBOLOS
xxiv
LISTA DE SIGLAS E ABREVIATURAS
xxv
CAPÍTULO 1
INTRODUÇÃO
1.1 Introdução
1
Esta pesquisa propõe-se a ampliar o conceito de novo. Considerou-se todo o
conhecimento útil, ainda que não necessariamente desconhecido. Consoante com essa
proposta, o conhecimento prévio que foi analisado por uma nova abordagem e que,
como conseqüência, criou suposições ou simplesmente ampliou o conhecimento sobre o
objeto estudado, foi considerado tão importante como o conhecimento novo.
1.2 Motivação
2
1.3 Objetivo
1.4 Contribuição
3
1.5 Contexto
4
1.6 Organização do Trabalho
A segunda parte, composta pelos capítulos cinco e seis, apresenta a aplicação do índice
nas tarefas de mineração de dados geográficos, grande parte delas realizada por
intermédio de Mapas Auto-Organizáveis (KOHONEN, 2001). Com base nos
resultados obtidos com as tarefas de mineração de dados geográficos, foram
identificadas as fases de evolução da epidemia. Esta parte inclui dois modelos para
predição da evolução da epidemia com óbito. Apresenta também uma modelagem
espaço-temporal.
5
(2004). A metodologia propõe que a descoberta de conhecimento seja executada em
três fases: conceitual, estrutural e de implantação. A metodologia proposta foi aplicada
no presente trabalho.
O sexto capítulo apresenta a análise da evolução da epidemia pelo vírus HIV. Apresenta
uma aplicação do índice de influência espacial como medida de conectividade, com o
objetivo de segmentar as fases de evolução da epidemia. Apresenta ainda, o
desenvolvimento de dois modelos para predição da evolução da aids com fechamento
óbito e uma modelagem espaço-temporal.
O oitavo capítulo apresenta uma proposta para analisar o movimento dos pacientes
entre bairros e unidades hospitalares de saúde. Esse estudo contribuiu para a
compreensão da epidemia. Definiu-se um critério de interação espacial baseado no total
6
de ocorrências comuns ao par formado pelo bairro e unidade hospitalar. A análise
indicou uma forte correlação entre bairro-unidade e espaço geográfico, conforme
esperado. Outras análises e conclusões são apresentadas.
O nono capítulo é a conclusão. Não existe uma explicação puramente técnica ou uma
determinação social que justifique o desenvolvimento da epidemia. O conhecimento
das redes, das relações complexas que as formam e das interações operadas nos levará a
compreender, um pouco mais, a epidemia.
7
CAPÍTULO 2
REVISÃO BIBLIOGRÁFICA
2.1 Introdução
8
O processo KDD é interativo e iterativo, envolvendo várias etapas, nas quais algumas
decisões são feitas pelo usuário. Diferentes abordagens para o desenvolvimento do
processo foram apresentadas. FAYYAD et. al. (1996) propôs o desenvolvimento em
nove etapas:
9
das etapas do processo KDD e refere-se à aplicação de algoritmos sobre os dados para a
descoberta de padrões.
A indução é a perspectiva mais comum, tendo sua origem na inteligência artificial (IA)
e no conceito de aprendizagem por exemplos (machine learning). HUNT et al. (1996)
foi um dos primeiros pesquisadores a estudar o conceito de aprendizagem por exemplos,
utilizando árvores de decisão para realizar operações de classificação. Recentemente,
CAI et al. (1991): HAN e FU (1995) implementaram algoritmos que utilizam esse
conceito em operações de bancos de dados. Basicamente, um algoritmo de indução
baseia-se na generalização e sumarização dos relacionamentos entre atributos de um
conjunto de dados. O principal objetivo da indução é extrair regras genéricas dos dados
e identificar irregularidades. Vários autores, como HAN et al. (1996) e WANG et al.
(1997) têm pesquisado métodos de indução com objetivo de extrair generalizações de
dados espaciais.
10
A perspectiva da compreensão orienta a seleção de um modelo em mineração de dados.
Um modelo é considerado bom quando utiliza qualquer variável, relacionamento ou
comportamento relevante e ignora os irrelevantes. Um modelo deve capturar a essência
do conhecimento do objeto de estudo buscando a simplicidade.
11
grupos de dados (FAYYAD et. al. 1996). A análise de cluster é uma técnica utilizada
para identificar as relações existentes entre um número de variáveis com o objetivo de
explicar um conjunto de fenômenos. Essa técnica permite retirar uma extraordinária
quantidade de informações e conhecer a existência de certos padrões nos dados.
12
A generalização consiste em encontrar uma descrição concisa dos dados. O objetivo é
prover múltiplas perspectivas dos dados, permitindo a identificação de características
que existem somente em algum nível conceitual (nível de abstração). A generalização
apresenta características similares à generalização utilizada em cartografia. Os
sistemas DBMiner (HAN et. al. 1996) e GeoMiner (HAN et. al., 1997) são exemplos de
sistemas de descoberta de conhecimento em bases de dados que realizam a tarefa de
generalização.
O termo sistema de informação geográfica (SIG) é aplicado para sistemas que realizam
o tratamento computacional de dados geográficos. A principal diferença de um SIG para
um sistema de informação convencional é sua capacidade de armazenar tanto os
atributos não espaciais como as geometrias dos diferentes tipos de dados geográficos.
Um importante conceito é a distinção entre espaço absoluto e espaço relativo. Espaço
absoluto, também chamado cartesiano, é um conjunto de coisas e eventos, uma estrutura
para localizar pontos, trajetórias e objetos. Espaço relativo é o espaço constituído pelas
relações espaciais entre coisas.
Uma das escolhas básicas que fazemos na modelagem dos fenômenos geográficos é
definir se utilizaremos representações no espaço absoluto ou no espaço relativo. Esta
escolha depende primordialmente do tipo de análise desejada. Relações de
conectividade como “Qual é a mortalidade por epidemia do vírus HIV de meus
vizinhos?” requerem a representação no espaço relativo. No presente trabalho, as
relações de conectividade foram consideradas, assim como as questões da álgebra de
mapas, utilizada para responder perguntas como: “Que áreas possuem contaminação
superior a 25% e renda familiar inferior a dois salários mínimos?”, nesse caso,
utilizando-se o espaço absoluto.
Existem dois modelos formais para entidades geográficos no espaço absoluto: geo-
campos e geo-objetos. O modelo de geo-campos enxerga o espaço geográfico como
13
uma superfície contínua, sobre a qual variam os fenômenos a serem observados. Por
exemplo, um mapa de vegetação associa a cada ponto do mapa um tipo específico de
cobertura vegetal. O modelo de geo-objetos representa o espaço geográfico como uma
coleção de entidades distintas, onde cada entidade é definida por uma fronteira fechada.
O geo-objeto é uma entidade geográfica singular e indivisível, caracterizada por sua
identidade, suas fronteiras, e seus atributos. Um geo-objeto é uma relação [id, a1,...an,
G], onde id é um identificador único, G é um conjunto de partições 2D conexas e
distintas {R1,...,Rn} do espaço ,, e ai são os valores dos atributos A1,...,An.
2
Figura 2.1a Geo-campo (INPE) Figura 2.1b Geo-objeto: análise da saúde segundo
14
sua função de atributo). Por outro lado, um geo-objeto é essencialmente definido por
sua fronteira, que o separa do mundo exterior. O geo-objeto não pode ser dividido e
manter suas propriedades essenciais. Dentro da fronteira, todas as propriedades do geo-
objeto são constantes. É bastante comum lidarmos com um conjunto de geo-objetos que
representam uma partição consistente do espaço; isto é, os recobrimentos espaciais
destes objetos não se interceptam e eles possuem o mesmo conjunto de atributos. Estas
características fazem com que possamos agrupar estes objetos numa coleção.
As pesquisas desenvolvidas para integração e análise dos dados aqui denominados geo
referenciados, tem surgido em áreas tradicionais, como métodos estatísticos, assim
como Inteligência Artificial, citando DRUCK et. al. (2004) e CASANOVA et. al.
(2005).
15
Os mecanismos de visualização devem oferecer suporte para apreensão cognitiva dos
aspectos relevantes dos dados pesquisados (MacEACHEREN, 2004). A construção de
conhecimento ocorre através da interação com uma ou várias representações visuais.
Toda representação visual influencia a forma como interpretamos e analisamos os dados
e, conseqüentemente, a construção do conhecimento. Diferentes técnicas de
representação visual possibilitam diferentes formas de construção do conhecimento
através dos diferentes estágios do processo. Assim sendo, é crucial o uso de
representação visual apropriada à construção do conhecimento. Cada SIG possui
características que o distingue dos demais. Além disso, os usuários do sistema usam
suas idiossincrasias, experiências, conhecimento e habilidades pessoais na construção
do conhecimento o que torna sua implementação uma tarefa difícil e complexa.
O termo Exploratory Visual Analysis (EVA) foi criado por estatísticos para descrever
métodos exploratórios que se baseiam no domínio visual. Recentemente, ferramentas
de visualização que auxiliam as atividades de mineração de dados foram propostas por
(KEIM e KRIEGEL, 1996; LEE e ONG, 1996) que criaram o termo Visual Data
Mining (VDM). MacEACHREN et. al. (1999) iniciou a pesquisa de métodos de
descoberta de conhecimento baseado em exploração visual. As diferenças entre EVA e
VDM são sutis. EVA tende a ser mais interativo, baseando-se na percepção do usuário,
sem o controle rígido do formato de dados. De forma contrária, o VDM utiliza
algoritmos específicos para encontrar padrões a partir das características numéricas dos
dados e de teorias estatísticas, reconhecimento de padrões e aprendizagem de máquina.
VDM tende a ser usado em grandes bases de dados. EVA tende a ser mais utilizado em
16
arquivos com grande dimensão de atributos, porém, com pequena quantidade de
instâncias.
RIBARSKY et. al. (1999) integrou as vantagens das duas abordagens para explorar
dados temporais e introduziu o termo Discovery Visualization para enfatizar a
importância da visualização na interação homem-máquina. A visualização geográfica
recebeu diferentes denominações. Na comunidade de banco de dados a denominação
mais utilizada é Visual Datamining (RIBARSKY et. al., 1999), enquanto o termo
Exploratory Visual Analysis ou Exploratory Data Analysis são mais utilizados por
estatísticos como TUKEY (1977), CHERNOFF (1978) ASIMOV(1985). Na geografia,
o termo mais utilizado é Exploratory Spatial Data Analysis.
17
Um grafo direto ou dígrafo contém um ou mais arcos. Uma relação que não é
direcionada (pacientes com vírus HIV da mesma família) é representada por uma linha
de conexão porque ambos os indivíduos estão igualmente envolvidos na relação. Um
grafo não direcionado não contém arcos: todas suas linhas são linhas de conexão.
A teoria das redes tem origem com o matemático Euler, responsável pelas primeiras
pesquisas nessa área e pela teoria dos grafos. O grafo é um conjunto de nós, conectados
por arestas que, em conjunto, formam uma rede. Na sociologia, a teoria dos grafos é
uma das bases do estudo das redes sociais, ancorado na Análise Estrutural, proveniente
das décadas de 60 e 70. A análise das redes sociais parte de duas grandes visões do
objeto de estudo: as redes internas e as redes personalizadas. O primeiro aspecto é
focado na relação estrutural da rede com o grupo social – as redes são assinaturas de
identidade social, o padrão de relações do indivíduo mapeia as preferências e as
18
características dos próprios envolvidos na rede. O segundo aspecto diz que o papel de
um indivíduo poderia ser compreendido não apenas através dos grupos – redes – a que
ele pertence, mas também através das posições que ele tem dentro dessas redes. A
análise estrutural das redes complexas baseia-se na interação como primado
fundamental do estabelecimento das relações entre os agentes humanos, que originarão
as redes complexas.
19
Modelo das Redes sem Escalas foi proposto por BARABÁSI (2002), que faz críticas
aos modelos de Erdös e Rényi. O autor discorda da concepção de que, nas redes
complexas, as conexões entre os vértices são estabelecidas de modo aleatório. Segundo
Barabási, há uma ordem na dinâmica de estruturação das redes, sendo alguns nós
altamente conectados, diferentemente dos demais, com poucas conexões. Os nós ricos,
denominados hubs ou conectores tendem a receber sempre mais conexões.
Inúmeras pesquisas sobre redes complexas têm sido desenvolvidas, como os de NOOY
et. al. (2005).
A disseminação do vírus da aids começou há cerca de 100 anos, no antigo Congo Belga,
hoje República Democrática do Congo, na África, conforme relatado na revista Nature
(setembro, 2008), em artigo assinado por pesquisadores da Universidade do Arizona,
nos Estados Unidos. Eles conseguiram determinar quando e de onde partiu o vírus por
meio da comparação genética das duas amostras mais antigas de HIV existentes, dos
anos de 1959 e 1960. A pesquisa concluiu que as amostras se originaram em um
mesmo hospedeiro humano, que teria vivido entre 1884 e 1924. A teoria mais aceita é
a de que o vírus HIV surgiu a partir do vírus SIV, encontrado no sistema imunológico
de chimpanzés e macacos-verdes. O SIV é um vírus altamente mutante que não faz mal
nenhum a esses animais. Entretanto, ao entrar em contato com o organismo humano,
ele sofreu uma mutação e se transformou no HIV. O mais provável é que essa
contaminação tenha ocorrida através do hábito comum na África, de comer macacos. A
partir do Congo, o vírus atingiu os Estados Unidos por meio de um único infectado, em
1969. Há relatos médicos a partir desse período sobre o aparecimento inexplicável de
doenças como o sarcoma de Karposi, um tipo raro de câncer de pele, e pneumonia,
principalmente entre homossexuais. Em 1981, a aids adquiriu contornos de epidemia e
foi identificada formalmente como doença. Dois anos depois, o HIV foi isolado.
Calcula-se que existam mais de quarenta milhões de pessoas contaminadas no mundo.
20
2.6.1 A Epidemia pelo Vírus HIV: Revisão Bibliográfica
2.7 Resumo
21
CAPÍTULO 3
PROPOSTA DE METODOLOGIA PARA DEFINIÇÃO DE PRIORIDADES
3.1 Introdução
3.2 Objetivo
3.3 Conceitos
3.3.1 Sistema
22
Os sistemas com interações fixas e variáveis dependem da natureza e da forma das
interações de seus componentes ao longo de sua existência. Assim, o sistema
apresentará um novo comportamento sempre que componentes forem adicionados,
removidos ou rearranjados, ou então, sempre que houver modificação nas interações.
23
3.3.3 Redes Complexas
Estas são grafos que apresentam algumas propriedades específicas, como o atendimento
à Lei de Potência, que ocorre quando existem poucos nós na rede muito conectados, e
muitos nós pouco conectados. Outra propriedade é conhecida como a Teoria do Mundo
Pequeno: o comprimento médio do caminho entre quaisquer dois vértices da rede tende
a ser pequeno, ainda que o número de vértices seja muito grande e que a densidade de
conexões entre os vértices da rede seja pequena. Redes sociais, metabólicas, gênicas,
tróficas e a rede mundial de computadores são exemplos de redes complexas.
24
Foram notificados e registrados no SINAN da Secretaria do Estado de Saúde do Rio de
Janeiro, 52.431 casos confirmados de aids residentes no estado do Rio de Janeiro,
diagnosticados desde o início da epidemia, em 1982, até dezembro de 2005. A maior
parte dos casos, considerando-se o estado, é de residentes nas regiões Metropolitana 1
(que inclui o município do Rio de Janeiro) e Metropolitana 2, que corresponde a 87% do
total. Entretanto, esta proporção vem se reduzindo ao longo do período, passando de
91.4% na primeira década da epidemia para 76% em 2005, em contrapartida ao
aumento da participação das outras regiões do estado. Do total de estado, foram
notificados 28.918 casos confirmados de aids, acima de 13 anos de idade, no município
do Rio de Janeiro no mesmo período, compondo a base de dados da pesquisa.
25
3.5 Metodologia
Nos últimos anos, diversas pesquisas sobre o processo KDD foram desenvolvidas,
conforme apresentadas na revisão bibliográfica. Embora diversas abordagens analisem o
problema com base em diferentes ângulos e com diferentes métodos e metodologias, o
objetivo consensual é identificar padrões novos e úteis em grandes volumes de dados.
Entretanto, não há na literatura pesquisada proposta de um método para definição de
prioridades e objetivos nessa busca por novos padrões. Pelo motivo exposto, o capítulo
apresenta uma metodologia que auxilia a definição de prioridades no processo KDD.
Usualmente, o processo KDD é realizado pelo especialista em inteligência em negócios,
gestão do conhecimento ou áreas similares, ainda que com nomes distintos, que muitas
vezes atua de forma autônoma. Essa proposta auxilia o especialista a coadunar os
interesses do processo KDD com a estratégia da empresa. Dessa forma, a metodologia
proposta não pretende substituir a proposta de FAYYAD et. al. (1996), mas a
complementá-la.
Na proposta de FAYYAD et. al. (1996), relacionadas a seguir, as duas primeiras etapas
seriam contempladas pelo nível conceitual proposto. As demais tarefas são de
implantação.
26
1. Desenvolvimento do conhecimento sobre o problema e os objetivos do usuário;
2. Definição dos dados que serão utilizados no processo de descoberta de
conhecimento;
3. Limpeza dos dados e pré-processamento;
4. Redução e transformação dos dados;
5. Definição da tarefa de mineração de dados;
6. Escolha do algoritmo de mineração de dados;
7. Mineração de dados: regras de associação, regressão, agrupamento de dados, etc.
8. Avaliação dos resultados;
9. Consolidação do conhecimento descoberto, incorporação desse conhecimento
nos respectivos processos ou sistemas ou, simplesmente, documentar e transmitir esse
conhecimento aos usuários do sistema.
Questão 1: Magnitude.
Questão 2: Fatores de risco, oportunidades, pontos fortes e fracos do processo KDD a
ser realizado.
Questão 3: Conhecimento do assunto.
Questão 4: Custo-efetividade.
Questão 5: Recursos.
27
Na presente pesquisa, as questões foram respondidas de acordo com o tema estudado.
Os exemplos podem ser adaptados para outros temas. Assim sendo, para mensurar a
magnitude do assunto a ser pesquisada pelo processo KDD, os seguintes tópicos foram
utilizados como apoio:
Com origem nesses tópicos, as prioridades assim como as lacunas de informação foram
identificadas. As lacunas são descritas no tópico Ação e foram utilizadas posteriormente
para a definição dos objetivos.
3.5.1.1.1 Magnitude
28
pesquisa em doenças e agravos. A primeira prioridade são as doenças
tropicais como malária, esquistossomose e lepra.
29
escopo da pesquisa ao município do Rio de Janeiro e à entidade
geográfica bairro, com o objetivo de reduzir esse risco.
Pontos fortes.
Os pontos fortes são aqueles relacionados à pesquisa. Assim sendo, pontos
fortes como campanhas educacionais sobre o assunto não fazem parte do escopo.
Métodos estocásticos adequados aos dados disponíveis.
Mineração de dados geográficos.
Pesquisa inédita.
Pontos fracos.
Os pontos fracos, assim como os pontos fortes, são aqueles relacionados ao
estudo.
Grande volume de dados espúrios.
Indisponibilidade de dados de relacionamento de pacientes infectados e
respectivo círculo social.
30
Definir o tipo de dado espaço-temporal a ser pesquisado: ambiental,
socioeconômico, discreto ou contínuo.
Definir a entidade espacial do banco de dados geográfico: setor
censitário ou bairro.
Definir o período a ser considerado: 1982 a 2007 e, após análise dos
dados, 1982 a 2005.
Definir a unidade de tempo a ser considerada na análise de séries
temporais: mês.
31
3.5.2 Nível Estrutural
Neste nível as entidades dos modelos formais são mapeadas para estruturas de dados e
algoritmos necessários para os objetivos definidos.
Atributos
não- Geo
espaciais DB
Visualização
geográfica dos
padrões descobertos
32
Definir o método de definição de variáveis relevantes: por intermédio do método
do critério da relevância, conforme proposto por SEIXAS et. al. (1995).
Para análise de redes complexas, optou-se por utilizar o software livre Pajek.
33
3.5.3 Nível de Implantação
Uma sugestão para pesquisa futura é a definição de um nível ontológico, no qual nossas
percepções sejam materializadas em conceitos que descrevam a realidade e definam os
tipos de entidades necessárias para descrever o objeto em estudo. Nesse nível, as
ontologias necessárias para tarefas de mineração de dados geográficos seriam definidas.
Nesse caso, esta seria a primeira fase.
Diferentes métodos têm sido desenvolvidos para identificar a dimensão dos dados como
análise discriminante, componentes principais, entre outras. Diversos testes foram
realizados com este objetivo utilizando-se o software Weka, entre outros.
Optou-se por utilizar o critério de relevância proposto por SEIXAS et. al. (1995). O
critério consiste basicamente em medir a relevância de cada variável para discriminar o
sistema em estudo. A relevância do componente j é definida por:
N 2
i 1
xi xi '
Rx
j
N
34
Onde:
xi é o valor do neurônio de saída, após o treinamento da RNA, para cada padrão
apresentado à RNA.
substituído pelo seu valor médio, calculado para todos os padrões usados no
treinamento da RNA.
Para utilizar o critério, entretanto, foi necessário limpar os dados. Os passos realizados
estão sucintamente descritos:
35
3.7 Resumo
36
CAPÍTULO 4
PROPOSTA DE ÍNDICE DE INFLUÊNCIA ESPACIAL
4.1 Introdução
Quando as relações espaciais são medidas, espera-se que as regiões próximas sejam
mais parecidas entre si que as regiões mais distantes (ANSELIN, 2005). Tal
propriedade é traduzida pela lei conhecida como a Primeira Lei da Geografia de Tobler
(1979):
4.2 Objetivo
37
4.3 Sistemas, Software e Dados
4.4 Conceitos
38
Existem diversos critérios de proximidade, como a distância inferior a um limite
definido ou a proporção mínima do lado comum em relação ao perímetro total do
polígono. Na presente pesquisa utilizaram-se medidas de proximidade de diferentes
ordens, por faixas de distância, representadas por W1,... Wn, onde W1 indica a
proximidade espacial de primeira ordem (dentro de uma faixa de distância
determinada), W2 indica a proximidade espacial de segunda ordem e assim
sucessivamente.
39
n n
n wij yi y (yj y)
i 1 j 1
I n 2
yi y wij
i 1 i j
2
A equação de I pode ser simplificada [N( =0e = 1] e alterarmos W, de forma que
a soma dos elementos de cada linha da matriz de proximidade espacial seja igual a 1,
conforme equação 4.1a.
n n
wij yi y (yj y)
i 1 j 1
I n
( yi y)2
i 1
40
Y=aWy+bX+e
41
A relação espacial de distância é intuitiva. Considerou-se um critério previamente
definido de distância mínima e/ou máxima. A distância entre os polígonos foi
classificada em uma faixa de distância. Assim sendo, a classificação em uma
determinada faixa, considera a distância entre os centróides. As faixas de distância são
mil metros, seguida por seis, dez, vinte e trinta mil metros.
Por outro lado, a relação espacial de direção não é tão simples. Para definir a relação
espacial de direção de um objeto O2 em relação a um objeto O1, considerou-se o um
ponto representativo do objeto O1. Considerou-se o centróide do polígono, como a
origem de um sistema virtual de coordenadas, cujos quadrantes e planos definem as
direções. Para definir a direção de O2, mais da metade dos pontos de O2 deve estar na
respectiva área do plano. Não existe uma única direção entre dois objetos e por isso,
considerou-se a mais exata. Entre a direção sul ou sudeste, optou-se pela sudeste, por
exemplo. A identificação da direção e o cálculo da distância de cada objeto (polígono)
em relação a todos os demais da região pesquisada foram armazenados no banco de
dados, no início da pesquisa. Esses valores são estáticos e raramente são modificados,
como em casos de criação de um novo bairro.
O1 O2
42
do IFd, considera-se vizinho de um dado objeto O, todo polígono que dista até trinta mil
metros do centróide de O na direção padrão específica. As direções são padronizadas
em zero, quarenta e cinco, noventa, cento e trinta e cinco, cento e oitenta, duzentos e
vinte e cinto, duzentos e setenta e trezentos e quinze graus, sendo os respectivos índices
identificados por IF0, IF45, IF90 até IF315.
n
yi y Wij y j y
j 1
IF n
(yj y)2
j 1
Onde:
yi é o valor do atributo considerado no polígono i;
yj é o valor do atributo considerado no polígono j;
y é o valor médio do atributo;
wij são os polígonos vizinhos ao polígono yi, sendo wij igual a 1, para todo polígono yj
cuja distância ao centróide de Oi seja inferior a dez mil metros, em todas as direções
válidas.
Na Figura 4.3, cada tonalidade da cor cinza, representa o conjunto dos polígonos
considerados no cálculo do IFd, nas respectivas direções, em relação ao objeto O144
(cor verde). O IFd foi calculado considerando-se o atributo taxa de contaminação de
aids do bairro, no ano de 1997. A reta da Figura 4.3 indica os polígonos na direção
noventa graus a partir de um eixo de coordenadas imaginário com coordenadas x e y
(0,0) no centróide de O144, e com distância máxima igual a trinta mil metros, que foram
43
considerados no cálculo do IF90 do objeto O144 (representado pela cor verde). O valor
do IF90 indicou que os polígonos vizinhos ao objeto O144 na direção 90º,
provavelmente influenciaram a sua taxa de contaminação. Confirmou-se, pelo mapa
temático de notificações de aids (Figura 4.4), que essa região apresentou taxas similares
de notificação de aids, em 1997.
O144
Figura 4.3 Índice de influência espacial IF90 de O144, a tonalidade de cinza indica os
polígonos considerados por direção.
Figura 4.4 Mapa temático de taxa de notificações de AIDS por bairro, 1997, município
do Rio de Janeiro.
44
4.5.2 Índice de Influência Espacial Global
45
correlação é significativo, há indicação de uma tendência espacial para o atributo
específico a partir do objeto o1.
Tabela 4.1 Estrutura de árvore com informações de relação espacial por objeto.
46
Considerando-se max-dist e dist números reais e d a direção, definiu-se o conceito de
Vizinhança para um banco de dados geográfico com distância max-dist e direção d
como sendo: V izinhança = { ( o1, o2, dist, d) | o1, o2 DB, o1 dist o2 <= dist-max e o1 d
o2}.
Chave Faixa
Vizinho Distância Direção/ângulo
Polígono Distância
O144 O1 10.000 7.123,71 0º
O144 O23 10.000 3.954,16 45º
... ...
O144 O148 10.000 3.104,13 315º
47
Utilizou-se o software Statistica 7.0 para definir duas RNAs do tipo perceptron de
múltiplas camadas, com algoritmo Backpropagation. Comparou-se o resultado das
duas redes neurais. A primeira RNA, além das taxas de contaminação dos vizinhos,
possui na camada de entrada, a informação do IF local de cada um dos quatro bairros
vizinhos. A segunda RNA não possui a informação do IF, sendo a camada de entrada
formada pelos valores das taxas de contaminação dos vizinhos. Quatro vizinhos por
bairro, ordenados por ordem decrescente de taxa de contaminação foram utilizados na
camada de entrada. Limitou-se a faixa de distância a dez mil metros, em qualquer
direção. A configuracao da primeira RNA foi definida por oito neurônios na camada
de entrada, quinze neurônios na camada intermediária e um neurônio na camada de
saída. A segunda rede com quatro neurônios na camada de entrada, sete neurônios na
camada intermediária e um neurônio na camada de saída. A camada de saída é
composta pela taxa de contaminação a ser prevista. As Tabelas 4.3a e 4.3b, apresentam
os resultados das RNA com e sem IF, respectivamente. Conforme esperado, o
desempenho da primeira RNA foi superior. O IF mede a dependência espacial entre os
bairros e o impacto no valor da variável a ser prevista, nesse caso, a taxa de
contaminação. A rede consegue extrair essa informação durante o treinamento,
obtendo, dessa forma, um melhor desempenho. As Figuras 4.6 e 4.7 apresentam o
resultado dos valores preditos e observados.
Tabela 4.3a Resultados da RNA de predição da taxa de contaminação por bairro com IF
na camada de entrada.
48
Tabela 4.3b Resultados da RNA de predição da taxa de contaminação por bairro sem IF
na camada de entrada.
Tx_ano.6 Tx_ano.7 Tx_ano.8 Tx_ano.9 Tx_ano.10
Data Mean 9.391317 9.391317 9.391317 9.391317 9.391317
Data S.D. 6.808094 6.808094 6.808094 6.808094 6.808094
Error Mean 0.357959 0.428495 -0.524329 -0.054062 -0.295187
Error S.D. 5.837753 5.810031 5.828004 5.807406 5.767635
Abs E. Mean 5.059816 5.037736 5.182887 5.139639 5.043155
S.D. Ratio 0.857472 0.853400 0.856040 0.853015 0.847173
Correlation 0.515874 0.521542 0.525920 0.527604 0.531349
16
14
12
10
8
6
4
2
0
-2
Model
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
5
Tx_ano, Observed
Figura 4.6 Valores observados e preditos pela RNA com IF na camada de entrada.
8
7
6
5
4
3
2
1
0
-1
Model
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
10
Tx_ano, Observed
Figura 4.7 Valores observados e preditos pela RNA sem o IF na camada de entrada.
49
4.6 Resumo
50
CAPÍTULO 5
APLICAÇÃO DO ÍNDICE EM TAREFAS DE MINERAÇÃO DE DADOS
5.1 Introdução
51
Dados; 4. Conceitos; 5. Aplicação do IF no Mapa Auto-Organizável; e 6. Resumo.
5.2 Objetivo
52
5.4 Conceitos
Segundo KOHONEN (2001), as RNA podem ser divididas em três categorias: redes de
transferência de sinal, redes de transferência de estado e redes competitivas. Nas redes
de transferência de sinal a saída da rede depende, única e exclusivamente, do valor de
entrada. Essas redes são usadas para transformação de sinais. São exemplos desse tipo
de rede aquelas denominadas redes alimentadas adiante, redes perceptron de múltiplas
camadas – Multi-Layer Perceptron-MLP e as redes de função de base radial – Radial
Basis Function-RBF. (HAYKIN, 1999). Essas redes são usadas como identificadores de
padrões, controle, entre outras funções.
O mapa auto-organizável (SOM) é uma RNA com duas camadas (KOHONEN, 2001): a
camada de entrada I e a de saída U. A entrada da rede corresponde a um vetor no espaço
53
d-dimensional em Rd, representado por xk = [ε1, ..., εd] T , k = 1, ..., n, sendo n o número
de vetores de entrada. Cada neurônio j da camada de saída possui um vetor de código w,
também no espaço Rd, associado ao vetor de entrada xk, wj = [wj1, ...,wjd]T . Os
neurônios da camada de saída estão interconectados por uma relação de vizinhança que
descreve a estrutura do mapa. Existem diferentes topologias para a estruturação de um
mapa auto-organizável, sendo a mais comum a de duas dimensões, pela facilidade de
visualização.
O algoritmo de treinamento da rede SOM é composto por três fases. Na primeira fase,
competitiva, os neurônios de saída competem entre si, segundo algum critério para
definir um neurônio vencedor ou BMU, do termo em inglês best match unit. Na segunda
fase, é definida a vizinhança do neurônio vencedor. Finalmente, na fase adaptativa, os
vetores do neurônio e da vizinhança são ajustados.
54
5.4.3 Avaliação de qualidade do Mapa Auto-Organizável
Com o objetivo de avaliar a qualidade do mapa gerado, optou-se por utilizar o erro de
quantização vetorial (Eq) (KOHONEN, 2001). Esse erro é a média do erro
correspondente à diferença entre o vetor de características xk e o vetor de código WBMU,
ou seja, o vetor de código vencedor no processo competitivo para o padrão xk.
55
Figura 5.2a Imagem fatiada usando estimador de densidade Kernel para o atributo total
de ocorrências de aids por setor censitário, visualização software Spring, 2005,
município do Rio de Janeiro.
56
treinamento, como a distância euclidiana, é também considerado para calcular a
distância entre os vetores de código e os neurônios adjacentes. O resultado gerado
quando essa matriz é aplicada sobre o mapa é uma imagem em que o nível de correlação
de cada pixel corresponde a uma distância.
57
não-aleatória de fato existe nos dados. A maioria dos algoritmos de agrupamento
encontra grupos mesmo em dados aleatórios. Outro objetivo é comparar os diversos
algoritmos de agrupamento ou determinar o valor mais apropriado de número de
agrupamentos.
58
Utilizou-se o índice Calinski-Harabasz para definição do número ideal de agrupamentos
em cada teste realizado.
59
Por meio do agrupamento de dados, segundo a taxa de crescimento de contaminação,
definiram-se três grandes grupos. O agrupamento um (cluster 1) é formado pelos
bairros de Centro, Saúde, Cidade Nova e Copacabana. A Figura 5.6 apresenta as taxas
de contaminação dos principais bairros. Verificou-se um padrão de crescimento
constante em cada bairro, apesar da variação entre os bairros.
Figura 5.6 Taxa de contaminação por bairro, 1982 a 1992, município do Rio de Janeiro.
30
25
20
15
10
-5
Cluster 1
Cluster 2
-10 Cluster 3
IF83 IF85 IF87 IF89 IF91 IF93 IF95 IF97 IF99
Figura 5.7 Resultado do agrupamento de bairros com atributo IF, visualização software
Statistica, 1982 a 2005, município do Rio de Janeiro.
60
O agrupamento de bairros permitiu identificar grupos bem distintos em relação a esse
atributo. Os bairros do Centro e da Saúde apresentaram uma expansão brusca seguida de
ma expansão mais branda e permanente na influência da vizinhança (cluster 1). O
cluster 2, formado por Santo Cristo, Cidade Nova, Flamengo, Glória, Catete e
Copacabana apresentou crescimento similar, entretanto, com valores inferiores de IF,
ao longo do período.
Figura 5.8 Valor do IF por bairro, 1982 a 1999, município do Rio de Janeiro.
61
Tabela 5.1 Atributos econômico-sociais de um dos agrupamentos.
FLAMENGO GLORIA
CATETE COPACABANA
62
Figura 5.10 Agrupamento de bairros com vetor de características composto pelos
atributos IF, taxa de contaminação e índices econômico-sociais, visualização
software Spring, 2005.
1) Perinatal
2) Usuário de drogas injetáveis (UDI)
3) Homo/bissexual masculino
4) Pessoa que recebeu sangue (transfusão de sangue)/hemoderivados e hemofílicos.
5) Pessoa que se infectou pela transmissão sexual
6) Outras modalidades
7) Ignorado
63
A categoria de exposição classifica a forma de contaminação pelo vírus HIV. A Figura
5.11 apresenta a evolução da contaminação para as principais categorias de exposição.
Figura 5.11 Total de casos de aids por categoria de exposição, 1982 a 2005, município
do Rio de Janeiro.
64
Durante o período de 1982 até 1988, a categoria de exposição homossexual foi
predominante em todos os bairros com ocorrências de aids. Cinco bairros da zona sul:
Copacabana, Flamengo, Botafogo, Ipanema e Gávea, em conjunto, foram responsáveis
por mais de cinqüenta por cento de todos os casos de contaminação em homossexuais
neste período. As Figuras 5.12a, 5.12b, 5.12c e 5.12d, apresentam as notificações de
aids das categorias homossexuais e heterossexuais de 1982 a 1988. As Figuras 5.12e e
5.12f apresentam o total de ocorrências, considerando-se o período de 1982 a 1999.
Observou-se o crescimento significativo de contaminação em homossexuais, em bairros
no sentido norte, leste e oeste até 1988. O crescimento na população de heterossexuais
também ocorreu neste mesmo sentido, de forma mais branda. A partir de 1988, o
crescimento ocorreu nos bairros da zona norte. Não foi identificada uma divisão de
bairros por categoria de exposição, conforme resultado do agrupamento de dados. As
notificações estão representadas por figuras geométricas em figuras distintas: círculo
(homossexual) e quadrado (heterossexual). Nestas figuras, os bairros com atributo
proporção de chefes de família com renda de até dois salários mínimos, estão
representados em cinza, com o objetivo de facilitar a comparação da proliferação da
epidemia e a renda das famílias. Observou-se que, a expansão da epidemia ocorreu nos
bairros com renda inferior. Os bairros com fundo cinza foram “preenchidos” pelas
figuras geométricas que representam as notificações de aids, ao longo do tempo.
65
Figura 5.12b Notificações de aids em heterossexuais, 1982 a 1985, município do Rio de
Janeiro.
66
Figura 5.12d Notificações de aids em heterossexuais, 1982 a 1988, município do Rio de
Janeiro.
67
Figura 5.12f Notificações de aids em heterossexuais, 1982 a 1999, município do Rio de
Janeiro.
68
5.6.4 Razão de Sexos
69
zona sul e no Centro. Em 1999, as maiores reduções ocorreram nos bairros da zona
norte e da zona oeste, conforme apresentadas na Tabela 5.5. O movimento de
crescimento da contaminação em mulheres acompanhou o crescimento da
contaminação na categoria de exposição homo e heterossexuais. O mapa de renda
comprova que o crescimento das mulheres foi simultâneo ao empobrecimento da
população e ao movimento da epidemia para a zona norte. As Figuras 5.15a e 5.15b
apresentam o percentual de homens e mulheres por bairro, contaminados e vivos no
ano de 2005, nas quais o tom cinza-escuro representa os bairros com maiores taxas de
contaminação. Os homens são maioria nos bairros de Copacabana, Centro e Tijuca.
Esses bairros também apresentam as maiores taxas de contaminação em mulheres.
Entretanto, grande parte das mulheres reside em bairros da zona norte e oeste.
Tabela 5.5 Tabela de bairros com maiores reduções da razão de sexos, 1989 e 1999.
Figura 5.15a Percentual de homens contaminados vivos por bairro, valores altos em tom
cinza-escuro, 2005, município do Rio de Janeiro.
70
Figura 5.15b Percentual de mulheres contaminadas vivas do bairro, valores altos em
tom cinza-escuro, 2005, município do Rio de Janeiro.
71
100%
90%
80%
70%
60% Ignorado
50% De 8 a 11 anos
40%
De 3 a 7 anos
30%
20% De 1 a 3 anos
10% Nenhuma
0%
1982 1985
1988 1991
1994 1997
Figura 5.16 Anos de estudo de pacientes com notificações de aids, 1982 a 1999,
município do Rio de Janeiro.
Claro para
escuro:
2-19%
20-37%
38-56%
Figura 5.17 Percentual de chefes de família do bairro com renda de até dois salários
mínimos, 2005, município do Rio de Janeiro.
Tabela 5.6 Bairros com maior percentual de pacientes com escolaridade de 8 a 11 anos.
Bairro % Bairro %
Copacabana 18.70 Leblon 3.02
Tijuca 6.74 Centro 2.93
Botafogo 4.92 Vila Isabel 2.49
Flamengo 4.31 Laranjeiras 2.23
Ipanema 4.04 Bangu 2.02
72
5.6.6 Resultados Obtidos com o Agrupamento de Dados
Por outro lado, o agrupamento dos bairros considerando-se o atributo IF, permitiu
identificar que a contaminação partiu da zona sul para o Centro, Leopoldina e seguiu em
direção à zona norte. A redução do nível de escolaridade e dos índices econômico-
sociais pode ser associada ao movimento em direção aos bairros das zonas norte e oeste
da cidade, considerando-se os índices econômico-sociais do IBGE. Apesar disso, os
bairros com maior volume de ocorrências, considerando-se todo o período, são Centro,
Copacabana e Tijuca.
5.7 Resumo
74
CAPÍTULO 6
ANÁLISE DA EPIDEMIA PELO VIRUS HIV
6.1 Introdução
6.2 Objetivo
Como em todo sistema complexo, são inúmeros os desafios de identificar novos padrões
da epidemia pelo vírus HIV. No presente capítulo objetivou-se analisar a evolução da
epidemia no tempo. Os objetivos definidos foram: 1) identificar as fases da evolução da
epidemia, 2) realizar a predição da evolução da epidemia com óbito e 3) realizar a
modelagem espaço-temporal. Os objetivos definidos contribuem para o planejamento
de estratégias de ação preventivas ou assistenciais.
Utilizou-se o software Statistica para definição das RNA utilizadas para realizar a
predição da evolução de epidemia por intermédio de séries temporais. Os casos são os
descritos no capítulo três.
75
6.4 Conceitos
6.4.1 Espaço
10.00 0.30
9.00
0.25
8.00
7.00
0.20
6.00
5.00 0.15
4.00
0.10
3.00
2.00
0.05
1.00
0.00 0.00
76
6.4.2 Séries Temporais
Figura 6.2 Bairros com dez maiores variações do IF, 1982 a 1999, município do Rio de
Janeiro.
6.5.1 Metodologia
77
ano de 1982, um único caso foi registrado no bairro de Bangú. Para executar o
agrupamento de dados, utilizou-se o software Statistica 7.0. Os resultados do
agrupamento de dados foram representados em um dendrograma, uma árvore que
apresenta a ordem de conexão. O corte do dendrograma em diferentes níveis resulta em
divisões da rede em um número menor ou maior de agrupamentos. Para facilitar a
análise inicial, utilizou-se um gráfico de linha com os valores da taxa de contaminação e
IF, com os bairros ordenados em função da posição no dendrograma. Desta forma, o
dendrograma resultante do agrupamento de dados hierárquico aglomerativo pode ser
comparado diretamente com os valores da taxa e do IF, para diferentes divisões da rede.
O dendrograma e o gráfico de linha das Figuras 6.3 e 6.4 facilitaram a análise. No ano
de 1983 o bairro de Sampaio apresentou taxa alta e IF baixo. Isso é explicado porque
nenhum bairro vizinho a Sampaio apresentou caso de AIDS naquele ano. Em 1984, o
bairro de Cidade Nova apresentou a maior taxa de contaminação e maior IF. O valor
alto de IF é justificado porque os vizinhos de Cidade Nova, Centro, Rio Comprido e
Tijuca também já haviam notificado casos de aids.
Figura 6.3 Dendrograma e gráfico de bairros, taxa da população contaminada pelo vírus
HIV e IF, por bairro, 1983, município do Rio de Janeiro.
78
Figura 6.4 Dendrograma e gráfico de bairros, taxa da população contaminada pelo vírus
HIV e IF, 1984, município do Rio de Janeiro.
Tabela 6.1 Índice de Influência Espacial por direção de Copacabana, 1988 e 1999.
80
Figura 6.5a Taxa de contaminação da aids por bairro, 1988, município do Rio de Janeiro
e retas na direção 90º e 225º a partir do centróide de Copacabana.
Figura 6.5b Taxa de contaminação da AIDS por bairro, 1999, município do Rio de
Janeiro e retas na direção 90º e 225º a partir do centróide de Copacabana.
81
Legenda
1ª fase: Hotspot Copacabana e Centro
A análise da série temporal foi realizada através da decomposição em outras séries mais
simples. Usualmente, as séries mais simples são funções determinísticas do tempo
(CALOBA, 2002). A diferença (erro) entre a recomposição dessas séries simples e a
série real é uma série residual que, normalmente, inclui duas outras séries: uma série
cujo valor, em cada instante t, depende de forma complexa e não linear, dos valores da
série anteriores a t, e uma série de ruído randômico.
82
Uma série pode sofrer transformações e decomposições, como a adição, a subtração ou
de outra série, que a torne estacionária no tempo. A decomposição aditiva é a mais
comum e nesse estudo, limitou-se ao seu uso.
A série de notificações de aids com fechamento óbito foi analisada em três domínios:
representação gráfica, correlograma e espectograma.
N k
1 1
r k 2
s t s t k s
s N k t 1
S
83
2
Onde µ é a média e s é a variância de s(t). O gráfico formado pelos eixos com valores
de s(k) e k é denominado autocorrelograma de s(t) (CHATFIELD 1989).
A correlação cruzada entre duas séries temporais s1(t) e s2(t) estacionárias no tempo mede a
correlação entre a variável s2 no momento atual s2(t) e a variável s1 com atraso de k unidades
de tempo s1(t-k). Desta forma, a autocorrelação:
N k
1 1
rs1s2 k s1 t s2 t k s2
s1 s2 N k t 1
S1
Uma série s(t), t=1,2,...,N pode ser representada por uma soma de senóides.
N
1
2
2 aN
s t a0 Ri cos it i cos t
i 1 N 2
Onde Ri2 ai2 bi2 é a energia com que a senoide de freqüência f i i N contribui para
84
No presente estudo, utilizou-se a Transformada Rápida de Fourier ou FFT, do termo em
inglês Fast Fourier Transform, implementado através do software Statistica 7.0. A
transformada rápida de Fourier (FFT) é um eficiente algoritmo para calcular a
transformada de Fourier discreta (DFT) e sua inversa. Existem muitos algoritmos FFT.
A DFT decompõe uma sequência de valores em componentes de diferentes freqüências.
Apesar de útil, o cálculo da DFT é pouco pratico. O algoritmo FFT é uma maneira de
calcular o mesmo resultado mais rapidamente. O cálculo da de uma DFT de N pontos,
utiliza O (N2) operações aritméticas, enquanto uma FFT pode calcular o mesmo
resultado em apenas O (N log N) operações. As FFT são de grande importância para
uma ampla variedade de aplicações, a partir de processamento digital de sinais e
resolver equações diferenciais parciais a algoritmos para uma rápida multiplicação de
grandes inteiros. A idéia geral de uma FFT foi popularizada por uma publicação de
COOLEY e TUKEY (1965). O desenvolvimento do FFT é descrito por COOLEY et. al.
(1967). Muitos trabalhos posteriores foram publicados em IEEE Transactions on
Acoustics, Speech and Signal Processing. O desenvolvimento da FFT é apresentado,
entre outros autores, por BLOOMFIELD (1976) e por PRIESLEY (1981).
A análise de séries temporais foi utilizada com os dados da evolução da doença com
fechamento óbito, no período de 1985 a 2005, para o qual a predição foi realizada. Em
2002, período 204 na Figura 6.7, a série sofreu uma mudança significativa em sua
85
tendência. A Figura 6.7a apresenta a série com valores normalizados e a Figura 6.7b, a
série após a retirada da tendência e da sazonalidade.
3 3
2 2
1 1
SIT2
0 0
-1 -1
-2 -2
-3 -3
-20 0 20 40 60 80 100 120 140 160 180 200 220 240 260
Figura 6.7a Série de óbitos normalizada, 1985 a 2005, município do Rio de Janeiro.
4 4
3 3
2 2
1 1
SIT2SZ
0 0
-1 -1
-2 -2
-3 -3
-20 0 20 40 60 80 100 120 140 160 180 200 220 240 260
Figura 6.7b Série de óbitos normalizada, sem tendência e sem sazonalidade, 1985 a
2005, município do Rio de Janeiro.
O espectograma obtido por FTT da série de óbitos da Figura 6.7b, está apresentado na
Figura 6.8 e indica freqüências dominantes, que foram extraídas pelo programa de
cálculo da FFT. O resultado está apresentado na Figura 6.9. A série após a retirada dos
ciclos senoidais está apresentada na Figura 6.10.
86
5 5
4 4
Periodogram Values
3 3
2 2
1 1
0 0
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
Frequency
2.0 2.0
1.5 1.5
Periodogram Values
1.0 1.0
0.5 0.5
0.0 0.0
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
Frequency
Figura 6.9 Espectograma da série de óbitos após a retirada das freqüências dominantes.
87
P lot of variable: sit2_sciclo2
2.5 2.5
2.0 2.0
1.5 1.5
1.0 1.0
sit2_sciclo2
0.5 0.5
0.0 0.0
-0.5 -0.5
-1.0 -1.0
-1.5 -1.5
-20 0 20 40 60 80 100 120 140 160 180 200 220 240 260
Autocorrelation Function
(Standard errors are white-noise estimates)
Lag Corr. S.E. Q p
1 +.415 .0626 43.88 .0000
2 +.150 .0625 49.62 .0000
3 +.049 .0624 50.25 .0000
4 -.111 .0622 53.43 .0000
5 -.209 .0621 64.79 .0000
6 -.123 .0620 68.76 .0000
7 -.155 .0619 75.02 .0000
8 -.089 .0617 77.08 .0000
9 -.183 .0616 85.92 .0000
10 -.148 .0615 91.69 .0000
11 -.071 .0614 93.02 .0000
12 +.010 .0612 93.04 .0000
13 +.058 .0611 93.95 .0000
14 +.120 .0610 97.81 .0000
15 +.032 .0608 98.09 .0000
16 +.026 .0607 98.27 .0000
17 +.005 .0606 98.28 .0000
18 +.004 .0605 98.28 .0000
19 +.044 .0603 98.82 .0000
20 -.017 .0602 98.90 .0000
21 +.031 .0601 99.17 .0000
22 -.038 .0599 99.57 .0000
23 -.084 .0598 101.6 .0000
24 -.108 .0597 104.8 .0000
25 -.066 .0596 106.1 .0000
26 -.139 .0594 111.5 .0000
27 -.035 .0593 111.8 .0000
28 +.035 .0592 112.2 .0000
29 +.061 .0590 113.3 .0000
30 +.080 .0589 115.1 .0000
31 +.138 .0588 120.6 .0000
32 +.026 .0586 120.8 .0000
33 -.011 .0585 120.9 .0000
34 -.135 .0584 126.2 .0000
35 -.101 .0582 129.2 .0000
36 -.116 .0581 133.2 .0000
37 -.040 .0580 133.7 .0000
38 -.047 .0578 134.4 .0000
39 -.019 .0577 134.5 .0000
40 +.002 .0576 134.5 .0000
41 +.095 .0574 137.2 .0000
42 +.087 .0573 139.5 .0000
43 +.191 .0571 150.7 .0000
44 +.203 .0570 163.4 .0000
45 +.154 .0569 170.7 .0000
46 +.089 .0567 173.2 .0000
47 +.036 .0566 173.6 .0000
48 -.066 .0565 174.9 .0000
49 -.086 .0563 177.3 .0000
50 -.126 .0562
0 182.3
0 .0000
Conf. Limit
-1.0 -0.5 0.0 0.5 1.0
88
Partial Autocorrelation Function
(Standard errors assume AR order of k-1)
Lag Corr. S.E.
1 +.415 .0630
2 -.027 .0630
3 -.004 .0630
4 -.153 .0630
5 -.132 .0630
6 +.032 .0630
7 -.112 .0630
8 +.016 .0630
9 -.222 .0630
10 -.033 .0630
11 -.015 .0630
12 +.027 .0630
13 +.018 .0630
14 -.002 .0630
15 -.085 .0630
16 -.012 .0630
17 -.006 .0630
18 +.004 .0630
19 +.045 .0630
20 -.107 .0630
21 +.098 .0630
22 -.118 .0630
23 +.010 .0630
24 -.097 .0630
25 -.001 .0630
26 -.140 .0630
27 +.036 .0630
28 +.046 .0630
29 -.013 .0630
30 +.042 .0630
31 +.017 .0630
32 -.072 .0630
33 -.074 .0630
34 -.134 .0630
35 -.027 .0630
36 -.060 .0630
37 +.035 .0630
38 -.062 .0630
39 -.044 .0630
40 +.014 .0630
41 +.063 .0630
42 -.014 .0630
43 +.119 .0630
44 +.028 .0630
45 +.053 .0630
46 +.027 .0630
47 +.037 .0630
48 -.022 .0630
49 -.050 .0630
50 -.036 .06300 Conf. Limit
-1.0 -0.5 0.0 0.5 1.0
89
2.5 2.5
2.0 2.0
1.5 1.5
sit2_sciclo2_predito:
1.0 1.0
sit2_sciclo2:
0.5 0.5
0.0 0.0
-0.5 -0.5
-1.0 -1.0
-1.5 -1.5
0 20 40 60 80 100 120 140 160 180 200 220
sit2_sciclo2 (L) sit2_sciclo2_predito (R)
90
série formada pelo atributo contagem de linfócitos CD+4 inferior a 350 células/mm3. A
Figura 6.15 apresentada as séries após a retirada de tendência e sazonalidade.
4 4
3 3
2 2
1 1
ESC2SZ:
SIT2SZ:
0 0
-1 -1
-2 -2
-3 -3
-20 0 20 40 60 80 100 120 140 160 180 200 220 240 260
ESC2SZ (L) SIT2SZ (R)
Figura 6.14 Série de óbitos e série de pacientes com escolaridade de um a três anos,
após a retirada de tendência e da sazonalidade, 1985 a 2005, município do Rio
de Janeiro.
Figura 6.15 Séries de óbitos e CD+4 inferior a 350 células/mm3, após a retirada de
tendência e sazonalizadade, 1985 a 2005, município do Rio de Janeiro.
A correlação cruzada é a ferramenta natural para a análise da relação entre duas séries
no domínio do tempo. Para a análise baseada na função de densidade espectral,
denominada análise no domínio da freqüência (CHATFIELD, 1989), calculou-se a
correlação cruzada entre as variáveis, identificando-se as freqüências características dos
91
eventos que influenciam na variabilidade da evolução da epidemia com óbito. Analisou-
se a coerência entre os picos das séries, verificando-se a correlação linear existente entre
espectro de duas variáveis, no processo denominado Bivariado (CHATFIELD, 1989).
CrossCorrelation Function
First : SIT2SZ
Lagged: ESC2SZ
Lag Corr. S.E.
-25
-24 .3583
.3645 .0664
.0662
-23
-22 .3704
.3756 .0661
.0659
-21
-20 .3988
.4369 .0658
.0657
-19
-18 .4497
.4440 .0655
-17 .4714 .0654
.0652
-16
-15 .4804
.4766 .0651
.0650
-14
-13 .5133
.5302 .0648
.0647
-12
-11 .5313
.5354 .0645
.0644
-10
-9 .5442
.5473 .0643
-8 .5768 .0642
.0640
-7
-6 .6055
.6130 .0639
.0638
-5
-4 .6051
.6296 .0636
.0635
-3
-2 .6678
.6888 .0634
.0632
-1
0 .7513
.8300 .0631
1 .7454 .0630
.0631
2
3 .6940
.6523 .0632
.0634
4
5 .6205
.5909 .0635
.0636
6
7 .5616
.5187 .0638
.0639
8
9 .5042
.4501 .0640
10 .4330 .0642
.0643
11
12 .4478
.4351 .0644
.0645
13
14 .4061
.3830 .0647
.0648
15
16 .3641
.3518 .0650
.0651
17
18 .3261
.3244 .0652
19 .3076 .0654
.0655
20
21 .2835
.2695 .0657
.0658
22
23 .2230
.2027 .0659
.0661
24
25 .1861
.1714 .0662
.0664
0 Conf . Limit
-1.0 -0.5 0.0 0.5 1.0
Figura 6.16a Correlação cruzada entre a série de óbitos e série de pacientes com
escolaridade de um a três anos, 1985 a 2005, município do Rio de Janeiro.
CrossCorrelation Function
First : SIT2SZ
Lagged: I35-39SZ
Lag
-30 Corr..0671
.1144 S.E.
-29
-28 .1214
.1424 .0670
.0668
-27
-26 .1390
.1184 .0667
.0665
-25
-24 .1367
.1392 .0664
.0662
-23
-22 .1650
.2035 .0661
.0659
-21
-20 .2258
.2319 .0658
.0657
-19
-18 .2389
.2264 .0655
.0654
-17
-16 .2615
.2754 .0652
.0651
-15
-14 .3061
.3423 .0650
.0648
-13
-12 .3749
.3476 .0647
.0645
-11
-10 .3819
.3826 .0644
.0643
-9
-8 .3938
.4289 .0642
.0640
-7
-6 .4356
.4377 .0639
.0638
-5
-4 .4366
.4707 .0636
.0635
-3
-2 .5292
.5707 .0634
.0632
-1
0 .6385
.7512 .0631
.0630
1
2 .6594
.5963 .0631
.0632
3
4 .5969
.5564 .0634
.0635
5
6 .5420
.5701 .0636
.0638
7
8 .5440
.5507 .0639
.0640
9
10 .5083
.5006 .0642
.0643
11
12 .5133
.5196 .0644
.0645
13
14 .5135
.5010 .0647
.0648
15
16 .4700
.4500 .0650
.0651
17
18 .4622
.4611 .0652
.0654
19
20 .4509
.4391 .0655
.0657
21
22 .4326
.4021 .0658
.0659
23
24 .3927
.3721 .0661
.0662
25
26 .3719
.3147 .0664
.0665
27
28 .2916
.2813 .0667
.0668
29
30 .2848
.2619 .0670
.0671
0 Conf. Limit
-1.0 -0.5 0.0 0.5 1.0
Figura 6.16b Correlação cruzada entre a série de óbitos e série de pacientes na faixa
etária de 35 a 39 anos, após a retirada de tendência e da sazonalidade, 1985 a
2005, município do Rio de Janeiro.
92
CrossCorrelation Function
First : SIT2SZ
Lagged: I30-34SZ
Lag
-25 Corr..0664
.1384 S.E.
-24
-23 .1553
.1691 .0662
.0661
-22
-21 .1884
.2338 .0659
.0658
-20
-19 .2409
.2823 .0657
.0655
-18
-17 .3128
.3032 .0654
.0652
-16
-15 .3065
.3394 .0651
.0650
-14
-13 .3403
.3686 .0648
.0647
-12
-11 .3846
.4208 .0645
.0644
-10
-9 .4369
.4641 .0643
.0642
-8
-7 .4764
.5010 .0640
.0639
-6
-5 .5166
.5696 .0638
.0636
-4
-3 .5894
.6047 .0635
.0634
-2
-1 .6088
.6499 .0632
.0631
0
1 .7301
.6827 .0630
.0631
2
3 .6520
.6433 .0632
.0634
4
5 .6203
.5760 .0635
.0636
6
7 .5817
.5669 .0638
.0639
8
9 .5793
.5580 .0640
.0642
10
11 .5493
.5487 .0643
.0644
12
13 .5649
.5764 .0645
.0647
14
15 .5726
.5472 .0648
.0650
16
17 .5373
.5239 .0651
.0652
18
19 .5299
.4987 .0654
.0655
20
21 .4674
.4682 .0657
.0658
22
23 .4668
.4479 .0659
.0661
24
25 .4578
.4345 .0662
.0664
0 Conf. Limit
-1.0 -0.5 0.0 0.5 1.0
Figura 6.16c Correlação cruzada entre a série de óbitos e série de pacientes na faixa
etária de 30 a 34 anos, após a retirada de tendência e da sazonalidade, 1985 a
2005.
CrossCorrelation Function
First : SIT2SZ
Lagged: AIDSSZ
Lag Corr. S.E.
-25 .2431 .0664
-24 .2387 .0662
-23 .2420 .0661
-22 .2450 .0659
-21 .2475 .0658
-20 .2497 .0657
-19 .2634 .0655
-18 .2655 .0654
-17 .2706 .0652
-16 .2744 .0651
-15 .2851 .0650
-14 .2936 .0648
-13 .2927 .0647
-12 .3027 .0645
-11 .3024 .0644
-10 .2975 .0643
-9 .3016 .0642
-8 .3142 .0640
-7 .3128 .0639
-6 .3243 .0638
-5 .3201 .0636
-4 .3366 .0635
-3 .3523 .0634
-2 .3580 .0632
-1 .3982 .0631
0 .4659 .0630
1 .4018 .0631
2 .3781 .0632
3 .3584 .0634
4 .3325 .0635
5 .3088 .0636
6 .3110 .0638
7 .2869 .0639
8 .2809 .0640
9 .2579 .0642
10 .2357 .0643
11 .2404 .0644
12 .2501 .0645
13 .2387 .0647
14 .2275 .0648
15 .2094 .0650
16 .1903 .0651
17 .1809 .0652
18 .1641 .0654
19 .1498 .0655
20 .1230 .0657
21 .1214 .0658
22 .0980 .0659
23 .0877 .0661
24 .0753 .0662
25 .0661 .0664
0 Conf. Limit
-1.0 -0.5 0.0 0.5 1.0
Figura 6.16d Correlação cruzada entre a série de óbitos e série de notificações de aids,
após a retirada de tendência e da sazonalidade, 1985 a 2005.
93
Para a análise no domínio da freqüência, realizou-se a análise do espectro cruzado entre
as séries, no processo denominado bivariado. A série CD+4 inferior a 350 células/mm3
apresentou densidade espectral alta para os períodos de seis, sete, vinte e dois e vinte e
cinco meses, conforme Tabela 6.2. A coerência mede o quadrado da correlação linear
entre os dois componentes do processo bivariado na freqüência considerada e é análogo
ao quadrado do coeficiente de correlação. Através dos valores altos de coerência entre
as séries comprovou-se a correlação linear entre as variáveis para atrasos de seis
períodos, assim como para atrasos de vinte e dois e vinte e cinco meses.
Densidade
Frequência Período Espectral Amplitude Coerência
0.142857 7.0000 0.99601 0.99992 0.905224
0.067460 14.8235 1.74806 1.78372 0.890544
0.043651 22.9091 3.50925 3.57700 0.882909
0.039683 25.2000 3.95224 4.13331 0.791450
0.023810 42.0000 2.50136 2.57758 0.759659
94
Além do atributo CD+4 Considerou-se um atraso de seis períodos para a série de
pacientes com escolaridade de um a três anos. Considerou-se ainda, como entrada da
rede, o total de casos de aids notificados com atraso de um período, com objetivo de
informar à rede o total de ocorrências do período. Após experimentos, a topologia da
RNA foi especificada com a camada de entrada formada por valores do atributo CD+4
com atrasos de seis, vinte e dois e vinte e cinco períodos e o atributo de escolaridade
entre um e três anos com atraso de sete e vinte e dois períodos, e finalmente da série de
notificações de aids com atraso de um período. Posteriormente, verificou-se que
mantendo-se somente as entradas de CD+4, o desempenho era praticamente o mesmo.
O total de duzentos e cinqüenta e dois pares de entrada e saída, referente aos valores das
séries por mês / ano, referente ao período de 1985 a 2005, foram utilizados. Deste total,
cinqüenta por cento para treinamento, trinta para verificação e vinte para teste da RNA
de múltiplas camadas com algoritmo backpropagation. Apesar de pequena quantidade
de dados para treinamento, o resultado foi satisfatório. Essa arquitetura de RNA
apresentou o melhor desempenho com a configuração de nove neurônios na camada
intermediária e funções de ativação linear para a camada de entrada e saída e função de
ativação tangente hiperbólica para camada intermediária. As predições de óbitos foram
realizadas para seis períodos. A Tabela 6.4 apresenta os resultados obtidos conforme o
número de épocas. O melhor desempenho ocorreu com quinhentas épocas com erros
iguais a 0.0082 e 0.0083 para treinamento e verificação respectivamente. A Figura 6.17
apresenta a relação entre os valores observados e previstos.
95
Figura 6.17 Valores observados e previstos, visualização Statistica.
Mais uma vez, para a análise da série no domínio do tempo, calculou-se a correlação
cruzada, que é a ferramenta natural para a análise de correlação entre séries no tempo
(CHATFIELD, 1989). Em seguida, calculou-se o espectro cruzado entre as variáveis,
identificando-se as freqüências características dos eventos que influenciam na
variabilidade da evolução da epidemia. Analisou-se a coerência entre os picos das
séries, verificando-se a correlação linear existente entre espectro de duas variáveis, no
processo denominado Bivariado (CHATFIELD, 1989).
96
Objetivou-se identificar as influências de variáveis relacionadas ao espaço e ao
ambiente na evolução da doença. As séries de ocorrências da epidemia foram
analisadas juntamente com variáveis consideradas determinantes de saúde, como: (i)
condições e estilos de vida (índice de desenvolvimento social do bairro e proporção de
domicílios alugados, entre outras), grau de instrução (proporção de chefes de família
com terceiro grau e por faixa de anos de estudo, entre outras) e; (ii) situação ambiental,
traduzido pelos índices sanitários do bairro da residência da pessoa infectada. Neste
último conjunto, nenhuma variável mostrou-se relevante. As variáveis consideradas no
modelo foram: proporção de domicílios alugados, proporção de responsáveis pelo
domicílio com rede de até dois salários, proporção de responsáveis pelo domicílio com
terceiro grau, conforme definição de variáveis relevantes apresentado no capítulo 3.
Tabela 6.5 Resultado parcial da RNA para predição da taxa de contaminação do bairro.
bai.1 Tx_ano.1 bai.2 Tx_ano.2 bai.3 Tx_ano.3 bai.4 Tx_ano.4 bai.5 Tx_ano.5
Data Mean 32.59748 6.274476 32.59748 6.274476 32.59748 6.274476 32.59748 6.274476 32.59748 6.274476
Data S.D. 34.58198 5.771567 34.58198 5.771567 34.58198 5.771567 34.58198 5.771567 34.58198 5.771567
Error Mean -0.19715 -0.010961 -0.06244 0.017757 -0.10471 -0.006256 -0.10745 0.038832 -0.06133 0.025515
Error S.D. 3.95542 1.070499 3.74167 0.988237 3.73755 0.932536 4.01468 1.008170 3.00481 0.948174
Abs E. Mean 1.26705 0.413338 0.91970 0.345035 0.69735 0.298192 1.04206 0.398266 0.94709 0.285458
S.D. Ratio 0.11438 0.185478 0.10820 0.171225 0.10808 0.161574 0.11609 0.174679 0.08689 0.164284
Correlation 0.99353 0.982684 0.99413 0.985254 0.99415 0.986864 0.99324 0.984681 0.99622 0.986429
97
6.8 Resumo
Em razão das profundas modificações nos estágios evolutivos da infecção pelo HIV, o
exame das tendências da epidemia deve combinar dados provenientes dos casos do
passado, com aqueles derivados da investigação e identificação de novos padrões da
doença. Através da análise integrada das notificações da doença com diferentes períodos
e condições de manifestação, objetivou-se identificar as influências de variáveis
relacionadas ao espaço e ao tempo na evolução da doença. Não foi identificada
correlação significativa com as variáveis relacionas ao meio ambiente como condições
sanitárias, número de banheiros, rede de esgoto, entre as variáveis apresentadas no
Anexo Indicadores Econômico-Sociais. Por outro lado, a identificação da forte
correlação dos óbitos com algumas variáveis, conforme apresentado no capítulo,
demanda ações de controle e pesquisa. A identificação de pacientes com contagem de
CD+4 acima de 350mm, fortemente correlacionada ao óbito pode efetivamente reduzir
o total de casos com óbito.
98
CAPÍTULO 7
ANALISE DA EPIDEMIA COM A ABORDAGEM DE REDES COMPLEXAS
7.1 Introdução
99
7.2 Objetivo
7.4 Conceitos
Na análise de redes sociais, algumas medidas referem-se à rede total, enquanto outras
resumem a posição estrutural de uma sub-rede ou de um único vértice. O cálculo produz
100
um número único no caso de uma característica da rede e uma série de números no caso
de sub-redes e vértices.
A exploração da estrutura de uma rede por medidas é mais precisa do que a inspeção
visual. Entretanto, os índices sobre a estrutura da rede usualmente são abstratos e de
difícil interpretação. Conseqüentemente, ambos, a inspeção visual e o cálculo dos
índices estruturais foram utilizados na análise da estrutura da rede no presente capitulo.
A rede pode ser desenhada de muitas maneiras e cada desenho enfatiza características
estruturais diferentes. Por esse motivo, alguns princípios básicos de desenho de redes
foram observados. O principio mais importante estabelece que a distância entre vértices
deve expressar a força ou o número de seus vínculos. Em um mapa, a distância entre
cidades iguala sua distância geográfica. Da mesma forma, os vértices conectados
devem ser desenhados mais próximos do que aqueles que não estão relacionados e o
comprimento da linha deve ser proporcional ao valor da linha.
101
7.4.2.1 Visão Global
A maneira mais fácil de reduzir uma rede é escolher uma classe de vértices. Um dos
principais objetivos da análise da terceira parte da tese foi identificar o movimento entre
bairros, assim como a interação entre bairros de residência e unidades hospitalares
utilizadas pelos pacientes. Utilizou-se uma partição para gerar uma sub-rede com a
visão global por região da cidade (zona sul, norte, oeste, entre outras). A visão
contextual obtida após a remoção das conexões entre bairro e unidade hospitalar
inferiores a 1% do total do período considerado, facilitou a identificação das principais
relações entre regiões da cidade e unidades hospitalares. A Figura 7.1a apresenta a
visão global. A Figura 7.1b apresenta a visão contextual.
Figura 7.1a Rede reduzida de bairros e unidades, visão global, 1982 a 1999, município
do Rio de Janeiro.
Esta global representa cada região da cidade por um vértice. A zona norte é a principal
usuária de quatro das cinco principais unidades. A exceção é a unidade identificada por
11312, onde os principais usuários residem na zona sul. A visão contextual permitiu
observar ainda que, considerando-se somente a região do Centro, os principais usuários
da unidade 11312 são os pacientes que residem no bairro do Cajú e no bairro de Santa
102
Teresa. A redução da rede não permitiu identificar um padrão entre bairros e unidades
hospitalares, haja vista que o principal usuário de todas as unidades desloca-se da região
norte. Nesse caso, outro tipo de análise é mais eficaz para a descoberta de padrões.
Figura 7.1b Rede reduzida de bairros e unidades, visão contextual, 1982 a 1999,
município do Rio de Janeiro.
103
da rede. Partições armazenam os valores discretos. Ambos foram amplamente
utilizados na descoberta de padrões desse trabalho.
Crosstabs
| 0 1 2 3| Total
---------------------------------------------------
0| 3 0 0 0| 3
1| 0 77 34 22| 133
2| 0 0 0 8| 8
3| 0 0 0 7| 7
---------------------------------------------------
Total| 3 77 34 37| 151
104
7.4.4 Medidas de Centralidade
105
Figura 7.2b Rede formada por unidades hospitalares utilizadas e bairros de residência
dos pacientes contaminados pelo vírus HIV, 1985, município do Rio de
Janeiro, visualização com NetDraw.
O conceito de coesão de uma rede social está ligado aos conceitos de densidade e
conectividade. A coesão de uma rede social pode ser medida pelo total de conexões
existentes na rede. A densidade é definida como o total de conexões de uma rede
simples (sem conexões múltiplas), expressa como uma proporção do número máximo
de conexões possível. Uma rede denominada completa é aquela que possui densidade
máxima.
Grande parte dos bairros (63%) possui até cinco vínculos e o crescimento do número de
vínculos não resulta no aumento da taxa de contaminação. A análise do total de
vínculos de forma isolada, não permitiu identificar um padrão de contágio e proliferação
da epidemia.
107
7.4.6 A força das Conexões Fracas
Segundo NOOY et. al. (2005), em redes sociais, pessoas com fortes vínculos tendem a
desenvolver grupos fechados. Um exemplo são os laços familiares: vários ou todos os
membros de uma família mantêm fortes vínculos entre si. Como conseqüência, os
vínculos familiares não são úteis para, por exemplo, encontrar novas oportunidades de
emprego porque todos se relacionam com as mesmas pessoas entre si. De forma
contrária, contatos menos intensos e irregulares tais como colegas antigos ou
conhecidos são melhores fontes de informação em relação a novas oportunidades de
trabalho. Estes vínculos fracos podem agir, mais facilmente, como pontes para redes
distantes de informação. Esse é o conceito da força dos vínculos fracos.
Freqüentemente, vínculos fracos são mais importantes para dispersar informação ou
doenças, que vínculos fortes. Esse conceito foi utilizado na análise de componentes e
no agrupamento dos vértices da rede.
7.4.7 K-Cores
A rede em estrela é a estrutura mais eficiente dado um número fixo de conexões. Uma
estrela é uma rede em que um vértice está conectado com todos os outros vértices, mais
estes vértices não estão conectados entre si. Isto conduz à idéia de que uma rede é mais
centralizada se os vértices mudam mais em relação a sua centralidade. Maior variação
na pontuação de centralidade dos vértices gera uma rede mais centralizada.
108
Figura 7.4 Valor de k-core por bairro, município do Rio de Janeiro.
Centralização é a variação no grau dos vértices dividida pela máxima variação em grau
possível dado o número de vértices da rede. Numa rede simples de um tamanho dado, a
rede em estrela tem variação máxima de grau. A divisão pela variação máxima garante
que o grau de centralização varie de zero (sem variação) a 1 (máxima variação), no caso
de uma rede em estrela.
109
a maior variação de grau. Assim sendo, como 576 é a variação máxima, e dividindo 576
por ele mesmo, obtemos um grau de centralização igual a 1.00.
Numa rede com linhas múltiplas ou laços múltiplos, o grau de um vértice não é igual ao
número de seus vizinhos. Nesse caso, a rede em estrela não tem necessariamente
variação máxima e a pontuação de centralização é superior a 1.00. Por esse motivo, não
é possível comparar a variação numa rede com linhas múltiplas ou laços múltiplos com
a variação numa rede em estrela simples do mesmo tamanho.
Figura 7.5 Rede estrela de pacientes que residem no município do Rio de Janeiro e que
realizaram diagnóstico de infecção pelo vírus HIV em outro município, 1982 a
2005.
110
menor a distância entre vértices, maior o risco de contagiar pessoas. Em uma rede de
comunicação, quanto menor o número de passos, mais fácil obter informação.
Caminho é uma seqüência de linhas onde nenhum vértice, entre o primeiro e o último
vértice, aparece mais que uma vez. Um nó da rede é alcançável por outro se existe um
caminho do último para o primeiro. Dois nós são mutuamente alcançáveis se estão
conectados por um caminho numa rede não direcionada. Entretanto, dois caminhos (um
em cada direção) são necessários em uma rede direcionada.
111
Tabela 7.1 Distribuição de freqüência de distância (total de vértices) entre uma
notificação de aids e a anterior, 1982 a 1985, município do Rio de Janeiro.
Distância Total %
0 9 7.62
1 11 9.32
2 20 16.94
3 19 16.10
4 26 22.03
5 12 10.16
6 12 10.16
7 8 6.77
8 1 0.84
total 118 100
112
7.4.9.1 Proximidade da Centralidade
113
Figura 7.7 Centralidade do bairro, 2005, município do Rio de Janeiro.
7.4.10 Intermediação
Nesse estudo, esse conceito foi denominado intermediação. Nesse caso, a centralidade
do vértice mede o quanto o mesmo é elo da cadeia de contatos da rede, facilitando a
difusão da epidemia. Considerando-se o geodésico como a principal via de contágio
entre os atores de uma rede, o ator que estiver localizado no geodésico de vários pares
de vértices, é, conseqüentemente, importante para o fluxo de disseminação da epidemia
(ou informação) na rede. Esse ator é mais central. A análise do poder de intermediação
de um vértice é importante para ações preventivas de bloqueio ou interrupção da
114
epidemia, especialmente nos casos em que a detecção ocorre no período inicial de
expansão.
Na rede em estrela, o centro possui o valor máximo, pois todos os geodésios o incluem.
De forma contrária, os demais vértices possuem valor de centralidade de intermediação
mínimo, porque não estão localizados entre os outros vértices da rede.
7.4.11 Pontes
115
conexão máxima – de tamanho mínimo três sem um vértice-corte. Num bi-componente,
nenhum bairro pode controlar completamente o fluxo do vírus entre outros dois bairros
porque existe sempre um caminho alternativo. Num bi-componente, cada bairro
conecta-se pelo menos com dois outros (numa rede não direcionada). Em redes
complexas, um bi-componente é mais coesivo do que um componente forte ou fraco
porque existem pelo menos dois caminhos diferentes entre cada par de vértices, ou seja,
dois caminhos que não compartilham um vértice entre o ponto inicial e o final.
116
7.4.12 Rede-ego e Conceito de Restrição
Numa tríade não direcionada que está conectada, porém incompleta, como o exemplo da
Figura 7.9, os vértices são consideradas menos ligados pelas normas do grupo. O vértice
A (pessoa A) está numa posição de vantagem em relação às demais porque ela pode
intermediar com as outras duas, fazendo-as competir, o que não seria possível se o
vértice (B) e a terceira pessoa (C) fizessem um acordo entre si. Isto é conhecido como
tertius gaudens (o terceiro que se beneficia) ou a estratégia tertius, que induz e explora
a competição ou rivalidade entre os outros dois, que não se relacionam diretamente. O
buraco estrutural permite que o ego aplique sua estratégia.
117
Uma variante mais maliciosa é conhecida como estratégia divide-e-governa, na qual
uma pessoa cria e explora conflitos entre os outros dois para controlar ambos. Um
exemplo ocorre quando o ego faz intrigas trazendo hostilidade entre os outros dois. Isto
não seria possível se eles pudessem verificar diretamente a informação e descobrir a
estratégia subversiva do ego. Novamente, o buraco estrutural permite que o ego aplique
sua estratégia.
A
0.25
B
0.25 0.33
5
D E
118
7.4.12.1 Rede-ego
A rede-ego é formada por um ego, os vizinhos do ego, e os vínculos entre eles. A rede-
ego de um vértice (Figura 7.10) contém todas as tríades que incluem esse vértice. Para
cada tríade na rede de bairros, analisou-se a posição do vértice (na posição de ego) e o
risco de contaminar os outros bairros, que podem estar ou não conectados diretamente
entre si. Da mesma forma, analisou-se a restrição que é exercida pelos vínculos, como a
que B exerce sobre A na Figura 7.10. Considerando-se que nenhum outro vizinho de A,
está conectado diretamente com B, não existe restrição em A causada por seu vínculo
com B. Uma restrição baixa indica a existência de buracos estruturais, que podem ser
explorados. Essa propriedade foi utilizada na análise de unidades hospitalares.
119
Conforme mencionado no início do capítulo, os pacientes que residem em um bairro
não são estáticos e movimentam-se constantemente. Entretanto, o presente estudo,
propõe-se a analisar a rede como uma entidade estática, baseando-se nas conexões
formadas pela geografia. Por esse motivo, buscou-se integrar as informações e padrões
identificados ao estudo de redes complexas, numa tentativa de explicar e entender a
importância da estrutura da rede no fenômeno estudado.
Na Figura 7.10, a restrição de A sobre E é igual à raiz da soma de: 0.25 (investimento
de A em E), mais 0.25 x 0.33 (vínculo de A para C e de C para E), mais 0.25 x 0.33
(idem para D). Os valores são as forças proporcionais e o valor da restrição de A com E
(assim como C e D) é igual a 0.17 e o com B é igual a 0.0625. A restrição de A em B é
aproximadamente 1/3 de que possui com os demais membros da rede. Há um buraco
estrutural entre A e B. A restrição agregada de um vértice é obtida pela soma de todas
as restrições diádicas de um vértice. Assim sendo, a restrição agregada de A é igual a
0.585. A Figura 7.11 apresenta os valores de restrição agregada dos vértices.
Segundo NOOY et. al. (2005) pesquisas indicam que, organizações e pessoas com
valores de restrição agregada menores apresentam melhor desempenho. Esse
desempenho é medido por intermédio da comparação do valor da restrição de um ator
da rede com um ou mais indicadores de desempenho, como os econômicos, por
exemplo.
120
Finalmente, a densidade egocêntrica de um vértice é a densidade de suas conexões, ou
seja, é a proporção de suas conexões em relação ao total de conexões. A Figura 7.12
apresenta os valores de densidade egocêntrica dos bairros. O coeficiente de correlação
entre a densidade egocêntrica e a taxa de contaminação dos bairros é de 0.25.
Em geral, quanto maior o número de conexões diretas com um bairro, maior a restrição
agregada do vértice.
121
Figura 7.12 Valores de densidade egocêntrica de bairros, município do Rio de Janeiro.
7.5 Objetivo
7.5.1.1 Contágio
Modelos de difusão em rede são baseados no processo de contaminação e, por isso, são
denominados contágio social. O processo de contágio segue um padrão. Normalmente,
poucas pessoas são contaminadas no início do processo, com crescimento vertiginoso
até estabilização da taxa de contaminação da doença. Esse padrão é conhecido como
reação em cadeia, no qual uma pessoa infectada contamina seus contatos e assim,
122
sucessivamente. A curva de contaminação pelo vírus HIV é um exemplo de curva de
difusão, onde o eixo do x representa o momento da contaminação e o eixo y a
prevalência da contaminação, conforme apresentado na Figura 7.13. A prevalência é a
freqüência acumulada, ou seja, é a soma percentual de pessoas contaminadas.
120.00
100.00
80.00
60.00
40.00
20.00
0.00
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1982
1995
Figura 7.13 Curva de contágio (bairros com notificações), 1982 a 1996, município do
Rio de Janeiro.
Na análise de vinte e cinco bairros que correspondem aos dezesseis por cento que
sofreram contágio nos primeiros anos, observou-se que as variáveis econômicas e
sociais apresentaram grande variabilidade. O mesmo ocorreu para os indicadores da
estrutura da rede. O índice de centralidade variou de 0.001 a 0.08, entre esses bairros. O
percentual de chefes de família com quinze anos ou mais de estudo variou de 1.6% a
60%. Por esse motivo, optou-se por utilizar a segunda abordagem para a análise.
124
1982 1983 1984 1985 1993
1996
Figura 7.14 Rede de bairros por ordem de contaminação e valor de exposição, 1984,
município do Rio de Janeiro.
A Figura 7.14 mostra a rede de bairros com a exposição dos vértices em 1984, indicada
pelo tamanho dos vértices e os respectivos valores entre parênteses. Os vértices
invisíveis têm exposição zero, nenhum dos seus vizinhos apresentou caso de aids antes
ou durante 1984. Onze dos quinze bairros que apresentaram casos em 1984 tinham
vizinhos entre os bairros com contaminação em 1983. O bairro da Gávea (código 23)
era o mais exposto com cinqüenta por cento de seus vizinhos com casos de
contaminação (exposição de 0.50) no final de 1984. Porém, nem todos expostos em
1984 apresentaram casos em 1985. Conforme esperado, o modelo de contágio simples,
que pressupõe que a contaminação de um vértice da rede depende da quantidade de
exposição, não explica integralmente a epidemia da aids.
A análise estatística da difusão de dados nem sempre encontra uma relação sistemática
entre exposição e adoção. Conseqüentemente, nem sempre encontra uma relação
sistemática entre exposição e contágio. Isto significa que o contágio apresenta diferentes
níveis de exposição. Esse conhecimento é intuitivo e, conforme mencionado
125
anteriormente, a contaminação pelo vírus HIV depende de inúmeras variáveis, e muito
específicas. Alguns bairros do município, e sua população, apresentaram maior
vulnerabilidade.
Na Figura 7.14, no ano de 1982, o bairro de Bangu (código 99) expôs seis vizinhos
(com códigos 97, 98, 100, 101, 102, 104), considerando-se somente aqueles com os
quais ele faz fronteira. Desses seis, nenhum apresentou caso de aids em 1984. Por
outro lado, nove bairros apresentaram casos em 1983. Considerando-se, da mesma
forma, somente os vizinhos com os quais fazem fronteira, eles expuseram quarenta e
oito bairros. Desse total, somente seis bairros apresentaram casos em 1984, que
representa o percentual de 12.5%. Cada um dos quarenta e dois bairros restantes
apresentou casos de contaminação após 1984, quando sua exposição era maior do que
no final daquele ano. Esse é o conceito de limiar. No estudo de marketing, sua
exposição não tinha alcançado o limiar necessário para adotar determinado produto
novo. Nesse estudo, utilizou-se o conceito de limiar para transmitir a idéia de limite de
imunidade, de prevalência da resistência à contaminação.
Os limiares individuais são computados numa rede de difusão depois do fato: são
predições com percepção tardia e, por esse motivo não são muito informativos. É
importante reconhecê-los ou validá-los, o que significa que eles devem ser associados
com outros indicadores como tempo de contaminação. Assim sendo, os limiares
indicam capacidades de resistência. O limiar mais baixo indica uma resistência menor,
e tempo menor de contaminação.
126
bairros contaminados anteriormente. Conseqüentemente, seus limiares são iguais a
zero, por definição. Assim sendo, na rede de bairros, é muito provável que os últimos
estejam conectados a muitos bairros contaminados, conduzindo a valores de exposição e
limiares altos no momento da primeira contaminação. Como a medida do tempo de
contágio está restrita a um pequeno número de momentos, produziu-se,
automaticamente, uma relação entre limiares e tempos de contágio do bairro, conforme
demonstrado na Tabela 7.2 e na Figura 7.15.
Tabela 7.2. Tabela comparativa de limiar médio e freqüência acumulada de bairros com
o primeira notificação de aids no ano, 1982 a 1992, município do Rio de Janeiro.
Figura 7.15 Limiar médio e freqüência acumulada de bairros com o primeira notificação
de aids no ano, 1982 a 1993, município do Rio de Janeiro.
127
Apesar disso, o estudo de limiares e da estrutura da rede, mostrou-se útil para a análise
nos primeiros anos da epidemia. Consoante com objetivo proposto no início do
capítulo, os resultados da mineração de dados geográficos foram analisados sob o ponto
de vista da estrutura da rede. Assim sendo, comparou-se o conjunto de medidas da rede,
com as taxas de contaminação e outros atributos.
Assim sendo, as notificações de aids foram acumuladas por períodos com o objetivo de
estudar a estrutura formada ao longo do tempo, e medir as variáveis de centralidade,
entre outras. Além disso, com objetivo de mensurar a centralidade lógica, ou seja, a
centralidade medida considerando-se a rede lógica formada pela epidemia, ao invés de
considerar a geografia dos bairros, desenvolveu-se uma rede somente com os bairros
que apresentaram notificações de aids.
Estas redes estão apresentadas nas Figuras 7.18a e 7.18b, e partindo-se dessa estrutura
calcularam-se (i) a distância entre os bairros, medida por intermédio da variável
proximidade da centralidade (ii) o grau de intermediação e (iii) a densidade egocêntrica.
Observou-se que, a centralidade e o limiar do bairro, são correlacionados
negativamente, com coeficiente de variação igual a (-0.18) no período de 1982 a 1987.
O coeficiente variou pouco nos demais períodos. Conseqüentemente, concluiu-se que
quanto maior a centralidade de um bairro, ou seja, quanto menor o somatório das
distâncias do bairro a todos os outros bairros, menor o valor do seu limiar. Essa idéia é
intuitiva, sendo a base da teoria do contágio. Os bairros mais centrais foram
contaminados mais cedo.
Por outro lado, a correlação entre o limiar e a taxa de contaminação do bairro, no ano
da primeira ocorrência é positiva, com coeficiente de correlação igual a 0.48. Para um
limite de confiança de 95%, e com os dados disponíveis e utilizados, o valor mínimo de
128
correlação, para ser considerado relevante é de 0.27. Esta forte correlação indica que o
bairro que resiste à epidemia, apesar de seus vizinhos contaminados, ao ser atingido,
apresenta um percentual maior de soropositivos no ano da primeira ocorrência, quando
comparados com os bairros com limiar inferior. A Tabela 7.3 apresenta a centralidade
dos bairros com maiores valores de limiar e a taxa da população contaminada, no ano da
primeira ocorrência. O valor médio da taxa no primeiro ano de contaminação é de 0.46.
As medidas de centralidade dos bairros, que foram contaminados no período de 1982 a
1985, estão apresentadas no Anexo F.
Tabela 7.3 Bairros com os maiores valores de limiar e respectiva taxa de contaminação
no ano da primeira ocorrência de aids.
As Figuras 7.16 e 7.17 apresentam a rede formada pelos bairros com notificações de
aids, no período de 1982 a 1985 e de 1982 a 1987, respectivamente. As conexões
129
indicam a vizinhança geográfica dos bairros. Entretanto, somente os bairros com
notificações de aids foram conectados.
Figura 7.16 Rede de bairros com ocorrência da epidemia, 1982 a 1985, município do
Rio de Janeiro.
Figura 7.17 Rede de bairros com ocorrência da epidemia, 1982 a 1987, município do
Rio de Janeiro.
130
A Figura 7.18 indica a relação entre a centralidade dos bairros e a epidemia. Os
vértices vermelhos são os mais centrais e o tamanho do vértice é a taxa de contaminação
pelo vírus HIV. Os bairros com vértice vermelho, ou seja, mais centrais, apresentaram
as maiores taxas no período seguinte.
O mapa com os valores de intermediação, ou seja, fazem parte do caminho entre dois
outros vértices, também expressam a importância do atributo na proliferação da rede,
conforme apresentado nas Figuras 7.19 e 7.20.
131
Figura 7.20 Medida de intermediação da rede de bairros contaminados representada
pelo tamanho do vértice, 1982 a 1987, município do Rio de Janeiro.
A Figura 7.22 apresenta os valores de limiares por bairro, de 1982 a 1996, ano que o
último bairro foi atingido pela epidemia. Os menores valores são apresentados por
amarelo e os maiores valores por azul.
Figura 7.22 Valor de limiar por vértice da rede de bairros, município do Rio de Janeiro.
133
limiar no período de 1982 a 1985. Por outro lado, a proporção razão de sexos é
positivamente correlacionada, explicado pela baixa contaminação de mulheres no
período analisada, de 1982 a 1993, primeira década da epidemia.
Alguns processos de difusão têm sucesso porque quase todos no grupo alvo são
contaminados. No município do Rio de Janeiro, cinqüenta e hum por cento dos bairros
foram contaminados até 1986, ou seja, num período de cinco anos. A disseminação de
uma doença contagiosa tem um limite crítico: uma vez ultrapassado, multiplica-se
rapidamente. A identificação desse limite crítico e importante para a prevenção ou
somente para histórico, no caso de eventos similares no futuro.
Esse limite é denominado massa crítica de um processo de difusão e é definido como o
número mínimo de atores que impedem a erradicação da contaminação. A massa crítica
de um processo de difusão particular é difícil de ser identificada. Usualmente,
considera-se uma regra prática empírica sobre processos de difusão. A regra afirma que
em um fenômeno particular quando a contaminação atinge vinte por cento de todas as
pessoas (no caso estudado, são os bairros da rede), a aceleração da taxa de
contaminação diminui, embora a taxa de contaminação ainda aumente em números
absolutos. Isto é conhecido como o primeiro ponto de inflexão de segunda ordem da
curva S.
Devido a esta relação empírica entre o primeiro ponto de inflexão de segunda ordem da
curva de difusão e a disseminação final de uma contaminação, os analistas de difusão
afirmam que a massa crítica é atingida quando a curva de difusão alcança este ponto de
inflexão. Segundo essa abordagem, o processo de difusão no qual a taxa de
134
contaminação acelera inicialmente e depois declina é conduzido pela reação em cadeia
característica de modelos de contágio. Presume-se que o contágio toma conta do
processo de difusão neste ponto, e que o processo atingiu sua massa crítica. Nesse
caso, processo de difusão da aids teria atingido sua massa critica no final de 1985.
Entretanto, essa abordagem pressupõe a relação entre contágio e massa crítica; não
prova que exista a massa crítica, apenas a assume. Todavia, é útil por motivos práticos.
Podemos monitorar o processo de difusão e vigiar para determinar o momento em que
ocorre o primeiro declínio do crescimento da aceleração (os declínios acidentais devem
ser ignorados). Nesse momento, é possível estimar o número final de bairros a serem
contaminados como cerca de cinco a dez vezes o número de bairros no momento de
maior crescimento porque entre 10 e 20 por cento já adotaram. Entretanto, essa é uma
simples regra prática.
Em outra perspectiva, assume-se que um processo de difusão atinge sua massa crítica
quando os vértices mais centrais são contaminados. Uma vez contaminados, tantos
atores na rede passam a ser expostos que muitos limiares individuais são alcançados,
conduzindo a uma avalanche de contaminações. O valor denominado intermediação,
do inglês between-centrality, parece estar associado com a massa crítica. Geralmente a
posição dos primeiros contaminados na rede é relevante para o processo de difusão. Se
os primeiros adotantes são centrais e conectados diretamente, seus vizinhos têm maiores
taxas de exposição e mais risco de contaminação.
A massa crítica traz uma mudança qualitativa do sistema traduzida num decréscimo
repentino dos limiares individuais. Durante o processo de difusão, os limiares
individuais podem decrescer como uma conseqüência da taxa de contaminação no
135
sistema total (menor resistência geral). Baixos limiares indicam maior vulnerabilidade à
contaminação, de forma que o processo de difusão se fortalece.
Um retardo de limiar é um período no qual um ator não é contaminado ainda que ele
esteja exposto ao mesmo nível em que ele será contaminado mais tarde. A diminuição
dos limiares quando a massa crítica é alcançada no processo de difusão pode explicar a
ocorrência de retardo de limiar, que é um período em que a exposição alcançou o limiar
individual, porém o indivíduo (vértice) não se contaminou. Neste caso, a adoção ocorre
depois de que a massa crítica é alcançada e o limiar do indivíduo decresce.
Esta abordagem de limiares e de retardos de limiar não prova que os vértices da rede
tenham limiares ou retardos de limiar, apenas os define numa forma particular. Numa
rede de difusão empírica, sempre é possível computar a exposição de um ator no
momento da contaminação (limiar) e por quanto tempo este ator precisou estar exposto
a esse nível antes de adotar (retardo de limiar). Segundo NOOY et. al. (2005) isto não
descarta a possibilidade de que o limiar do indivíduo fosse realmente mais baixo e seu
retardo de limiar mais longo.
Da mesma forma, na sub- rede com poucas conexões, ou seja, com valor de grau
médio baixo, a difusão foi mais lenta.
136
Quanto maior a vizinhança de um nó da rede, mais rapidamente ele foi
infectado.
Confirmou-se uma prevalência de pessoas com vírus HIV pertencentes a classes sociais
com menor poder aquisitivo, confirmadas pelos índices econômico-sociais (IBGE) dos
bairros. Entretanto, unidades hospitalares de saúde pública atendem primordialmente a
esse grupo social. Assim sendo, existem, provavelmente, pacientes soropositivos que,
quando atendidos por hospitais privados, nem sempre registram a notificação
compulsória.
7.7 Resumo
137
Este modelo de crescimento é típico de uma reação em cadeia causada por contágio. Os
modelos de rede se aproximam da difusão como um processo de contágio no qual os
vértices da rede expõem seus contatos à contaminação. Uma vez que a exposição atinge
seus limiares, que depende de atributos do vértice e das características da infecção, eles
serão contaminados e começarão a infectar outros. Como conseqüência, a estrutura da
rede e as posições dos primeiros contaminados da rede, influenciam a taxa de
proliferação. Este é um mecanismo muito provável. Entretanto, é difícil provar que a
difusão realmente funciona assim.
Alternativamente, a massa crítica pode ser associada ao momento em que os atores mais
centrais são contaminados ou quando, relativamente, muitos atores foram contaminados
embora suas exposições não estejam aumentando. No último caso, a teoria é que a
massa crítica ou fatores externos diminuem os limiares individuais. Pesquisas em curso
sobre difusão de contaminação devem esclarecer esta questão. Entretanto, o conceito
oferece algumas ferramentas práticas para monitorar e guiar o processo de difusão.
138
CAPÍTULO 8
PROPOSTA DE MEDIDA DE INTERAÇÃO ESPACIAL
8.1 Introdução
Este capítulo propõe-se a apresentar uma proposta para identificar o movimento dos
pacientes entre bairros, por intermédio de um critério de interação espacial com base no
total de ocorrências comuns ao par formado pelo bairro e pela unidade hospitalar.
8.2 Objetivo
139
8.3 Sistemas, Software e Dados
Utilizou-se o software NetDraw (2008) para visualização dos resultados. Mais uma vez,
utilizou-se a base de dados do Sistema Nacional de Notificações (SINAN), de 1982 a
2005.
Considerou-se que dois bairros são conectados, quando os mesmos compartilham pelo
menos um diagnóstico realizado por um paciente do respectivo bairro, na mesma
unidade hospitalar, no período de tempo considerado.
Unidade Bairro
Figura 8.1 Gráfico Bipartite, de interação entre bairro-unidade, sem considerar o tempo.
140
8.4.1 Cálculo da Interação Espacial
A força da interação espacial entre dois locais, como bairro e a unidade hospitalar de
saúde, pode ser medida pela quantidade de pacientes compartilhados, pela distância
geográfica ou por outra medida de interação espacial. Utilizou-se uma medida de
interação espacial (IE), que considera o total de pacientes compartilhados por dois
locais: unidade e bairro ou entre dois bairros. As notificações de aids foram totalizadas
por mês e bairro, obtendo-se o total de ocorrências de cada local, assim como o total
compartilhado por cada par bairro-unidade.
Calculou-se a medida de interação espacial dos pares compostos por bairro e unidade,
considerando-se o total de pacientes compartilhados, ou seja, o total de pacientes que
residem no bairro x com diagnóstico realizado na unidade y, conforme Equação 8.1.
2
IE Pc x, y Px Py
Onde:
IE (x,y) medida de interação espacial;
Pc (x,y) quadrado do total de soropositivos que residem no bairro x e com diagnóstico
realizado na unidade y, no período de tempo considerado;
Px total de soropositivos que residem no bairro x, no período de tempo considerado.
Py total de soropositivos que realizaram o diagnóstico na unidade y, no período de
tempo considerado.
141
relação entre o total de pacientes compartilhados e a distância média entre os locais que
compartilham esses pacientes. Conforme esperado, os pares que compartilham poucos
pacientes são em geral, mais distantes. De forma contrária, os pares que compartilham
muitos pacientes, tendem a ser mais próximos com distância média variando de cinco a
quinze mil metros. Mais uma vez, observou-se o principio da potência constante,
confirmando-se que o cálculo da interação espacial pode ser baseado no total de
pacientes compartilhados entre bairro e unidade ou entre bairros. Na Figura 8.4, o valor
absoluto do total de pacientes compartilhados, foi substituído pela medida de interação
espacial.
1000
100
10
1
1 10 100 1000 10000
15000
10000
5000
0
0 100 200 300 400 500 600 700 800
Figura 8.3 Distância média dos pares (eixo y) que compartilham Pc pacientes (eixo x).
142
0.02
0.01
0
1 10 100 1000
Calculou-se a medida de interação espacial dos pares formados por bairro e unidade
hospitalar, ou seja, o total de pacientes que residem no bairro x com diagnóstico
realizado na unidade y, conforme equação 8.1.
143
Na segunda fase, realizou-se um agrupamento de dados hierárquico com o conjunto
menor de pares, resultantes dessa simplificação. Para facilitar a identificação de
padrões, as unidades de saúde foram ordenadas de tal forma que os bairros com
maiores valores de IE, em relação à determinada unidade, fossem posicionados mais
próximos, reduzindo-se dessa forma a interseção de curvas na Figura 8.6. Com as
unidades de saúde posicionadas no eixo vertical e o tempo no eixo horizontal, foi
possível visualizar a variação da interação bairro-unidade no tempo.
144
Figura 8.5a Rede de bairros e unidades hospitalares, 1985, município do Rio de Janeiro,
visualização com NetDraw.
145
14000 14000
12000
11738
12000
Unidade de Saúde 10000
7943 FLAMENGO
8000
7439 7323 LARANJEIRAS
10000
6000 GLORIA
CATETE
4000
8000 BOTAFOGO
2000
6000 0
1985
1987
1989
1991
1993
1995
1997
1999
2001
2003
2005
Figura 8.6 Total de interações entre bairros (lista parcial) e respectivas unidades
hospitalares de saúde, 1985 a 2005, município do Rio de Janeiro.
Figura 8.7 Unidade de saúde mais utilizada por bairro, a tonalidade cinza representa
uma unidade hospitalar, 1982 a 2005, município do Rio de Janeiro.
8.6 Resumo
A visualização proposta auxilia a interpretação dos resultados. Essa informação pode ser
útil. Supondo-se que determinado bairro apresente uma redução brusca de casos da
epidemia, indicando uma anomalia ou erro, poder-se-ia pesquisar diretamente a unidade
de saúde que historicamente atende o bairro, em busca de possíveis falhas nos
diagnósticos. O estudo se propõe ainda a auxiliar o redirecionamento de pacientes em
caso de desativação de uma unidade hospitalar.
Na maioria dos casos a relação entre bairro e unidade hospitalar é definida pela
distância entre a unidade e bairro de residência. O mesmo critério pode ser considerado
para relacionar bairros através de outra entidade, diferente da unidade hospitalar.
Outra aplicação do modelo refere-se aos casos de infecção por contágio, nos quais a
informação sobre o deslocamento das pessoas infectadas estivesse disponível. Nesse
caso, os pares de bairros e unidades seriam substituídos por pares de locais visitados
pela pessoa infectada. A análise da Figura 8.6 permitiria identificar rapidamente os
locais visitados pelas pessoas infectadas e, conseqüentemente os locais com maior
probabilidade de contaminação.
147
CAPÍTULO 9
CONSIDERAÇÕES FINAIS
9.1 Conclusões
A definição estática da OMS que definia a saúde como o estado de completo bem estar,
foi superada. Nas definições atuais ela é dependente da dinâmica social e de políticas
econômicas e culturais. Assim sendo, os níveis de padrão sanitário dependem muito
mais de políticas econômicas, sociais e de aspectos culturais do que da intervenção da
medicina propriamente dita. Por esse motivo, buscou-se novas formas de estudar
saúde.
A pesquisa foi dividida em três grandes partes. A primeira composta pela proposta do
Índice de influência espacial. Na segunda parte, o Indice foi utilizado e agrupamentos
de dados usando Mapas Auto-Organizáveis de Kohonen foram realizadas, com o
objetivo de compreender os relacionamentos entre bairros e pacientes e, principalmente,
entender os vetores da epidemia. Nessa fase, as variáveis relevantes foram
148
identificadas. As informações obtidas foram utilizadas na modelagem espaço-temporal e
na predição de óbitos. Na terceira e última parte, a epidemia foi analisada com a
abordagem de redes sociais, buscando-se padrões na estrutura da rede formada, que
pudessem auxiliar no conhecimento da epidemia.
Na segunda parte, através do agrupamento dos bairros por ano da primeira ocorrência,
identificou-se que a contaminação partiu da zona sul para a Leopoldina e zona norte. A
redução do nível de escolaridade e dos índices econômicos pode ser associada ao
movimento em direção aos bairros da zona norte e oeste da cidade, considerando-se os
índices sócio-econômicos do IBGE. Apesar disso, os bairros mais críticos,
considerando-se todo o período, ainda são os do Centro, Copacabana e Tijuca.
149
fenômeno estudado pode ser compreendido. Prevaleceram as direções partindo-se de
Copacabana e Centro sentido norte, Leste-Oeste e norte.
150
total de pacientes compartilhados entre bairro e unidade de saúde, assim como entre
bairros que utilizam a mesma unidade de saúde é diretamente relacionado à distância
geográfica. Além disso, observou-se que a unidade de saúde mais utilizada por bairro é
constante nos últimos períodos da epidemia, na maioria dos bairros.
151
9.2 Trabalhos Futuros
Uma sugestão para continuação desse trabalho é considerar a relação topológica entre
os objetos espaciais, no cálculo do índice de influência espacial. Nesse caso, além da
distância e direção, a relação topológica também seria considerada no cálculo.
Exemplos de relações topológicas são: A contêm B, A está dentro de B, A intercepta B,
entre outras. A inclusão da relação topológica seria especialmente útil em tarefas de
mineração espacial que utilizam polígonos que contem e interceptam ruas, escolas, rios
e hospitais, sendo uma das sugestões de continuidade desse trabalho. Esse, de fato, era
o objetivo inicial da pesquisa. Entretanto, apesar de inúmeras solicitações dos mapas do
município ao Instituto Pereira Passos, sem sucesso, o objetivo foi modificado.
152
REFERÊNCIAS BIBLIOGRÁFICAS
ANSELIN, L., 2005, GeoDa 0.9 User's Guide, Spatial Analysis Laboratory,
Department of Agricultural and Consumer Economics and CSISS, University of
Illinois, Urbana, IL.
ASIMOV, D. 1985, “The grand tour: a tool for viewing multidimensional data”, SIAM
Journal of Science and Statistical Computing 6: pp. 28-143.
BLOOMFIELD, P., 1976, Fourier Analysis of Time Series: An Introduction, New York:
Wiley.
BREIMAN, L., FRIEDMAN, J.H., OLSHEN, R.A e STONE C.J., 1984, Classification
and regression trees. Belmont. CA: Wadsworth.
153
CAI, Y. CERCONE, N. e HAN, J., 1991, “Atribbute-oriented induction in relational
databases”, In: Piatesky-Shapiro, G. E Frawley, W. J. (eds) Knowledge Discovery in
Databases. AAAI Press, pp. 213-8.
CALINSKI, T. e HARABASZ, J., 1974, "A Dendrite Method for Cluster Analysis",
[online], http://www.informaworld.com/, dez/2006.
CÂMARA, G., 1996, "SPRING: Integrating remote sensing and GIS by object-oriented
data modelling", Garrido J Computers & Graphics, 20: (3) 395-403, May-Jun 1996.
CASANOVA, M.A., CAMARA, G., DAVIS, J., CLODOVEU A., VINHAS L.,
QUEIROZ, G.R., Bancos de Dados Geográficos, Editora MundoGeo, 2005.
CHATFIELD, C., The Analysis of Time Series, Chapman and Hall Ltd, London, 1989.
CHERNOFF, H., 1973, “The use of faces to represent points in k-dimensional space
graphically”, Journal of American Statistical Association, 68: pp. 361-36.
COOLEY, J.W. e TUKEY, J. W., 1965, "An algorithm for the machine calculation of
complex Fourier series," Math. Comput. 19, 297–301.
COOLEY, J.W., LEWIS, P.A.W. e WELCH, P.D., 1967,” Historical notes on the fast
Fourier transform”, IEEE Trans., AU-15,no. 2,76-9.
154
DAVIES, D. L. e BOULDIN, D. W., 1979, “A cluster separation measure”, IEEE
Transactions on Pattern Analysis and Machine Intelligence, v. PAMI-1, p. 224–227.
ERDOS, P e RÉNYI, A., 1960, The Evolution of Random Graphs. Magyar Tud. Akad.
Mat. Kutató Int. Közl. 5: 17–61.
ESTER, M., KRIEGEL, H. P. E XU, X., 1995, “Knowledge discobvery in large spatial
databases: focusing techniques for efficient class identification”, Proceedings
Iternational Symposium on Large Databases (SSD’95), Maine.
GAHEGAN, M., 2000, “On the application of inductive machine learning tools to
geographical analysis”, Geographical Analysis, 32(2), 113-39.
155
GOEBEL, M. e GRUENWALD, L.,1999, “A survey of data mining and knowledge
discovery software tools”, SIGKDD Explorations, 1: pp. 20-33.
HAN, J. e FU, Y., 1995, “Discovery of multiple level associations rules from large
databases”, Proceedings of the International Conference on Very Large Databases,
430-1.
HAN, J., FU, U. WANG, W., CHIANG, J. GONG, W., KOPERSKI, , K. D., LU, Y.,
RAJAN, A., STEFANOVIC, N., XIA, B. e ZAIANE, O. R., 1996, “DBMiner: a system
for mining knowledge in large relational databases”, Proceedings of International
Conference on Mining and knowledge Discovery (KDD 96), Oregon.
HAN, J., 1999, Characteristic rules. In: Handbook of Data Mining and Knowledge
Discovery (Ed. Kloegen, W. and Zytkow, J.), Oxford University Press, Oxford, UK (in
press).
HASLETT, J., BRADLEY, R., CRAIG, P., UNWIEN, A. e WILLS, G., 1990,
“Dynamic graphics for exploring spatial data with application to locating global and
local anomalies”, The American Statistician, Vol. 45, No. 3, pp. 234-242.
156
HSU, C. N. e KNOBLOCK, C. A., 1996, “Using inductive learning to generate rules for
semantic query optimization”, In: FAYYAD U. M. et al. (eds) Advances in Knowledge
Discovery and Data Mining, AAAI Press/The MIT Press, pp. 425-45.
HUNT, E., MARIN, J. e STONE, P., Experiments in Induction, New York: Academic
Press., 1996.
IBGE, www.ibge.gov.br/home/estatistica/populacao/tabuadevida/2003/default.shtm,
consulta realizada em 24-01-2007
KEIM, D., KRIGEL, H., 1996, “Visualization techniques for mining large databases: a
comparison”, IEEE Transactions on Knowledge and Data Engineering (Special Issue
on Dataming).
KEMPE, D., KLEINBERG, J.M. e TARDOS, E., 2005, “Influential nodes in a diffusion
model for social networks”, in ICALP, pp. 1127-1138, Springer Verlag.
LEE, H. Y. e ONG, H. L., 1996, “Visualization support for data mining”, IEEE Expert
Intelligent Systems and their Applications, Vol. 11, No. 5, pp. 69-75.
157
MacEACHREN, A. M., WACHOWICS, M., EDSALL, R., HAUG, D. e MASTERS,
R., 1999, “Constructing knowledge from multivariate spatio temporal data: integrating
geographical visualization with knowledge discovery methods”, International Journal
of Geographical Information Science, 13(4): 311-334.
MANN, J. e TARANTOLA, D., 1996, AIDS in the World II, New York/Oxford: Oxford
University Press.
MATTOS, R., 1999, Sobre os limites e as possibilidades dos estudos acerca dos
impactos das políticas públicas relativas à epidemia de HIV/AIDS. Algumas reflexões
metodológicas feitas a partir do caso brasileiro. In: Saúde, Desenvolvimento e Política:
Respostas frente à AIDS no Brasil (R. Parker, J. Galvão e M.S. Bessa, eds) pp 29-90,
São Paulo: Editora 34.
MATLAB, The Language of Technical Computing Matlab 7.0, The MathWorks, Inc.,
disponível em http://www.mathworks.com/company, dez/2006.
158
MILGRAM, S., 1969, “Interdisciplinary thinking and the small world problem”, In: M.
Sherif & C. W. Sherif (Eds), Interdisciplinary Relationships in the Social Sciences,
Chicago, Aldine, 1969, pp. 103-20.
NG, R. e HAN, J. 1994, “Efficient and effective clustering method for spatial data
mining”, Proceedings International Conference on Very Large Databases, pp. 144-55.
NOWELL, D e KLEINBERG, J., 2003, “The link prediction problem for social
networks”, in CIKM 03: Proceedings of the twelfth international conference on
Information and knowledge management, pp. 556-559, 2003.
PRIESTLEY, M.B., 1981, Spectral Analysis and Time Series, vols 1 e 2, London:
Academic Press.
QUINLAN, J. R., 1986, “Induction on decision trees”, Machine Learning, 1: pp. 81-
106.
159
QUINLAN, J. R., 1990, “Learning logical definitions from relations”, Machine
learning, 5: pp. 239-66.
QUINLAN, J. R., 1993, C4.5 Programs for Machine Learning, San Matel, CA:
Morgan, Kaufmann.
REINARTZ, T., 1999, “Focusing Solutions for Data Mining”, Lecture Notes in
Artificial Intelligence, pp. 16-23. Berlin: Springer.
RIBARSKY, W., KATZ, J. e HOLLAND, A., 1999, “Discovery visualization using fast
clustering”, IEEE Computer Graphics and Applications, pp. 32-39, September/October
1999.
SANTOS, F.F, EBECKEN, N.F. F., 2006, “O Ressarcimento ao SUS como instrumento
de informação sobre a Saúde no Brasil”, In: 8º Congresso Brasileiro de Saúde Coletiva
e 11º Congresso Mundial de Saúde Pública, Abrasco e World Federation of Public
Health Associations, WFPHA. pp. 23-35, Rio de Janeiro, Brasil.
160
SANTOS, F.F, EBECKEN, N.F.F., 2007, Knowledge Discovery based on the
integration of KDD and GIS, Statistics for Data Mining, Learning and Knowledge
Extraction, pp 45-47, Aveiro, Portugal.
SEIXAS, J.M., CALOBA, L.P. e DELPINO, I., 1995, “Reducing Input Space
Dimension for Real-Time Data Analysis in High-Event Rate Environments”,
International Conference on Applications of Neural Networks, Paris.
SIEGEL, M. D., 1998, “Automatic rule derivation for semantic query optimizer”,
Proceedings of the International Conference on Expert Systems, pp. 371-85.
TREISMAN, A., 1986, “Features and objects in visual processing”, Scientific American,
November 1986, 255(5): 114B-25.
161
TUFTE, E. R., 1990, Envisioning Information, Graphics Press, Cheshire, Connecticut,
USA.
TUKEY, J. W., 1977, Exploratory Data Analysis. Reading, MA, USA: Addison-
Wesley.
ULTSCH, A., 1993, “Knowledge extraction from self-organizing neural networks”, In:
Opitz, O. ed. Information and Classification. Springer, 1993
ULTSCH, A., 1999, “Data Mining and Knowledge Discovery with Emergent Self-
Organizing Feature Maps for Multivariate Time Series”, In: Oja, E.; Kaski, S. ed.
Kohonen Maps, Elsevier, 1999. p. 36–46.
VESANTO J., 1997, “Data Mining Techniques Based on the Self-Organizing Map.”
Dissertação – Helsinki University of Technology, May 1997. [online],
http://www.cis.hut.fi/projects/monitor/publications/html/mastersJV97/, Jul/2007.
VESANTO, J., 2000, SOM Toolbox for Matlab 5, Helsinki, Finlândia: Helsinki
University of Technology, 2000.
UNAIDS (The Joint United Nations Programme on HIV/AIDS), 1999, UNAIDS 3rd
Meeting of the Latin America and Caribbean Epidemiological Network. Abstracts.
Cuernavaca: UNAIDS.
WANG, W., YANG, J. e MUNTZ, R., 1997, “STINGA: Statistical information grid
approach to spatial data mining”, Proceedings of Very Large Databases, pp. 186-96.
162
WITTEN, I. H. e EIBE F., Data Mining: Practical machine learning tools and
techniques, 2nd Edition, Morgan Kaufmann, San Francisco, 2005.
163
ANEXO A - Agrupamento de Bairros por Área e Índices Econômico-sociais
164
ANEXO B - Agrupamento de Bairros por Índices Econômico-Sociais
Claro para
escuro:
0- 32%
33-64%
65-97%
Claro para
escuro:
2- 47%
48-93%
94-100%
165
ANEXO C - Agrupamento de Bairros por Índices Econômico-Sociais (Parte 2)
Claro para
escuro:
2- 19%
20-37%
38-56%
Proporção de responsáveis do domicílio com renda menor que 2 salários mínimos (%),
2005.
166
ANEXO D - Agrupamento de Bairros por Indices Econômicos-sociais (Parte 3)
Claro para
escuro:
2- 19%
20-37%
38-56%
167
ANEXO E - Tabelas de Medidas de Centralidade por Bairro
168
Bairro Ano Limiar Prox. Intermed. Densid. Taxa no
1ª Central. ego 1o ano
ocorr
Penha 1985 0.00 0.11 0.00 0.00 0.17
Botafogo 1985 0.25 0.15 0.01 0.18 0.82
Gamboa 1985 0.50 0.12 0.00 0.00 1.93
S Teresa 1985 0.33 0.17 0.01 0.18 0.80
Bangú 1985 0.00 0.15 0.02 0.04 0.38
Pavuna 1985 0.00 0.12 0.00 0.00 0.15
Manguinhos 1985 0.00 0.13 0.00 1.00 0.40
Anchieta 1985 0.00 0.11 0.00 0.00 0.24
Benfica 1985 0.14 0.12 0.00 1.00 0.51
R Miranda 1985 0.25 0.10 0.00 0.00 0.24
Glória 1985 0.40 0.11 0.00 0.00 1.09
Santo Cristo 1985 0.50 0.11 0.00 0.00 0.94
Vila Isabel 1985 0.50 0.14 0.01 0.07 0.57
Eng Leal 1985 0.00 0.11 0.00 0.00 0.00
Leme 1985 0.33 0.12 0.00 1.00 0.75
Sepetiba 1985 0.00 0.12 0.00 0.17 0.67
B Ribeiro 1985 0.20 0.09 0.00 0.00 0.22
Catete 1985 0.25 0.15 0.01 0.20 1.46
Penha Circ 1985 0.25 0.10 0.00 0.00 0.20
Ipanema 1985 0.67 0.12 0.00 1.00 0.27
Todos Santos 1985 0.25 0.10 0.00 0.00 0.43
Olaria 1985 0.00 0.10 0.00 0.00 0.18
Taquara 1985 0.14 0.11 0.00 0.00 0.12
T Coelho 1985 0.17 0.10 0.00 0.00 0.37
Parada Lucas 1985 0.25 0.08 0.00 0.00 0.54
Humaitá 1985 0.29 0.12 0.00 0.00 0.63
Vidigal 1985 1.00 0.12 0.00 1.00 0.97
169
ANEXO F - Algoritmo Cálculo de Tendência Espacial
objeto: polígono Oi para o qual os cálculos serão feitos, sendo o default todos.
direção: direções válidos: 0º, 45º , 90º, 135º , 180º , 225º , 270º e 315º .
n= total de polígonos
end
170
end do;
// cálculo de IFd
media = (soma + atributo(Oi)) / k;
desv = atributo(Oi) – media;
soma = 0;
// Cálculo da regressão
Calcular regressão tipo_calc de obj_total e armazenar em coefcorr
171
if abs(coefcorr) > = min_coefcorr then
Oi_ dir_dist_coefcorr = coefcorr
else Oi_ dir_dist_coefcorr = 0
Armazenar Oi_dir_dist_coefcorr
else nop;
end do;
end algoritmo
172
ANEXO G - Indicadores Econômico-sociais
Indicador Definição
situset Situação do setor (1- Área urbanizada)
tiposet Tipo do setor (0-Comum ou não especial, 1- Especial aglomerado)
tdomicpp Número de domicílios particulares permanentes
pop2000 População total
thom População masculina
tmul População feminina
pcasas Proporção de casas (%)
paptos Proporção de apartamentos (%)
pdomimp Proporção de domicílios improvisados (%)
pdomprop Proporção de domicílios próprios (%)
pdomalug Proporção de domicílios alugados (%)
paguared Proporção de domicílios ligados à rede de água (%)
paguapoc Proporção de domicílios com abastecimento por água de poços e nascentes (%)
paguaout Proporção de domicílios com outras fontes de água (%)
psbanh Proporção de domicílios sem banheiro (%)
psredint Proporção de domicílios sem rede interna de água (%)
psanrede Proporção de domicílios ligados à rede de esgoto (%)
psanfoss Proporção de domicílios com esgoto de fossa (%)
psanvala Proporção de domicílios com esgoto para vala (%)
psanrio Proporção de domicílios com esgoto para rio ou mar (%)
psaninad Proporção de domicílios com esgoto inadequado (%)
plixocol Proporção de domicílios com lixo coletado (%)
plixocac Proporção de domicílios com lixo coletado por caçamba (%)
plixoent Proporção de domicílios com lixo enterrado (%)
plixoquei Proporção de domicílios com lixo queimado (%)
plixojog Proporção de domicílios com lixo coletado jogado em rio ou terreno (%)
plixoina Proporção de domicílios com lixo inadequado (%)
nmedpesd Número médio de pessoas por domicílio
pest2g Proporção de responsáveis do domicílio com segundo grau (%)
pest3g Proporção de responsáveis do domicílio com curso superior (%)
173
Indicador Definição
pren0_2 Proporção de responsáveis do domicílio com renda menor que dois salários minm ários mí
mínimos (%)
pren1_3 Proporção de responsáveis do domicílio com renda entre um e três salários mínmos
mínimos (%)
razhxm Razão entre população masculina e feminina
pchefmul Proporção de responsáveis do domicílio que são mulheres (%)
174
ANEXO H- Mapa da rede de bairros, tamanho do vértice proporcional a centralidade, 2005, município do Rio de Janeiro
175
ANEXO I - Mapa de valores de degrau (número de conexões) rede de bairros, do município do Rio de Janeiro
176
ANEXO J - Mapa de Valores de Centralidade de Bairros, município do Rio de Janeiro.
177
ANEXO K – Mapa de Valores de Restrição Agregada da Rede de Bairros, do município do Rio de Janeiro
178
ANEXO L – Mapa de Valores de Densidade Egocêntrica da Rede de Bairros, município do Rio de Janeiro.
179
ANEXO M – Mapa de Valores de Limiar da Rede de Bairros, município do Rio de Janeiro.
180
ANEXO N Dicionário de Dados
181
** Caracter 4 NU_ANO Ano dos primeiros sintomas Preenchido
para os agravos agudos e ano automaticamente a partir
do diagnóstico para os casos de da data correspondente
hanseníase, tuberculose e
AIDS
Município de Caracter 7 ID_MUNICIP Código e nome dos Nome do município onde está Digitação do nome do
notificação municípios do localizada a unidade de saúde município ou do código.
cadastro do IBGE (ou outra fonte notificadora) Quando digitado o nome,
que realizou a notificação. O o código é preenchido
nome não é uma variável. Está automaticamente e vice-
associado ao código versa.
É campo-chave para
identificar registros no
sistema
Unidade de saúde (ou Caracter 7 ID_UNIDAD Código e nome do Nome completo e código da Digitação do nome da
outra fonte E estabelecimento unidade de saúde (ou outra unidade de saúde ou do
notificadora)
segundo tabela fonte notificadora) que realizou código. Quando digitado
disponibilizada para o atendimento e notificação do o nome, o código é
cadastramento pelo caso preenchido
usuário automaticamente e vice-
versa.
É campo-chave para
identificar registros no
sistema
Recomenda-se a utilização
das tabelas do SIA e SIH -
SUS
** Caracter 2 SG_UF_NO Siglas da unidade federada que notificou
o caso
T
182
Data do Data - DT_DIAG mm/dd/aa Data em que foi realizado o Preenchimento
Diagnóstico diagnóstico do caso notificado. obrigatório.
Data de notificação
Data do nascimento Data DT_NASC mm/dd/aa Data de nascimento do Preenchimento
paciente obrigatório, caso a idade
não esteja preenchida no
campo seguinte.
183
Raça / cor Caracter 1 CS_RACA 1- branca Considera-se na seleção das
2- preta categorias a cor ou raça
3- amarela declarada pela pessoa.
4- parda 1- branca
5- indígena 2- preta
9- ignorado 3- amarela ( pessoa que se
declarou de raça amarela)
4- parda (pessoa que se
declarou mulata, cabocla,
cafuza, mameluca ou
mestiça de preto com
pessoa de outra cor ou
raça)
5- indígena (pessoa que se
declarou indígena ou índia)
184
Escolaridade (em Caracter 3 CS_ESCOL 1 – nenhuma Anos de estudo concluídos. A - Categoria padronizada
anos de estudos AR 2 – De 1 a 3 classificação é obtida em função segundo definição da
concluídos) 3 – De 4 a 7 da série e do grau que a pessoa RIPSA
4 – De 8 a 11 está freqüentando ou freqüentou - Categoria 6- não se
5 – De 12 e mais considerando a última série aplica é preenchida
6 - Não se aplica concluída com aprovação. A automaticamente
9 - Ignorado correspondência é feita de forma quando caso notificado é
que cada série concluída com < 7 anos.
aprovação corresponde a um ano
de estudo.
185
Município de Caracter 7 ID_MN_RES Códigos e nomes Código e nome do município de Digitação do nome do
residência I padronizados pelo residência do caso notificado. município ou do código.
IBGE - Serão exibidos somente os Quando digitado o nome, o
Municípios pertencentes à UF código é preenchido
selecionada no campo anterior. automaticamente e vice-
versa.
- Campo de
preenchimento
obrigatório quando UF é
digitada
Bairro Caracter 9 ID_BAIRRO Códigos e nomes Nome e respectivo código do Digitação do nome ou
padronizados bairro de residência do paciente preenchimento automático a
segundo tabela por ocasião da notificação. partir do código no campo
disponibilizada Serão exibidos apenas os Bairros seguinte.
pelo sistema. pertencentes ao Município
Cadastramento selecionado no campo anterior.
realizado pelo
usuário.
Zona Caracter 1 CS_ZONA 1-urbana Zona de residência do paciente Critérios definidos na
2-rural por ocasião da notificação Oficina de trabalho do
3 – urbana/rural SINAN (set/98)
9- ignorado
Relações sexuais caracter 1 ANT_REL_SE 1. só com homens Pratica sexual do paciente Não pode ser nulo
2. só com mulheres Quando o paciente for do sexo
3. com homens e feminino e ANT_REL_SEX=2, o
mulheres programa deve mostrar uma
4. não se aplica mensagem alertando para a
9. ignorado notificação de paciente
HOMOSSEXUAL FEMININO
186
Relações sexuais com caracter 1 ANT_REL__1 1. sim Relações Sexuais com Não pode ser nulo
indivíduo sabidamente 2. não indivíduo sabidamente
HIV + / AIDS 3. não se aplica HIV+ /AIDS
9. ignorado
Classificação das Caracter 2 ANT_REL_CA 10 -Homossexual Categoria de Exposição do paciente - Rotina de classificação
Categorias de Exposição 20- Bissexual Hierarquizada ;
- Não pode ser nulo.
30- Heterossexual
40-Drogas * Campo que não consta da ficha de
50-Hemofilico notificação e na tela do programa.
60-Transfusão Variável interna do sistema
70- Acidente de Trabalho Disponível após exportação para outros
80-Perinatal formatos.
90-Ignorado Ver Rotina para classificação das
Para todas as categorias: categorias de exposição no final deste
21- Bi/Drogas documento.
22- Bi/Hemofilico
23- Bi/Transfusão
24- Bi/Droga/Hemof
Paciente com múltiplos caracter 1 ANT_PAC_MU 1. Sim Paciente com múltiplos parceiros Aceitar apenas códigos
parceiros 2. Não Listados
9. Ignorado
Parceiro(a) que mantém caracter 1 ANT_PARC_H 1. Sim Parceiro (a) que mantém Aceitar apenas códigos listados
relações sexuais só com 2. Não relações sexuais só com Quando paciente do sexo feminino,
homens 9. Ignorado homens preencher com a categoria 2 (não).
Parceiro(a) que mantém caracter 1 ANT_ PARC 1. Sim Parceiro (a) que mantém Aceitar apenas códigos listados
relações sexuais só com _M 2. Não relações sexuais só com Quando paciente do sexo masculino,
mulheres 9. Ignorado mulheres preencher com a categoria 2 (não).
Parceiro(a) que mantém caracter 1 ANT_ PARC _1 1. Sim Parceiro (a) que mantém Aceitar apenas códigos listados
relações sexuais com 2. Não relações sexuais com homens e mulheres
homens e mulheres 9. Ignorado
Parceiro(a) com caracter 1 ANT_PARC_3 1. Sim Parceiro(a) com Aceitar apenas códigos listados
múltiplos parceiros 2. Não múltiplos parceiros
9. Ignorado
Parceiro(a) que usa caracter 1 ANT_PARC_D 1. Sim Parceiro(a) que usa Aceitar apenas códigos listados
drogas injetáveis 2. Não drogas injetáveis
9. Ignorado
187
Parceiro(a) que recebeu caracter 1 ANT_PARC_T 1. Sim Parceiro(a) que recebeu Aceitar apenas códigos listados
transfusão de 2. Não transfusão de sangue/derivados
sangue/derivados 9. Ignorado
Parceiro Hemofílico caracter 1 ANT_PARC_2 1. Sim Parceiro Hemofílico Aceitar apenas códigos listados
2. Não
9. Ignorado
Uso de Droga Injetável caracter 1 ANT_DROGA 1. Sim Paciente Usuário de Droga Injetável Aceitar apenas códigos listados
2. Não
9. Ignorado
Hemofilia caracter 1 ANT_HEMOLF 1. Sim Paciente Hemofílico Aceitar apenas códigos listados
2. Não Quando paciente do sexo feminino,
9. Ignorado preencher com a categoria 2 (não).
História de Transfusão de caracter 1 ANT_TRANSF 1. Sim Paciente tem Historia de Transfusão de Aceitar apenas códigos listados
Sangue/Derivados 2. Não Sangue/Derivados
9. Ignorado
No caso de haver Historia date ANT_DT - Data da Transfusão Não pode ser nulo se ANT_TRANSF =
de transfusão, 1
data da Transfusão
Unidade federada de caracter 2 ANT_UF - unidade federada da transfusão do paciente Aceitar apenas códigos listados – tabela
Transfusão de siglas de unidade federada
Não pode ser nulo se ANT_TRANSF =
1
Município de Transfusão caracter 7 ANT_MUNICI - município da transfusão do paciente Aceitar apenas códigos listados – tabela
(código IBGE) de municípios
Não pode ser nulo se ANT_TRANSF =
1
Instituição de Transfusão caracter 7 ANT_INSTIT - Nome da Instituição de Transfusão
Após investigação caracter 1 ANT_INFECC 1. sim Após investigação realizada conforme Não pode ser nulo se ANT_TRANSF =
realizada conforme 2. não algoritmo da CN DST/AIDS, a transfusão 1
algoritmo da CN 3. não se aplica foi considerada causa da infecção pelo HIV Crítica para data da transfusão em
DST/AIDS, a transfusão 9. ignorado relação à data do diagnóstico – não
foi considerada causa da aceitar se a data da transfusão for
infecção pelo HIV? menor que 1 ano da data do
diagnóstico e mostrar mensagem
alertando da inconsistência!
188
Transmissão vertical Caracter 1 ANT_TRASMI 1. sim Ocorreu transmissão vertical (mãe/filho) Aceitar apenas códigos listados.
(mãe/filho) 2. não Incluir mensagem alertando o
3. não se aplica digitador que o sistema está
9. ignorado incluindo um caso de aids de
transmissão vertical e se ele tem
certeza!
Acidente de trabalho em Caracter 1 ANT_ACIDEN 1. sim Acidente trabalho em Profissionais de Aceitar apenas códigos listados.
profissionais de saúde 2. não saúde com sorologia negativa no momento Incluir mensagem alertando o
com sorologia negativa no 3. não se aplica do acidente e soroconversão nos primeiros digitador que o sistema está
momento do acidente e 9. ignorado 6 meses incluindo um caso de aids por
soroconversão nos acidente de trabalho e se ele tem
primeiros 6 meses certeza!
Outro Caracter 70 ANT_OUTRO
CRITÉRIO CARACAS Caracter 1 ANT_SARCO 1. Sim Sarcoma de Kaposi Aceitar apenas códigos listados.
M 2. Não Pontuação (10)
Sarcoma de Kaposi
9. Ignorado
Tuberculose disseminada Caracter 1 ANT_TUBERC 1. Sim Tuberculose disseminada/extrapulmonar/ Aceitar apenas códigos listados.
/ extra-pulmonar / não 2. Não não cavitária - Pontuação (10)
cavitária 9. Ignorado
Candidíase Oral ou Caracter 1 ANT_CANDID 1. Sim Candidíase Oral ou Leucoplasia Pilosa Aceitar apenas códigos listados.
leucoplasia pilosa 2. Não Pontuação (5)
9. Ignorado
Tuberculose pulmonar Caracter 1 ANT_PULMO 1. Sim Tuberculose pulmonar cavitária ou não Aceitar apenas códigos listados.
cavitária ou não N 2. Não especificada - Pontuação (5)
especificada 9. Ignorado
Herpes Zoster em Caracter 1 ANT_HERPES 1. Sim Herpes Zoster em indivíduo menor ou igual Aceitar apenas códigos listados.
indivíduo menor ou igual 2. Não a 60 anos
a 60 anos 9. Ignorado Pontuação (5)
Disfunção do sistema Caracter 1 ANT_DISFUN 1. Sim Disfunção do sistema nervoso central Aceitar apenas códigos listados.
nervoso central 2. Não Pontuação (5)
9. Ignorado
Diarréia igual ou maior Caracter 1 ANT_DIARRE 1. Sim Diarréia igual ou maior que um 1 mês Aceitar apenas códigos listados.
que um 1 mês 2. Não Pontuação (2)
9. Ignorado
Febre >= 38ºC por tempo Caracter 1 ANT_FEBRE 1. Sim Febre maior ou igual 38º C, por tempo Aceitar apenas códigos listados.
maior ou igual a 1 mês 2. Não maior ou igual a 1 mês
9. Ignorado Pontuação (2)
189
Caquexia ou perda de Caracter 1 ANT_CAQUE 1. Sim Caquexia ou pedra de peso maior que 10% Aceitar apenas códigos listados.
peso maior que 10% X 2. Não Pontuação (2)
9. Ignorado
Astenia maior ou igual a 1 Caracter 1 ANT_ASTERI 1. Sim Astenia maior ou igual a 1 mês Aceitar apenas códigos listados.
mês 2. Não Pontuação (2)
9. Ignorado
Dermatite persistente Caracter 1 ANT_DERMA 1. Sim Astenia maior ou igual a 1 mês Aceitar apenas códigos listados.
T 2. Não Pontuação (2)
9. Ignorado
Anemia e/ou linfopenia Caracter 1 ANT_ANEMIA 1. Sim Anemia e/ou linfopenia e/ou Aceitar apenas códigos listados.
e/ou trombocitopenia 2. Não trombocitopenia
9. Ignorado Pontuação (2)
Tosse persistente ou Caracter 1 ANT_TOSSE 1. Sim Tosse persistente ou qualquer pneumonia Aceitar apenas códigos listados.
qualquer pneumonia 2. Não (exceto tuberculose)
(exceto tuberculose) 9. Ignorado Pontuação (2)
Linfadenopatia maior ou Caracter 1 ANT_LINFO 1. Sim Linfadenopatia maior ou igual a 1 cm, Aceitar apenas códigos listados.
igual a 1 cm, maior ou 2. Não maior ou igual a 2 sítios extra-inquinais por
igual a 2 sítios 9. Ignorado tempo maior ou igual a 1 mês
extrainguinais por tempo Pontuação (2)
> ou = a 1 mês
CRITÉRIO CDC – Caracter 1 ANT_PULMA 1. Sim Candidíase (esôfago, traquéia, Aceitar apenas códigos listados.
Candidíase (esôfago, O 2. Não brônquios,pulmão)
traquéia, brônquios, 9. Ignorado
pulmão)
Citomegalovirose Caracter 1 ANT_CITO 1. Sim Citomegalovirose Aceitar apenas códigos listados.
2. Não
9. Ignorado
Câncer cervical invasivo Caracter 1 ANT_CANCER 1. Sim Câncer cervical invasivo Aceitar apenas códigos listados
2. Não Crítica: se sexo=1, preencher com o
9. Ignorado código 2.
Criptococose Caracter 1 ANT_CRIPTO 1. Sim Criptococose (Extra-Pulmonar) Aceitar apenas códigos listados
(Extrapulmonar) 2. Não
9. Ignorado
Criptosporidíase Caracter 1 ANT_CRIP_1 1. Sim Criptosporidíase Aceitar apenas códigos listados.
2. Não
9. Ignorado
Histoplasmose Caracter 1 ANT_HISTO 1. Sim Histoplasmose disseminada Aceitar apenas códigos listados.
disseminada 2. Não
9. Ignorado
190
Isosporíase Caracter 1 ANT_ISOPOR 1. Sim Isosporíase Aceitar apenas códigos listados.
2. Não
9. Ignorado
Herpes Simples (Muco- Caracter 1 ANT_H_SIMP 1. Sim Herpes Simples (Muco-Cutâneo > 1 mês, Aceitar apenas códigos listados.
Cutâneo > 1 mês, 2. Não esôfago, brônquios, pulmão)
esôfago, brônquios, 9. Ignorado
pulmão)
Leucoencefalopatia Caracter 1 ANT_LEUCO 1. Sim Leucoencefalopatia Multifocal Progressiva Aceitar apenas códigos listados.
Multifocal Progressiva 2. Não
9. Ignorado
Linfoma não Hodgkin caracter 1 ANT_LINFOM 1. Sim Linfoma não Hodgkin Aceitar apenas códigos listados.
2. Não
9. Ignorado
Linfoma Primário do caracter 1 ANT_LINFO_ 1. Sim Linfoma Primário do Cérebro Aceitar apenas códigos listados.
Cérebro 2. Não
9. Ignorado
Micobacteriose caracter 1 ANT_MICRO 1. Sim Micobacteriose Disseminada Aceitar apenas códigos listados.
Disseminada 2. Não
9. Ignorado
Pneumonia caracter 1 ANT_PNEUM 1. Sim Pneumonia por P. Carinii Aceitar apenas códigos listados.
por P. Carinii O 2. Não
9. Ignorado
Salmonelose caracter 1 ANT_SALMO 1. Sim Salmonelose (Septicemia recorrente) Aceitar apenas códigos listados
(Septicemia recorrente) 2. Não
9. Ignorado
Toxoplasmose Cerebral caracter 1 ANT_TOXO 1. Sim Toxoplasmose Cerebral Aceitar apenas códigos listados
2. Não
9. Ignorado
Sorologia para HIV - caracter 1 LAB_ELISA1 1. Positivo Diagnóstico de Infecção pelo HIV Aceitar apenas códigos listados
Elisa (1º teste) 2. Negativo Elisa ( 2º teste )
3. Inconclusivo
4. Não realizado
9. Ignorado
191
Sorologia para HIV – caracter 1 LAB_IMUNO 1. Positivo Diagnóstico de Infecção pelo HIV Aceitar apenas códigos listados
Imunofluorescência 2. Negativo Imunofluorescência
3. Inconclusivo
4. Não realizado
9. Ignorado
Sorologia para o HIV – caracter 1 LAB_WEST 1. Positivo Diagnóstico de Infecção pelo HIV Aceitar apenas códigos listados
Western Blot 2. Negativo Western Blot
3. Inconclusivo
4. Não realizado
9. Ignorado
PCR caracter 1 LAB_PCR 1. Positivo Diagnóstico de Infecção pelo HIV Aceitar apenas códigos listados
2. Negativo PCR
3. Inconclusivo
4. Não realizado
9. Ignorado
Outros caracter 1 LAB_OUTRO 1. Positivo Outros Diagnósticos de Infecção pelo HIV Aceitar apenas códigos listados
2. Negativo
3. Inconclusivo
4. Não realizado
9. Ignorado
Outros caracter 60 LAB_OUTROS especificar
Contagem de Linfócitos Numérica 4 LAB_CD4
CD4+
Data da contagem de data LAB_DT Data da contagem do CD4
CD4+
192
Critério excepcional caracter 1 DEF_DEFINI 1. Sim No caso de presença de situações clínicas Aceitar apenas códigos listados
CDC – caso sem 2. Não definidoras, porém sem o diagnóstico Campo habilitado se o diagnóstico
diagnóstico laboratorial 9. Ignorado laboratorial da infecção pelo HIV, houve laboratorial (LAB_ELISA1 &
da infecção pelo HIV, exclusão das causas de imunodeficiência LAB_ELISA2 & LAB_IMUNO &
excluídas outras causas listadas na definição de caso de AIDS do LAB_WEST & LAB_PCR &
de imunodeficiência Ministério da Saúde LAB_OUTRO) >2
(corticoterapia
sistêmica, leucoses e
síndrome de imuno-
deficiência genética) e
com doença indicativa
de AIDS diagnosticada
por método definitivo
Diagnóstico de AIDS caracter 1 DEF_DIAGNO 1. Sim Diagnóstico de AIDS explicitado na Aceitar apenas códigos listados
explicitado na 2. Não declaração de óbito, sem nenhum outro Se EVO_SITUAC=1, então campo
declaração de óbito 9. Ignorado dado preenchido com código 2)
Óbito por causa não caracter 1 DEF_CAUSA 1. Sim Óbito por causa não externa em paciente Aceitar apenas códigos listados
externa em paciente em 2. Não em acompanhamento e com ARC Se EVO_SITUAC=1, então campo
acompanhamento e com 9. Ignorado preenchido com código 2)
ARC
Nome da unidade caracter 7 TRA_UF - Nome da unidade federada onde se realiza o
federada onde se realiza tratamento
o tratamento
Nome do município caracter 7 TRA_MUNICI - Nome do município onde se realiza o
onde se realiza o tratamento
tratamento
Nome da Unidade de caracter 6 TRA_UNIDAD - Nome da unidade de saúde onde se realiza
saúde onde se realiza o o tratamento
tratamento
Situação Atual caracter 1 EVO_SITUAC 1. Vivo Situação atual do paciente: vivo, morto ou Aceitar apenas códigos listados
2 . Morto ignorado
9 . Ignorado
Data do Óbito data EVO_DT - Data do óbito do paciente Se EVO_SITUAC =1 ativar o botão
SALVAR, caso contrário habilitar os
campos seguintes como obrigatórios.
Nº da declaração de caracter 15 EVO_DO - Numero da D. O
óbito (D.O)
193
No caso de óbito Caracter 60 EVO_CAUSA1 - No caso de óbito informar a causa da morte
informar a causa da (exatamente como na declaração de óbito
morte (exatamente
como a Declaração de
óbito)
No caso de óbito Caracter 60 EVO_CAUSA2 - No caso de óbito informar a causa da morte
informar a causa da (exatamente como na declaração de óbito
morte
No caso de óbito Caracter 60 EVO_CAUSA3 - No caso de óbito informar a causa da morte
informar a causa da (exatamente como na declaração de óbito
morte
No caso de óbito Caracter 60 EVO_CAUSA4 - No caso de óbito informar a causa da morte
informar a causa da (exatamente como na declaração de óbito
morte
100. CDC Definição do caso de aids em maiores de 12 Variável interna do sistema, preenchida
* Critério de caracter 3 CRITERIO 200. CDC/Laboratório anos segundo os critérios adotados pela segundo os critérios descritos abaixo. A
confirmação/descarte 300. RJ/Caracas Coordenação Nacional de DST/Aids hierarquização dos critérios deve ser
120. CDC+ feita na seguinte ordem de importância
CDC/Laboratório (maior para o menor): 123, 120, 130,
130. CDC+ RJ/Caracas 140, 200, 100, 300, 500, 600, 400.
140. CDC/Laboratório +
RJ/Caracas
123. CDC+
CDC/Laboratório +
RJ/Caracas
400.CDC Excepcional
500. ARC+ Óbito
600. Óbito
900. Descartado
901.HIV+
* Data da Digitação data 8 DTDIGIT - Data da Digitação do caso, preenchido com preenchido com a data da digitação do
a data do dia caso
da digitação do caso * Campo que não consta da ficha de
notificação e da tela do programa.
194
Definição de caso de aids em casos com 13 anos ou mais segundo os critérios adotados pela Coordenação Nacional de DST/Aids
CDC : (LAB_ELISA1=1 AND LAB_ELISA2=1) OR (LAB_IMUNO=1 OR LAB_WEST=1 OR LAB_PCR=1 OR LAB_OUTRO=1) AND (LAB_IMUNO<>2 AND LAB_WEST<>2
AND LAB_PCR<>2 AND LAB_OUTRO<>2) AND (ANT_PULMAO=1 OR ANT_CITO=1 OR ANT_CANCER=1 OR ANT_CRIPTO=1 OR ANT_CRIP_1=1 OR ANT_HISTO=1
OR ANT_ISOPOR=1 OR ANT_H_SIMP=1 OR ANT_LEUCO=1 OR ANT_LINFOM=1 OR ANT_LINFO_ =1 OR ANT_MICRO=1 OR ANT_PNEUMO=1 OR ANT_SALMO=1 OR
ANT_TOXO=1)
CDC/Laboratório: (LAB_ELISA1=1 E LAB_ELISA2=1) OR (LAB_IMUNO=1 OR LAB_WEST=1 OR LAB_PCR=1 OR LAB_ORTRO=1) AND (LAB_IMUNO<>2 AND
LAB_WEST<>2 AND LAB_PCR<>2 AND LAB_OUTROS<>2) AND (LAB_CD4 >0 AND LAB_CD4 <350).
RJ/CARACAS : (LAB_ELISA1=1 AND LAB_ELISA2=1 OR LAB_IMUNO=1 OR LAB_WEST=1 OR LAB_PCR=1 OR LAB_OUTRO=1) AND (LAB_IMUNO<>2 AND
LAB_WEST<>2 AND LAB_PCR<>2 AND LAB_OUTRO<>2) AND (a soma dos campos PS, PT, PC, PP, PH, PD, PR, PF, PQ, PA, PE ,PN,PO,PL totalize 10 ou mais pontos,
segundo as condições abaixo relacionadas):
CDC Excepcional: (LAB_ELISA1>3 AND LAB_ELISA2>3 AND LAB_IMUNO>3 AND LAB_WEST>3 AND LAB_PCR>3 AND LAB_OUTRO>3) AND
(ANT_PULMAO=1 OR ANT_CITO=1 OR ANT_CANCER=1 OR ANT_CRIPTO=1 OR ANT_CRIP_1=1 OR ANT_HISTO=1 OR ANT_ISOPOR=1 OR ANT_H_SIMP=1 OR
ANT_LEUCO=1 OR ANT_LINFOM=1 OR ANT_LINFO_ =1 OR ANT_MICRO=1 OR ANT_PNEUMO=1 OR ANT_SALMO=1 OR ANT_TOXO=1)
ARC + ÓBITO: (LAB_ELISA1=1 E LAB_ELISA2=1) OR (LAB_IMUNO=1 OR LAB_WEST=1 OR LAB_PCR=1 OR LAB_OUTRO=1) AND (LAB_IMUNO<>2 AND
LAB_WEST<>2 AND LAB_PCR<>2 AND LAB_OUTRO<>2) AND (EVO_SITUAC=2 AND DEF_CAUSA=1 AND EVO_DT= DT_DIAG) AND (a soma dos campos PS, PT, PC,
PP, PH, PD, PR, PF, PQ, PA, PE,PN,PO,PL totalize menos de 10 pontos , segundo as condições abaixo relacionadas):
195
A data do óbito deve ser igual a data do diagnostico
11 – Homo/Drogas:
Em casos do sexo masculino:
quando ANT_REL_SE = 1 AND ANT_DROGA=1 AND ANT_INFECC<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
Em casos do sexo feminino
quando ANT_REL_SE = 1 AND ANT_REL_1= 1 AND ANT_DROGA=1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
12 - Homo/Hemofilico:
Somente nos casos de sexo masculino, quando ANT_REL_SE = 1 AND ANT_HEMOF=1 AND ANT_DROGA<>1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
13 – Homo/ Transfusão:
Manter somente para receber base de dados anterior. Casos novos entram na categoria 62.
14 - Homo/Droga/Hemof:
196
Somente nos casos de sexo masculino, quando ANT_REL_SE = 1 AND ANT_HEMOF=1 AND ANT_DROGA=1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
15 – Homo/Droga/Transfusão:
Manter somente para receber base de dados anterior. Casos novos entram na categoria 64.
20 - Bissexual:
Somente nos casos do sexo masculino, quando ANT_REL_SE = 3 AND ANT_DROGA<>1 AND ANT_INFECC<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
21 - Bi/Drogas:
Somente nos casos do sexo masculino, quando ANT_REL_SE = 3 AND ANT_DROGA=1 AND ANT_INFECC<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
22 - Bi/Hemofílico:
Somente nos casos do sexo masculino, quando ANT_REL_SE = 3 AND ANT_HEMOF=1 AND ANT_DROGA<>1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
23- Bi/Transfusão:
Manter somente para receber base de dados anterior. Casos novos entram na categoria 63.
24 - Bi/Droga/Hemofílico :
Somente nos casos do sexo masculino, quando ANT_REL_SE = 3 AND ANT_DROGA=1 AND ANT_HEMOF=1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
25 – Bi/Droga/Transfusão:
Manter somente para receber base de dados anterior. Casos novos entram na categoria 65.
30- Heterossexual:
Em casos do sexo masculino:
quando ANT_REL_SE = 2 AND (ANT_REL_1=1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR ANT_PARC_3=1 OR
ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_DROGA<>1 AND ANT_INFECC<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
Em caso do sexo feminino:
quando ANT_REL_SE = 1 AND (ANT_REL_1= 1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR ANT_PARC_2=1 OR
ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_DROGA<>1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
quando ANT_REL_SE = 3 AND (ANT_REL_1= 1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR ANT_PARC_2=1 OR
ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_DROGA<>1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
31- Hetero/Droga:
Em casos do sexo masculino:
quando ANT_REL_SE = 2 AND ANT_DROGA=1 (ANT_REL_1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR ANT_PARC_3=1
OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_INFECC<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
Em casos do sexo feminino:
quando ANT_REL_SE = 1 AND ANT_DROGA=1 (ANT_REL_1= 1 AND ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR
ANT_PARC_2=1 OR ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_INFECC<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
197
quando ANT_REL_SE = 3 AND ANT_DROGA=1 (ANT_REL_1= 1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR
ANT_PARC_2=1 OR ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
32 - Hetero/Hemofilico:
Somente nos casos do sexo masculino, quando ANT_REL_SE = 2 AND (ANT_REL_1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1
OR ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_HEMOF=1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
33 - Hetero/Transfusão:
Manter somente para receber base de dados anterior. Casos novos entram na categoria 66.
34 - Hetero/Droga/Hemof:
Somente em casos do sexo masculino, quando ANT_REL_SE = 2 AND ANT_DROGA=1 AND ANT_HEMOF=1 AND ANT_REL_1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR
ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
35 – Hetero/Droga/Transfusão:
Manter somente para receber base de dados anterior. Casos novos entram na categoria 67.
40 - Drogas:
Em casos do sexo masculino:
quando (ANT_REL_SE =9 OR ANT_REL_SE = 4) AND ANT_DROGA=1 AND ANT_INFECC<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
ou quando ANT_REL_SE = 2 AND ANT_DROGA=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1 OR ANT_ PARC _1<>1 OR
ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_INFECC<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
Em casos do sexo feminino:
quando (ANT_REL_SE =9 OR ANT_REL_SE = 4) AND ANT_DROGA=1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
quando ANT_REL_SE = 1 AND ANT_DROGA=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1 OR ANT_ PARC _1<>1 OR
ANT_PARC_2=1<>1 OR ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
ou quando ANT_REL_SE = 3 AND ANT_DROGA=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1 OR ANT_ PARC _1<>1 OR
ANT_PARC_2=1<>1 OR ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
198
41 -Drogas/Hemofílico:
Somente para o sexo masculino,
quando (ANT_REL_SE =9 OR ANT_REL_SE = 4) AND ANT_DROGA=1 AND ANT_HEMOF=1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
ou quando ANT_REL_SE = 2 AND ANT_DROGA=1 AND ANT_HEMOF=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1 OR
ANT_ PARC _1<>1 OR ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
42 -Drogas/ Transfusão:
Manter somente para receber base de dados anterior.
50-Hemofilia:
Somente para o sexo masculino,
quando (ANT_REL_SE =9 OR ANT_REL_SE = 4) ANT_HEMOF=1 AND ANT_DROGA<>1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
ou quando ANT_REL_SE = 2 AND ANT_HEMOF=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1 OR ANT_ PARC _1<>1 OR
ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_DROGA<>1 AND ANT_INFECC<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
60-Transfusão:
Em casos do sexo masculino:
quando (ANT_REL_SE =9 OR ANT_REL_SE = 4) AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_DROGA<>1 AND ANT_HEMOF<>1 AND ANT_TRASMI<>1 AND
ANT_ACIDEN<>1
ou quando ANT_REL_SE = 2 AND ANT_INFECC=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _1<>1 OR ANT_PARC_3<>1
OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_DROGA<>1 AND ANT_TRASMI<>1 AND ANT_HEMOF<>1 AND ANT_ACIDEN<>1
Em casos do sexo feminino:
quando (ANT_REL_SE =9 OR ANT_REL_SE = 4) AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_DROGA<>1 AND ANT_ACIDEN<>1
quando ANT_REL_SE = 2 AND ANT_REL_1<>1 AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_DROGA<>1 AND ANT_ACIDEN<>1
quando ANT_REL_SE = 1 AND ANT_INFECC=1 AND (ANT_REL_1<> 1 OR ANT_PAC_MU<>1 OR ANT_ PARC _M<>1 OR ANT_ PARC _1<>1 OR ANT_PARC_2=1 <>1 OR
ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_DROGA<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
ou quando ANT_REL_SE = 3 AND ANT_INFECC=1 AND ANT_DROGA=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1 OR
ANT_ PARC _1<>1 OR ANT_PARC_2=1 <>1 OR ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
61-Transfusão/Drogas:
Em casos do sexo masculino:
quando (ANT_REL_SE =9 OR ANT_REL_SE = 4) AND ANT_DROGA=1 AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_HEMOF<>1 AND ANT_ACIDEN<>1
ou quando ANT_REL_SE = 2 AND ANT_INFECC=1 AND ANT_DROGA=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1
OR ANT_ PARC _1<>1 OR ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_TRASMI<>1 AND ANT_HEMOF<>1 AND ANT_ACIDEN<>1
Em casos do sexo feminino:
quando (ANT_REL_SE =9 OR ANT_REL_SE = 4) AND ANT_INFECC=1 AND ANT_DROGA=1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
quando ANT_REL_SE = 2 AND ANT_REL_1<>1 AND ANT_DROGA=1 AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
quando ANT_REL_SE = 1 AND ANT_INFECC=1 AND ANT_DROGA=1 AND (ANT_REL_1<> 1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1 OR
ANT_ PARC _1<>1 OR ANT_PARC_2=1 <>1 OR ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
199
ou quando ANT_REL_SE = 3 AND ANT_INFECC=1 AND ANT_DROGA=1 AND (ANT_REL_1<>1 OR ANT_PAC_MU<>1 OR ANT_PARC_H<>1 OR ANT_ PARC _M<>1 OR
ANT_ PARC _1<>1 OR ANT_PARC_2=1 <>1 OR ANT_PARC_3<>1 OR ANT_PARC_D<>1 OR ANT_PARC_T<>1) AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
62-Transfusão/Homo:
Em casos do sexo masculino:
quando ANT_REL_SE = 1 AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_DROGA<>1 AND ANT_HEMOF<>1 AND ANT_ACIDEN<>1
Em casos do sexo feminino:
quando ANT_REL_SE = 2 AND ANT_REL_1=1 AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_REL_1= 1 AND ANT_DROGA<>1 AND ANT_ACIDEN<>1
63-Transfusão/Bi:
Somente nos casos do sexo masculino, quando ANT_REL_SE = 3 AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_DROGA<>1 AND ANT_HEMOF<>1 AND
ANT_ACIDEN<>1
64-Transfusão/Droga/Homossexual:
Em casos do sexo masculino:
quando ANT_REL_SE = 1 AND ANT_DROGA=1 AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_HEMOF<>1 AND ANT_ACIDEN<>1
Em casos do sexo feminino:
quando ANT_REL_SE = 2 AND ANT_REL_1= 1 AND ANT_DROGA=1 AND ANT_INFECC=1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
65 -Transfusão/Droga/Bissexual:
Somente nos casos do sexo masculino, quando ANT_REL_SE = 3 AND ANT_DROGA=1 AND ANT_INFECC=1 AND ANT_TRASMI<>1AND ANT_HEMOF<>1 AND
ANT_ACIDEN<>1
66-Transfusão/Hetero:
Em casos do sexo masculino:
quando ANT_REL_SE = 2 AND ANT_INFECC=1 AND (ANT_REL_1=1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _1=1 OR ANT_PARC_3=1 OR
ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_DROGA<>1 AND ANT_TRASMI<>1 AND ANT_HEMOF<>1 AND ANT_ACIDEN<>1
Em caso do sexo feminino:
quando ANT_REL_SE = 1 AND ANT_INFECC=1 AND (ANT_REL_1= 1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR
ANT_PARC_2=1 OR ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_DROGA<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
ou quando ANT_REL_SE = 3 AND ANT_INFECC=1 AND (ANT_REL_1= 1 OR ANT_PAC_MU=1 OR ANT_ PARC _M=1 OR ANT_ PARC _1=1 OR ANT_PARC_2=1<>1 OR
ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_DROGA<>1 AND ANT_TRASMI<>1 AND ANT_ACIDEN<>1
67-Transfusão/Droga/Hetero:
Em casos do sexo masculino:
quando ANT_REL_SE = 2 AND ANT_INFECC=1 AND ANT_DROGA=1 AND (ANT_REL_1=1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_
PARC _1=1 OR ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_TRASMI<>1 AND ANT_HEMOF<>1 AND ANT_ACIDEN<>1
Em caso do sexo feminino:
quando ANT_REL_SE = 1 AND ANT_INFECC=1 AND ANT_DROGA=1 AND (ANT_REL_1= 1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_
PARC _1=1 OR ANT_PARC_2=1 OR ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_TRASMI=1AND ANT_ACIDEN<>1
200
quando ANT_REL_SE = 3 AND ANT_INFECC=1 AND ANT_DROGA=1 AND (ANT_REL_1= 1 OR ANT_PAC_MU=1 OR ANT_PARC_H=1 OR ANT_ PARC _M=1 OR ANT_
PARC _1=1 OR ANT_PARC_2=1 OR ANT_PARC_3=1 OR ANT_PARC_D=1 OR ANT_PARC_T=1) AND ANT_TRASMI<>1AND ANT_ACIDEN<>1
201