Sunteți pe pagina 1din 0

Anlise Forense de

Documentos Digitais

Prof. Dr. Anderson Rocha


anderson.rocha@ic.unicamp.br
http://www.ic.unicamp.br/~rocha

Reasoning for Complex Data (RECOD) Lab.


Institute of Computing, Unicamp
Av. Albert Einstein, 1251 - Cidade Universitria
CEP 13083-970 Campinas/SP - Brasil

Organizao

Organizao
Conceitos de Imagem Digital
Operaes com Imagens
Aprendizado de Mquina
A. Rocha, 2012 Anlise Forense de Documentos Digitais

Organizao
Aprendizado de Mquina
Supervisionado
No-Supervisionado
Semi-Supervisionado
Avaliao e Comparao de Mtodos
A. Rocha, 2012 Anlise Forense de Documentos Digitais

Imagem

Imagem
acordo com [Gomes & Velho 1996], para
De
trabalharmos com imagens, devemos estabelecer
um universo matemtico no qual seja possvel
definir diversos modelos abstratos destas

seguida, precisamos criar um universo de


Em
representao onde procuramos esquemas que
permitam uma representao discreta desses
modelos

A. Rocha, 2012 Anlise Forense de Documentos Digitais

Imagem

O objetivo da representao discreta desses

modelos codificar a imagem no computador

Quando observamos uma fotografia, ou uma

cena no mundo real, recebemos de cada ponto


do espao um impulso luminoso que associa
uma informao de cor a esse ponto

A. Rocha, 2012 Anlise Forense de Documentos Digitais

Imagem

Nesse sentido, podemos definir uma imagem


contnua (no discreta) como a aplicao
I:U !C

onde U R3 uma superfcie e C um espao


vetorial

Na maioria das aplicaes, U um subconjunto


plano e C um espao de cor

A. Rocha, 2012 Anlise Forense de Documentos Digitais

Imagem

A funo I na definio chamada de funo


imagem

O conjunto U chamado suporte da imagem


I
O
conjunto
de
valores
de
, que um

C
subconjunto de , chamado de conjunto de
valores da imagem

A. Rocha, 2012 Anlise Forense de Documentos Digitais

Imagem
C um espao de cor de dimenso 1,
Quando
dizemos que a imagem monocromtica ou em

tons de cinza

representao mais comum de uma imagem


Aespacial
consiste em tomar um subconjunto

discreto U U do domnio da imagem, uma


espao de cor C associado a um dispositivo
grfico e representar a imagem pela amostragem
0
I
!
U
da funo imagem
0

A. Rocha, 2012 Anlise Forense de Documentos Digitais

10

Imagem

chamado de elemento da imagem ou pixel

0
(x
,
y
)
U
Cada ponto i i do subconjunto discreto

a representao em computador, devemos


Para
tambm trabalhar com modelos onde a funo
imagem I toma valores em um subconjunto
discreto do espao de cor C

processo de discretizao chamado de


Esse
quantizao
A. Rocha, 2012 Anlise Forense de Documentos Digitais

11

Imagem
mais utilizado de discretizao espacial
Ode caso
uma imagem consiste em tomar o domnio
como sendo um retngulo e discretizar esse
retngulo usando os pontos de um reticulado
bidimensional

forma a imagem pode ser representada de


Dessa
forma matricial por uma matriz
A

(mn)

= (aij = (I(xi , yj ))

A. Rocha, 2012 Anlise Forense de Documentos Digitais

12

Imagem
Cada elemento

aij , i = 1, . . . , m e j = 1, . . . n

da matriz representa o valor da funo imagem


I no ponto de coordenadas (xi , yj ) do
reticulado

Dessa forma, cada ponto aij um vetor do


espao de cor representando a cor do pixel na
coordenada (i, j) da imagem

A. Rocha, 2012 Anlise Forense de Documentos Digitais

13

Imagem
Se cada ponto possui trs valores associados e
cada valor precisa de oito bits para ser
representado, ento cada pixel dessa imagem
pode ser representado com 24 bits

A imagem dita de 24 bits


Se cada pixel tambm codifica transparncia, a
imagem tem um quarto canal, chamado alfa,
tornando-se uma imagem de 32 bits

A. Rocha, 2012 Anlise Forense de Documentos Digitais

14

136

6 Digital Images

Imagem
amostragem

Images

Gomes & Velho

codificao

decodificao
Representao
Contnua

reconstruo

Fig. 6.1. Abstraction levels in the representation of an im

Representao
Representao
Discreta
Note that these levels will be Simblica
realized concretely in differen

image processing system. For this reason, in order to obtain a u


for image processing, we must use transformations to pass from
another, and we must also be able to manipulate descriptions on
(see Chapter 2).

Fig. 6.1. Abstraction levels


the representation
of an image.
6.2in The
Spatial Model
A. Rocha, 2012 Anlise Forense de Documentos Digitais

15 fo
Although there are several mathematical models appropriate
Note that these levels will be realized concretely in different ways in an

Espaos de Cor
espao de cor pode variar de acordo com o
Odispositivo
de exibio (e.g., monitor, impressora)

Espaos de cor
RGB (Vermelho,Verde, Azul)
CMYK (Ciano, Magenta, Amarelo, Preto)
HSV (Matiz, Saturao e Brilho)
etc.
A. Rocha, 2012 Anlise Forense de Documentos Digitais

16

Espao de cor RGB


propsito principal do sistema RGB
Oa reproduo
de cores em dispositivos

monitores de TV e computador
datashows
scanners

Wikipedia.org

eletrnicos

cmeras digitais
fotografia tradicional

A. Rocha, 2012 Anlise Forense de Documentos Digitais

17

A. Rocha

Imagem

A. Rocha, 2012 Anlise Forense de Documentos Digitais

18

A. Rocha (Montagem)

Imagem

* The Persistence of Memory by Salvador Dali

A. Rocha, 2012 Anlise Forense de Documentos Digitais

19

Espao de cor CMYK


Wikipedia.org

Modelo de cores subtrativas


Contraposio ao RGB
Apropriado para impressoras
K vem de keyed (alinhamento) da

placa de impresso de cor preta com


as outras
Wikipedia.org

A. Rocha, 2012 Anlise Forense de Documentos Digitais

20

Matiz (tonalidade): verifica o tipo da


cor (abrange todas as cores do
espectro)

Wikipedia.org

Espao de cor HSV

Saturao (pureza): valores baixos so


prximos do cinza.Valores altos so
prximos da cor pura

Brilho: define o brilho (intensidade) da


cor

A. Rocha, 2012 Anlise Forense de Documentos Digitais

21

Operaes com
Imagens

Quantizao
Mapeamento dos nmeros reais em valores
discretos

Tipicamente utiliza-se bytes (256 valores) ou


inteiros curtos (65536 valores)

A. Rocha, 2012 Anlise Forense de Documentos Digitais

23

Warping
Modifica o domnio da funo de imagem.

A. Rocha, 2012 Anlise Forense de Documentos Digitais

24

Transformaes - Atributos
r
u
l
b

arestas

can
al

A. Rocha, 2012 Anlise Forense de Documentos Digitais

25

Decomposio em Canais
de Cores
separamos a imagem em suas cores
Quando
bsicas representadas no espao de cores
C

o espao de cores utilizado um espao


Se
RGB, temos os componentes vermelho (Red),
verde (Green), e azul (Blue);

A. Rocha, 2012 Anlise Forense de Documentos Digitais

26

Decomposio Wavelet
L

H3

V3

D3

H2

V2

D2

H1

A. Rocha
V1

D1

A. Rocha

A. Rocha, 2012 Anlise Forense de Documentos Digitais

27

Decomposio em Planos
de Bits
decompomos a imagem em seus planos
Quando
de bits
exemplo, aps a decomposio da imagem
Por
de 24 bits em seus trs canais de cores (R,G,B),
podemos ainda, fazer uma decomposio por
planos de bits.

canal de cor possui 8 bits e possui 8 planos


Cada
de bits por canal de cor
A. Rocha, 2012 Anlise Forense de Documentos Digitais

28

A. Rocha

Decomposio em Planos
de Bits

* Decomposio da imagem em canais de bits

A. Rocha, 2012 Anlise Forense de Documentos Digitais

29

Nomenclaturas

Nomenclatura
Diferentes reas tem nomes distintos para
coisas parecidas

Aprendizado de Mquina
Reconhecimento de Padres
Aprendizado Estatstico
Minerao de Dados
A. Rocha, 2012 Anlise Forense de Documentos Digitais

31

Aprendizado de
Mquina

Aprendizado de Mquina
Aprendizado de Mquina uma rea da

Inteligncia Artificial concentrada no


desenvolvimento de tcnicas que permitem que
computadores sejam capazes de aprender com
a experincia [Mitchell 1997]

Extrao de informaes e extrapolao do


conhecimento a partir de dados

A. Rocha, 2012 Anlise Forense de Documentos Digitais

33

Aprendizado de Mquina
Alguns problemas que utilizam aprendizado de
Mquina [Mitchell 1997] [Friedman et al. 2001]

reconhecimento de caracteres
reconhecimento da fala
predio de ataques cardacos
deteco de fraudes em cartes de crditos
A. Rocha, 2012 Anlise Forense de Documentos Digitais

34

Aprendizado de Mquina
Na soluo desses problemas, podemos ter
classificadores fixos ou baseados em
aprendizado, que, por sua vez, pode ser
supervisionado ou no-supervisionado
[Friedman et al. 2001]

A. Rocha, 2012 Anlise Forense de Documentos Digitais

35

Definio Classificadores
ver um classificador, matematicamente, como
Podemos
um mapeamento a partir de um espao de
caractersticas X para um conjunto discreto de rtulos
(labels) Y

IA, um classificador de padres um tipo de motor


Em
de inferncia que implementa estratgias eficientes para
computar relaes de classificao entre pares de
conceitos ou para computar relaes entre um
conceito e um conjunto de instncias

[Dudaetal.2000]
A. Rocha, 2012 Anlise Forense de Documentos Digitais

36

Classificadores
Classificadores podem ser
Supervisionados
Semi-Supervisionados
No-Supervisionados
A. Rocha, 2012 Anlise Forense de Documentos Digitais

37

Classificadores
supervisionados consistem em
Classificadores
tcnicas em que procuramos estimar uma funo
de classificao f a partir de um conjunto de
treinamento

conjunto de treinamento consiste de pares de


Ovalores
de entrada X, e sua sada desejada Y
[Friedman et al. 2001]

A. Rocha, 2012 Anlise Forense de Documentos Digitais

38

Classificadores
observados no conjunto X so
Valores
denotados por x , isto , x a i-sima
i

observao em X

de variveis que constituem cada uma


Odasnmero
entradas em em X p
X tem n observaes, chamados de
Assim,
vetores de caractersticas

A. Rocha, 2012 Anlise Forense de Documentos Digitais

39

Classificadores
vetor de entrada composto por p graus
Cada
de liberdade (dimenses ou variveis)
sada da funo f pode ser um valor contnuo
A(regresso)
ou pode predizer a etiqueta (label)
de um objeto de entrada (classificao)

A. Rocha, 2012 Anlise Forense de Documentos Digitais

40

Classificadores
do aprendizado predizer o valor da funo
Aparatarefa
qualquer objeto de entrada que seja vlido aps

ter sido suficientemente treinado com um conjunto de


exemplos [Bishop 2006]

Alguns exemplos de classificadores supervisionados so


Support Vector Machines
Linear Discriminant Analysis,
Boosting
A. Rocha, 2012 Anlise Forense de Documentos Digitais

41

Aprendizado No-Supervisionado

Um outro grupo de tcnicas de aprendizado,


no utilizam exemplos de treinamento
marcados (classe conhecida)

Conhecidos como tcnicas para aprendizado


no-supervisionado

Esta forma de aprendizado, na maioria das

vezes, trata o seu conjunto de entrada como


um conjunto de variveis aleatrias

A. Rocha, 2012 Anlise Forense de Documentos Digitais

42

Aprendizado No-Supervisionado

Um modelo de distribuio conjunta (joint

distribution model) ento construdo para a


representao dos dados

Desta forma, o objetivo deste aprendizado avaliar


como os dados esto organizados e agrupados
[Friedman et al. 2001]

Tcnicas de Maximizao de Esperana [Baeza-Yates


2003], por exemplo, podem ser utilizadas para

aprendizado no-supervisionado
A. Rocha, 2012 Anlise Forense de Documentos Digitais

43

Aprendizado Semi-Supervisionado

Um outro grupo de tcnicas de aprendizado


envolve abordagens mistas

Supervisionado
No Supervisionado

So as tcnicas Semi-Supervisionadas
A. Rocha, 2012 Anlise Forense de Documentos Digitais

44

Modelagem de
Problemas

Modelagem de Problemas
Problemas so descritos por variveis
Dois tipos
Reais
Categricas
A. Rocha, 2012 Anlise Forense de Documentos Digitais

46

Modelagem de Problemas
Como transitar entre os dois tipos de variveis?
possvel converter uma representao em
outra?

A. Rocha, 2012 Anlise Forense de Documentos Digitais

47

Modelagem de Problemas
Simplicidade vs. Complexidade
O que realmente importante?
Precisamos realmente de todos os dados
possveis para tomar uma deciso?

A. Rocha, 2012 Anlise Forense de Documentos Digitais

48

Modelagem de Problemas
Dimenso do vetor de caractersticas tem
efeitos colaterais importantes:

Dimenso alta
Distncias mdias ficam grandes
Dados ficam esparsos
Maldio da Dimensionalidade
A. Rocha, 2012 Anlise Forense de Documentos Digitais

49

Aprendizado
Supervisionado
(Primeiros Passos)

Aprendizado Supervisionado
Dados para Aprendizado Supervisionado
Give me more data
Classificao vs. Regresso
A. Rocha, 2012 Anlise Forense de Documentos Digitais

51

Aprendizado Supervisionado

Ser que quanto mais complexo nosso modelo


de predio melhor o resultado?

A. Rocha, 2012 Anlise Forense de Documentos Digitais

52

Exemplo KNN
K-Vizinhos mais Prximos (KNN)
Um exemplo de tcnica baseada em instncias.
No h aprendizado
decises so feitas para cada instncia
A. Rocha, 2012 Anlise Forense de Documentos Digitais

53

KNN k = 1

o.... .... o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
.. .. .. .. .. ..o
.........................................
o o
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... ... o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. o
o o
.. ..o
.. .. ... ...o
o
.
.
.
.
.
.
.
.
.
.
.
.
.
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. ..o
. .o
.. .. ..o.. .. .. ..o
....................................
o o o
.. .. ... ...o
.. .. .. .. ..o
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o
...o
... ... ... ... ... ... o
o oo
o
.
.
.
.
.
.
.
.
o ... ... ... ...o... ... ... .... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... .....o.....o..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... .....
o
.. ..o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o ... ... ... ... ... ... ... ... ...oo... ... ... ... ... ... ... ...o
o
.
.
o
o
.. .. .. .. .. .. .. .. .. .. .. .. o
.. .. o
.. .. .. .. o
.. ... o
... ... ... ... ... ... ... ... ... ... ... ... ...o
... ... ... ... ... ... ... ... ... ... ... ... ... ...
o
o
.. .. .. .. .. .. .. .. o
..................
o o o.....o..... ..... o.....o..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... .....o..... ..... ..... ..... o
.. .. .. .. .. .. .. ..o
... ... ... ... ... ... ... ... ... ... ...o... ... ... ... ... ... ...
........
.. .. .. .. .. .. .. .. .. .. .. .. .. ..o
o o .. .. .. .. .. o.. ..o
.. o
.. .. .. .. ..o.. .. .. .. ..o
.. .. .. ... ... ... ... o
o
.. .. .. ..o
.. .. .. o
.. .. .. .. .. .. .. ... ... ... ... ... ... ... ...
o
o
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
o
oooo.. o
o
...o
... o
...o
... ... ... ... ... ...o
... o
... ... ... ... ... ...o...
... ... ... ...o... ... ... ... ... ... ... ... ... ... ... ... o
o...o..... ..... o.....o..... o..... ..... ..... ..... ..... ..... ..... .....o..... o
o
. . . . . . . .o
. . .. .. ..o
. . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o o
.. ..o
.. ... ... ... ... ... ... ... ... ... ... ... ... o
.. .. .. ... ... o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o
... ... ... ... ...o... ... ... ... ... ...o
o
o
o
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
o
o
o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
. .. o
.. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. ... o
...o
... ... ... ... ... ... ... ... ... ... ... ... ...
.
o.. ..o.. o.. .. o.. .. .. .. o.. .. .. .. .. .. .. .. .. .. .. .. .. .. o
. . . . . . . . . . . . .o. . . . .. .. .. .. .. .. ..
.. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... o
.. .. .. .. .. .. .. .. o
.. .. .. .. .. .. ..
... ... ... ... ... ... ...o... o
o
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
o
o
o
. . .o
..........o
. . . . . . . . . . . . . . . .o
. . . . . . . . . . . . .. .. .. .. .. ..
o .... .... .... .... .... .... .... o.... o.... .... .... .... .... .... ....o.... ....o.... o.... o....oo.... .... .... o.... .... .... ....o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
..............
..o
. . . . . . ..o..o.. ..o
..o
. .. .. .. o
. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..o
.. ... ... ... ... ... ... o
.. o
.. .. .. ... ... ... o
.. .. .. ... o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...o... ... ... ... ...o...o
.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.
o... ... ... ... ... ... ... ... ... ... ... ... ... ... ...o... ...oo... ... ... o
.. o
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. ..o
.. .. .. ..o.. .. .. o
.. .. .. .. .. .. .. ... o
. . . . . . . .o
..................
o ... ... ...o... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
. . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
. . . . . . .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o. . . . . . . . . . . . . . . . . . . . . .
... ... ... ... ...o
.. .. .. .. .. .. .. ..o.. .. .. .. .. .. ...o... ... ... ... ...o
.. .. .. .. .. .. .. .. .. .. .. .. .. o
.. o
.. o
.. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ... ... ... ... o
... ... ... ... ... ... o
... ... o
... ... ... ... ...o
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.........................
.. .. .. .. .. .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
. . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o. . . . . . . . . . . . . . . . .
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ...o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
................
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
...
...
..
..
..
..
..
..
..
..
..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
.. ..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
.. ..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..

..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
...
..
...
.
...
...
..
..
..
..
..
..
..
..
..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
.. ..
... ...
..
... ...
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
.. ..
... ...
.. ..
... ...
..
... ...
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..

..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
...
...
...
..
...
.
...
...
..
..
..
..
..
..
..
..
..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
.. ..
... ...
... ...
... ...
.. ..
... ...
..
... ...
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
.. ..
.. ..
... ...
... ...
... ...
.. ..
... ...
..
... ...
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
..
... ...
.. ..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
.. ..
.. ..
... ...
.. ..
... ...
... ...
... ...
.. ..
... ...
..
... ...
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..

..
..
..
..
..
..
..
.
...
.
...
..
.
...
..
..
..
.
...
..
..
..
..
..
...
..
..
...
..
...
...
...
..
...
.
...
...
..
..
..
..
..
..
..
..
..

.. ..
.. ..
.. ..
..
... ...
.. ..
.. ..
.. ..
..
... ...
.. ..
.. ..
.. ..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
.. ..
..
... ...
.. ..
... ...
... ...
... ...
.. ..
... ...
..
... ...
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

..
..
.

J. Friedman et al.

1-Nearest Neighbor Classifier

Figure 2.3: The same classification example in two

Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais

54

KNN k = 15

o.... .... o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
.. .. .. .. .. ..o
.........................................
o o
.. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. ..o
.. .. o
. . .. .. .. .. .. .. .. .. .. .. .. .. .. o
............................
o o
.. .. o
.. .. ... ...o
.. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. ..o
. . .. .. ..o.. .. .. ..o
....................................
.. .. ... ...o
.. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
o o o
.. .. .. ..o
. . . .. ..o
......................................
o
..o
.. .. .. ... ... ... o
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
o oo
o .... .... .... ....oo.... .... .... .... .... .... .... .... .... .... .... .... .... .... ....o....o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
o
.. ..o
. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o ... ... ... ... ... ... ... ... ...oo... ... ... ... ... ... ... ...o
.. ... o
.. .. .. .. .. .. .. .. .. .. .. .. ..o
.. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. ..o.. .. .. .. ..o.. .. o
.. .. o
.. .. ..o... o
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. .. .. .. .. .. .. .. .. .. .. .. .. ..
o
o
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
o
o
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . .o. . . . . . .
o
o
o...o... ... ...o... ... ... ... ... ... ... ... ... ... ... ... ...o... ... ... ... o
.. .. .. .. .. .. .. ..o
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.
.
.
.
.
.
.
.
o
o o .. .. .. .. .. o.. ..o
.. .. .. .. .. ..o
.. .. .. .. ..o
.. .. .. .. .. .. .. o
.. .. .. .. .. .. .. o
.. .. .. .. .. .. ..o
.. .. .. .. .. .. .. ..
o
o
o
o
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
o
o
o
.. .. .. .. .. .. .. .. .. .. .. .. .. o
. .. o
. .. .. .. .. .. .. .. .. .. ..o
.. .. .. .. .. .. .. .. .. .. .. .. ... o
.. .. .. .. .. ..o..
o
ooo.....oo
.. .. o
.. .. .. .. .. .. .. .. .. .. .. ...o
.. ...o
.. ..o
.. .. .. ..o
.. .. .. o
.. o
.. .. .. .. .. .. .. .. .. .. .. .. o
.. ... ... ... ... ... ... ...
o.. .. .. .. .. o
.. .. .. o
.. .. .. .. .. .. .. .. .. .. .. .. .. o
. . .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. ... ... ...o...o... o
.. ...o
... ...o
o
o
o
.
.
.
.
.
.. .. .. .. .. .. .. .. .. .. .. .. ... ... o
.
.
.
.
.
. .. .. .. .. .. .. .. .. .. .. .. .. ..
o
.. .. .. .. .. .. .. .. .. .. ..o
.o
.
.
.
..o.. .. ..o
.. .. o
.. .. .. .. .. ..o.. .. .. ..o.. .. .. .. .. .. ...o
.............
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
o.. ..o.. o.. .. o.. .. .. .. o.. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. .. .. .. .. .. .. .. .. .. ... ...o... ... ... ... ... ... ... ... ... ... ...
. . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
. . . .. .. .. .. .. o
. . . . .. .. .. .. o
.......
.. o
.. .. .. .. .. .. .. .. o
.. .. o
... ... ... o
.. .. .. ..o
.. ... ... ... ... o
.. o
.. .. .. ... ... o
.. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ...
o
o .... .... .... .... .... .... .... o.... o.... .... .... .... .... .... ....o.... ....o.... .... o....oo.... .... .... o.... .... .... ....o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
...o
... ... ... ... ... ... o
...o...o... ...o
... ... o
... ... ... ... o
... o
... ... ... ... ... ... ... ... ... ... ... ... ... ... ...o
.. ... ... ... ... ... ... ... ... ... ... ... ... ...
.
... ... ... ... ... ... ... ... o
... ...o... ... ... ... o
...o...o
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
o.... .... .... .... .... .... .... .... .... .... .... .... .... .... ....o.... ....oo.... .... .... o
.o
.. .. .. .. .. .. .. ..o
..................
... ... ...o
... ... ...o
... ... ... ...o... ... ... o
... ... ... ... ... ... ... ... o
.. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
o .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
. . . . . . .. .. .. ..o
o.. .. .. .. .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
... ... ... ... ...o
.. .. .. .. .. .. .. ..o.. .. .. .. .. .. ...o... ... ... ... ...o
.. .. .. .. .. .. .. .. .. .. .. .. .. o
.o
. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. ... ... o
. . .. .. .. .. o
. . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. ... ...o
.. .. o
.. .. ... ... ... ... ...o
.....................
.. .. .. .. .. .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. o
.. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
. . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ...o
o. . . . . . . . . . . . . . . . .
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
................
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
...
..
.
...
..
..
..
..
..
..
..
..
.

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
... ...
.. ..
..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
... ...
.. ..
..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
...
..
...
..
.
...
..
..
..
..
..
..
..
..
.

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
.. ..
... ...
.. ..
..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
.. ..
... ...
.. ..
... ...
.. ..
..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
.
...
..
..
...
..
...
..
.
...
..
..
..
..
..
..
..
..
.

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
.. ..
... ...
.. ..
... ...
.. ..
..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
... ...
... ...
... ...
.. ..
... ...
.. ..
... ...
.. ..
..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
... ...
..
... ...
... ...
... ...
.. ..
... ...
.. ..
... ...
.. ..
..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
..
...
...
.
...
...
...
..
...
..
...
..
.
...
..
..
..
..
..
..
..
..
.

.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
... ...
... ...
..
... ...
... ...
... ...
.. ..
... ...
.. ..
... ...
.. ..
..
... ...
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

.. ..
.. ..
..

.. ..
.. ..
..

..
..
.

.. ..
.. ..
..

..
..
.

J. Friedman et al.

15-Nearest Neighbor Classifier

Figure 2.2: The same classification example in two

Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais

55

Avaliao e
Comparao

Avaliao e Comparao
Vis e Varincia
Treinamento e Teste
Matriz de Confuso
Mtricas e Critrios
Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais

57

Avaliao e Comparao

Conjuntos de validao e teste


Validao cruzada

Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais

58

Curvas ROC
Especificidade
E = TN / (TN + FP)
Sensitividade
S = TP / (TP + FN)
(Sensitividade) vs. (1 - Especificidade) = Curva
Caracterstica de Operao (ROC)

Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais

59

Wikipedia.org

Curvas ROC

Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais

60

Referncias

Referncias
1. [Baeza-Yates 2003] R. Baeza-Yates. Clustering and Information Retrieval. Kluwer Academic Publishers. 1 edition.
2. [Bishop, 2006] C. M. Bishop. Pattern Recognition and Machine Learning. Springer, 1 edition, 2006.
3. [Duda et al. 2001] R. O. Duda, P. E. HART and D. G. STORK. Pattern Classification. Wiley-Interscience, 2, 2000.
4. [Friedman et al. 2001] J. Friedman, T. Hastie, and R. Tibshirani. The Elements of Statistical Learning. Springer, 1
edition, 2001.
5. [Gomes & Velho, 1996] J. Gomes L. Velho. Computao Grfica: Imagem. IMPA-SBM, 1.
6. [Gonzalez & Woods, 2007] R. Gonzalez and R. Woods. Digital Image Processing. Prentice-Hall, 3 edition.
7. [Mitchell 1997] T. M. Mitchell. Machine Learning. McGraw-Hill, 1 edition, 1997.

A. Rocha, 2012 Anlise Forense de Documentos Digitais

62

Obrigado!

S-ar putea să vă placă și