Documente Academic
Documente Profesional
Documente Cultură
Neural
Network
2
INDICE
Introducción
Problemática del spam
Modalidades de spam
Problemática
Objetivos
Limites
Alcances
Modelos
Redes neuronales
Propuesta de solución
Ventajas de la propuesta
Conclusiones
Introducción
¿Que es el Spam ?
Correos electrónicos comerciales no solicitados .
Correos electrónicos masivos no solicitados.
Definición:
Un mensaje electrónico es spam si:
La identidad personal del receptor y el contexto
son irrelevantes porque el mensaje es igualmente
aplicable a muchos otros receptores potenciales.
Además si es que, no se puede verificar que el
receptor haya dado un permiso deliberado,
explícito, y aún revocable, para que el mismo le
sea enviado
“Se considera que un mensaje es spam sí y sólo sí
el mensaje es no solicitado y, a su vez, es
Países reproductores de SPAM
FILTRO BAYESIANO
2 millones de spam por día
Probabilidad de falsos positivos = 1/10000
Probabiliad de falsos negativos = 1/10000
2000000/100000 = 200
En una semana 200*7 = 1400
En un mes 20*30 = 6000
Modalidades de propagación de
spam
Modalidades de propagación de spam
diferentes al medio de correo electrónico:
Mensajería instantánea
Grupo de noticias
Chat
Foros
Telefonía móvil
Ventanas emergentes (pop ups)
Problemáticas
Objetivo general
Proponer un sistema experto basado en redes
neuronales, siguiendo métodos heurísticos que
permitan categorizar un correo electrónico en
spam.
Objetivos específicos
Construir una topología para la red neuronal,
capaz clasificar patrones de reconocimiento.
Definir reglas de aprendizaje para la red
neuronal, para la detección de spam en el
correo electrónico.
Determinar la arquitectura de red neuronal
adecuada para la resolución de la problemática
planteada.
Construir el prototipo de manera que sea
Limites
Realizar la detección de spam sólo en el correo electrónico y
no así en otros medios.
El resultado obtenido tras el análisis del correo electrónico
tendrá un porcentaje de error en cuanto a falsos positivos y
negativos se refiere.
La aplicación no pretende hacer un consumo mínimo de
recursos del servidor de correos.
El entrenamiento de la red neuronal será realizado en base a
patrones generales de spam.
El análisis del correo electrónico no se lo hará en tiempo real.
El prototipo de diseño final no llegara a su fase de
implementación.
Alcances
Plataforma
Microsoft Windows XP Service Pack 2
Tecnologia
MatLab 6.1
Microsoft Visual Studio 2005
Microsoft SQL Server 2000
Redes neuronales artificiales
S2
OUTPUT
n
ó
aci
ag
S op
pr
de
Erro
r de p
or
ro p
aga
r
Er
ci ó n
ENTRADAS
ESQUEMA Tipo de red
(Caracteristicas del RED NEURONAL GENERAL backpropagation
corr eo )
Estudio de patrones de
DE LA spam
SOLUCIÓN Aprendendizaje
SA LIDAS
inteligente
SPAM Cuarentena
SISTEMA DE
Resultado
BACKPROPAGATION
HAM Receptor
CLASIFICACIÓN de los
correos mediante
aprendizaje
Propuesta
DETECCIÓN DE SPAM
1. Envio de correo
electrónico
Diagrama UML: Casos de uso
«extends»
2. Clasificación
de patrones
«extends»
«extends»
4. Generar
estadisticas
«extends»
5. Obtener
Resultado
INTERNET E – MAIL
Servidor de Correo
E – MAIL E – MAIL E – MAIL
Usuario
E – MAIL
SPAM
Servidor Antispam
Gracias por su atención
20
¿Preguntas?
21