Sunteți pe pagina 1din 21

Aplicación de redes neuronales

para la detección de spam en el


correo electrónico

Ing. Jimmy Gutierrez Nina


Presentation Movement

Neural
Network

2
INDICE

 Introducción
 Problemática del spam
 Modalidades de spam
 Problemática
 Objetivos
 Limites
 Alcances
 Modelos
 Redes neuronales
 Propuesta de solución
 Ventajas de la propuesta
 Conclusiones
Introducción

¿Que es el Spam ?
 Correos electrónicos comerciales no solicitados .
 Correos electrónicos masivos no solicitados.

Definición:
 Un mensaje electrónico es spam si:
La identidad personal del receptor y el contexto
son irrelevantes porque el mensaje es igualmente
aplicable a muchos otros receptores potenciales.
Además si es que, no se puede verificar que el
receptor haya dado un permiso deliberado,
explícito, y aún revocable, para que el mismo le
sea enviado
 “Se considera que un mensaje es spam sí y sólo sí
el mensaje es no solicitado y, a su vez, es
Países reproductores de SPAM

PAISES REPRODUCTORES DE SPAM


1%
1%
2%
1%
2% 2%
Estados Unidos
3% 12%
Corea del Sur
3%
China
3%
Francia
España
10% Canada
Japón
Brasil
Inglaterra
Alemania
35%
Australia
Polonia
25% Otros
AXS BOLIVIA

FILTRO BAYESIANO
2 millones de spam por día
Probabilidad de falsos positivos = 1/10000
Probabiliad de falsos negativos = 1/10000
2000000/100000 = 200
En una semana 200*7 = 1400
En un mes 20*30 = 6000
Modalidades de propagación de
spam
Modalidades de propagación de spam
diferentes al medio de correo electrónico:

 Mensajería instantánea
 Grupo de noticias
 Chat
 Foros
 Telefonía móvil
 Ventanas emergentes (pop ups)
Problemáticas

 Perdida de productividad y dinero en las empresas.



Reducción de efectividad del correo electrónico.

Amenaza la viabilidad de Internet como un medio efectivo de
comunicación.

Incremento de costos relacionados con el tiempo.

Genera importantes costos de seguridad a empresas ISP’s.

Incremento de propagación de virus informáticos.

Saturación de servidores. Muchos servidores dedicados para
uso privado o para uso general son congestionados implicando
una reducción de calidad de servicio.
 Denegación de servicios (Deny of services). Una cantidad
excesiva de correos no deseados puedo congestionar
totalmente el servicio y así denegarlo al mismo.
 Buzón de entrada incontrolable por parte del receptor. Causado
por la cantidad masiva que los spammers envían a los correos
electrónicos.
 Daño de imagen de terceros.
Objetivos

Objetivo general
 Proponer un sistema experto basado en redes
neuronales, siguiendo métodos heurísticos que
permitan categorizar un correo electrónico en
spam.

Objetivos específicos
 Construir una topología para la red neuronal,
capaz clasificar patrones de reconocimiento.
 Definir reglas de aprendizaje para la red
neuronal, para la detección de spam en el
correo electrónico.
 Determinar la arquitectura de red neuronal
adecuada para la resolución de la problemática
planteada.

Construir el prototipo de manera que sea
Limites

Realizar la detección de spam sólo en el correo electrónico y
no así en otros medios.
 El resultado obtenido tras el análisis del correo electrónico
tendrá un porcentaje de error en cuanto a falsos positivos y
negativos se refiere.

La aplicación no pretende hacer un consumo mínimo de
recursos del servidor de correos.

El entrenamiento de la red neuronal será realizado en base a
patrones generales de spam.
 El análisis del correo electrónico no se lo hará en tiempo real.

El prototipo de diseño final no llegara a su fase de
implementación.
Alcances

 Obtener porcentajes de aciertos de la red


neuronal en su proceso de categorización de
correos.

Proporcionar un software capaz de aprender
patrones de spam en correos electrónicos.
 Minimizar los falsos positivos y falsos negativos
entre pruebas primarias y pruebas finales.
 Contribuir a la investigación sobre la aplicación
de redes neuronales en el área de detección de
correos basura, proporcionando una alternativa
para combatir con el spam.
MODELOS

 Modelo de desarrollo del sistema


 Modelo de programación
 Arquitectura de la aplicación
 Capa de modelo de datos
 Capa de presentación de la aplicación
 Capa de la red neuronal backpropagation

Modelo de trabajo de la Red Neuronal
HERRAMIENTAS A UTILIZAR

 Plataforma
 Microsoft Windows XP Service Pack 2
 Tecnologia
 MatLab 6.1
 Microsoft Visual Studio 2005
 Microsoft SQL Server 2000
Redes neuronales artificiales

S2

OUTPUT

n
ó
aci
ag
S op
pr
de

Erro
r de p
or

ro p
aga
r
Er

ci ó n

CAPA CAPA OCULTA CAPA SALIDA


ENTRADA
Propuesta

ENTRADAS
ESQUEMA  Tipo de red
(Caracteristicas del RED NEURONAL GENERAL backpropagation
corr eo ) 
Estudio de patrones de
DE LA spam
SOLUCIÓN  Aprendendizaje
SA LIDAS

inteligente

SPAM Cuarentena
SISTEMA DE
Resultado
BACKPROPAGATION
HAM Receptor
CLASIFICACIÓN de los
correos mediante
aprendizaje
Propuesta

DETECCIÓN DE SPAM

1. Envio de correo
electrónico
Diagrama UML: Casos de uso
«extends»

2. Clasificación
de patrones

«extends»

Servidor de correo electrónico


3. Comparación de
Internet patrones

«extends»

4. Generar
estadisticas
«extends»

5. Obtener
Resultado
INTERNET E – MAIL

Servidor de Correo
E – MAIL E – MAIL E – MAIL

Usuario

E – MAIL

SPAM

Servidor Antispam
Gracias por su atención

20
¿Preguntas?

21

S-ar putea să vă placă și