Documente Academic
Documente Profesional
Documente Cultură
En esta seccin se presentan las ecuaciones de probabilidad usadas por el clasificador Naive
Bayes, para el clculo de la hiptesis ms probable, y la aplicacin de estas en la generacin de un
listado de predicciones o recomendaciones, para contenidos multimedia. Sea x un ejemplo que
puede ser clasificado dentro de v categoras, y sea x descrito por n caractersticas: a1,a2,..,an, el
clasificador de Naive Bayes busca encontrar la hiptesis ms probable que describa al ejemplo x, a
partir de la siguiente formula probabilstica [22,33,34], ver (1):
Vnj arg max P (vj) P (ai | vj)
(1)
En (1) Vnj es la probabilidad de que conocidas las n caractersticas que describen al ejemplo x,
stas pertenezcan a la categora vj; vj es cada una de las categoras V dentro de las que se puede
clasificar el ejemplo x. La probabilidad de P(ai|vj) est definida en general por (2) [22,33,34]:
P( ai | vj) nc n
(2)
En (2), nc es el nmero de veces que ocurre la caracterstica ai en la categora vj, mientras que n
es el nmero de casos totales de la categora vj. En caso de que nc sea igual a cero, se puede
usar de la m-estimacin o estimacin de Laplace [22,33,34], ver (3):
P (ai | vj) nc 1 / nc k
(3)
En (3), n es el nmero de casos totales con categora vj, nc es el nmero de veces que se da la
caracterstica ai en la categora vj, k es el nmero de valores diferentes que toma la caracterstica
ai. As, el clasificador de Naive Bayes puede ser usado para predecir la posible categora de un
caso x a partir de un conjunto de casos ocurridos, lo cual puede ser aplicado para la generacin de
recomendaciones en escenarios de contenidos multimedia [22,23].
A modo de ejemplo de aplicacin del clasificador de Naive Bayes, en la Tabla 1 se presenta el
catlogo de una tienda de pelculas, en el que un conjunto de contenidos multimedia han sido
valorados. Cada pelcula puede ser calificada dentro de 3 posibles valores (vj): v={1,2,3}. As
mismo, cada pelcula tiene 2 caractersticas (an) que la describen: a={Genero, Ao}.
TABLA I
EJEMPLO CLASIFICADOR NAIVE BAYES
Muestra
1
Gnero
Accin
Ao
2001
Valoracin
1
Drama
2005
Accin
2002
Comedia
2012
Comedia
2002
Si a partir de los datos de la Tabla 1, se desea predecir la posible calificacin de una pelcula cuyo
Gnero sea Accin y cuyo ao sea 2005, se realiza el clculo de las siguientes expresiones de
probabilidad (usando (1), (2) y (3)):
P(1)P(Accin|1)P(2005|1)=(0.4)(1)(0.5)=0.2
P(2)P(Accin|2)P(2005|2)=(0.4)(0.33)(0.5)=0.07
P(3)P(Accin|3)P(2005|3)=(0.2)(0.5)(0.5)=0.05