Documente Academic
Documente Profesional
Documente Cultură
Asimismo, lea un vector de "stop words" y elimine dichas palabras del vector original
(dichas palabras pueden algunos verbos auxiliares, preposiciones, etc).
Calcule la frecuencia relativa de aparicin de cada palabra y muestre las 10 palabras
con mayor frecuencia.
Implemente una funcin que reciba 2 vectores que representan documentos y calcule la
similaridad entre ellos. Para el caso de este problema se utilizar un criterio muy simple
que consiste en obtener el porcentaje de trminos comunes que aparecen en el top
10 de la lista de frecuencias calculada en el paso anterior.