Documente Academic
Documente Profesional
Documente Cultură
Contexto y perspectiva
Contexto y perspectiva
Contexto y perspectiva
Contexto y perspectiva
Contexto y perspectiva
Propsitos y limitaciones
de la minera de datos
La minera de datos, como se ha explicado antes, aplica mtodos
estadsticos y matemticos a enormes cantidades de datos. stos mtodos
pueden ser usados para organizar los datos, o para crear modelos
predictivos. La organizacin de grandes cantidades de datos puede incluir
por ejemplo agrupar personas con caractersticas similares en los mismos
grupos o encontrar caractersticas similares entre unos grupos y otros a
travs de cierto nmero de observaciones.
Sin embargo, los modelos predictivos transforman estas caractersticas en
expectativas en las que podemos basar nuestras futuras decisiones.
Por ejemplo, la duea de una venta de libros en la web podra usar estos
mtodos para saber qu tan frecuentemente debera reabastecer su
inventario con cierto ttulo que posee a la venta.
Propsitos y limitaciones
de la minera de datos
Es importante mencionar que el minado de datos no puede proveer
respuestas a todas y cada una de nuestras dudas. No podemos siempre
esperar que los modelos predictivos den resultados totalmente iguales a la
realidad.
La minera de datos est limitada por los datos que se hayan recolectado. Y
esas limitaciones pueden resultar ser demasiadas. Debemos recordar que
esos datos recolectados no siempre podran ser aplicables a los individuos
de los cuales los hemos recolectado.
Los datos pudieron haber sido recolectados de forma incorrecta o estar
desactualizados.
Propsitos y limitaciones
de la minera de datos
Existe una expresin en la minera de datos que dice "basura que entra,
basura que sale".
La calidad de los datos obtenidos de la minera de datos depender de la
calidad de los datos que se hayan recolectado y de su forma de
organizarlos. Incluso despus de haber hecho nuestro mejor esfuerzo en
llevar a cabo una recoleccin de datos de alta calidad, debemos recordar
basar las decisiones que tomemos no solo en los resultados que
obtengamos del minado, sino tambin en fuentes disponibles, la toma
aceptable de riesgos y sentido comn.
la
el
son
llamadas
Tipos de datos
Tipos de datos
Muchas veces, los datos transaccionales son demasiado como para llegar a ser
tiles, o los detalles podra comprometer la privacidad de los individuos. En
muchas instancias, el gobierno, las universidades, u organizaciones sin fines de
lucro pueden crear data sets y ponerlos a disponibilidad del pblico.
Por ejemplo, si queremos identificar regiones de los Estados Unidos que han
estado histricamente en alto riesgo de influenza, podra ser difcil obtener
permisos para acceder a los registros mdicos en todo el pas y compilar esta
informacin en un data set significativo. Sin embargo, el Centro de Control y
Prevencin de enfermedades de los Estados Unidos hace exactamente eso cada
ao. Las agencias de informacin generalmente no hacen esta informacin
disponible al pblico, pero an as se puede solicitar.
Tipos de datos
Tipos de datos
Tipos de datos
Todos estos tipos de datos cargan con ellos algunas preocupaciones. Ya que
estos datos son secundarios, han derivado de otras fuentes primarias y
podra hacerles falta documentacin adecuada, y el rigor con que han sido
creados podra ser muy variable.
Incluso algunos de estos datos podran no estar destinados a ser
distribuidos abiertamente y sera mejor asegurarse de obtener los permisos
adecuados antes de comenzar algn minado de datos o a usar algn data
set.
Hay que recordar que solo por que los datos han sido obtenidos en
internet, eso no significa que son de dominio pblico, y solo porque en una
organizacin haya un data set disponible, no significa que se pueda
libremente hacer minera de datos de ste.
Obtener permisos de los administradores, autores y de las partes
interesadas es crtico antes de empezar a hacer minera de datos.
Siempre debemos recordar que detrs de todos los datos que obtenemos en
nuestro trabajo de minera, hay gente real involucrada.
Y estas personas tienen ciertos derechos sobre la proteccin de su privacidad
y de crmenes como el robo de identidad. Como minadores de datos tenemos
la obligacin tica de proteger esos derechos individuales. Esto requiere
mucho cuidado en trminos de seguridad de la informacin. El simple hecho
de que un representante del gobierno o un contratista los solicite no significa
que debamos drselos.
Los objetivos esperados de la minera de datos nunca deben justificar el uso
de medios poco ticos. La minera de datos puede ser una poderosa
herramienta para la administracin de relaciones con clientes, mercadeo,
administracin de operaciones, y produccin; pero en todos los casos el
elemento humano debe estar siempre en la mira.
Preguntas
Preguntas