Documente Academic
Documente Profesional
Documente Cultură
UNIVERSIDAD EL BOSQUE
CENTRO DE DESARROLLO TECNOLOGICO
FACULTAD DE INGENIERIA
PROGRAMAS
AMBIENTAL ☐ BIOINGENIERIA ☐ ELECTRONICA ☐ INDUSTRIAL ☐ SISTEMAS ☐ OTROS ☐
NOMBRE DEL DOCENTE: Mónica Rojas Martínez IDENTIFICACION:
SEMESTRE: VI SALON/AULA: F201 PERIODO: 2019-2
PRESENTACION/INTRODUCCION
El centro de desarrollo tecnológico es una unidad encargada de la prestación de servicios y le recomendamos acatar las normas y ordenamiento
para su adecuado uso, y por lo tanto le sugerimos que todos los contenidos y normas las utilice para su adecuado uso.
Los métodos no paramétricos de clasificación como mínimas distancias o k-vecinos son muy potentes e intuitivos.
Tienen la ventaja de que pueden trazar un umbral de decisión altamente complejo dependiendo de la distribución
de los datos observados y del número de clases sin necesidad de estimar un conjunto de parámetros (i.e. los
parámetros theta)
En este laboratorio se trabajará con un conjunto de datos utilizado para diferenciar un tipo de vino italiano producido
en tres viñedos diferentes. Los atributos fueron obtenidos a través del análisis de los componentes químicos así:
- Alcohol
- Ácido málico
- ceniza
- Magnesio
- Fenoles totales
- Flavonoides
- Fenoles no flavonoides
- Proantocianidinas
- Intensidad del color
A partir de estas características usted debe estimar de manera automática el origen de un vino.
CONTENIDO
OBJETIVO GENERAL
Hacer una clasificación y validación por el algoritmo de mínimas distancias y el de k-vecinos
OBJETIVOS ESPECIFICOS
Página 2 de 3
1. Analizar la incidencia que tiene la normalización de las características sobre los resultados obtenidos
2. Analizar como varía la clasificación dependiendo del algoritmo utilizado
3. Observar cual es el rendimiento obtenido y obtener el mejor modelo para los datos observados
RESULTADOS ESPERADOS
CONTENIDO/METODOLOGIA
donde X son las observaciones de validación y r el vector (o vectores) de referencia a partir de los
datos de entrenamiento para el cálculo del discriminante
2. Implementar una función que calcule la pertenencia de un conjunto de observaciones a cada una
de las clases como:
3. Utilizar las funciones anteriores para clasificar los datos de validación (Xv) con el algoritmo de
mínimas distancias y el de k- vecinos para knn= [1, 5, 7, 23] vecinos y evaluar los siguientes
aspectos
La necesidad de utilizar una normalización: Para esto haga la clasificación con y sin
normalización de los datos y anote sus observaciones en el informe
Calcular el rendimiento de la clasificación con un índice basado ya sea en la sensibilidad,
exactitud, precisión o especificidad y que sea apropiado para el conjunto de datos de
validación
Obtener el modelo de mayor rendimiento y analizar el por qué de dicho comportamiento
Recuerde que debe crear una función principal desde donde debe definir las variables y hacer el
llamado a las funciones secundarias. Adicionalmente los algoritmos deben ser generales de tal
manera que se puedan utilizar con diferente número de entradas, de salidas y de observaciones.
El informe debe tener la parte de análisis correspondiente y el código creado para el laboratorio. En
este caso en particular no se tendrá en cuenta el contexto del análisis para la calificación del mismo
pero si se deberán analizar los resultados obtenidos de acuerdo a lo que se plantea en el ítem 3.
PLACA/CODIGO
EQUIPO/MATERIAL CANTIDAD MEDIDA
CONDICIONES
No olvide diligenciar el formato “SOLICITUD DE PRACTICAS DE LABORATORIO”, con ocho (8) días de anticipación a la
realización de cualquier práctica, para con esto evitar cualquier inconveniente.
Para solicitar los equipos y materiales anteriormente mencionados, favor diligenciar el formato “SOLICITUD DE MATERIAL DE
PRACTICAS DE LABORATORIO”.
En caso de presentarse algún inconveniente o novedad dentro de la realización de las diferentes prácticas, ya sea por parte
del profesor o estudiante, diligenciar el formato “REPORTE DE NOVEDAES”.