Documente Academic
Documente Profesional
Documente Cultură
4. ¿Cuál es el F1 Score?
- Redundancia / Irrelevancia: tratar con muchos predictores puede ser muy ineficaz. En
las primeras fases de modelización es vital identificar aquellos predictores redudantes
y expulsarlos para en etapas posteriores no enfrentarse a un problema. Es vital utilizar
aquellos predictores con un impacto considerable en la variable dependiente
- Overfitting: Trabajar con multitud de predictores puede hacer que un modelo rindan
muy bien en el entrenamiento porque esté adaptándose a las circustancias propias de
dicho dataset pero luego su rendimiento sea penoso de cara a un conjunto de datos
que no ha visto. Por lo tanto, hay que buscar modelos que generalicen bien.
- Productividad: de cara a almacenamiento/ejecución/cálculo/velocidad no es lo mismo
tratar con 15 variables que con solo 5.
- Complejidad: un modelo con pocas variables es más comprensible que uno con
muchísimas. Es importante tener esa noción a la hora de construir modelos eficaces.