Documente Academic
Documente Profesional
Documente Cultură
Muestra (Sample) Puede muestrear los datos creando una o más tablas de datos. Las muestras
deben ser lo suficientemente grandespara contener la información significativa, pero lo
suficientemente pequeña como para procesarla.
Explore explora los datos buscando relaciones anticipadas, tendencias imprevistas,y anomalías
para ganar entendimiento e ideas.
Modificar Modifica los datos creando, seleccionando y transformando las variables para
enfocar el modelo proceso de selección.
Modelo Usted modela los datos usando las herramientas analíticas para buscar una
combinación de los datos que predice confiablemente un resultado deseado.
Evalúe usted evalúa modelos predictivos competitivos (gráficos de construcción para evaluar
la utilidad y confiabilidad) de los hallazgos del proceso de minería de datos).
La herramienta Agregar (Append) se usa para anexar conjuntos de datos que se exportan
mediante dos rutas diferentes en un diagrama de flujo de proceso único. El nodo Append
también puede agregar conjuntos de datos de entrenamiento, validación y prueba en un
nuevo conjunto de datos de entrenamiento.
La herramienta DMDB crea una base de datos de minería de datos que proporciona
estadísticas de resumen e información a nivel de factor para las variables de clase e intervalo
en el conjunto de datos importados.
La herramienta de Análisis de ruta le permite analizar datos de registro web para determinar
las rutas que los visitantes toman a medida que navegan por un sitio web. También puede usar
la herramienta para realizar análisis de secuencia.
seleccionar variables para análisis, para clusters de perfiles y para modelos predictivos
La herramienta Imputar le permite reemplazar valores para observaciones que tienen valores
perdidos. Puede reemplazar valores faltantes para variables de intervalo con el promedio, la
mediana, el rango medio, el espaciado mínimo medio o el reemplazo basado en la distribución,
o puede usar un estimador M de reemplazo como el biweight de Tukey, Huber o Andrew's
Wave. También puede estimar los valores de reemplazo para cada entrada de intervalo
utilizando un método de imputación basado en árbol. Los valores faltantes para las variables
de clase se pueden reemplazar por el valor que ocurre con más frecuencia, el reemplazo
basado en distribución, la imputación basada en árbol o una constante.
La herramienta Intervalos interactivos (Interactive Binning )es una herramienta de
agrupación interactiva que se usa para modelar funciones no lineales de múltiples modos de
distribuciones continuas. La herramienta interactiva calcula contenedores iniciales por
cuantiles. Luego puedes dividir y combinar interactivamente los contenedores iniciales. Utiliza
el nodo Intervalos interactivos para crear compartimientos o cubos o clases de todas las
variables de entrada, que incluyen variables de entrada tanto de clase como de intervalo.
Puede crear contenedores para reducir el número de niveles únicos e intentar mejorar la
capacidad de predicción de cada entrada.
La herramienta Generador de reglas (Rules Builder) abre la ventana Generador de reglas para
que pueda crear conjuntos de reglas ad hoc con resultados definibles por el usuario. Puede
definir interactivamente los valores de la variable de resultado y las rutas al resultado. Esto es
útil en la creación de reglas ad hoc, como aplicar lógica para probabilidades posteriores y
valores de scorecard.
Nota:
La solución Credit Scoring for SAS Enterprise Miner no se incluye con la versión base de SAS
Enterprise Miner. Si su sitio no otorgó licencia Credit Scoring para SAS Enterprise Miner, la
pestaña Credit Scoring y sus herramientas asociadas no aparecen en su software SAS
Enterprise Miner.
La herramienta Inferencia de rechazo utiliza el modelo que se creó con las aplicaciones
aceptadas para calificar las aplicaciones rechazadas en los datos retenidos. Las observaciones
en el conjunto de datos rechazado se clasifican como "buenos" inferidos e "malos" inferidos.
Las observaciones inferidas se agregan al conjunto de datos Acepta que contiene los registros
"buenos" y "malos" reales, formando un conjunto de datos aumentados. Este conjunto de
datos aumentados sirve entonces como el conjunto de datos de entrada de una segunda
ejecución de modelado de puntuación de crédito. Durante la segunda ejecución de modelado,
la clasificación de atributos se reajusta y los coeficientes de regresión se vuelven a calcular
para compensar el aumento del conjunto de datos.
La herramienta Scorecard le permite reescalar los puntajes logit de los modelos de predicción
binarios para que caigan dentro de un rango específico.
El flujo de trabajo analítico es la secuencia de pasos que se requieren para cumplir un objetivo
analítico aplicado. Las herramientas y capacidades de SAS Enterprise Miner ocupan los pasos
centrales de este flujo de trabajo. Antes de utilizar SAS Enterprise Miner, debe definir
cuidadosamente su objetivo analítico, seleccionar casos de análisis y extraer, validar y
posiblemente reparar datos de análisis. SAS Enterprise Miner le permite luego transformar sus
datos, aplicar el análisis de interés y generar métodos de implementación. El flujo de trabajo
analítico continúa fuera de las competencias de SAS Enterprise Miner. Los métodos de
implementación deben integrarse en los sistemas de producción. Los resultados de esta
integración deben ser capturados, evaluados y utilizados para refinar la próxima iteración del
análisis.
Creación de un proyecto SAS Enterprise Miner
Un proyecto SAS Enterprise Miner contiene materiales que están relacionados con una tarea
de análisis particular. Estos materiales incluyen flujos de procesos de análisis, conjuntos de
datos de análisis intermedios y resultados de análisis. Para definir un proyecto, debe
especificar un nombre de proyecto y la ubicación del proyecto en SAS Foundation Server. Siga
los pasos a continuación para crear un nuevo proyecto SAS Enterprise Miner.