Sunteți pe pagina 1din 17

Laboratorio 05

PROCESO DE LA MINERIA DE DATOS EN EL 2. Objetivo


ANALYSIS SERVICES
Al finalizar este laboratorio los alumnos estarán en
1. Presentación. capacidad de:

HERRAMIENTAS DEL SQL SERVER Laboratorio 05. Sesión 1


Crear una base de datos de Analysis Services,
El Microsoft SQL Server ofrece 4 de herramientas agregar un origen de datos, crear una vista de origen
principales: de datos y modificar una vista de origenes de datos
para preparar una nueva base de datos que se va a
utilizar para la minería de datos.

Analysis Database Integration Reporting Laboratorio 05. Sesión 2


Services Engine Services. Services Crear un escenario de modelos de minería de datos
para predecir la respuesta de clientes ante una
En este laboratorio trabajaremos con el SQL Server campaña de correo directo.
Analysis Services (SSAS) que permite crear una
esquema para administrar los objetos de una base Laboratorio 05. Sesión 3
de datos de Analysis Services definidas por: Crear y utilizar los algoritmos de minería de datos,
Cubos OLAP (Primera parte del curso) los visores del modelo de minería de datos y las
Modelos de minería de datos. (Segunda parte del herramientas de minería de datos
curso) Árboles de decisión de Microsoft
Clústeres de Microsoft
ENTORNOS DE DESARROLLO Bayes naive de Microsoft
El SSAS ofrece un entorno integrado para crear
cubos OLAP y modelos de minería de datos y Esto puede ser visualizado en la figura 1.
trabajar con ellos, conformado por:

BD Escenario Algortimos
Analysis de Minería
SQL Server Management Studio. Services de Datos
Herramienta principal para administrar Database
Engine (Motor de base de datos) y escribir código de
Transact-SQL.

SQL Server Business Intelligence Development


studio.
Es el Microsoft Visual Studio con tipos de proyecto
adicionales específicos de Business Intelligence. Es
el entorno que se utilizará para desarrollar soluciones
de Analysis Services, Integration Services y
Reporting Services usando plantillas específicas.

1
Laboratorio 05. Sesión 1 1. Crear un proyecto de Analysis Services
PREPARA LA BD DEL ANALYSIS SERVICES
PARA EL PROCESO DE MINERÍA DE DATOS. Un proyecto de SSAS permite definir un esquema
que contiene los objetos de una BD del Analysis
Este laboratorio se desarrollará usando el Business Services, estos es modelos de minería de datos y
Intelligence Development Studio. objetos complementarios.

Este laboratorio tiene por objetivo crear una vista de Para crear un proyecto de Analysis Services
origen de datos para trabajar con los modelos y a. Abra el Business Intelligence Development
algortimos de minería de datos. Studio.

Conceptos importantes b. En el menú Archivo, seleccione Nuevo y haga


clic en Proyecto.
Plantilla de proyecto. Permite crea un proyecto
vacío del tipo seleccionado en el que se definen
objetos del Database Engine o del Analysis
Services.
Origenes de datos. Es una conexión de datos
que se administra en el proyecto y se
implementa en el (SSAS), contiene el nombre del c. Seleccione Proyecto de Analysis Services en
servidor y la base de datos donde residen los el panel Plantillas.
datos del origen.
Vista de origenes de datos. Son vistas
unificadas de los metadatos, desde las tablas y
vistas seleccionadas en los orígenes de datos.

Este laboratorio incluye las siguientes tareas:


1. Crear un proyecto de Analysis Services basado
en una plantilla de proyecto del SSAS.
2. Agregar uno o varios origenes de datos.
3. Crear una vista de origen de datos.
4. Modificar una vista de origen de datos.

Observe que estas tarea son comunes a cuando se


desea crear y trabajar con un cubo OLAP
d. Denomine al proyecto lab_05_db_mineria_datos

e. Haga clic en Aceptar.

2
2. Crear un origen de datos

Un origen de datos es una conexión de datos que se


administra en el proyecto y se implementa en el
(SSAS), contiene el nombre del servidor y la base de
datos donde residen los datos del origen.

Para crear un origen de datos


1. Abilite el Explorador de soluciones.
6. En la lista Nombre del servidor, seleccione el
servidor en el que se aloja la base de datos
AdventureWorksDW (seleccione localhost si la
base de datos se aloja en el servidor local.)

2. Seleccione la carpeta Orígenes de datos y


luego Nuevo origen de datos en el Explorador
de soluciones. 7. En la lista Seleccione o introduzca un nombre
de base de datos, seleccione
AdventureWorksDW.

3. Se abrirá el Asistente para orígenes de datos,


haga clic en Siguiente.
8. Verifique la conectividad presionando el boton
Prueba de conexión.

Debe obtener el siguiente mensajes

4. Haga clic en Nuevo para agregar una conexión a


las bases de datos, se abrirá el cuadro de
diálogo Administrador de conexión. 9. Presione el boton Ok para terminar.

5. En la lista Proveedor del Administrador de


conexión, seleccione OLE DB nativo\Microsoft
OLE DB Provider for SQL Server. Presione siguiente para ingresar a la página
Información de suplantación.

3
10. En la página Información de suplantación, 3. Crear una vista de origen de datos
seleccione Utilizar la cuenta de servicio, haga
clic en Siguiente. Luego presione finalizar. Una vista de origen de datos es una abstracción del
origen de datos, permite modificar la estructura de
los datos (sin modificar los objetos de la base de
datos original) para que sean más significativos en el
contexto del proyecto. Se puede seleccionar tablas,
establecer relaciones entre ellas, adicionar columnas
calculadas y vistas con nombre.

Para crear una vista de origen de datos


1. En el Explorador de soluciones, haga clic con el
11. El nuevo origen de datos, Adventure Works DW, botón secundario en Vistas de origen de datos
aparecerá en la carpeta Orígenes de datos del y seleccione Nueva vista de origen de datos.
Explorador de soluciones.

2. Se abrirá el Asistente para vistas de origen de


datos.

3. En la página Seleccionar un origen de datos,


el origen de datos Adventure Works DW que se
creó en la última tarea aparecerá seleccionado
de forma predeterminada en Orígenes de datos
relacionales. Haga clic en Siguiente.

4. Si desea crear un nuevo origen de datos, haga


clic en Nuevo origen de datos para iniciar el
Asistente para orígenes de datos.

4
5. En la página Seleccionar tablas y vistas,
seleccione las siguientes tablas y vistas, use la 4. Modificar una vista de origen de datos.
flecha derecha para incluirlas:
dbo.ProspectiveBuyer Puede utilizar el Diseñador de vistas de origen de
dbo.vAssocSeqLineItems datos para: cambiar la forma de ver los datos en un
dbo.vAssocSeqOrders origen de datos, cambiar el nombre de cualquier
dbo.vTargetMail objeto por uno que sea más significativo para el
dbo.vTimeSeries proyecto, sin modificar en el origen de datos original,
pero puede referirse al objeto dentro del proyecto
utilizando este nombre más descriptivo.

Para crear una nueva relación entre tablas


1. En el panel de la vista de origen de datos del
Diseñador de vistas de origen de datos,
seleccione la columna OrderNumber de la tabla
vAssocSeqLineItems.

presione Siguiente.

6. En la página Finalizando el asistente, la vista


de origen de datos tendrá el nombre Adventure
Works DW de forma predeterminada. Haga clic
en Finalizar.

2. Arrastre la columna hasta la tabla


vAssocSeqOrders y colóquela en la columna
OrderNumber.

7. Se abrirá el Diseñador de vistas de origen de


datos para mostrar la vista de origen de datos
Adventure Works DW.

Ahora existirá una nueva relación de varios a uno


entre las tablas vAssocSeqOrders y
vAssocSeqLineItems.

5
Laboratorio 05. Sesión 2 Requisitos previos
CREAR UN ESCENARIO DE CORREO DIRECTO Antes de desarrollar este laboratorio debe de leer el
tutorial de árboles de decisión. Para confirmar que
Planteamiento del problema ha leído y entendido el tutorial diga el significado de
El departamento de marketing de Adventure Works los siguientes términos:
desea aumentar las ventas dirigiendo una campaña
de correo directo a clientes específicos. Predicción.
Clasificación
Mediante el análisis de los atributos de clientes Regresión
conocidos, la empresa espera determinar los Atributo
patrones de comportamiento que posteriormente se Clase
aplicarán a clientes potenciales. Nodo
Hoja
La empresa pretende utilizar los patrones hallados
Regla de decisión
para predecir qué clientes potenciales tienen más
Error del clasificador
probabilidades de comprar un producto.

Tipos de atributos.
Otros conceptos importantes
Atributos continuos. Son aquellos atributos por
Escenario de correo electrónico. Corresponde a
lo general numéricos, tales como 23.45, 23.4555,
un problema que puede ser abordado con las
87. Por ejemplo una columna puede contener
técnicas de la minería de datos, generalmente
información salarial como valores de sueldo
corresponde a problemas de clasificación o
actuales, que son continuos
predicción.
Atributo discreto. Son aquellos datos
Asistente de minería de datos. Herramienta del
categóricos tales como alto, bajo, varon o mujer.
SSAS para facilitar la creación de modelos de
Generalmente se afirma que un atributo es
mienería de datos.
discreto cuando tiene una cantidad de posible de
valores diferentes que se pueden contar. Por Estructura de minería de datos. Objetos (tablas,
ejemplo una columna puede contener vistas), algoritmos necesarios para implementar
información salarial en rangos de sueldo la solución a un problema de minería de datos.
codificados, como 1 = < $25.000; 2 = de $25.000
a $50.000, que son discretos. Para el desarrollo de este laboratorio se
desarrollaran los siguientes tereas:
Modelo de árboles de decisión.
1. Crear una estructura del modelo de minería de
El algoritmo de árboles de decisión es un algoritmo datos Targeted Mailing.
de clasificación y regresión para modelar la 2. Modificar el modelo Targeted Mailing.
predicción de atributos (clase) discretos o continuos: 3. Explorar los modelos Targeted Mailing
4. Comprobar la precisión de los modelos de
minería de datos
Para los atributos discretos, el algoritmo hace
5. Crear predicciones
predicciones basándose en las relaciones entre
las columnas de entrada de un conjunto de
datos. Utiliza los valores, conocidos como
estados, de estas columnas para predecir los
estados de una columna que se designa como
elemento de predicción (generalmente se le
llama la clase), el algoritmo identifica las
columnas de entrada que se correlacionan con la
columna de predicción.

Para los atributos continuos, el algoritmo usa la


regresión lineal para determinar dónde se divide
un árbol de decisión.

6
1. Crear una estructura del modelo de minería 4. En la página Seleccionar la técnica de
de datos Targeted Mailing minería de datos, en ¿Qué técnica de minería
de datos desea utilizar?, seleccione Árboles
El primer paso para crear un escenario de correo de decisión de Microsoft.
directo consiste en utilizar el Asistente para minería
de datos para crear la estructura de minería de
datos y luego un modelo de minería de datos de
árboles de decisión.

Para crear una estructura de minería de datos para


un escenario de correo directo
1. En el Explorador de soluciones, haga clic
con el botón secundario en Estructuras de
minería de datos y seleccione Nueva
estructura de minería de datos.
Se abrirá el Asistente para minería de datos. 5. En la página Seleccionar vista de
origen de datos, observe que Adventure Works
DW se ha seleccionado de forma
predeterminada. Haga clic en Explorar para ver
las tablas de la vista de origen de datos.
Presione siguiente.

2. En la página de inicio del Asistente para


minería de datos, haga clic en Siguiente.

6. En la página Especificar tipos de


tablas, active la casilla de verificación de la
columna Escenario, situada junto a la tabla
vTargetMail; a continuación, haga clic en
Siguiente.

3. En la página Seleccionar el método de


definición, compruebe que la opción A partir de
una base de datos relacional o un almacén de
datos se ha seleccionado y, a continuación,
haga clic en Siguiente.

7
7. En la página Especificar los datos de Para este laboratorio, omita las sugerencias
entrenamiento, seleccione las siguiente haciendo clic en Cancelar.
columnas:

Columna

Predicti
Input
Key

on
CustomerKey X
BikeBuyer X X
Age X
CommuteDistance X
CustomerKey X
EnglishEducation X
EnglishOccupation X
FirstName X
Gender X
GeographyKey X
HouseOwnerFlag X
LastName X
MaritalStatus X
NumberCarsOwned X
NumberChildrenAtHome X
Region X 9. En la página Especificar el contenido y
TotalChildren X el tipo de datos de las columnas, haga clic en
YearlyIncome X Detectar. Un algoritmo usará los datos de la
vista y determinará si las columnas numéricas
Un atributo puede ser marcado como: contienen valores continuos o discretos.
Key. El asistente elegirá esa columna como
clave para el modelo.
Input (Columna de entrada). Este atributo se
usará como variable predictora.
Prediction. (Columna de salida). Es la clase
o el atributo a predecir.

8. Alternativamente puede presionar el


boton Sugerir, se abrirá el cuadro de diálogo
Sugerir columnas relacionadas que enumera las
columnas que están más ligadas a la columna de
predicción, ordenando los atributos según la
relación que tengan con el atributo de predicción.
Las columnas cuyo valor es mayor que 0,05 se
seleccionan automáticamente, si está de acuerdo
haga clic en Aceptar.

8
10. Después de hacer clic en Detectar,
compruebe que las entradas de las columnas
Tipo de contenido y Tipo de datos tengan la
configuración especificada en la siguiente tabla.

Columna Tipo de Tipo de


contenido datos
Age Continuous Long
BikeBuyer Discrete Long
CommuteDistance Discrete Text
CustomerKey Key Long
EnglishEducation Discrete Text
EnglishOccupation Discrete Text
FirstName Discrete Text
Gender Discrete Text
GeographyKey Discrete Text
HouseOwnerFlag Discrete Text
LastName Discrete Text
MaritalStatus Discrete Text
NumberCarsOwned Discrete Long
NumberChildrenAtHome Discrete Long
Region Discrete Text
TotalChildren Discrete Long
YearlyIncome Continuous Double
Usted debe de modificar para que corresponda a
los valores de la tabla de arriba, revise el caso
por ejemplo de: GeographyKey Es finalmente le permitira entrar a la ventana de
diseño del modelo de minería de datos para árboles
11. Haga clic en Siguiente. de decisión:

En porcentaje de datos para prueba no


coloque 30%.
En máximo número de casos en el conjunto
de datos de prueba no coloque nada, borre Observe ahora que en la parte superior de la ventana
el valor. del Diseñador de Minería de Datos se ubican cinco
fichas de ventanas:
12. En la página Finalización del asistente
hago lo siguiente:
En Nombre de la estructura de minería de
datos, escriba Targeted Mailing. Estructura de minería de datos
En Nombre del modelo de minería de datos, Modelos de minería.
escriba TM_Decision_Tree. Visor del modelo de minería de datos.
Active la casilla de verificación Permitir Gráfico de exactitud del modelo
obtención de detalles. Rendimiento del modelo de predicción
Haga clic en Finalizar.

9
2. Modificar el modelo Targeted Mailing 3. Se abrirá el cuadro de diálogo Nuevo
modelo de minería de datos.
En esta tarea se definirá dos modelos de minería En Nombre del modelo, escriba
(estructuras) de adicionales al algoritmo de árboles TM_Clustering.
de decisión mediante la ficha Modelos de minería En Nombre del algoritmo, seleccione
de datos del Diseñador de minería de datos. En esta Clústeres de Microsoft.
tarea, definirá un modelo Naive Bayes y un modelo
Clustering.

a. Crear un modelo Microsoft Clustering


Para crear un modelo de minería de datos de clúster
debe ejecutar los siguientes pasos:

1. Cambie a la ficha Modelos de minería


de datos del Diseñador de minería de datos en
Business Intelligence Development Studio.

4. Aparece un modelo nuevo en la ficha


Modelos de minería de datos del Diseñador de
minería de datos.

Observe que el diseñador muestra dos


columnas: una para la estructura de minería de
datos y otra para el modelo de minería de datos
inicial, que creó en la tarea anterior de esta
lección.
Un modelo creado con el algoritmo de clústeres
2. Haga clic con el botón secundario en la
de Microsoft puede agrupar en clúster y predecir
columna Estructura y seleccione Nuevo
atributos continuos y discretos. Aunque puede
modelo de minería de datos.
modificar el uso y las propiedades de la columna
para el modelo nuevo, en este laboratorio no es
necesario hacer cambios en el modelo
TM_Clustering.

10
b. Crear un modelo Microsoft Naive Bayes c. Procesar los modelos de minería de datos

Para crear un modelo Naive Bayes: Ahora que la estructura y los parámetros para los
1. En la ficha Modelos de minería de modelos de minería de datos se han completado,
datos del Diseñador de minería de datos, haga puede implementar y procesar cada uno de los
clic con el botón secundario en la columna modelos:
Estructura y seleccione Nuevo modelo de
minería de datos. Implementación de la BD Analysis Services
1. En el menú Depurar, seleccione Iniciar
2. Se abrirá el cuadro de diálogo Nuevo depuración. O, puede presionar F5.
modelo de minería de datos.
Esto permitirá que la base de datos Analysis
En Nombre del modelo, escriba Services se implemente en el equipo servidor y
TM_NaiveBayes. los modelos de minería de datos se procesen.
En Nombre del algoritmo, seleccione
Bayes naive de Microsoft..

Con esto puede obtener los siguientes


3. Aparece un modelo nuevo en la ficha resultados.
Modelos de minería de datos. Aunque puede
modificar el uso y las propiedades de la columna
para todos los modelos de la ficha, en este
laboratorio, no es necesario hacer cambios en el
modelo TM_NaiveBayes.

11
Procesamiento de la BD Analysis Services
Si la base de datos ya se ha implementado en el 3. Haga clic en Ejecutar.
equipo servidor, puede procesar sólo los modelos de Se abre el cuadro de diálogo Progreso del
minería de datos mediante el proceso siguiente. proceso para mostrar información acerca del
procesamiento del modelo. El procesamiento del
1. En el menú Modelo de minería de modelo puede llevar algún tiempo, dependiendo
datos de BI Development Studio, haga clic en del equipo.
Procesar estructura de minería de datos y
todos los modelos.

4. Al finalizar, haga clic en Cerrar dos


veces.

2. Se abre el cuadro de diálogo Procesar


estructura de minería de datos: <Targeted
Mailing>.

12
3. Explorar los modelos Targeted Mailing Ficha Árbol de decisión

Una vez que se procesen los modelos de su


proyecto, podrá verlos utilizando la ficha Visor de
modelos de minería de datos del Diseñador de 2. En la ficha Árbol de decisión, puede examinar
minería de datos. los modelos de árbol que componen un modelo
de minería de datos. Si hubiera más árboles,
podría utilizar el cuadro Árbol para elegir uno
diferente, en este caso dado que contiene un
Puede utilizar la lista Modelos de minería de datos, único atributo de predicción (Bike Buyer), sólo
ubicada en la parte superior de la ficha, para hay un árbol para ver.
examinar los modelos individuales en la estructura de
minería de datos. 3. El visor muestra por defecto los primeros tres
niveles del árbol, si el árbol contiene menos se
mostrará sólo los niveles existentes, puede ver
más niveles utilizando el control deslizante
Mostrar nivel o la lista Expansión
predeterminada.
Las secciones siguientes describen cómo explorar
2 niveles 3 niveles
los modelos de minería de datos en los visores.
Modelo Microsoft Decision Tree
Modelo Microsoft Clustering
Modelo Microsoft Naive Bayes

a. Modelo Microsoft Decision Tree.


1. Cada algoritmo utilizado para crear un modelo
aporta diferentes resultados, existe un visor
independiente para cada algoritmo.

Cuando se examina un modelo de minería de


datos, el modelo se muestra en la ficha Visor de
modelos de minería de datos. Este visor
contiene dos fichas: Árbol de decisión y Red de
dependencias.

4. Para analizar la cantidad de registros por nodo


cambie la lista Fondo a 1, esto permitirá ver
rápidamente el número de escenarios (registros)
para Bike Buyer que son igual a 1 y que existen
en cada nodo. Cuanto más oscuro sea el
sombreado del nodo, más escenarios incluirá.

Fondo = todos

13
Obteniendo el siguiente detalle:

Fondo = 1

Fondo = 0

5. Cada nodo muestra la siguiente información: Ficha Red de dependencias.


La condición para alcanzar el nodo desde el
nodo anterior. Puede ver la ruta completa del
nodo en la Leyenda de minería de datos o
deteniendo el puntero sobre un nodo para 7. La ficha Red de dependencias muestra las
ver un recuadro informativo. relaciones entre los atributos que contribuyen a
la capacidad de predicción del modelo de
minería de datos.

Un histograma que describe la distribución


de estados de la columna de predicción por
orden de popularidad. Puede decidir cuántos
estados aparecerán en el histograma
mediante el control Histogramas.

La concentración de escenarios, si el estado El nodo central, representa el atributo de


del atributo de predicción se ha especificado predicción del modelo de minería de datos.
en el control Fondo. Cada nodo adyacente representa un atributo
que afecta al resultado del atributo de
6. Puede ver los escenarios (datos) de predicción.
entrenamiento que cada nodo admite haciendo Utilice el control de la izquierda para
clic con el botón secundario en el nodo y, a controlar la intensidad de los vínculos que se
continuación, seleccionando Obtener detalles. muestran. Si desplaza el control hacia abajo,
se mostrarán los vínculos de mayor
intensidad.
Si hace clic en un nodo de la red puede
consultar la leyenda de color situada en la
parte inferior, si predice o es predicho.

14
4. Crear predicciones 2. Desplácese por el árbol hasta la
estructura Targeted Mailing, expándala,
Puede crear consultas de predicción (DMX) por seleccione TM_Decision_Tree y, a continuación,
medio del Generador de consultas de predicción en haga clic en Aceptar.
la ficha Predicción de modelo de minería de datos
del Diseñador de minería de datos.

3. En el cuadro Seleccionar tabla(s) de


El Generador de consultas de predicción es similar entrada, haga clic en Seleccionar tabla de
al Generador de consultas de Access; ofrece escenarios.
operaciones de arrastrar y colocar para crear las
consultas, ccontiene las vistas siguientes:
Diseño
Se abrirá el cuadro de diálogo Seleccionar
Consulta
tabla.
Resultado

a. Crear la consulta.
1. Seleccionar una modelo de minería de
datos y una tabla de entrada.
En la ficha Predicción de modelo de minería
de datos del Diseñador de minería de datos, en
el cuadro Modelo de minería de datos, haga
clic en Seleccionar modelo.

En la lista Origen de datos, compruebe que


Adventure Works DW se haya seleccionado.
En la lista Nombre de tabla o lista,
seleccione la tabla ProspectiveBuyer y, a
continuación, haga clic en Aceptar.

Se abrirá el cuadro de diálogo Seleccionar


modelo de minería de datos.

15
4. Después de seleccionar la tabla de 3. Proporcionan información acerca de
entrada, el Generador de consultas de predicción cómo realiza las predicciones el modelo
crea una asignación predeterminada entre el mediante las funciones de predicción. La función
modelo de minería de datos y la tabla de PredictProbability proporciona información
entrada, en función de los nombres de las acerca de la corrección de la probabilidad de
columnas. predicción. En la columna Criterios o argumento,
puede especificar parámetros para la función de
predicción.

Haga clic en la siguiente fila vacía de la columna


Origen y, a continuación, seleccione Función de
predicción.

En la fila Función de predicción, de la columna


Campo, seleccione PredictProbability.

4. Especificar la columna de destino para la


Para crear una consulta de predicción función PredictProbability.
1. Agregar un identificador único a la
consulta de predicción para que pueda identificar En la fila PredictProbability de la columna
quién es más y menos probable que compre una Criterios o argumentos, escriba
bicicleta, y quién es menos probable. [TM_Decision_Tree].[Bike Buyer].

En la columna Origen de la cuadrícula de la 5. Haga clic en Cambiar a vista de


ficha Predicción de modelo de minería de resultado de consulta, que es el primer botón de
datos, haga clic en la celda de la primera fila la barra de herramientas de la ficha Predicción
vacía y, a continuación, seleccione de modelo de minería de datos.
ProspectiveBuyer.

En la fila ProspectiveBuyer de la columna


Campo, compruebe que ProspectAlternateKey La tabla siguiente muestra una parte de los
se haya seleccionado. resultados que se devuelven. Estos resultados
muestran que es probable que el cliente con Id.
2. Determinar qué modelo de árboles de 827 compre una bicicleta, y la probabilidad de
decisión de Microsoft de la estructura de correo que la predicción sea correcta es del 63%.
directo se utilizará para crear predicciones.

Haga clic en la siguiente fila vacía de la columna ProspectAlternateKey BikeBuyer Expresión


Origen y, a continuación, seleccione 827 1 0.633836…
TM_Decision_Tree.
833 0 0.521134…
844 0 0.735697…

En la fila TM_Decision_Tree de la columna


Campo, compruebe que Bike Buyer se haya
seleccionado.

16
3. Al hacer clic en Diseño de consulta para volver
b. Ver los resultados a la cuadrícula y cambiar la consulta.

1. El primer botón en la barra


de herramientas de la ficha
Predicción de modelo de
minería de datos le
permite alternar entre tres
vistas. Puede alternar entre la vista Consulta y la vista
Resultados; sin embargo, si vuelve a la vista
Diseño, no se conservará la consulta
2. Al hacer clic en Resultado, podrá ver los modificada.
resultados de la consulta de predicción actual.
Las columnas ProspectAlternateKey, 4. Al hacer clic en Consulta, podrá ver y modificar
BikeBuyer y Expression identifican a los el código DMX que creó el Generador de
clientes potenciales, indican si son compradores consultas de predicción.
de bicicletas y la probabilidad de que la
predicción sea correcta. Puede utilizar estos También puede ejecutar la consulta, modificarla
resultados para determinar a qué clientes y ejecutar la consulta modificada. Por ejemplo,
potenciales debe dirigirse en el correo. para ver sólo los clientes que es probable que
compren una bicicleta y ordenarlos por orden
descendente de probabilidad, puede agregar las
instrucciones siguientes al final de la consulta
DMX:

WHERE [Bike Buyer] = 1


ORDER BY
PredictProbability([TM_Decision_Tree].[
Bike Buyer]) DESC

SELECT
t.[ProspectAlternateKey],
[TM_Decision_Tree].[Bike Buyer],
PredictProbability([TM_Decision_Tree].[Bike Buyer])
From
[TM_Decision_Tree]
PREDICTION JOIN
OPENQUERY([Adventure Works DW],
'SELECT
[ProspectAlternateKey],
[FirstName],
[LastName],
[MaritalStatus],
[Gender],
[YearlyIncome],
[TotalChildren],
[NumberChildrenAtHome],
[HouseOwnerFlag],
[NumberCarsOwned]
FROM
[dbo].[ProspectiveBuyer]
') AS t
ON
[TM_Decision_Tree].[First Name] = t.[FirstName] AND
[TM_Decision_Tree].[Last Name] = t.[LastName] AND
[TM_Decision_Tree].[Marital Status] = t.[MaritalStatus] AND
[TM_Decision_Tree].[Gender] = t.[Gender] AND
[TM_Decision_Tree].[Yearly Income] = t.[YearlyIncome] AND
[TM_Decision_Tree].[Total Children] = t.[TotalChildren] AND
[TM_Decision_Tree].[Number Children At Home] = t.[NumberChildrenAtHome] AND
[TM_Decision_Tree].[House Owner Flag] = t.[HouseOwnerFlag] AND
[TM_Decision_Tree].[Number Cars Owned] = t.[NumberCarsOwned]

17

S-ar putea să vă placă și