Sunteți pe pagina 1din 71

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Conceptos Bsicos
Elemento: Es la unidad acerca de la cual se solicita informacin. En una investigacin con encuestas, por lo regular el elemento es el entrevistado.

AM04003-Anlisis e interpretacin de resultados


Sesin1. La importancia del muestreo

Poblacin meta: Es el conjunto de todos los elementos definidos antes de la seleccin de la muestra y que posee la informacin que busca el investigador. Una poblacin definida adecuadamente debe definirse en trminos de ELEMENTOS, UNIDADES DE MUESTREO, ALCANCE y TIEMPO. Ejemplos:

Conceptos Bsicos
Si deseamos monitorear las ventas de un nuevo producto, como un jabn de tocador, la poblacin podra ser: ELEMENTO: Jabn de tocador UNIDADES DE MUESTREO: Supermercados, farmacias, almacenes de descuentos, tiendas de abarrotes. ALCANCE: Monterrey TIEMPO: 6 al 20 de enero de 2007

Conceptos Bsicos
La poblacin para medir la reaccin de un comprador hacia un nuevo producto qumico industrial sera: ELEMENTO: Ingenieros Qumicos UNIDADES DE MUESTREO: Empresas que compran mas de 2 millones de pesos en qumicos por ao. ALCANCE: La zona norte de la Repblica Mexicana TIEMPO: 2007

Unidad de muestreo
Es el elemento o elementos disponibles para su seleccin en alguna etapa del proceso de muestreo. En el tipo de muestreo ms simple, que sera el de una sola etapa, las unidades y los elementos de muestreo son los mismos. En el caso de procedimientos ms complejos, se pueden tener el nmero de etapas que el investigador desee, lo que se tiene que hacer es especificar la unidad de muestreo en cada una de las etapas.

Conceptos Bsicos
Por ejemplo, una muestra en tres etapas podras ser: Etapa 1: Ciudades con poblacin de mas de 800,000 habitantes. Etapa 2: Colonias de nivel socioeconmico C+ Etapa 3: Mujeres de 40 aos y ms

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Marco muestral o de referencia


Representacin de los elementos de la poblacin meta que consiste en una lista o grupo de indicaciones para identificar a la poblacin meta. Un ejemplo de esto podran ser una lista de clase, una lista de votantes registrados, una lista de empleados, directorio telefnico y hasta un mapa. En el caso del mapa se estaran muestreando partes geogrficas, como por ejemplo, colonias, cuadras o manzanas dentro de una ciudad.

Por qu una muestra?


La alternativa al muestreo es realizar un censo, en el cual se estaran utilizando todos los elementos disponibles de una poblacin definida, como el censo poblacional que realiza el gobierno, por parte de INEGI. Los censos casi no se utilizan en la investigacin de mercados, debido a que las poblaciones de inters por lo comn incluyen miles o millones de individuos; aunque hay casos en el que un censo puede ser til para una empresa de productos industriales que slo tiene un pequeo nmero de clientes de un producto altamente especializado.

Beneficios del muestreo

1. Ahorra dinero: claramente ahorraramos dinero entrevistando a 1000 personas en vez de un milln de personas que compondran un poblacin dada, en caso de hacer un censo. 2. Ahorra tiempo: definitivamente no sera lo mismo entrevistar a un milln de personas que slo a 1000, en el caso de una muestra.

3. Puede ser mas preciso: a pesar de lo que pueda parecer, cuanto ms pequeo sea un estudio, mayores sern las posibilidades de controlar al personal en cada una de las etapas del proceso de muestreo. Entre ms personal se utilice, y ms tiempo se lleve el estudio, habr ms errores y resultados menos exactos.

10

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Crditos:

Lic. Ana Mara Lpez Navarro

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Proceso de Muestreo

Definir la poblacin Identificar el marco muestral Seleccionar un mtodo de muestreo Determinar el tamao de la muestra Ejecutar el plan

AM04003-Anlisis e interpretacin de resultados


Sesin 2. Procedimiento de muestreo

1. Definir la poblacin
La poblacin se debe definir en trminos de: Elementos Unidades de muestreo Alcance Tiempo

1. Definir la poblacin
Los datos demogrficos tales como edad, ingreso, nivel de estudios, etc., se utilizan mucho para definir a la poblacin. Tambin los estilos de vida se pueden considerar, o bien condiciones de vida como tener poco tiempo disponible para dormir, comer, etc. Por ejemplo, si queremos hacer una investigacin para pastillas de cafena, debemos asumir que una de las caractersticas de la poblacin meta debe ser que tenga poco tiempo para dormir, como pueden ser choferes, doctores, enfermeras, etc.
3 4

2. Identificar el marco muestral


Ya que se ha definido la poblacin, el investigador debe buscar un listado que le sirva como marco muestral. Existen algunas fuentes tanto privadas como pblicas que pueden servir, pero hay que considerar que todas tienen un grado de error muestral, hay que evaluar bien las fuentes y buscar la que mejor represente a la poblacin meta.

2. Identificar el marco muestral


Para evaluar el error muestral en una lista, y ver si le puede servir al investigador, hay que considerar dos puntos: Evaluar el grado de afinidad de las caractersticas del marco muestral con los de la poblacin meta. Estimar la cantidad de personas no listadas de la poblacin meta.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

2. Identificar el marco muestral


Para evaluar el grado de afinidad de los miembros de la lista con los de la poblacin meta se utiliza un rango de incidencia que son los que calificaran para la muestra. Esto se puede hacer en una encuesta con preguntas de filtro, para poder descartar a las personas que no califican.

2. Identificar el marco muestral


Para el segundo punto, si el investigador determina que la cantidad de miembros no considerada dentro de la lista no representa un error considerable para la muestra final, la puede juzgar como aceptable. Por ejemplo, en un club deportivo, puede ser que se tomen en cuenta solamente los registrados en Internet, pero hay unos cuantos que no estn registrados, ms sus hbitos de consumo no difieren en la opinin de los registrados, por lo cual podra ser vlido el marco muestral.

3. Seleccionar un mtodo de muestreo


Mtodos de Muestreo

4. Determinar el tamao de la muestra


Nmero de elementos que se incluirn en la muestra. Los factores cualitativos que se deben considerar son: Importancia de la decisin Naturaleza de la investigacin Nmero de variables Naturaleza del anlisis Tamaos de muestra utilizados en estudios similares Tasas de incidencia Tasas de cumplimiento Restricciones de recursos $
10

No Probabilsticos

Probabilsticos

Por juicio

Por cuotas

Aleatorio simple Sistemtico

Estratificado

Bola de nieve

Por conveniencia

De grupo o agrupamientos

4. Determinar el tamao de la muestra


En estudios concluyentes se deben tomar en cuenta factores como: Desviacin estndar de la media Nivel de confiabilidad Error estndar En estudios de naturaleza exploratorio las muestras tienden a ser ms pequeas, en estudios concluyentes las muestras deben ser ms grandes.
11

5. Ejecutar el plan
En esta etapa de deben desarrollar procedimientos operacionales para la seleccin de la muestra. Por ejemplo, en el caso de una encuesta casa por casa, es muy importante tener un manual detallado para los entrevistadores, ya que debe eliminarse la participacin de ellos al mximo, y debe especificarse detalladamente la ruta a seguir, el salto de casas, instrucciones si la casa est vaca, si no se encuentran, si hay terrenos baldos, etc.

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

5. Ejecutar el plan
En una muestra probabilstica es de suma importancia cuidar los procedimientos, ya que son factores crticos de xito, y muchas veces la ejecucin es la que puede constituir un obstculo para toda la investigacin.

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

13

14

Crditos:

Lic. Ana Mara Lpez Navarro

15

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis en interpretacin de resultados

Muestreo no probabilstico
De conveniencia

AM04003-Anlisis e interpretacin de resultados


Sesin 3. Muestreo no probabilstico

De juicio Por cuotas Bola de nieve

Muestreo de conveniencia
Las muestras por conveniencia se seleccionan, como su nombre lo dice, de acuerdo a la conveniencia del investigador. Es muy utilizado por las empresas debido a su bajo costo y facilidad de ejecucin. Ejemplos: Realizar entrevistas en un centro comercial. Utilizar grupos de estudiantes de cierta universidad. Entrevistar a las personas que pasen por cierta calle.

Muestreo de juicio
Se aplica a cualquier muestra en la que los criterios de seleccin se basan en el criterio del investigador acerca de lo que constituye una muestra representativa. Por ejemplo, en una prueba de comercializacin se hace un juicio con respecto a qu ciudades podran considerarse como las mejores para lanzar un nuevo producto.

Muestreo por cuotas


Se seleccionan de manera que las caractersticas demogrficas de inters para el investigador estn representadas en la muestra en las proporciones meta. Es decir, las cuotas aseguran que la composicin de la muestra se la misma que la de la poblacin en relacin a las caractersticas de inters.

Muestreo por cuotas

Ejemplo:
Caracterstica de control Sexo Masculino Femenino Composicin de la poblacin Porcentaje 45% 65% Composicin de la muestra Porcentaje 45% 65% Nmero 450 650

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis en interpretacin de resultados

Bola de Nieve
En este mtodo se selecciona un grupo inicial de encuestados, generalmente al azar; despus de ser entrevistados se les pide que identifiquen a otros que pertenecen a la poblacin de inters. Este proceso es como una cadena, una referencia lleva a otra y as sucesivamente, por eso del nombre bola de nieve.

Bola de Nieve
Un ejemplo comn de este mtodo es cuando te llaman por telfono para ofrecerte una tarjeta de crdito, posteriormente te piden si puedes proporcionarles los datos de algn familiar o conocido que pudiera estar interesado en la tarjeta de crdito tambin. Tambin empresas de Internet como Terra te llaman para ofrecerte los servicios, te preguntan informacin y posteriormente te piden datos de algn posible interesado en los servicios.

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Crditos:

Lic. Ana Mara Lpez Navarro

10

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Muestreo probabilstico
Cada elemento de la poblacin tiene la misma probabilidad de ser seleccionado para la muestra, hay cuatro tipos:

AM04003-Anlisis e interpretacin de resultados


Sesin 4. Muestreo probabilstico

Aleatorio simple Sistemtico Estratificado Por agrupamiento


1 2

Muestreo aleatorio simple


Es la forma ms pura del muestreo probabilstico y se realiza a partir de una lista de la poblacin. El procedimiento para realizarlo es: 1. Seleccionar un marco muestral. 2. Asignar a cada elemento un nmero del 1 al N (tamao de la poblacin). 3. Generar n (tamao de la muestra) nmeros aleatorios diferentes entre 1 y N. Esto se puede hacer mediante programas computacionales o tablas de nmeros aleatorios. 4. Los nmeros generados denotan los elementos que debern incluirse en la muestra.

Muestreo aleatorio simple


Ejemplo para utilizar una tabla de nmeros aleatorios:
PASO 1. Asigna a todos los miembros de la poblacin un nmero. (supongamos que tenemos una lista de 30)

PASO 2.

Selecciona cualquier nmero en la tabla de nmeros aleatorios como punto de partida y encuentra el primer nmero que corresponda a la lista de la poblacin. En este ejemplo hemos seleccionado el nmero 32 como punto de partida.
75 55 16 29 26 27 58 48 50 30 49 17 93 05 59 43 28 51 18 81 59 01 10 32 94 99 44 09

Nombre Lpez, Ricardo Prez, Luis Flores, Ana Sosa, Eva Aldape, Josu Bonilla, Erik

Nmero 1 2 3 4 5 30
5

23 65 03 38 96 11 43

15 54 87 97 31 74 36

Punto de partida: Nos moveremos hacia la izquierda hasta el final de la fila, despus hacia abajo y hacia la derecha, posteriormente hacia abajo y as sucesivamente, en zig-zag.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

PASO 3. Selecciona a la persona que corresponda a los nmeros de la lista, como vayan apareciendo, en este caso aparecen primero el 28, posteriormente el 30, luego el 16 y sigue el 87, que no lo incluye nuestra lista, este lo saltamosllevamos por lo pronto a las siguientes personas: #28 Brito, Javier #30 #16 Bonilla, Erik Garza, Alicia

Muestreo sistemtico
El muestreo sistemtico se utiliza a menudo como sustituto del muestreo aleatorio simple, produce muestras casi idnticas a las generadas por el simple aleatorio, pero es ms sencillo de aplicar. El procedimiento es:

PASO 4. Continuamos de la misma forma hasta completar el nmero completo de elementos para la muestra. Si encuentras un nmero que ya seleccionamos anteriormente, simplemente lo saltamos y seguimos en la seleccin.
7 8

PASO 1. Identifica un listado de la poblacin que contenga un nivel aceptable de error. Ejemplo: El directorio telefnico de tu ciudad. PASO 2. Calcula el intervalo de salto dividiendo el nmero de nombres de tu lista entre el nmero de la muestra. Ejemplo: 25,000 nombres en el directorio = 50 Muestra de 500 personas

PASO 3. Utilizando nmeros aleatorios, determina el punto de partida en la lista. Ejemplo: Selecciona un nmero aleatorio para la pgina del directorio donde se comenzar. Selecciona un nmero aleatorio para seleccionar la columna. Selecciona un nmero aleatorio para el rengln de la columna donde se comenzar, vamos a decir que ya seleccionando los puntos anteriores, empezaramos en Fuentes, Pedro.

El intervalo de salto sera cada 50 personas o nombres.

10

PASO 4. Aplica el intervalo de salto para determinar los nombres de la lista que se incluirn en la muestra. Ejemplo: Si empezamos en Fuentes, Pedro, saltamos 50 nombres y seleccionamos el siguiente.

PASO 5. La lista se maneja de manera circular, es decir, el primer nombre que se seleccion aleatoriamente, ser el ltimo de la lista al ir avanzando. Ejemplo: Empezamos en la F de Fuentes, seguiramos seleccionado hasta llegar a la Z, donde continuaramos en la letra A hasta llegar, en dado caso, nuevamente a la letra F.

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Muestreo estratificado
Las muestras estratificadas son las muestras probabilsticas que se distinguen por los siguientes pasos en el procedimiento: 1. La poblacin original o principal, se divide en dos o ms subconjuntos mutuamente excluyentes y extensivos. (por ejemplo, hombre y mujer) 2. Las muestras simples aleatorias de los elementos de los dos o ms subconjuntos se eligen independientemente una de la otra.

Procedimiento

1. Seleccionar un marco muestral. 2. Seleecionar las variables de estratificacin y el nmero de estratos. 3. Dividir la poblacin completa en H estratos, con base en la variable de calificacin, cada elemento de la poblacin es asignado a uno de los estratos H. 4. En cada estrato, numerar los elementos del 1 al Nh (tamao de la poblacin del estrato H).

13

14

Ejemplo: 5. Determinar el tamao de la muestra de cada estrato, nh, con base en muestreo estratificado proporcionado o desproporcionado: H nh = n

h=1

6. En cada estrato, seleccionar una muestra aleatorio simple de tamao nh.

Supongamos que en Zacatecas, 70% de los nios de primaria van a escuela pblica y el 30% a privadas. Si queremos 1,000 nios, lo que haremos es dividir los alumnos en 2 estratos (pblica y privada) y se eligen aleatoriamente 700 nios de la pblica y aleatoriamente 300 de la privada.

15

16

Muestreo por agrupamiento


En el muestreo por conglomerados o agrupamiento, en lugar de considerar cada elemento de la poblacin, lo que consideramos son conglomerados de elementos. El proceso es elegir aleatoriamente uno o varios conglomerados y la muestra estar formada por TODOS los elementos de los conglomerados. Ejemplos: -En las encuestas durante las elecciones, los conglomerados pueden ser las mesas electorales, y lo que se hace es escoger algunas mesas al azar (y de ah se toman todos los votos de las mesas seleccionadas). -En otros ejemplos, los conglomerados pueden ser las colonias de viviendas, los municipios, etc.

17

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Crditos:

Lic. Ana Mara Lpez Navarro

19

20

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Mtodos
Existen 5 enfoques o mtodos para calcular el tamao de la muestra:

AM04003-Anlisis e interpretacin de resultados


Sesin 5. Tamao de la muestra

Enfoque Arbitrario Enfoque Convencional Enfoque basado en el costo Enfoque Estadstico Enfoque del Intervalo de Confianza

Enfoque Arbitrario
Este enfoque se basa en una regla fija, donde una muestra debe ser al menos el 5% de la poblacin total para poder ser confiable. Este enfoque es muy fcil de aplicar, pero no es eficiente ni econmico.

Enfoque Convencional
Este enfoque se refiere a utilizar un tamao convencional de muestra para el investigador. El nmero convencional puede ser el promedio de tamaos de muestra en estudios similares o puede ser el mismo tamao de muestra que utiliz la competencia en un estudio similar. La diferencia entre el enfoque convencional y el arbitrario es que el convencional puede tener cierta lgica, y el arbitrario no, se usa el 5% indistintamente.

Enfoque basado en costo


Este enfoque utiliza el presupuesto disponible de la empresa para determinar el tamao de la muestra. Si no hubiera costos definidos para el investigador, todo podra ser manejado con censos. En este enfoque es importante valorar la importancia de los resultados de la investigacin para la toma de decisiones, ya que a veces es conveniente considerar un ajuste en el presupuesto.

Enfoque Estadstico
En este mtodo el tamao de la muestra es determinado por los anlisis estadsticos que van a ser utilizados, ya que ciertos anlisis necesitan un mnimo de tamao para que los resultados obtenidos sean confiables y aptos para la toma de decisiones. Los anlisis estadsticos se utilizan para analizar subgrupos dentro de una muestra. Se analizan aspectos por edades, sexo, estado civil, etc.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Intervalo de confianza
Existe slo un mtodo que permite al investigador PREDETERMINAR la exactitud de los resultados de la muestra y es el de intervalo de confianza. Este mtodo aplica conceptos de variabilidad, intervalo de confianza, distribucin de la muestra y error estndar de la media para crear un tamao de muestra vlido. Este es de los mtodos ms comnmente utilizados por los investigadores. A continuacin veremos cada uno de los factores considerados en este enfoque.
7

Intervalo de confianza
Este mtodo est basado en dos premisas bsicas: Intervalo de confianza: Es el rango en donde las terminaciones o colas definen un cierto porcentaje de las respuestas a una pregunta. Teorema del lmite central: Es una teora que sostiene que los valores estadsticos tomados repetitivamente de la muestra en una investigacin tienen una distribucin normal.
8

Intervalo de confianza
Recordamos los dos tipos de errores: Error de No Muestreo Error de Muestreo o error muestral: Este es el tipo de error que estaremos controlando mediante las frmulas. Frmula de error muestral :
Error muestral % veces

Intervalo de confianza
Relacin entre el tamao de la muestra y el error muestral:

Relacin precisin/tamao de la muestra


Para una muestra de 1,000 o ms se gana muy poca precisin, inclusive si se dobla la muestra a 2,000.

Precisin

Tamao de la muestra

10

Intervalo de confianza
Variabilidad: se refiere a qu tan similar o diferentes son las respuestas a una pregunta dada. P : Porcentaje Q : 100% - P Punto importante: A mayor variabilidad en la poblacin estudiada, mayor ser el tamao de la muestra requerida para cumplir con un nivel de precisin estipulado.

Intervalo de confianza
Qu hemos aprendido hasta ahora? Existe una relacin entre:
El nivel de confianza que queremos que tengan nuestros resultados La variabilidad de la poblacin y La cantidad de error muestral aceptable (precisin deseada) que queremos tener y El tamao de la muestra!

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Intervalo de confianza
Existe una frmula que conjuga todos estos factores, sta es la que considera porcentajes:
n= z2(pq) e2

Intervalo de confianza
Frmula para calcular el tamao de la muestra que considera una media:
n= s2 z2 e2

Dnde: n = tamao de la muestra z = error estndar asociado al nivel del confianza seleccionado p = porcentaje estimado de la poblacin q = 100 p e = error muestral aceptable

13

Dnde: n = tamao de la muestra z = error estndar asociado al nivel del confianza seleccionado s = variabilidad indicada por una desviacin estndar estimada e = error muestral aceptable

14

Intervalo de confianza
Cmo estimar la variabilidad ( p q ) en la poblacin? Esperar el peor de los casos (p=50; q=50) Estimar la variabilidad: Existen estudios anteriores? Se conducir un estudio piloto?

Intervalo de confianza
Cmo determinar el nivel de error muestral? El investigador debe ponerse de acuerdo con los gerentes para definir esta decisin, qu tanto error estn dispuestos a tolerar? Lo convencional es 5%. Entre ms importante sea la decisin, menor deber ser el error.
15 16

Intervalo de confianza
Cmo determinar el nivel de confianza? El investigador debe ponerse de acuerdo con los gerentes para definir esta decisin, a mayor nivel de confianza, mayor tamao de la muestra. Lo convencional es 95%. (z=1.96) Entre ms importante sea la decisin, mayor deber ser el nivel de confianza, 99% de confianza, z=2.58
17

Factor de correccin de la poblacin finita


Es un ajuste al tamao de la muestra que se hace en los casos donde la muestra es igual a 5% ms de la poblacin total. Generalmente sucede en mercados muy especializados donde la poblacin total es pequea, como el mercado industrial o mdico.

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Factor de correccin de la poblacin finita


Este clculo se hace utilizando la siguiente frmula: nN N+n-1

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).

n =

Donde: n = tamao revisado de la muestra n = tamao original de la muestra N = tamao de la poblacin

19

20

Crditos:

Lic. Ana Mara Lpez Navarro

21

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Planeacin de las operaciones de campo


Como contexto general, existen cuatro aspectos que son comunes en las operaciones de campo:

AM04003-Anlisis e interpretacin de resultados


Sesin 6. Planeacin del trabajo de campo

1. 2. 3. 4.

Programacin del tiempo Presupuesto Trabajadores de campo Medicin del desempeo

Programacin del tiempo


Cualquier proyecto debe incluir una programacin del tiempo que especifique: Comienzo e inicio del proyecto Secuencia de actividades dentro del tiempo especificado (usualmente se utiliza una grfica de Gantt)
ACTIVIDADES

Programacin del tiempo


Ejemplo:
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Borrador del cuestionario de prueba Seleccionar la muestra de prueba Seleccionar los entrevistadores de prueba Preparar el material de capacitacin Capacitar a los entrevistadores Realizar entrevistas de prueba Evaluar los resultados de la prueba Afinar cuestionario segn resultados de prueba Seleccionar personal de campo Preparar material de capacitacin Capacitar personal de campo Realizar entrevistas Validacin del trabajo de campo Evaluacin del personal de campo Informe final de campo

15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 OCTUBRE 1 2 3 4 5 6 7 NOVIEMBRE

Es necesario detallar el nmero de das para cada actividad pero que sean realistas, ya que a veces los proyectos se atrasan por fijar metas inalcanzables.
3

Programacin del tiempo


Cuando son proyectos muy largos, es necesario realizar una grfica general, y otras especficas por actividades o bloques de actividades. Debe estar muy clara la calendarizacin del proyecto, ya que deben cumplirse los tiempos establecidos.

Presupuesto
Se deben asignar costos a cada una de las actividades del programa, los costos estn directamente relacionados, ya que un cambio en alguna actividad afecta a otra y el presupuesto se puede ver modificado. Hay que detallar lo mejor posible cada uno de los rubros, y si es necesario, asignar un fondo de reserva para cubrir contingencias imprevistas.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Presupuesto
Para un estudio basado en entrevistas personales, por ejemplo, las principales categoras de costos son: Sueldos y salarios administrativos Materiales y suministros Telfono Supervisores de campo o servicios por entrevistas Salario de entrevistadores etc.
7

Personal
El xito del trabajo de campo depende principalmente en la calidad del personal, es necesario realizar una cuidadosa seleccin y capacitacin para poder exigir tiempos y el cumplimiento de adecuado de las actividades. Es necesario que el personal entienda claramente sus responsabilidades y la forma de medir su desempeo.

Medicin del desempeo


Es necesario tener un control por escrito para poder evaluar el desempeo individual del personal. Se requieren mediciones claras y fciles de entender. Muchas veces en caso de cuestionarios se evala por encuesta respondida, o en el caso de entrevistas, por el nmero realizado. Pero existe otra informacin importante como rechazos, casos de ausencia, etc., con la cual pueden hacerse comparaciones interesantes. A continuacin se presenta un ejemplo en el caso de entrevistas:
9

Medicin del desempeo


Ejemplo tabla de evaluacin, indicadores esperados y reales:
MEDIDA DE DESEMPEO 1. Total de encuestados elegibles 1.1 Entrevistas 1.2 Rechazos 1.3 No contactos 1.4 Otro (especifique) 2. Total de encuestados no elegibles 2.1 Se mudaron 2.2 Otro (especifique) 3. Muestra total 3.1 Tasa de respuestas 3.2 Tasa de rechazos 3.3 Tasa de contactos 3.4 Tasa de elegibilidad ESPERADO REAL

% % % %

% % % %
10

Mtodos de recoleccin de datos


Existen diferentes mtodos para la recoleccin de datos en una investigacin, y cada uno de ellos tiene sus particularidades. Los mtodos son: Entrevista personal Entrevista telefnica Entrevista por correo Entrevista por computadora Observacin

Bibliografa
Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Crditos:

Lic. Ana Mara Lpez Navarro

13

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Proceso del trabajo de campo y recopilacin de datos


Seleccin de los trabajadores de campo

AM04003-Anlisis e interpretacin de resultados


Sesin 7. Trabajo de campo y recopilacin de datos

Capacitacin de los trabajadores de campo Supervisin de los trabajadores de campo Validacin del trabajo de campo

Evaluacin de los trabajadores de campo


1 2

Seleccin de los trabajadores de campo


El primer paso en el proceso de trabajo de campo es la seleccin, ya que las caractersticas , antecedentes, y actitudes del personal de campo afectan en las respuestas de los entrevistados. Entre mayor afinidad exista entre el personal de campo y el entrevistado, es mayor la probabilidad de que la investigacin sea exitosa.

Seleccin de los trabajadores de campo


Por lo cual, antes de seleccionar al personal, debemos definir los siguientes aspectos: Establecer los requerimientos del proyecto, de acuerdo al mtodo de recopilacin de datos. Definir las caractersticas necesarias en el personal de campo. Contratar al personal.

Capacitacin de los trabajadores de campo


Es muy importante tener bien capacitado al personal, ya que de eso dependen resultados uniformes durante la investigacin. Se deben especificar todos los aspectos del mtodo a utilizar, como: Primer contacto Realizacin de preguntas Sondeo Registro de respuestas Conclusin de entrevista

Primer Contacto

En el primer contacto se decide si el entrevistado coopera o no en la investigacin, por esto es muy importante capacitar al personal para que realice comentarios que inviten a participar en el estudio. Muchas veces no se debe preguntar al entrevistado si desea participar o no, sino ms bien ser asertivos y dar la pauta para empezar la entrevista. Hay que saber manejar objeciones y ser proactivos en la investigacin.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Realizacin de preguntas
Realizar preguntas correctamente no es una tarea fcil, cualquier cambio en la redaccin de la pregunta, entonacin, en el orden, puede alterar su significado y sesgar la respuesta. Es de vital importancia capacitar al personal y dar todos los detalles para preguntar de manera uniforme y sin sesgar al entrevistado. A continuacin se presentan algunos lineamientos para hacer preguntas:

Realizacin de preguntas
1. Conocer a fondo el cuestionario 2. Plantear las preguntas en el orden que aparecen en el cuestionario exclusivamente. 3. Utilizar exactamente las palabras que estn descritas en el cuestionario. 4. Leer cada pregunta pausadamente. 5. Repetir las preguntas que no haya sido entendidas. 6. Hacer todas las preguntas aplicables. 7. Seguir las indicaciones y esquemas de salto; sondear cuidadosamente.
8

Sondeo
Sondear significa motivar a los entrevistados para que elaboren, aclaren o expliquen sus respuestas; tambin es til para ubicar al entrevistado en el contenido de la entrevista y que slo proporcione informacin relacionada al estudio. A continuacin se presentan algunas tcnicas comumes de sondeo:

Sondeo
1. Repetir la pregunta, esto puedo estimular la respuesta. 2. Repetir la respuestas del entrevistado, esto sirve para alentar al entrevistado para que detalle ms de sus propios comentarios. 3. Hacer una pausa o silencio. Esto puede alentar a que el entrevistado complete ms su respuesta, pero esto no debe en tanto no sea incmodo.

10

4. Tranquilizar o impulsar al entrevistado. Si la persona entrevistada quiere que se le explique alguna pregunta, no se debe interpretar, se le comenta lo que signifique para usted. En el caso de que el entrevistado dude de sus respuestas, se le debe indicar no existen respuestas buenas o malas, queremos su opinin solamente. 5. Estimular las aclaraciones. Para que el entrevistado aclare ms sus respuestas se le pueden mencionar frases como, No comprendo bien su respuesta, sera tan amable de decirme algo ms por favor?
11

6. Hacer comentarios y preguntas neutras. Algunos comentarios que se utilizan para sondear se abrevian a lado de cada pregunta, deben ser objetivos y neutros como, Algo ms? (AM), Por qu opina as? (POA), Alguna otra razn? (AO)

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Registro de las preguntas


Se debe especificar claramente el formato en el cual se deben registrar las preguntas. Todos los entrevistadores lo deben de hacer en la misma forma. Cada encuesta o entrevista es diferente, por lo tanto debe de tener indicaciones explcitas de cada punto. Como regla general, las respuestas abiertas se deben de registrar literalmente.

Registro de las preguntas


Por ejemplo, el Survey Research Center en la ciudad de Michigan, tiene los siguientes lineamientos: 1. Anote las respuestas durante la entrevista. 2. Utilice las mismas palabras que el entrevistado. 3. No resuma ni parafrasee las respuestas abiertas. 4. Incluya todo lo que concierna a los objetivos de la pregunta. 5. Incluya todos los sondeos y comentarios. 6. Repita la respuesta mientras la escribe.
14

13

Conclusin de entrevista
La entrevista no debe darse por concluida si se encuentra incompleta. El entrevistador no debe responder ninguna pregunta relacionada con el estudio. El entrevistado debe llevarse una sensacin positiva, es importante darle las gracias y expresar su aprecio.

Supervisin de los trabajadores de campo


Significa asegurarse de que se estn aplicando las tcnicas y procedimientos que se indicaron en la capacitacin. La supervisin abarca: Control de calidad y correcciones Control del muestreo Control de fraudes Control de la oficina central

15

16

Validacin del trabajo de campo


Se deben verificar al azar del 10 al 25% de los cuestionarios o entrevistas, donde se pregunte si efectivamente el entrevistador realiz las preguntas, la duracin de la entrevista, la calidad, y datos demogrficos bsicos. La informacin demogrfica se cruza con la registrada para verificar la autenticidad de las entrevistas.

Evaluacin de los trabajadores de campo


Se debe evaluar a los trabajadores de campo en base: Costos y tiempos Tasas de respuesta Calidad de la entrevista Calidad de los datos

17

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).

Crditos:

Lic. Ana Mara Lpez Navarro

19

20

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Errores en la recoleccin de datos de campo


El error de muestreo es slo uno de los dos tipos de error que afectan una investigacin.

AM04003-Anlisis e interpretacin de resultados


Sesin 8. Errores en la recoleccin de datos de campo

El error de no muestreo incluye lo siguiente: Todos los tipos de error que no sean de muestreo Errores en la recoleccin de datos Errores en el manejo de los datos Errores de anlisis Errores de interpretacin
1 2

Errores no-muestrales

Tambin se incluyen errores en la definicin del problema, parafraseo de preguntas; pero generalmente el mayor potencial de error no-muestral se encuentra en la etapa de recopilacin de datos. Por lo cual, veremos este tema con mayor detalle, a continuacin se presenta una clasificacin de los errores no-muestrales:

Errores del trabajador de campo

Error de los entrevistados

Errores intencionales
1. 2. Fraude Guiar a una respuesta 1. 2. 3.

Errores no-intencionales
Caractersticas del entrevistador Malentendidos Fatiga

Errores intencionales
1. 2. Respuestas falsas No respuesta

Errores no-intencionales
1. 2. 3. 4. 5. Malentendidos Supuestos Prdida de atencin Distracciones Fatiga

Errores del trabajador de campo Intencionales


Fraude
Este ocurre cuando el trabajador de campo concientemente no est incluyendo informacin representativa de la muestra. Puede ser que est dando informacin falsa o que escoja a las personas que ms se le faciliten, no las que debe seleccionar. Esto muchas veces se da debido a que se paga por encuesta o entrevista completada.

Errores del trabajador de campo Intencionales


Guiar a una respuesta
Este ocurre cuando el trabajador de campo concientemente est guiando al entrevistado a que le responda algo en especfico. Puede ser mediante la pronunciacin, entonacin, lenguaje corporal o inclusive el parafraseo de un reactivo. Por ejemplo, no es lo mismo preguntar, Es el tema del gas un problema para usted?, que guiar la pregunta como, Acaso no es el tema del gas un problema para usted?

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Errores del trabajador de campo No-Intencionales


Caractersticas del entrevistador
En este tipo de error influencian las caractersticas personales del trabajador de campo, como el sexo, acento, o comportamiento. Bajo ciertas circunstancias el hecho de que el trabajador de campo sea hombre o mujer influye en los resultados segn el tema que se est investigando. En las entrevistas por telfono puede influenciar mucho el acento, muchas veces las personas tienen prejuicios de acentos de ciertas regiones, se tienen que considerar todos lo factores.
7

Errores del trabajador de campo No-Intencionales


Malentendidos
En este tipo de error ocurre cuando el personal de campo, cree que comprende bien como administrar la investigacin, pero en realidad lo hace incorrectamente. El cuestionario puede incluir instrucciones, diferentes tipos de escala, instrucciones de cmo registrar las respuestas de los entrevistados y otros procedimientos que deben ser comprendidos. Existe una diferencia en educacin muy considerable entre los diseadores de la investigacin y el personal de campo, y esta diferencia puede reflejarse en una problema de comunicacin.
8

Errores del trabajador de campo No-Intencionales


Fatiga
El tercer error no intencional es referente a la fatiga, esto se da cuando el personal de campo ya se encuentra cansado. El trabajo de campo puede ser muy repetitivo y montono, por lo cual la gente se fatiga. Al final de un largo da de entrevistas, el personal de campo puede estar menos alerta y descuidar aspectos de la investigacin. Puede descuidar patrones de respuesta, como saltar una pregunta en caso de cierta respuesta, o profundizar ms en algunas preguntas, o hacerlo ms rpido y con menos detalle por la prisa de terminar.
9

Errores de los entrevistados Intencionales


Respuestas falsas
Este tipo de error ocurre cuando el entrevistado no proporciona informacin veraz, ya sea por proteger su intimidad o por vergenza. Existen ciertos temas que son ms propensos que otros a recibir respuestas falsas, como por ejemplo, el ingreso que recibe una persona, la edad, o cuestiones de higiene personal.

10

Errores de los entrevistados Intencionales


No respuesta
Este es el error intencional que ms se da en una investigacin, y es cuando los entrevistados no proporcionan respuesta a un reactivo determinado. Las negativas a participar en una investigacin son problemas que el investigador debe enfrentar. En una investigacin por telfono, por ejemplo, es muy comn este problema.

Errores de los entrevistados No-Intencionales


Malentendidos
Es cuando el entrevistado proporciona una respuesta sin comprender la pregunta planteada o el contexto. Por ejemplo, en una investigacin donde se requieren cantidades despus de impuestos, una persona puede estar respondiendo en trminos brutos, no netos.

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Errores de los entrevistados No-Intencionales


Supuestos
Es cuando el entrevistado proporciona una respuesta de la cual no est seguro de su veracidad y est haciendo un supuesto de la informacin. Por ejemplo, en una pregunta como: Cunto fue el consumo en su hogar de agua el mes pasado en litros? Muchas personas podran suponer la cantidad que se le est preguntando, en lugar de ver el recibo de agua y dar el dato verdico.
13

Errores de los entrevistados No-Intencionales


Prdida de atencin
Es cuando el inters del entrevistado decae; entrevistado no est interesado en la investigacin como est el investigador, por lo que conforme avance cuestionario o entrevista cada vez se pierde ms y ms inters. el lo el el

14

Errores de los entrevistados No-Intencionales


Distracciones
Es cuando ocurren distracciones o interrupciones durante la entrevista. Por ejemplo, puede ser que al entrevistar a una madre de familia por telfono la interrumpa el beb o alguno de sus hijos. En el caso de una encuesta en un centro comercial puede ser que el entrevistado salude a algn conocido o familiar.

Errores de los entrevistados No-Intencionales


Fatiga
Es cuando el entrevistado se cansa de participar en la investigacin. Cuando esto sucede, las respuestas que se proporcionan ya no son reflexionadas. Por ejemplo, puede ser que en un cuestionario la persona tienda ms a seleccionar la categora de NR, no respuesta, a fin de terminar pronto.

15

16

Bibliografa
Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5). Burns, Alvin. Marketing Research. Estados Unidos: Editorial Prentice Hall 2000, (ISBN 0-13-014411-8).

Crditos:

Lic. Ana Mara Lpez Navarro

17

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Estrategias de control en la recoleccin de datos de campo


Como hemos visto, a pesar de que existen muchos factores de error en la recoleccin de datos de campo, afortunadamente existen tambin estrategias de control que podemos utilizar para minimizar estos errores. Cabe mencionar que no se eliminan en su totalidad, slo podemos disminuir su efecto. Las estrategias de control se resumen en la siguiente tabla:
1 2

AM04003-Anlisis e interpretacin de resultados


Sesin 9. Cmo minimizar los errores en la recoleccin de datos de campo

Cmo controlar (minimizar) los errores


Tipos de error
Errores del trabajador de campo Errores intencionales Errores no-intencionales Error de los entrevistados Errores intencionales
Respuestas falsas Asegurar anonimato y confidencialidad Incentivos Chequeos de validacin Tcnica de la tercera persona Asegurar anonimato y confidencialidad Incentivos Tcnica de la tercera persona Cuestionario bien redactado Preguntas directas Cuestionario bien redactado Opciones de respuesta (respuestas cerradas) Escalas de diferencial semntico Utilizar apuntadores de avance (frases de nimo) Fraude Guiar a una respuesta Supervisin Validacin

Mecanismos de control

Estrategias de control para evitar errores del trabajador de campo Intencionales


Existen dos estrategias que se pueden utilizar para evitar los errores intencionales por parte del trabajador de campo: Supervisin Validacin

Caractersticas del entrevistador Malentendidos Fatiga

Seleccin y entrenamiento de los entrevistadores Sesiones de orientacin y simulacin de roles Descansos e investigaciones alternas

No respuesta

Errores no-intencionales

Malentendidos Adivinar respuestas Prdida de atencin Distracciones Fatiga

Supervisin Validacin
En la supervisin se utiliza una persona para vigilar el trabajo de campo. Por ejemplo, en las entrevistas telefnicas se les escucha o graba para ver si el entrevistador no est sesgando las preguntas o si est entrevistando a las personas de la muestra. En el caso de las entrevistas personales el supervisor puede ir de observador para evaluar el procedimiento.

En la validacin se verifica que el trabajador de campo haya hecho el trabajo requerido. Hay varias formas de hacer esto, por ejemplo, en una encuesta, se contacta nuevamente a la persona para ver si efectivamente particip en la investigacin.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Estrategias de control para evitar errores del trabajador de campo No-Intencionales


El nmero estndar que se debe validar es el 10% de la muestra. Tambin es conveniente realizar algunas preguntas nuevamente para comparar los resultados. Otra forma de validar, es que una persona con experiencia en el campo observe los cuestionarios y detecte si hay algn patrn inconsistente de respuestas; como en el caso de personas muy jvenes y una gran nmero de hijos, etc. Existen tres mecanismos de control para controlar los errores de campo no-intencionales: Sesiones de orientacin Simulacin de roles Descansos

Sesiones de orientacin

Simulacin de roles

Son reuniones en las cuales se orienta a los trabajadores de campo respecto al cuestionario y se les explican los procedimientos de administracin. En estas sesiones se debe ser claro respecto a los patrones de salto de respuestas, alguna instruccin especial o el formato de aplicacin del cuestionario.

La simulacin de roles tiene el propsito de que el entrevistador se familiarice con el cuestionario y se le oriente de manera prctica cmo resolver algn problema en la administracin del mismo. Se trata de actuar como si fuera una entrevista real, pero haciendo alusin a todos los requisitos de la investigacin.

10

Descansos
Con los descansos se pretende evitar la fatiga en los entrevistadores y evitar errores por esta cuestin. Es importante ser firmes en los descansos designados, an y que el trabajador de campo no los crea necesarios. En caso de tener varias investigaciones al mismo tiempo, se puede alternar a los trabajadores, para evitar que se fatiguen con la monotona de un mismo estudio.

Estrategias de control para evitar errores de los entrevistados Intencionales


Para controlar este tipo de errores, que son informacin falsa o falta de respuesta, es importante ofrecer confidencialidad de la informacin proporcionada por el entrevistado, y anonimato, que su nombre no pueda ser asociado con la informacin proporcionada. Otra estrategia es ofrecer incentivos, ya sea econmicos, regalos, o algn tipo de recompensa, como cupones, descuentos, etc. De esta forma el entrevistado se sentir ms comprometido a decir la verdad ya que est siendo remunerado por su participacin.
12

11

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Tambin se puede utilizar validacin de pruebas, segn el caso, para reducir el error, por ejemplo, si el entrevistado responde que utiliza cierto tipo de vitaminas, pedirle que muestre el frasco. Si la persona dice tener cierta edad, pedirle una identificacin, si queremos el domicilio o colonia, pedirle un comprobante, etc.

Por ltimo, podemos utilizar la tcnica de la tercera persona, esto es preguntar al entrevistado en trminos de alguien ms, sobre todo en temas que pueden ser vergonzosos para algunos. Por ejemplo, Piensa usted que alguna persona de su misma edad y condicin fsica podra utilizar medicamentos tomados para evitar la calvicie?

13

14

Estrategias de control para evitar errores de los entrevistados No-intencionales


Para controlar este tipo de errores, que son Malentendidos, Adivinar respuestas, Prdida de atencin, Distracciones y Fatiga, es importante ofrecer cuidar el diseo de un cuestionario, se deben ofrecer ejemplos en caso necesario, cuando hay opciones de respuesta, ofrecer alternativas como Indiferente, Sin respuesta, Respuesta dudosa; ya que esto evita que las personas hagan supuestos de la informacin y adivinen las respuestas.

Estrategias de control para evitar errores de los entrevistados No-intencionales


Otra tctica es utilizar escalas de diferencial semntico, y no cargar las respuestas afirmativas o negativas de un solo lado. Por ltimo, en cuestionarios o entrevistas muy largas, es recomendable utilizar apuntadores de avance, o frases de nimo, como: Acabamos de terminar la parte ms complicada de la investigacin, Ya estamos por terminar, etc.

15

16

Ajuste de resultados para reducir el error de no- respuesta


El error de no-respuesta por parte del entrevistado, es de lo ms comn, por lo cual siempre debe ser cuantificado, y si el grado se considera un problema, se deben realizar ajustes; si este factor no es significativo, entonces no existe una razn para hacer ajustes. En el caso de necesitar ajustes, existen dos mtodos de compensacin: Promedios ponderados Sobremuestreo
17

Bibliografa
Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5). Burns, Alvin. Marketing Research. Estados Unidos: Editorial Prentice Hall 2000, (ISBN 0-13-014411-8).

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Crditos:

Lic. Ana Mara Lpez Navarro

19

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

1. Validacin y edicin

2. Codificacin

AM04003-Anlisis e interpretacin de resultados


Sesin 10. Procesamiento de datos

3. Introduccin de datos

4. Limpieza de los datos

5. Tabulacin y anlisis
1 2

1. Validacin y edicin
La validacin se refiere al proceso de verificar que las entrevistas se hayan realizado de acuerdo a las indicaciones establecidas. Se verifican tanto los errores intencionales como los intencionales por parte del entrevistador y el entrevistado. Sobre todo las omisiones, si se siguieron los patrones de salto, etc. Es muy tedioso este proceso, puesto que a veces son miles de pginas por verificar, pero es algo que se debe realizar para garantizar la calidad de los resultados.

2. Codificacin
Se refiere al proceso de agrupar y asignar cdigos numricos a las posibles respuestas de una pregunta dentro de un cuestionario o entrevista. En muchos cuestionarios las respuestas ya estn precodificadas. Lo ms recomendable en estudios grandes es tener precodificada la mayor parte de la informacin.

Ejemplo de una encuesta pre-codificada

Procedimiento para codificacin de datos general

Revisar respuestas a preguntas cerradas

Asignar claves a preguntas cerradas Iniciar captura

Definir claves para cada pregunta cerrada del cuestionario vaco.

Integrar el catlogo de claves Revisar respuestas a preguntas abiertas Integrar por separado claves para preguntas abiertas Asignar claves a preguntas abiertas

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Proceso de codificacin para respuestas abiertas Ejemplo de libro de cdigos


1. Realizar un listado de respuestas. Esto es en el caso de preguntas abiertas, donde se tiene que ver las respuestas que se van dando y agrupar las que se repiten, es como realizar un catlogo, se listan las que van saliendo nuevas y si se repiten se aaden al conteo de las respuestas registradas. 2. Consolidar las respuestas. Varias respuestas se pueden agrupar en una misma categora, pero esto lo tiene que decidir un investigador calificado y muchas veces se decide tambin con el cliente.

Ejemplo de respuestas a pregunta abierta codificada:


Por qu le gusta tomar Coca-Cola?

3. Determinar los cdigos. Se asigna el cdigo numrico a cada respuesta final. 4. Introducir los cdigos.

1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19.

Porque sabe bien Porque me gusta Por la publicidad Porque le gusta a mi esposo/a Es la que ms se vende Es la que siempre encuentro a la mano Porque te la traen a domicilio Estoy acostumbrado Es un hbito Es la que beben todos mis amigos Porque est en oferta Tena promocin Por inercia La bebo desde que era nio Me ayuda con el dolor estmago Me reanima cuando me siento mal No hay ninguna razn en particular No s No tengo idea

10

3. Introduccin de datos
Es el proceso de convertir la datos a un formato electrnico, y nos sirve para poder procesarlos y obtener informacin relevante del estudio para la toma de decisiones. Este proceso requiere de un dispositivo para la introduccin de datos, como una computadora y un medio de almacenamiento, como cd, disco duro, etc.

Generalmente los datos se introducen en un paquete estadstico, como SPSS (ejemplo de pantalla), SAS, Minitab, Excel, por mencionar algunos. El ms utilizado en el mercado de investigacin de mercados es el SPSS.

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

4. Limpieza de datos
En esta parte ya se han introducido los datos a la computadora y es el momento de realizar una verificacin final de errores antes de continuar con el anlisis estadstico. Se utilizan tcnicas que en principio son para clculo estadstico pero que nos dan pistas de los posibles problemas.

Podemos controlar varios aspectos en los datos: Valores perdidos Casos repetidos Valores imposibles: Sexo varn, dos embarazos Valores implausibles: Altura 1.60 mts, peso 100 kilos Los valores imposibles deben ser corregidos, los valores implausibles pueden ser valores legtimos y necesitan ser investigados con detalle.

13

14

Existen comprobaciones generales en la hoja de clculo: Lneas repetidas (SPSS 12 tiene un comando para esto) Casillas en blanco Valores repetidos Utilizando tcnicas estadsticas. Estas tcnicas son diferentes para variables categricas o numricas y tambin nos permiten ver si hay errores de captura.

Categricas Frecuencias para una variable Cruces de Frecuencias para ms de una variable Numricas Mximos y mnimos para variables numricas. Tambin histogramas

15

16

Diagramas de dispersin para dos variables

5. Tabulacin y anlisis estadstico


Ya que los datos han sido introducidos a la computadora y estn libres de errores de captura, estn listos para tabularse y realizar anlisis estadsticos. Las tres grandes ramas de tipos de anlisis que estaremos viendo en los siguientes mdulos son:

17

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Bibliografa
Inicio

Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5).
Ms de dos

Una

Cuntas variables van a utilizarse a la vez? Dos

Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).

Anlisis univariado de datos

Anlisis bivariado de datos

Anlisis Multivariado de datos

19

20

Crditos:

Lic. Ana Mara Lpez Navarro

21

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Anlisis de Datos
PROCESO DE PREPARACION DE DATOS
Revisin del Cuestionario Edicin Codificacin Transcripcin Depuracin de datos Ajuste estadstico Estrategia de Anlisis
1 2

AM04003-Anlisis e interpretacin de resultados


Sesin 11. Anlisis univariado de datos: Estadstica descriptiva

Estrategia de Anlisis
Nmero de variables a analizar simultneamente Univariado, Bivariado o Multivariado Propiedades de las tcnicas estadsticas Descriptivas o Inferenciales Conocer caractersticas de los datos Escalas de medicin de acuerdo al tipo de datos Consideraciones durante el proceso de investigacin Definicin del problema, mtodo y diseo Antecedentes y filosofa del investigador
3

Cuntas variables se analizarn simultneamente ?


1 2 Ms de 2

Univariado

Bivariado
Se enfoca en:

Multivariado

Niveles (promedio) Distribucin (desviacin)

Grado de relaciones (correlaciones y covarianzas)

Anlisis univariado
Es el anlisis de una variable de manera individual. Se utiliza cuando hay una medida nica de cada elemento de la muestra o en caso de tener dos o ms mediciones de los elementos cada variable se analiza por separado. Los datos pueden analizarse solos o agrupados categoras o clases (frecuencias). en

Tipos de Anlisis de Datos Univariados


Propiedades Tcnicas Estadsticas Descriptiva. Estadsticas que proporciona medidas
resumidas de los datos en sus muestras. Tales como: Medidas de Tendencia Central y Dispersin Inferencial. Estadsticas que permiten hacer juicios acerca de la poblacin total basado en resultados generados por las muestras. Tales como: Pruebas z, t y ji cuadrada
6

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Procedimientos univariados
Las estadsticas que se utilizan para analizar los datos univariados van de acuerdo a la escala y el tipo de informacin que queremos obtener: Medida de Tendencia Central Moda Mediana Media

Medidas de tendencia central: media


Es la suma de los valores dividido por el tamao de la muestra. Es lo que se conoce como "promedio". Se usa con datos de intervalos

Escala Nominal Ordinal Intervalo

Medida de Dispersin Frecuencias Rango intercuartil Desviacin estandar


7

Ejemplo: Valores: 12,16,15,11 y 9 = 63/5 = 12.6

Tambin se puede utilizar cuando los datos de intervalo se agrupan en categoras o clases (frecuencias).
Categora/Edad 25 a 30 aos 30 a 35 aos 35 a 40 aos Mas de 40 Totales No. de personas fi 8 16 24 16 64 Punto medio Xi 14 18 22 26 fiXi 112 288 528 416 1,344

Medidas de Tendencia Central: Mediana


Es el valor medio cuando los datos se agrupan en orden de magnitud. Se utiliza con los datos de escala ordinal o de intervalo.

Observacin X1 X2 X3 X4 X5

Valor de Xi 15 26 Mediana 71 84 102

= 1,344 / 64 = 21
9

Los datos se ordenan de manera creciente o decreciente.


10

Medidas de Tendencia Central: Moda


Es la categora de una variable nominal que ocurre con mayor frecuencia. Se utiliza con datos de escalas nominales o de orden superior. Categora/ Edad 25 a 30 aos 30 a 35 aos 35 a 40 aos Mas de 40 Totales Numero de personas fi 8 16 24 16 64
11

Medidas de dispersin: Desviacin Estndar


Indica cunto tienden a alejarse los valores puntuales del promedio. Se utiliza con datos de Intervalo. Una desviacin estndar grande indica que los puntos estn lejos de la media y una desviacin pequea indica que los datos estn agrupados cerca de la media. Se representa con: S o con la letra sigma

MODA

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Datos: 20,36,30,24,6,12,10,14 1) Determinar la media = 19 2) Raz Cuadrada de los cuadrados de las desviaciones de los datos de la media (x- X)2
(20-19)^2= (36-19)^2= (30-19)^2= (24-19)^2= (6-19)^2= (12-19)^2= Total 1 289 121 25 169 49 654

Medidas de dispersin: Frecuencias


La frecuencia es la repeticin de un proceso. La distribucin de frecuencias es hacer un conteo del numero de respuestas asociadas con diferentes valores de la variable. Se utilizan en Datos de Escala Nominal. Pueden ser: Absolutas. Son los nmeros de la muestra que aparecen en cada categora de la variable nominal.

3) S= Raz cuadrada de 654/8 4) S= 25.57


13

Relativas. Son los porcentajes de los elementos totales que aparecen en cada categora.
14

Medidas de dispersin: Frecuencias


Ejemplo. Cuntas veces por semana consume leche?
xi 0 1 2 3 4 5 6 7 f absoluta 8 18 25 20 6 8 4 1 n = 90 F relativa 8.88% 20% 27.7% 22.2 6% 8% 4% 1% 100% f absoluta / n

Qu hemos aprendido?
Debemos elegir una tcnica estadstica en funcin a: El nmero de variables a analizar simultneamente (anlisis UNIVARIADO, bivariado y multivariado). Tipo de informacin estadstica deseada: DESCRIPTIVA (descripcin de la muestra) e Inferencial. En el anlisis univariado Descriptivo utilizamos medidas de TENDENCIA CENTRAL y de DISPERSION , y para determinar cuales estadsticos debemos conocer el tipo de ESCALA de los datos (intervalo, ordinal o nominal).
15 16

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).

Crditos:

Lic. Ana Mara Lpez Navarro

17

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Anlisis Univariado Inferencial


Como vimos en la sesin anterior, de acuerdo al tipo de informacin, podemos dividir la estadstica en dos categoras, la estadstica descriptiva e inferencial. Estadstica Inferencial nos permite hacer juicios acerca de la poblacin total basado en resultados generados por las muestras. Ejemplo. Para estimar el consumo de leche en Monterrey, una muestra aleatoria puede someterse a investigacin Con base en estos resultados muestrales puede estimarse el consumo de la poblacin.
1 2

AM04003-Anlisis e interpretacin de resultados


Sesin 12. Anlisis Univariado Inferencial: Prueba de Hiptesis

Prueba de Hiptesis
Con frecuencia no es suficiente describir lo que aparece en la muestra, sino se requiere hacer inferencias de la muestra con respecto a la poblacin de la cual se tom. Para hacer un anlisis inferencial, debemos conocer las Pruebas de Hiptesis. Prueba de Hiptesis: Procedimiento basado en la evidencia muestral y la probabilidad. Es una aseveracin de una poblacin con el propsito de verificar si la afirmacin es razonable en funcin a los datos de la muestra.
3

Pasos Prueba de Hiptesis


1.Formular hiptesis nula y alternativa 2.Elegir la estadstica de prueba 3.Determinar Nivel de significancia 4.Calcular la estadstica de prueba 5.Determinar la probabilidad: valor critico 6.Comparar valor critico y tomar decisin

No se rechaza HO

Se rechaza HO

1. Formular Hiptesis
Hiptesis Nula ( H0 ) Enunciado del estado en que se encuentran las cosas y en el que no se espera ninguna diferencia ni efecto, es decir, supone que un parmetro de poblacin adquiere determinado valor o conjunto de valores. La hiptesis nula es la que siempre se pone a prueba. Alternativa ( H1 ) Enunciado en el que se espera alguna diferencia o efecto (opuesto a la hiptesis nula).
5

1. Formular Hiptesis
Las pruebas pueden ser bilateral o de 2 colas o unilateral, una cola, en caso de tener una direccin (> o <).

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

2. Elegir la Estadstica de Prueba


La estadstica de prueba mide la aproximacin de la muestra a la hiptesis nula. La prueba apropiada de inferencias estadsticas vara segn el nivel de ESCALA de los Datos. Datos de Intervalo (hipotesis de ) Prueba z Prueba t Datos nominales (hipotesis de ) Prueba ji cuadrada
7

2. Elegir la Estadstica de Prueba


Datos de Intervalo
La prueba z y la prueba t, son pruebas sobre el tamao de la media de la poblacin. La seleccin entre las dos depende del conocimiento que tiene el investigador sobre la desviacin estndar y el tamao de la muestra utilizado.

2. Elegir la Estadstica de Prueba


Datos de Intervalo
Prueba z es adecuada cuando: 1)El tamao de la muestra es de cualquier orden y se conoce la desviacin estndar de la poblacin, o 2) El tamao de la muestra es mayor que 30 y no se conoce la desviacin estndar. Prueba t es adecuada cuando: 1) La n < 30 y no se conoce la desviacin estndar.
9

2. Elegir la Estadstica de Prueba


Datos Nominales
Prueba ji cuadrada Compara una distribucin hipottica de la poblacin con una distribucin generada por la muestra.

10

3. Nivel de Significancia ()
Es la probabilidad de rechazar la hiptesis nula cuando esta es realmente cierta . Se pueden cometer dos clases de errores: Error tipo I (). Es rechazar la hiptesis nula cuando sta es realmente cierta. Error tipo II () Es no rechazar la hiptesis nula cuando sta es realmente falsa. (proporcin)
11

3. Nivel de Significancia ()
Potencia de la prueba (1-) Es el complemento de la probabilidad de un error tipo II. El nivel de significancia () se escoge de acuerdo al riesgo de rechazar equivocadamente la H0 que se dese. Los niveles ms usados son .10, .05 y .01

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

4. Calcular Estadstico de Prueba


Parmetro en Ho una poblacin

5. Determinar Probabilidad: Valor crtico


Valor crtico. Valor que define dnde comienza la regin crtica. Regin crtica. Es el conjunto de valores del estadstico de prueba para los que se rechaza H0. La regin crtica depende del tipo de hiptesis (una o dos colas), la distribucin de probabilidad y el nivel de significancia. El valor crtico se determina usando el nivel de significancia, una vez que se haya determinado dnde se encuentra la regin crtica. (Tablas z y t para hiptesis de medias y de ji cudrada para hiptesis de desviacin)
13 14

Informacin

Distribucin

Estadstico de prueba

Normal Z n>30 Normal z n<30 Prueba t

S* Poblacin normal

Poblacin normal

Ji cuadrada

* La s es un estimado de la desviacin estndar, ya que no se conoce. Existen frmulas para calcular las pruebas si se tienen proporciones.

6. Comparar valor crtico y Tomar una decisin


Para tomar una decisin debemos comparar los valores crticos con el valor del estadstico de prueba. Si este ltimo cae dentro de la regin crtica entonces rechazamos H0 De lo contrario decimos que no hay suficiente evidencia para rechazar H0

Ejemplo: Prueba de Hiptesis


Sabritas quiere probar si en su nueva promocin tiene 20 ms ganadores por da. Un ejecutivo de la empresa asegura que se estn sobreestimando el nmero de ganadores, por lo que decide escoger una muestra de 45 bolsas de papitas y probar con un nivel de significancia de .05. De la muestra se obtuvo una media de 16 y una desviacin estndar de 10. Determinar la distribucin de
Formular la hiptesis: probabilidad y la regin crtica:

H0: 20 H1: < 20


Valor crtico Se obtuvo de la tabla Z
- 1.64

15

16

Ejemplo: Prueba de Hiptesis


Calcular el estadstico de prueba:

Ejemplo: Prueba de Hiptesis 2


La nueva presentacin de Pepsi contiene 12 oz de refresco, para el director de calidad no slo es importante que el promedio de oz est cerca de 12, sino tambin que la varianza no sea mayor de .200 oz2 Se seleccion una muestra de 101 latas con un nivel de significancia de .05, dando una media de 11.75 oz y 2= .245oz2
Formular la hiptesis:

Z
-1.64

Tomar una decisin: Como cae en la regin crtica rechazamos H0, lo cual quiere decir que el ejecutivo tiene razn, se esta sobreestimando el nmero de ganadores por da.
17

H0: 2 .200 H1: 2 > .200

Determinar la distribucin de probabilidad y la regin critica:

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Ejemplo: Prueba de Hiptesis 2


Calcular el estadstico de prueba:

Anlisis Inferencial
Lo que hemos aprendido hasta ahora El anlisis inferencial nos permite hacer supuestos de una poblacin con los datos obtenidos de una muestra. Para realizar este anlisis debemos aplicar la prueba de hiptesis. Los pasos de la prueba de hiptesis son: 1. Formular la hiptesis (nula y alternativa) 2. Seleccionar el estadstico de prueba en funcin a: a) Tipo de escala b) La informacin que tenemos de la muestra y desviacin estndar para hiptesis de
20

Tomar una decisin: Como el valor crtico no cae en la regin, no hay suficiente evidencia para decir que la varianza es mayor a .200 por lo tanto se acepta H0.
19

Anlisis Inferencial
3. 4. 4. 5. 6. Determinar el nivel de significancia . Considerar los tipos de error I y II. Calcular el estadstico de prueba. Determinar la probabilidad (valor crtico). Considerar una cola o dos colas, se utilizan tablas para determinar la regin crtica con valores de z, t y jicuadrada. 7. Comparar Valor Crtico y tomar una decisin.

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).

21

22

Crditos:

Lic. Ana Mara Lpez Navarro

23

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Tablas cruzadas o tablas de contingencia


El objetivo de la tabulacin cruzada es identificar la relacin que existe entre dos variables.

AM04003-Anlisis e interpretacin de resultados


Sesin 13. Anlisis bivariado: tablas cruzadas

Con los datos de una muestra podemos observar si existe alguna relacin entre dos variables, y la pregunta que surge naturalmente es si esta relacin es verdadera o es el resultado del error muestral. Las tablas de contingencia son tabulaciones cruzadas entre dos variables X e Y con r y c categoras respectivamente. Es decir, que la tabla de contingencia entre X e Y tendr r filas y c columnas.
1 2

Los datos se organizan en una tabla de doble entrada, llamada Tabla de contingencia, cuya forma general es la siguiente:
VAR B1 VAR A A1 A2 A3 Ar Total Or1 C1 Or2 C2 Or3 C3 O11 O21 O31 B2 O12 O22 O32 B3 O13 O23 O33 B Bc O1c O2c O3c Orc Cc Rr n Total R1 R2 R3

Tablas cruzadas o tablas de contingencia


Oij es el nmero de sujetos caractersticas Ai y Bj a la vez. que tienen las

Ri (i = 1,,r) es la suma de la i-sima fila de la tabla. Es decir, es el total de sujetos que poseen la caracterstica Bi. Cj (j = 1,,c) es la suma de la j-sima columna de la tabla. Es decir, es el total de sujetos que poseen la caracterstica Ai. n representa el total de observaciones tomadas.
4

Tablas de Contingencia y Medidas de Asociacin


Existir o no relacin entre las variables A y B?, es decir si A y B son o no independientes. A y B sern independientes si cada entrada de la tabla es igual al producto de los totales marginales dividido entre el nmero de datos. Esto es si cumple, Se utiliza un test de hiptesis conocido como el test Chicuadrado de Pearson. La hiptesis nula del test es que las dos variables analizadas son independientes. La hiptesis alternativa es que las variables no son independientes, es decir, que existe una relacin entre las dos variables. Ilustremos el test utilizando un ejemplo. La siguiente tabla de contingencia muestra la tabulacin cruzada de la variable ingreso anual (dividido en tres categoras) y la ltima marca de coche comprada (dividida en tres marcas).
6

Oij =

Ri C j n

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Tablas de Contingencia y Medidas de Asociacin


Marca del ltimo auto comprado Ford Toyota Renault Ingreso anual Menos de 20,000 20,000 - 40,000 ms de 40,000 Total 50 200 100 350 200 100 25 325 125 350 50 525 375 650 175 1200

Tablas de Contingencia y Medidas de Asociacin


Las entradas de la tabla representan el nmero de personas en la muestra con cada combinacin de ingreso y marca de auto. Por ejemplo, 50 personas que ganan menos de 20,000 $ compraron un auto marca Ford. El test Chi-cuadrado de Pearson se basa en encontrar cul hubiera sido el valor de cada entrada si las variables fueran independientes. Es decir, el valor esperado de cada celda de la tabla si las variables ingreso y marca son independientes.

Total

Si ingreso y marca son independientes, la probabilidad del evento conjunto "A1: ganar menos de $20,000" y "B1: comprar marca Ford" es el producto de esas dos probabilidades: Pr(A1 y B1) = Pr(A1)*Pr(B1) Pr(A1) = A1/A = 375/1200, Pr(B1) = B1/B = 350/1200 Donde A y B son las frecuencias totales de los eventos.

Por lo tanto: Pr(A1 y B1) = Pr(A1)*Pr(B1) = 375*350/(1200*1200) = 0.091 El nmero esperado en la entrada A1B1 es entonces: N* Pr(A1 y B1) = 1200*0.091 = 109.38

10

Tablas de Contingencia y Medidas de Asociacin


En general la frmula del valor esperado es: Eij = (NAi*NBj)/N. Eij = nmero esperado NAi= nmero de elementos en la categora Ai NBi= nmero de elementos en la categora Bi Para A1B1 el nmero esperado es: E11 = (375*350)/1200 = 109.38
11

Este proceso se puede repetir para cada una de las entradas de la tabla. Una vez hecho esto el estadstico Chi-cuadrado se calcula con la siguiente frmula:

E ij i =1 j =1 r = nmero de categoras de la variable en las filas c = nmero de categoras de la variable en las columnas Oij = nmero observado en entrada ij Eij = nmero esperado en la entrada ij
Este estadstico Chi-cuadrado tiene (r-1)*(c-1) grados de libertad.
12

2 =

r c

(Oij E ij )2

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Tablas de Contingencia y Medidas de Asociacin


En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad. Realizando todas las cuentas con la tabla del ejemplo, el estadstico da 252.2. Comparando este nmero con el valor crtico de la distribucin Chi-cuadrado con 4 grados de libertad a un nivel de significatividad del 5% el valor crtico correspondiente es 9.49. Como 252.2 > 9.49 se rechaza la hiptesis nula. Es decir, las variables no son independientes. El estadstico de Pearson nos dice si dos variables son independientes una de otra pero no nos dice nada acerca de la naturaleza de la relacin. Cuando analizamos variables dicotmicas (adoptan solo los valores 0, 1) el estadstico de Pearson puede ser poco preciso. En esos casos se suelen utilizar otras medidas de asociacin.

13

14

Medidas de Asociacin para Tablas de 2x2


El Coeficiente Phi () Es una medida del grado de asociacin entre dos variables dicotmicas basada en el estadstico Chicuadrado de Pearson. Este coeficiente toma valores en el intervalo cero-uno. Valores prximos a cero indican poca asociacin entre las variables y valores cercanos a uno indican una fuerte asociacin. El coeficiente puede ser calculado como el coeficiente de correlacin entre dos variables dicotmicas. Alternativamente, puede ser calculado utilizando el estadstico Chi-cuadrado de Pearson con la siguiente frmula: = (2/N)1/2 donde N es el nmero de datos.

15

16

Riesgo Relativo El riesgo relativo es una medida del grado de asociacin entre dos variables dicotmicas, que compara el producto de las frecuencias en la diagonal principal de la tabla con el producto de las frecuencias en la diagonal opuesta mediante el cociente entre ambos. En consecuencia toma valores positivos y, si las variables son independientes, su valor ser prximo a uno.

El coeficiente de contingencia El coeficiente de contingencia es una extensin del coeficiente al caso de que al menos una de las variables presente ms de dos categoras. Toma valores entre 0 y Cmax, donde si r y c son el nmero de categoras de cada una de las variables: Cmax = [min(r-1,c-1)/(1+ min(r-1,c-1))]1/2

17

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Medidas de Asociacin para Tablas Mayores a 2x2


Valores del coeficiente de Contingencia cercanos a 0 indican que no hay asociacin entre las variables y valores prximos a Cmax indican una fuerte asociacin (note que Cmax es un nmero que siempre ser menor a uno).

Medidas de Asociacin para Tablas Mayores a 2x2


La V de Cramer Otra extensin del coeficiente al caso de variables con ms de dos categoras es la V de Cramer que, a diferencia del coeficiente de contingencia toma valores entre 0 y 1. Valores de V cercanos a 0 indican que no hay asociacin entre las variables y valores cercanos a 1 indican una fuerte asociacin. V = (2/(r c)*N)1/2
19 20

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Crditos:

Lic. Ana Mara Lpez Navarro

21

22

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Anlisis bivariado
Son los mtodos estadsticos para analizar la relacin entre dos variables de estudio. Se conocen como tcnicas bivariadas. Cuando se analiza el grado de asociacin entre dos variables, debe de existir una variable independiente, que es el factor de prediccin, y una variable independiente, que es el criterio.

AM04003-Anlisis e interpretacin de resultados


Sesin 14. Anlisis bivariado: correlacin

Procedimientos bivariados

Las variables independientes son aquellas que se cree afectan el valor de la variable dependiente. Por ejemplo, variables independientes tales como precio, distribucin, gasto en promocin, etc., se pueden utilizar para describir el tipo de relacin y predecir su comportamiento, en variables dependientes como ventas o participacin de mercado de un producto.

Dos variables de intervalo

Cul es el nivel de escala de las variables?


Dos variables ordinales

Dos variables nominales

Coeficiente de correlacional lineal r Regresin simple

Coeficiente de correlacin por rangos Gamma Tao

Coeficiente de contingencia Lambda

Prueba t sobre el coeficiente de regresin Prueba z sobre la diferencia entre medias Prueba t sobre la diferencia entre medias

Prueba U de Mann Whitney Prueba de Kolmogorov Smirnov

Prueba de ji cuadrado

Anlisis bivariado
CORRELACIN: Con esta tcnica trataremos de dar respuesta a si existe dependencia entre dos variables. Si son independientes, no se sigue estudiando. Si existe dependencia, nos plantearemos el grado de dependencia. REGRESIN: Con esta tcnica trataremos de determinar el tipo de dependencia. Si son dependientes intentaremos determinar la variable dependiente a partir de la variable independiente. Y = Variable dependiente o variable respuesta. X = Variable independiente o regresora.
5

Correlacin y regresin
VARIABLES CUALITATIVAS VARIABLES CUANTITATIVAS Estudio de independencia
Dos variables son independientes cuando la frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales

fi. * f.j = fij


Si son independientes ya no seguimos estudiando la relacin porque no existe.

2.Estudio del grado de relacin Grado de asociacin


1.- Coeficiente de asociacin (H) 2.- otros estadsticos (ro de Spearman, tau de kendall) 3.- Test de la X2 (Lo veremos al ver la inferencia)

Correlacin
1.- Grficamente. 2.-Analticamente: Covarianza. Coeficiente de correlacin de Pearson.

3. Regresin
partir de la ind.)

(estimar los valores de la vble. dep. a

Relacin lineal. Relacin no lineal


(no la veremos)

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Introduccin: un poco de historia


El trmino regresin fue introducido por Galton en su libro Natural inheritance (1889) refirindose a la ley de la regresin universal: Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor. Regresin a la media Su trabajo se centraba en la descripcin de los rasgos fsicos de los descendientes (una variable) a partir de los de sus padres (otra variable).

Pearson (un amigo suyo) realiz un estudio con ms de 1000 registros de grupos familiares observando una relacin del tipo: Altura del hijo = 85cm + 0,5 altura del padre (aprox.) Conclusin: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede decirse de los padres muy bajos. Hoy en da el sentido de regresin es el de prediccin de una medida basndonos en el conocimiento de otra.

Correlacin
A la derecha tenemos un ejemplo de los datos obtenidos observando dos variables en varios individuos de una muestra. En cada fila tenemos los datos de un individuo. Cada columna representa los valores que toma una variable sobre los mismos. Los individuos no se muestran en ningn orden particular. ANLISIS GRFICO: Dichas observaciones pueden ser representadas en un diagrama de dispersin (scatterplot). En ellos, cada individuos es un punto cuyas coordenadas son los valores de las variables. Nuestro objetivo ser intentar reconocer a partir del mismo si hay relacin entre las variables, de qu tipo, y si es posible predecir el valor de una de ellas en funcin de la otra.
Altura en cm.
162 154 180 158 171 169 166 176 163 ...

Peso en Kg.
61 60 78 62 66 60 54 84 68 ...

Altura en cm.
162 154 180 158 171 169 166 176 163 ...

Peso en Kg.
61 60 78 62 66 60 54 84 68 ...

10

Correlacin - Diagramas de dispersin


Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersin.
100 90 80 70 60 50 40 30 140 150 160 170 180 190 200
11

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersin.

100 90

Pesa 76 kg. Mide 187 cm.

80 70 60 50 40 30 140

Pesa 50 kg. Mide 161 cm.

au eso el p que ce are ura P lt la a

on ac ent m

150

160

170

180

190

200
12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Correlacin: Prediccin de una variable en funcin de la otra = Regresin


Aparentemente el peso aumenta 10 kg por cada 10 cm de altura... o sea, el peso aumenta en una unidad por cada unidad de altura.
100 90 80 70 60 50 40 30 140 150 160

Correlacin: Cmo reconocer relacin directa e inversa.


330 280 230 180 130 80 30 140
100

Incorrelacin

90 80 70 60 50 40 30

Fuerte relacin directa.

150

160

170

180

190

200

140

150

160

170

180

190

200

Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Incorrelacin.

Para los valores de X mayores que la media le corresponden valores de Y mayores tambin. Para los valores de X menores que la media le corresponden valores de Y menores tambin. Esto se llama relacin directa o creciente entre X e Y. Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relacin inversa o decreciente.

10 kg.
80 70 60 50 40 30

10 cm.
170 180 190 200
13

Cierta relacin inversa

20 10 0 140 150 160 170 180 190 200

14

Correlacin: Covarianza de dos variables X y Y


La covarianza entre dos variables, Sxy, nos indica si la posible relacin entre dos variables es directa o inversa. Directa: Sxy >0 1 Inversa: Sxy <0 S xy = ( xi x )( yi y ) n i No-relacionda: Sxy =0

Correlacin: Covarianza de dos variables X y Y


La covarianza tiene el inconveniente de que no est delimitada, por tanto necesitamos un coeficiente o algn valor que venga definida la relacin entre dos variables para poder saber si la relacin es fuerte o dbil: COEFICIENTE DE CORRELACIN DE PEARSON

El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relacin entre las variables. Adems es una medida que depende de las unidades, por lo que permite comparar entre distribuciones.
15 16

Correlacin: Coeficiente de correlacin lineal de Pearson


La coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales). Tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relacin sea directa o inversa. s til para determinar si hay relacin lineal entre dos variables, pero no servir para otro tipo de relaciones (cuadrtica, logartmica,...)

Correlacin: Coeficiente de correlacin lineal de Pearson


El coeficiente nos sirve para determinar si existe una relacin significativa o no a la asociacin en anlisis. Debemos identificar tres aspectos : 1. Grado de presencia : El valor de p, a la hora de calcular el coeficiente, debe ser examinado primero, ya que si la relacin es (>.05), siginifica que no existe relacin, si p=or<.05, significa que s existe una relacin significativa y procedemos a determinar:

r=

S xy

SxS y
17 18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Correlacin: Coeficiente de correlacin lineal de Pearson


2. Direccin de la asociacin: Hay que ver si el coeficiente es negativo (-) o positivo (+). 3. Fuerza de la asociacin: El coeficiente de correlacin (r) es un nmero que se encuentra en el rango 1.0 a +1.0. Entre ms cercano sea a 1.00 (+ -), mayor es la asociacin, a continuacin presentamos una clasificacin que ser til en este aspecto.

Correlacin: Coeficiente de correlacin lineal de Pearson


Despus de haber obtenido el coeficiente de correlacin y determinar si es estadsticamente significativo, podemos concluir acerca de la fuerza en la asociacin de variables. Si el coeficiente cae entre: +1 y +.81 -1 y -.81 +.80 y +.61 -.80 y -.61 +.60 y +.41 -.60 y -.41 +.21 y +.40 -.21 y -.40 Igual o menor a .20 Relacin Alta Relacin Moderada Relacin Baja Relacin Dbil Inexistente
20

19

Correlacin: Otros coeficientes de correlacin


Cuando las variables en vez de ser numricas son ordinales, es posible preguntarse si hay algn tipo de correlacin entre ellas. Para estos casos, disponemos de dos estadsticos: (ro) de Spearman (tau) de Kendall Son estadsticos anlogos a r y los podemos aplicar donde las variables no puedan considerarse numricas.

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

21

22

Crditos:

Lic. Ana Mara Lpez Navarro

23

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Regresin
El anlisis de regresin no se debe confundir con el de correlacin, el que mide el grado de relacin lineal entre las variables, en cambio, el de regresin, mide relaciones de causalidad. El anlisis de correlacin supone que todas las variables son aleatorias, en cambio, cuando se regresiona, se supone que las variables explicativas son fijas en muestreos repetidos.

AM04003-Anlisis e interpretacin de resultados


Sesin 15. Anlisis bivariado: regresin lineal simple

El anlisis de regresin sirve para predecir una medida en funcin de otra medida (o varias). Y = Variable dependiente predicha explicada X = Variable independiente predictora explicativa Es posible descubrir una relacin? Y = f(X) + error f es una funcin de un tipo determinado el error es aleatorio, pequeo, y no depende de X

Veremos un ejemplo del estudio de la altura en grupos familiares de Pearson, como la sesin anterior, que estaremos manejando durante el resto del tema. Altura del hijo = 85cm + 0,5 altura del padre (Y = 85 + 0,5 X) Si el padre mide 200cm cunto mide el hijo? Se espera (predice) 85 + 0,5x200=185 cm. Alto, pero no tanto como el padre. Regresa a la media.

Modelo de regresin lineal simple


En el modelo de regresin lineal simple, dado dos variables Y (dependiente) X (independiente, explicativa) buscamos encontrar una funcin de X muy simple (lineal) que nos permita aproximar Y mediante = b0 + b1X b0 (ordenada en el origen, constante) b1 (pendiente de la recta) Y y rara vez coincidirn por muy bueno que sea el modelo de regresin. A la cantidad e=Y- se le denomina residuo o error residual.

Si el padre mide 120cm cunto mide el hijo? Se espera (predice) 85 + 0,5x120=145 cm. Bajo, pero no tanto como el padre. Regresa a la media. Es decir, nos interesaremos por modelos de regresin lineal simple.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Modelo de regresin lineal simple


Y y rara vez coincidirn por muy bueno que sea el modelo de regresin. A la cantidad e=Y- se le denomina residuo o error residual. En el ejemplo de Pearson y las alturas, l encontr: = b0 + b1X b0=85 cm (No interpretar como altura de un hijo cuyo padre mide 0 cm) b1=0,5 (En media el hijo gana 0,5 cm por cada cm del padre)
180 150 120 90 60 30 0
7 8
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220

b1=0,5

b0=85 cm

La relacin entre las variables no es exacta. Es natural preguntarse entonces: Cul es la mejor recta que sirve para predecir los valores de Y en funcin de los de X Qu error cometemos con dicha aproximacin (residual).

Modelo de regresin lineal simple


El modelo lineal de regresin se construye utilizando la tcnica de estimacin mnimo cuadrtica: Buscar b0, b1 de tal manera que se minimice la cantidad i ei2 Se comprueba que para lograr dicho resultado basta con elegir: S b1 = r Y b0 = y b1 x SX

180 150 120 90 60 30 0


0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220

b1=0,5

b0=85 cm
9 10

Se obtiene adems unas ventajas de regalo El error residual medio es nulo. La varianza del error residual es mnima para dicha estimacin. Traducido: En trmino medio no nos equivocamos. Cualquier otra estimacin que no cometa error en trmino medio, si es de tipo lineal, ser peor por presentar mayor variabilidad con respecto al error medio (que es cero).

Modelo de regresin lineal simple


Que el error medio de las predicciones sea nulo no quiere decir que las predicciones sean buenas. Hay que encontrar un medio de expresar la bondad del ajuste (bondad de la prediccin)
No importa. Con los dos ltimos clientes me equivoqu en +10 y +20. En trmino medio el error es cero. Cometi un error de -30 en su ltima prediccin

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Cmo medir la bondad de una regresin?


Imaginemos un diagrama de dispersin, y vamos a tratar de comprender en primer lugar, qu es el error residual, su relacin con la varianza de Y, y de ah, cmo medir la bondad de un ajuste.
13

Cmo medir la bondad de una regresin? Interpretacin de la variabilidad en Y


En primer lugar olvidemos que existe la variable X. Veamos cul es la variabilidad en el eje Y. La franja sombreada indica la zona donde varan los valores de Y. Proyeccin sobre el eje Y = olvidar X
Y

14

Cmo medir la bondad de una regresin?

Interpretacin del residuo


Y

Regresin: Bondad de un ajuste


Resumiendo: La dispersin del error residual ser una fraccin de la dispersin original de Y Cuanto menor sea la dispersin del error residual mejor ser el ajuste de regresin. Eso hace que definamos como medida de bondad de un ajuste de regresin, o coeficiente de determinacin a:
Y

Fijmonos ahora en los errores de prediccin (lneas verticales). Los proyectamos sobre el eje Y. Se observa que los errores de prediccin, residuos, estn menos dispersos que la variable Y original. Cuanto menos dispersos sean los residuos, mejor ser la bondad del ajuste.

R2 = 1
15

S e2 2 SY

2 Se2 < SY
16

Regresin: Bondad de un ajuste Resumen


La bondad de un ajuste de un modelo de regresin se mide usando el coeficiente de determinacin R2 R2 es una cantidad adimensional que slo puede tomar valores en [0, 1] Cuando un ajuste es bueno, R2 ser cercano a uno. Cuando un ajuste es malo R2 ser cercano a cero. A R2 tambin se le denomina porcentaje de variabilidad explicado por el modelo de regresin. R2 puede ser pesado de calcular en modelos de regresin general, pero en el modelo lineal simple, la expresin es de lo ms sencilla: R2=r2

17

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Crditos:
Lic. Ana Mara Lpez Navarro

19

20

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Analisis e interpretacin de resultados

SPSS
El paquete estadstico SPSS (Statistical Package for the Social Sciences) es uno de los muchos que se pueden utilizar para la investigacin de mercados. Existen otros paquetes como SAS, Minitab e inclusive Excel que se pueden utilizar, sin embargo, el SPSS es el ms empleado actualmente para este rubro.

AM04003-Anlisis e interpretacin de resultados


Sesin 16. SPSS

Regresin
SPSS esta estructurado en tres ventanas diferentes: Editor de datos de SPSS: es la primera ventana que aparece nada ms acceder al programa. Permite visualizar los datos y las variables con los que vamos a trabajar. Recoge todos los mens para trabajar con los datos y realizar los anlisis estadsticos. Editor de sintaxis de SPSS: en esta ventana podemos pegar la sintaxis generada al realizar un clculo, implementar un mtodo, dibujar un grfico, en general, al implementar cualquiera de las utilidades que nos ofrece SPSS. Visor de resultados de SPSS: en esta ventana podemos visualizar los resultados del mtodo implementado.
3

Introducir datos en SPSS Al abrir el programa SPSS lo primero se solicita es el archivo de trabajo. Se puede seleccionar una base de datos o bien pulsar en el botn Cancelar y acceder directamente a la ventana de Editor de datos del programa SPSS. En esta ventana se pueden entrar de forma manual los datos o bien cargar unos nuevos datos mediante la opcin Abrir Datos del men Archivo. El programa SPSS trabaja con los datos previamente grabados en un archivo al que denominamos archivo de datos y tiene la extensin obligatoria .sav

La ventana de Editor de datos de SPSS dispone de dos pestaas: Vista de datos y Vista de variables. - Vista de datos: est dividida en columnas y filas dando lugar a celdas o casillas donde se recogen los datos. Cada columna tiene asignado un nombre de variable, ya sea especificado por el usuario o bien por el propio programa SPSS (mximo 8 caracteres). Las filas, a su vez, estn numeradas de forma correlativa.

- Vista de variables: recoge las caractersticas de las variables o lo que es lo mismo, de las columnas. Informa sobre el Nombre de la variable, el Tipo (Numrico, Cadena, Fecha,..), el Ancho de la variable, el nmero de decimales (en el caso de variables numricas), la Etiqueta (permite introducir una pequea descripcin de la variable), etiquetas para Valores de la variable, etiquetas para identificar valores Perdidos, el ancho de columna, la Alineacin y la Medida.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Analisis e interpretacin de resultados

Creacin de un archivo
1. Debemos crear la estructura (definir las variables) de un nuevo archivo de datos de SPSS. Para cada variable habr que ir especificando cada una de sus caractersticas, empezando por el nombre (primera columna). 2. Definir etiquetas para cada variable, pueden ser de hasta 60 caracteres. se escribe un cdigo en la zona en la que aparece Valor y la etiqueta correspondiente en la zona de Etiqueta de valor y despus pulsar el botn de Aadir; as, en la Figura 3.2, al cdigo 1 se le ha asignado la etiqueta no, al cdigo 2 se la ha asignado la etiqueta moderado y al cdigo 3 se le aadir la etiqueta grave en cuanto pulsemos el botn Aadir.
7

3. Hay que definir los valores perdidos, que stos seran las NO-respuestas por parte de los entrevistados, generalmente se le asigna un nmero grande y fcil de tabular a fin de que no se confunda con los valores de anlisis, usualmente se asigna 99. 4. No olvides grabar tu documento para no perder la informacin almacenada.

Vista de archivo
Un archivo de datos tendra mas o menos el siguiente aspecto:

Estadsticas Descriptivas
El procedimiento Frecuencias proporciona estadsticos y representaciones grficas que resultan tiles para describir muchos tipos de variables. Es un buen procedimiento para una inspeccin inicial de los datos. Supongamos que deseamos estudiar una muestra de 50 sujetos a los que hemos medido cinco variables: edad, sexo, peso y altura. Veamos la salida que nos proporciona el procedimiento frecuencias.

10

En primer lugar, al ejecutar este procedimiento, nos aparece una ventana en la que hemos de seleccionar las variables sobre las que deseamos obtener la informacin. Supongamos que en nuestro caso, deseamos ver qu ocurre si seleccionamos las variables edad y sexo.

Estadsticas Descriptivas
Si pulsamos aceptar sin modificar ninguna otra opcin, la salida que proporciona el programa es la siguiente, para cada variable seleccionada:

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Analisis e interpretacin de resultados

Adems, en el procedimiento frecuencias podemos establecer una serie de opciones. Si en la ventana de Frecuencias elegimos el botn de Estadsticos, podemos elegir un conjunto de ellos sobre las variables seleccionadas (valores percentiles, estadsticos de posicin, de dispersin o sobre la forma de la distribucin).

Si en ese cuadro seleccionamos, por ejemplo, media, mediana, desviacin tpica y varianza y lo ejecutamos para la variable edad, los resultados proporcionados, adems del cuadro referente a las frecuencias, seran:

13

14

Igualmente, en el procedimiento Frecuencias existe una opcin para dibujar grficos. Si seleccionamos esa opcin aparecer la siguiente ventana:

El procedimiento Descriptivos muestra estadsticos de resumen univariados para variables en una nica tabla y calcula puntuaciones tipificadas (puntuaciones z).

Si seleccionamos la opcin Histogramas, por ejemplo, la salida sera:

15

16

Estadsticas Descriptivas
Si se ejecuta el procedimiento para el conjunto de variables seleccionadas, la salida que proporciona el programa es la siguiente:

Adems de los estadsticos que aparecen en el cuadro anterior es posible aadirles otros. Simplemente en el cuadro de Descriptivos hay que pulsar sobre el botn Opciones y aparecer la siguiente ventana:

En ella se pueden seleccionar ms estadsticos y elegir el orden de visualizacin de las variables (alfabtico o por el valor ascendente o descendente de las medias).

17

18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Analisis e interpretacin de resultados

Tablas Cruzadas
El procedimiento Tablas de contingencia crea tablas de clasificacin doble y mltiple y adems proporciona 22 pruebas y medidas de asociacin para tablas de doble clasificacin. Los estadsticos de tablas de contingencia y las medidas de asociacin slo se calculan para las tablas de doble clasificacin. Si se especifica una fila, una columna y un factor de capa (variable de control), el procedimiento tablas de contingencia crea un panel de medidas y estadsticos asociados para cada valor del factor capa.

19

20

En nuestro ejemplo vamos a realizar una tabla de contingencia para las variables edad en filas y sexo en columnas. Veamos la salida que proporciona:

El procedimiento Tablas de contingencia tiene tres posibilidades. Como siempre para acceder a ellas debemos pulsar los botones de la parte inferior de la ventana de Tablas de contingencia. La primera opcin es Estadsticos. Esta opcin proporciona distintos estadsticos que hemos de seleccionar en funcin del tipo de variables con las que estamos trabajando (dicotmicas, nominales, ordinales, etc.).

21

22

Adems, el procedimiento permite acceder a la ventana Casillas. Esta ventana permite descubrir las tramas en los datos que contribuyen a una prueba chi-cuadrado significativa. As permite mostrar las frecuencias esperadas y tres tipos de residuos que miden la diferencia entre las frecuencias observadas y las esperadas. Cada casilla de la tabla puede contener cualquier combinacin de recuentos, porcentajes y residuos seleccionados.

Por ltimo, la opcin Formato permite, como en otros procedimientos del programa, elegir las filas en orden ascendente o descendente.

23

24

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Analisis e interpretacin de resultados

Regresin y Correlacin
En todo problema de regresin y correlacin, el primer paso consiste en dibujar la nube de puntos, con objeto de detectar posibles no-linealidades en la relacin o alguna otra falla en las hiptesis del modelo de regresin lineal. El procedimiento que permite dibujar nubes de puntos, lo encuentras en Grficos Diagrama de Dispersin.

Para llevar a cabo una Regresin Lineal, se realiza con el procedimiento Analizar Regresin Linea Para llevar a cabo una Correlacin, se realiza con el procedimiento Analizar Correlaciones Bivariadas

25

26

Anlisis de Varianza
Para llevar a cabo un Anlisis de Varianza, se realiza con el procedimiento Analizar Comparar Medias ANOVA de un factor

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958600-124-5).

27

28

Crditos:

Lic. Ana Mara Lpez Navarro

29

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Anlisis de Varianza
El anlisis de varianza (ANOVA) prueba medias de dos o ms poblaciones, se utiliza para analizar resultados experimentales. Generalmente la hiptesis nula es que todas las medias son iguales. Por ejemplo, supongamos que un investigador quiere saber si los consumidores constantes, regulares y ocasionales, ms los no-consumidores de la avena en sobres de sabores Quaker, difieren en su preferencia a la avena Quaker, medido en una escala Likert de nueve puntos. La hiptesis nula de que no difiere la preferencia por la avena de los cuatro grupos puede verificarse con un anlisis de varianza.
1 2

AM04003-Anlisis e interpretacin de resultados


Sesin 17. Anlisis bivariado: varianza (ANOVA)

El ANOVA puede responder a preguntas cmo: El anlisis de varianza debe tener una variable dependiente, que en este caso sera la preferencia por la avena, que es mtrica (medida en una escala de intervalo o razn). Las variables independientes deben ser variables nomtricas, como consumo constante, regular u ocasional. A las variables independientes se les llama factores. Una combinacin particular de niveles de factores se llama tratamiento. Cmo vara la intencin de compra del producto por parte de los consumidores segn los niveles de precios? Varan las opiniones de las polticas de distribucin de la empresa entre los agentes, vendedores y mayoristas? Vara el nivel de consumo de mi producto segn el segmento?

Anlisis de Varianza Estadsticos principales


Eta2 (2). La fuerza de los efectos X en Y. El valor de 2 vara entre 0 y 1. Estadstica F. Con esta estadstica se verifica la hiptesis nula de que las medias de las categoras son iguales. SCA. Tambin se denota SCx. Es la variacin de Y relacionada con la variacin de las categoras de X. SCE. Se denota con Scerror. Es la variacin de Y debido a la variacin en cad una de las categoras de X. SCy. Variacin total de Y.
5

Etapas del ANOVA de un factor

Identificar variables dependiente e independiente

Descomponer la variacin total

Medir los efectos

Probar la significacin

Interpretar resultados

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Etapas del ANOVA de un factor


Todo el proceso se puede hacer en forma manual, pero es muy largo y complicado, y si se tienen gran cantidad de datos tiene que recurrirse a algn tipo de software. En la prctica todo se resume en un estadstico, F, y tiene desglosados todos los componentes del mismo. El formato general de una tabla de ANOVA que arrojan los paquetes estadsticos generalmente tiene los siguientes componentes: Fuente de Variacin
Tratamientos

Tabla de Anova
Suma de Grados de Cuadrado Cuadrados libertad Medio
SSCA k-1
MSTR= SSCA/ k-1

F= MSTR/MSE

Error

SCE

nT - k

MSE= SCE/nT - k

Total

SSy

nT-1

Donde: k=nmero de tratamientos, nT= Nmero total de datos

Estadstico F

Este tipo de anlisis fue ideado por Sir Ronald A. Fisher


que durante los aos 1912 a 1962 y contribuy en forma notable a un modo de pensamiento y filosofa estadstica moderna. Frmula:

Por ejemplo, si tenemos 3 programas distintos de incentivos y queremos ver cul aumenta el rendimiento de manera ms eficaz, utilizamos el anlisis de varianza. Queremos medir el rendimiento de cada grupo y averiguar si existen o no diferencias entre ellos.

F=

SCx / ( c 1 ) Scerror / ( N c) )

10

Estadstico F
Si la probabilidad o significancia del Estadstico F es menor a .05 rechazaremos la hiptesis de igualdad de medias y concluiremos que no todas la medias poblacionales comparadas son iguales. En caso contrario, no podemos rechazar la hiptesis de igualdad y no podremos afirmar que los grupos comparados difieran en sus promedios poblacionales.
Sumas de cuadrados Entre grupos Dentro de los grupos 3.95331 Grados de libertad 4 Medias cuadrticas 0.98832753 F 8.252442 Sig. .000

4.431188

37

0.119761824

Total

8.384498

41

En una tabla este es el valor que se evala y se compara en base a .05.

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Estadstico F
En este caso, puesto que la significancia da a .000, entonces vemos que .05 es mayor que .000, por lo cual se rechaza la hiptesis nula y podemos concluir que s existe una diferencia en rendimiento de acuerdo al programa de incentivos utilizado.

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4).

13

14

Crditos:

Lic. Ana Mara Lpez Navarro

15

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Anlisis multivarainte
Es el anlisis simultneo de ms de dos variables.

AM04003-Anlisis e interpretacin de resultados


Sesin 18. Anlisis multivariante. Tcnicas dependientes

Se pueden categorizar en funcin a: Si alguna de las variables se puede identificar como dependiente de otra u otras Existe ms de una variable dependiente La naturaleza de los datos (tipo de escala)

Propsitos del anlisis multivariante


Comprender la relacin de los datos (mediante las distancias de stos) Visualizarlos Hacer modelos Obtener informacin correlacionada Reducir los datos o simplificar la estructura de stos Sortearlos y agruparlos Investigar la dependencia entre las variables Predecir Construir hiptesis y probarlas
3

Anlisis multivariante
Tcnicas Multivariantes

Tcnicas de Dependencia
Una Variable Dependiente

Tcnicas de Interdependencia
Interdependencia variables Semejanza entre objetos

Mas de una variable dependiente

Regresin Mltiple Correlacin Discriminante Cannica Medicin Conjunta Varianza y Covarianza

Anlisis Conglomerado Factor Comn Escala Multidimensional


4

Tcnicas dependientes
Una variable dependiente Regresin Mltiple Anlisis Discriminante Varianza y Covarianza Medicin Conjunta

Regresin mltiple
Examina la relacin entre por lo menos 2 variables independientes de intervalos de escala y una variable dependiente de intervalo de escala. La ecuacin predictiva : Y= a + b1X1 +b2X2

Las variables independientes se utilizan para predecir la dependiente

Mltiples variables dependientes Correlacin Cannica

X1 y X2 a, b1 y b2 son los coeficientes de regresin generados a partir de datos de la muestra, que indica la contribucin relativa de dicha variable para explicar la dependiente
5 6

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Regresin mltiple ejemplo


Un coeficiente positivo indica una relacin directa entre esa variable independiente y la variable dependiente, un coeficiente negativo indica una relacin inversa. El tamao del coeficiente indica la cantidad de cambio en la variable dependiente asociado con un incremento de una unidad en dicha variable independiente, asumiendo que todas las dems variables independientes permanezcan constantes. Considera la siguiente ecuacin de regresin mltiple: Y = 121 + 0.2 X1 + 5.2 X2 R2 = 0.42 donde: Y = Estimado de ventas, X1 = Costo de publicidad, X2 = Ingresos Las ventas tienden a aumentar en .2 unidades por cada unidad incrementada en el costo de publicidad y en 5.2 unidades por cada incremento en los ingresos R2 es el coeficiente de determinacin mltiple, indica la proporcin de la variacin en Y explicado por la regresin. 42% de la variacin en Ventas pueden ser relacionadas por el costo de publicidad y el ingreso.
8

Anlisis discriminante
Este anlisis busca generar dimensiones que permitan separar los objetos tanto como sea posible, a partir de grupos ya determinados Se utiliza con una variable dependiente en escala nominal y un conjunto de variables independientes en escala de intervalo.

Anlisis discriminante
Objetivos: 1) Analizar si existen diferencias entre los grupos en cuanto a su comportamiento con respecto a las variables consideradas y averiguar en qu sentido se dan dichas diferencias (descriptivo). 2) Elaborar procedimientos de clasificacin sistemtica de individuos de origen desconocido, en uno de los grupos analizados. (predictivo).

10

Anlisis discriminante
D= b0 +b1X1+b2X2+b3X3 + bkXk Dnde: D = Puntuacin discriminante bx = coeficientes o peso discriminante Xs = variables independientes Funcin discriminante. Combinacin lineal de las variables independientes que diferencie al mximo los puntajes de las medidas a travs de categoras de la variable dependiente.

Anlisis discriminante Ejemplo


Walt Mart est interesado en analizar la opinin de sus clientes con respecto a la tienda. Para ello realiza una encuesta a una muestra de 200 de ellos en las que le pide que valoren su labor haciendo una valoracin entre 0 y 5 en los siguientes aspectos: Limpieza, Precios Competitivos, Disponibilidad de Productos, Servicio en Caja, Calidad, Cercana y Promociones. Adems, tiene clasificados a sus clientes en dos grupos de acuerdo a si tienen hijos o no. El nmero de clientes pertenecientes al grupo de muestra con hijos es igual a 120 y el del grupo sin hijos es de 80.

11

12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Varianza y Covarianza
El objetivo del estudio es analizar si existen diferencias en cuanto a la percepcin de la tienda entre los clientes con hijos y los clientes sin hijos, y en caso de que existan, analizar en qu sentido se dan dichas diferencias. En este caso, existen 7 variables clasificadoras (p=7) y dos grupos a discriminar (q=2). El tamao de la muestra es n=200 con n1 = 120 y n2 = 80. Anlisis de Varianza (ANOVA) se utiliza en el anlisis de datos experimentales. Requiere una variable dependiente en escala de intervalos y una variable o variables independientes en escala nominal. Anlisis de Covarianza (ANCOVA) se utiliza en situaciones en donde se descubre despus del experimento, que alguna fuente externa de variacin contribuye a los valores de la variable dependiente. Se requiere una variable dependiente en escala de intervalos y variables independientes en escala nominal.
14

13

Medicin conjunta
Se ocupa de los efectos conjuntos de dos o ms variables independientes nominales en la disposicin de una variable dependiente ordinal. Se utiliza para medir los intercambios que los consumidores hacen sobre atributos de productos; para predecir la participacin de mercados o la rentabilidad de un producto que ofrece varias combinaciones de atributos. Es til en el diseo de nuevos productos o servicios.
15

Medicin conjunta Ejemplo


Resumen de Importancia de los atributos en la seleccin de un automvil

Importance summary
50 40

Averaged Importance Importancia promedio

30

20

10

0 Colour carro Color del of car Brand Name

Marca

Repairs for one yearTamao del motor Seguridad Engine size as indic

Factor

16

Correlacin cannica
Es apropiada cuando se tiene un conjunto de variables dependientes en escala de intervalos y un conjunto de variables independientes. El procedimiento implica obtener un conjunto de ponderaciones para las variables dependientes e independientes que proporcione la correlacin nica mxima entre el conjunto de variables dependientes y el conjunto de variables independientes. Ejemplo. Para conocer la forma en que un conjunto de actitudes se relacionen con un conjunto de comportamiento.
17

Que hemos aprendido hasta hoy...


El anlisis multivariante nos permite analizar mltiples variables simultneamente para entender la relacin (distancia), correlacin, agrupar datos o simplificar la estructura de estos. Podemos definir dos tcnicas multivariantes, dependientes e interdependientes. En las tcnicas dependientes una o ms variables pueden identificarse como dependientes (el resultado estudiado o evento) y las dems variables como independientes.
18

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Bibliografa
Los mtodos estadsticos a utilizar dependen de si tenemos una o ms variables dependientes y el tipo de escala de los datos. Una variable dependiente: Regresin Mltiple, Anlisis Discriminante, Varianza y Covarianza, Medicin Conjunta. Mltiples variables dependientes: Correlacin Cannica Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

19

20

Crditos:

Lic. Ana Mara Lpez Navarro

21

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Anlisis multivariante
Tcnicas Multivariantes

AM04003-Anlisis e interpretacin de resultados


Sesin 19. Anlisis multivariante: tcnicas interdependientes

Tcnicas de Dependencia
Una Variable Dependiente

Tcnicas de Interdependencia
Interdependencia variables Semejanza entre objetos

Mas de una variable dependiente

Regresin Mltiple Correlacin Discriminante Cannica Medicin Conjunta Varianza y Covarianza


1

Anlisis Conglomerado Factor Comn Escala Multidimensional


2

Tcnicas interdependientes
No hace diferencias entre variables dependientes e independientes, analiza el conjunto completo de la interrelacin de las variables. Enfoque en variables Anlisis Factor Comn Enfoque en objetos Anlisis Conglomerado (Cluster) Escalas Multidimensionales

Anlisis de factor comn


Procedimiento que selecciona un gran nmero de variables u objetos y se investiga si tienen un numero pequeo de factores en comn que expliquen su intercorrelacin. Pasos: 1. Matriz de correlacin entre variables: Factor R. correlaciones entre variables Factor Q. correlacin entre casos 2. Extraccin de factores de la matiz de correlacin. 3. Rotacin de factores iniciales.
3 4

Anlisis de factor comn Ejemplo


Matriz de correlacin
X1 X1 X2 X3 X4 1.00 X2 0.85 1.00 X3 0.35 0.95 1.00 X4 0.20 0.15 0.75 1.00

En este ejemplo se tienen 4 variables y mediante la matriz de correlaciones se identificaron 2 factores (A y B)

Las cargas de la matriz de factores miden cules variables estn involucradas en qu patrn factorial, hasta qu grado y en qu direccin. (se lee como correlacin). Se le asigna a cada factor un nombre creativo que identifique el conjunto de variables.

Interpretacin de factores
Factor A (Innovadores) X1, X3, x4

Rotacin de Factores
Variable X1 X2 X3 X4 A .63 .48 .70 .76 B .38 .53 .26 -.54

Factor B (seguidores)

X2

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Anlisis conglomerado
El objetivo es clasificar una muestra de entidades (personas u objetos) en un nmero pequeo de grupos mutuamente excluyentes basados en similitudes entre las entidades. En el anlisis conglomerado, a diferencia del anlisis discriminante, los grupos no estn pre-definidos. Por consiguiente, se usa la tcnica para identificar los grupos de casos u observaciones relativamente homogneos.

Anlisis conglomerado Ejemplo


Se utiliza en: Segmentacin de Mercado, definicin del mercado meta, posicionamiento de productos y desarrollo de nuevos productos.
Dendograma.

Se mide las distancia entre las similutues/diferencias de los objetos o de la matriz de correlacin para hacer Agrupamientos.

Objeto 1 Objeto 2 Objeto 3 Objeto 4 Objeto 3 Objeto 6

Distancia
7 8

Escala multidimensional MDS


Obtiene las dimensiones de los juicios de los encuestados sobre la similitud o preferencias de los productos transformndolos en distancias. Se utilizan mapas preceptales de dos o ms dimensiones para tener un diagrama visual de las preferencias y percepciones. Se utiliza en preferencias por marcas o tiendas.

Escala multidimensional MDS Ejemplo


MDS Anlisis para los refrescos: Coca Cola, Pepsi, Big Cola, Fanta, Sprite Variables que los consumidores clasificaron en 6 atributos: Buen sabor, Refrescante, Alta calidad, Alto contenido de azcar, Quita la sed, Barato. MDS muestra la relacin entre las variables colocndolas en una espacio multidimensional. Con estas dimensiones, las cuales fueron definidas por los atributos de los refrescos, el MDS ilustra la posicin de los refrescos en la mente del consumidor.
9 10

Mapa perceptual refrescos Ejemplo


Barato

Que hemos aprendido hasta hoy...


El anlisis multivariante nos permite analizar mltiples variables simultneamente para entender la relacin (distancia), correlacin, agrupar datos o simplificar la estructura de stos. Podemos definir dos tcnicas multivariantes, dependientes e interdependientes.

BIG COLA

Alto en azcar

FANTA

Buen sabor

COCA COLA PEPSI


Alta calidad

Refrescante

SPRITE

Quita la sed 11

Las tcnicas interdependientes analizan el conjunto completo de la interdependencia de las variables, sin distinguir variables dependientes.
12

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Bibliografa
Se puede clasificar si se tiene enfoque a objetos o a variables, los mtodos estadsticos para las tcnicas interdependientes estn en funcin de esta clasificacin. Enfoque en variables: Anlisis de Factor Comn Enfoque en objetos: Anlisis Conglomerado (Cluster), Escalas Multidimensionales MDS Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

13

14

Crditos:

Lic. Ana Mara Lpez Navarro

15

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006.

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Qu es un reporte de investigacin...
Un documento escrito y/o una presentacin oral basada en la documentacin escrita que comunica el propsito, los objetivos, el alcance, la hiptesis, la metodologa, los hallazgos, las limitaciones y finalmente las recomendaciones del proyecto de investigacin. Es el ultimo paso del proceso de la investigacin de mercados. Es ms que un resumen de lo investigado, es un registro del proceso de investigacin.

AM04003-Anlisis e interpretacin de resultados


Sesin 20. Presentacin de resultados

Proceso de preparacin del reporte


Definicin del problema Diseo de investigacin Metodologa Anlisis de Datos

Consideraciones para la elaboracin del Informe escrito


Considerar la audiencia objetivo Empezar con lo simple Definir trminos tcnicos Utilizar palabras sencillas que conozcan los lectores Utilizar ayudas grficas o visuales Facilitar la lectura de cifras, utilizando porcentajes, redondeo, rangos, etc. Tener en cuenta las necesidades de informacin Asegurar la relacin de los hallazgos con los objetivos gerenciales. Entender la informacin y dar conclusiones interpretativas de stas.

Antes del reporte escrito

Interpretacin de los hallazgos

Preparacin del Informe

Reporte Escrito

Presentacin Oral
Despus del Reporte Escrito

SEGUIMIENTO Lectura por parte del cliente

Ser conciso y preciso Seleccionar la informacin de manera de no meterse en detalles, pero si enfocarse en las necesidades de informacin al momento de redactar el informe. En ocasiones una imagen o grfica dice ms que mil palabras. No repetir informacin innecesaria. Objetividad No sesgar ni favorecer la informacin, debe presentarse los hallazgos y defender su validez en caso necesario.

Comunicacin Definir un estilo de redaccin considerando: Lenguaje de negocios, breve Palabras y frases cortas Ser conciso Apariencia (utilizacin de espacios) Informacin estadstica visual Utilizar tiempo presente Voz activa No modismos Colocar citas de los encuestados

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Formato del informe escrito


Portada Tabla de contenido ndice de tablas ( grficas, imgenes, figuras, etc) Resumen ejecutivo Cuerpo del informe Conclusiones y recomendaciones Apndice

Portada
Titulo que trasmita la esencia del estudio, atractivo que invite y despierte el inters por la lectura Fecha Organizacin o persona que lo emite o presenta Organizacin o personas a quien va dirigido

Tabla de contenido Secuencial de los temas que se cubren en el informe y paginacin Objetivo. Ayudar en la identificacin rpida de los temas de inters ndice de tablas Puede ir junto con la tabla de contenido o por separado. Contiene los ttulos y la paginacin de todos los apoyos visuales incluidos.

Resumen ejecutivo Abreviacin o sntesis de los aspectos importantes de la investigacin. Debe tener los hallazgos de mayor impacto, ya que algunos ejecutivos solo es lo que leen del informe, deben facilitar el emprender una accin. Debe incluir: Objetivos de la investigacin Naturaleza del problema de decisin Resultados Conclusiones (opiniones basadas en la investigacin) Recomendaciones

Cuerpo del informe Introduccin Informacin bsica del proyecto, naturaleza del problema de decisin y objetivos. Metodologa Describir la naturaleza del diseo de la investigacin, plan muestral, procedimiento de recoleccin y anlisis de datos. Tipo de investigacin exploratoria o concluyente, especificar las fuentes de datos, el mtodo de recoleccin. Es un resumen de los aspectos tcnicos que desarrolla la confiabilidad de la investigacin.

Cuerpo del informe Resultados Flujo lgico de informacin para el propsito de toma de decisiones. Limitaciones Apartado cuya finalidad es permitir al lector juzgar la validez. Entre las limitaciones se involucran las insuficiencias del muestreo.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Conclusiones Relacin de los hallazgos de la investigacin con las necesidades de informacin, pueden formularse recomendaciones. Apndice Material no esencial, pero relacionado con el objeto de estudio, tal como formatos de recoleccin, detalles del plan de muestreo, estimativos, instrucciones, estadsticas.

Presentacin de los datos


Se utilizan apoyos visuales como grficas o tablas para la presentacin de datos cuantitativos o procesos tcnicos. Elementos de los apoyos visuales: Nmero de la tabla o figura Ttulo del contenido de la tabla Ttulos horizontales y verticales Organizacin Bases de las mediciones Notas de pie de pgina

Tipos de Presentacin de los datos


Tabular Presentacin numrica de datos. Grficas Presentacin de datos (nmeros, tendencias y relaciones) en trminos de tamao interpretados visualmente. Las ms utilizadas son: Graficas de pastel (representa relaciones proporcionales). Graficas de barras (representa magnitud). Graficas de lnea (representa tendencias) (histograma, polgono de frecuencia, de barras). Mapas geogrficos o perceptuales Representan ubicacin relativa y/o dimensiones. Pictogramas Despliegue de datos con imgenes o smbolos pequeos.

Presentacin Oral
La clave para una presentacin eficaz es la preparacin. Cuidar el lenguaje corporal. Principio Dgales: 1) Dgales que va a decir. 2) Dgales. 3) Dgales que les dijo. Principio SIDI: Hgalo simple y directo. Antes de la presentacin Verificar equipo y material a utilizar. Tener un plan de contingencia en caso de falla de equipo. Analizar la audiencia, como ser la reaccin, se debe comenzar con ideas en comn. Practicar la presentacin varias veces.

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006

Universidad Tec Milenio: Profesional AM04003 Anlisis e interpretacin de resultados

Durante la presentacin Empezar con una visin general. No dar la espalda a la audiencia. Evitar leer un guin, dirigirse a las personas. Utilizar notas para evitar olvidar algn punto y dar una secuencia ordenada a la presentacin. Utilizar apoyos visuales, simples y fciles de interpretar. Evitar poses o movimientos innecesarios. Evitar muletillas o modismos. Preguntar si quedo alguna duda (repetir la pregunta, no inventar respuestas, ser breve).

Bibliografa
Malhotra, Naresh. Investigacin de Mercados, un enfoque prctico. Mxico: Editorial Pearson Educacin 2004, (ISBN 970-26-0491-5). Mc Daniel, Carl. Investigacin de Mercados. Mxico: Editorial Thomson 2005, (ISBN 970-686-366-4). Kinnear, Thomas. Investigacin de Mercados, un enfoque aplicado. Mxico: Editorial Mc Graw Hill 1996, (ISBN 958-600-124-5).

Crditos:

Lic. Ana Mara Lpez Navarro

D.R. Universidad TecMilenio Lzaro Crdenas #2610 Col. Del Paseo Residencial Monterrey, N.L., 2006

S-ar putea să vă placă și