Sunteți pe pagina 1din 6

Programa para la inmersión a la Educación Superior - PIES

Departamento de Ciencias Básicas


Área: Estadı́stica
Guı́a # 4
Espacio académico: MÉTODOS ESTADÍSTICOS

Elaborado por: Tatiana Jiménez (tjimenez@unisalle.edu.co)

Fecha de elaboración: Julio 2018


Fecha de actualización: 24 de enero de 2019

Tema: Tablas cruzadas

INTENCIONALIDAD

Se espera que el estudiante utilice una tabulación cruzada para representar la relaciones entre variables
de tipo cualitativo. A su vez, que identifique frecuencias marginales, conjuntas y condicionales.

CONCEPTOS CLAVE

Una tabla cruzada, también llamada tabla de contingencia, relaciona la cantodad de observaciones
correspondientes a cada combinación de valores de dos variables categóricas (nominales u ordinales).

Ejemplo: Los registros de los siguientes datos proporcionan nombres de individuos y una indicación
de si ellos han consultado un optómetra en el último año. Compile los datos en una tabulación cruzada,
utilizando como variables: Sexo (Femenino, Masculino) y Consulta (Si, No).
David-Si Pedro-No Cristina-No Maria-Si
Elizabeth-No Antonio-No Sean-Si Manuel-No
Miguel-No Samuel-Si Arturo-No Cyntia-No
Eudora-Si Leroy-No Bernabé-Si Vanessa-Si
Enrique-No Paula-Si Ernesto-No Sabrina-No
Gary-Si Elena-No Marco-Si Kevin-No
Bárbara-No Sonia-Si Roberto-No Cathy-Si
Andrea-No Andrés-Si Nancy-No Laura-Si
Donald-Si Carolina-No Rebeca-Si René-No
Kimberly-No Ginger-Si Débora-No Rafael-No
Se construye una tabla de 2 filas por dos columnas, en la cual las filas representan las categorı́as de
respuesta para SEXO y las columnas representan las categorı́as de respuesta para Asistencia, de tal manera
que se generan cuatro posibles combinaciones. De esta manera, se registra en cada celda la cantidad de
individuos que cumplen con las dos caracterı́sticas a la vez.

Si No
Femenino
Masculino
Si No
Femenino 11 9
Masculino 12 8

Las distribuciones marginales son las distribuciones unidimensionales que nos informan el número de
observaciones para cada categorı́a de una de las variables,(prescindiendo de la información sobre los valores
de las demás variables). Se obtiene calculando el total para cada una de las categorı́as de respuesta.

Si No Total SEXO
Femenino 11 9 20
Masculino 12 8 20
Total ASISTENCIA 23 17 40

En el caso del ejemplo, la comluna Total SEXO representa la distribución marginal para la variable
SEXO y la fila Total ASISTENCIA representa la distribución marginal para la variable ASISTENCIA.

A partir de la construcción anterior, responda las siguientes preguntas:

1. ¿Qué porcentaje de sujetos son hombres?

2. ¿Qué porcentaje de sujetos consultaron a un optómetra en el último año?

3. ¿Qué porcentaje de hombres consultaron a un optómetra en el último año?

4. ¿Qué porcentje de mujeres vieron aun optómetra el último año?

Otro aspecto importante de las tablas cruzadas es su aplicación para identificar la posible relación entre
dos variables cualitativas. Esta relación puede evidenciarse calculando procentajes apropiados a partir de
los conteos dados. Estos porcentaje definen una distribución condicional.

Como ejemplo se calcula la distribución condicional de la ASISTENCIA sobre el SEXO, en este caso se
quiere verificar que tento hombres como mujeres tienen la misma distribución de asistencia al optómetra.

Para calcular esta frecuancia relativa condicionada, el conteo de cada celda se divide sobre el conteo
marginal de cada fila.
Si No Total SEXO
Femenino 55 % 45 % 100 %
Masculino 60 % 40 % 100 %

¿Cómo leerı́a los valores en esta tabla?

También se puede construir la distribución condicional del SEXO sobre la ASISTENCIA. En este caso
querriamos verificar que tanto hombres como mujeres asisten o no de la misma manera a la consulta con el
optómetra.

Si No
Femenino 48 % 53 %
Masculino 52 % 47 %
Total ASISTENCIA 100 % 100 %

¿Cómo leerı́a los resultados de esta tabla?


Con los porcentajes de esta tabla se puede generar un diagrama de barras comparativo, de manera que se
ilustre gráficamente la posible relación entre las dos variables.
EJERCICIOS PROPUESTOS

SELECCIÓN MÚLTIPLE CON ÚNICA RESPUESTA


The National Longitudinal Study of Adolescent Health interviewed several thousand teens (grades 7 to 12).
One question asked was ”What do you think are the chances you will be married in the next 10 years?”
Here is a two-way table of the responses by sex:
Opinion Female Male
Almost no chance 119 103
Some chance but probably not 150 171
A 50-50 chance 447 512
A good chance 735 710
Almost certain 1174 756
Exercises 1 to 9 are based on this table.

1. How many individuals are described by this table?


(a) 2625 (b) 4877 (c) Need more information

2. How many females were among the respondents?


(a) 2625 (b) 4877 (c) Need more information

3. The percent of females among the respondents was


(a) about 46 %. (b) about 54 %. (c) about 86 %.

4. Your percent from the previous exercise is part of


(a) the marginal distribution of sex.
(b) the marginal distribution of opinion about marriage.
(c) the conditional distribution of sex among adolescents with a given opinion.

5. What percent of females thought that they were almost certain to be married in the next 10 years?
(a) about 40 % (b) about 45 % (c) about 61 %

6. Your percent from the previous exercise is part of


(a) the marginal distribution of opinion about marriage.
(b) the conditional distribution of sex among those who thought they were almost certain to be
married.
(c) the conditional distribution of opinion about marriage among women.
7. What percent of those who thought they were almost certain to be married were female? (a) about
40 % (b) about 45 % (c) about 61 %
8. Your percent from the previous exercise is part of
(a) the marginal distribution of opinion about marriage.
(b) the conditional distribution of sex among those who thought they were almost certain to be
married.
(c) the conditional distribution of opinion about marriage among women.
9. A bar graph showing the conditional distribution of opinion among female respondents would have
(a) 2 bars. (b) 5 bars. (c) 10 bars.

EJERCICIO
En un esfuerzo para determinar si hay diferencias en las fuentes primarias de contaminación fecal en
diferentes localizaciones de l acuenca de Morro Bay, se recogieron n=623 especı́menes de agua en tres
posiciones primarias que pertenecı́an a la cuenca de Morro Bay. Se utilizaron técnicas de reconocimiento de
ADN para determinar el origen intestinal de la variedad E. coli dominante en cada espécimen de agua. La
siguiente tabla presenta un resumen de los conteos conjuntos encontrados.

Localización Pájaro Doméstico Granja Humano Mamı́fero


Chorro Creek 46 29 106 38 22
Los Osos Creek 79 56 323 63 26
Baywood 35 23 0 60 8

1. Construya las distribuciones marginales para cada una de las variables utilizadas en el estudio.
2. ¿Son los animales domésticos un problema mayor (respecto a la fuente) de E.coli en Chorro Creek o
en Baywood? Utilice la condicional adecuada y presente el diagrama de barras que le permita ilustrar
su respuesta.

Ayuda para RStudio:


BIBLIOGRAFÍA

Moore, D. S. (2007). The basic practice of statistics (Vol. 2). New York: WH Freeman.
Triola, M. F. (2012). Probabilidad y estadı́stica. Pearson Educación
Samuels, M. L., Witmer, J. A., Schaffner, A. A., & Portillo Garcı́a, J. (2012). Fundamentos de es-
tadı́sticas para las ciencias de la vida. Pearson Educacion.

S-ar putea să vă placă și