Sunteți pe pagina 1din 57

Probabilidad

¿Qué es probabilidad?

• Una probabilidad (p) es una especificación de la


frecuencia probable de que ocurra un evento de interés
particular entre un gran número de ensayos.

• Calculo de una probabilidad


# 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑒𝑥𝑖𝑡𝑜𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
• 𝑝 𝑑𝑒 é𝑥𝑖𝑡𝑜 =
# 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
• Donde p[de éxito]= probabilidad del “evento de
interés”
¿Qué es probabilidad?

• Ejemplo1: al lanzar una moneda ¿Cuál es la


probabilidad de obtener cara?

• Con una moneda hay dos resultados posibles, y cara es


uno de ellos. Por tanto

# 𝑑𝑒 𝑐𝑎𝑟𝑎𝑠 1
• 𝑝 𝑐𝑎𝑟𝑎 = = = 0.5000
# 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 2
¿Qué es probabilidad?

• Ejemplo 2: al sacar una sola carta al azar de un mazo


estándar de juego de 52 cartas bien revueltas:

# 𝑟𝑒𝑦𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 4
a) 𝑝 𝑟𝑒𝑦 = # 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑟𝑡𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 = 52 0.0769
# 𝑑𝑒 7 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 4
b) 𝑝 7 = # 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑟𝑡𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜
=
52
= 0.0769
# 𝑑𝑒 𝑐𝑜𝑟𝑎𝑧𝑜𝑛𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 13
c) 𝑝 𝑐𝑜𝑟𝑎𝑧𝑜𝑛𝑒𝑠 = # 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑟𝑡𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜
=
52
= 0.2500
Regla de probabilidad 1: las probabilidades
siempre varían entre 0 y 1.
• Como las probabilidades son proporciones, su
límite numérico inferior es cero (el evento no puede
ocurrir) y su límite numérico superior es uno (el
evento debe ocurrir).
• Algunos eventos tienen una probabilidad de cero
ocurrencia, otras ocurren con una probabilidad del
100 % siempre suceden, sin embargo muchos
eventos no están tan definidos, sus probabilidades
de ocurrencia están en alguna parte entre nunca y
siempre.
Regla de probabilidad 2: la regla de la adición
para eventos alternativos.
• Establece que la probabilidad de eventos alternativos es
igual a la suma de las probabilidades de los eventos
individuales.
• En otras palabras, imaginemos, cual es la probabilidad de
sacar un rey o un as de un mazo de cartas?
• 𝑝 𝑟𝑒𝑦 𝑜 𝑎𝑠 = 𝑝 𝑟𝑒𝑦 + 𝑝 𝑎𝑠

# 𝑑𝑒 𝑟𝑒𝑦𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 # 𝑑𝑒 𝑎𝑠𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜


• 𝑝 𝑟𝑒𝑦 𝑜 𝑎𝑠 = +
# 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑟𝑡𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 # 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑟𝑡𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜

4 4 8
• 𝑝 𝑟𝑒𝑦 𝑜 𝑎𝑠 = + = = 0.1538
52 52 52
Regla de probabilidad 2: la regla de la adición
para eventos alternativos.
• Si el resultado lo multiplicamos por 100 obtenemos el
porcentaje. (0.1538)(100)= 15%
• Un truco simple a seguir con la regla de la adición es
reemplazar la palabra o con un signo de adición, +.
• Usaremos el símbolo P para representar la probabilidad
de éxito y Q para representar la probabilidad de fracaso.
La probabilidad de éxito o fracaso debe ser 1.00; es decir,
P+Q=1.
• Q=1-P
• De manera similar P=1-Q
Regla de probabilidad 3: ajuste para las
ocurrencias conjuntas
• Cuando tenemos un evento que tiene doble éxito o une
dos aspectos de éxito lo llamamos ocurrencia conjunta.
Para calcular la probabilidad correcta debemos restar cada
ocurrencia conjunta para eliminar este doble conteo.
• Ejemplo:
• 𝑝 𝑟𝑒𝑦 𝑜 𝑟𝑒𝑖𝑛𝑎 𝑜 𝑐𝑜𝑟𝑎𝑧𝑜𝑛 = 𝑝 𝑟𝑒𝑦 + 𝑝 𝑟𝑒𝑖𝑛𝑎 + 𝑝 𝑐𝑜𝑟𝑎𝑧𝑜𝑛

# 𝑑𝑒 𝑟𝑒𝑦𝑒𝑠+#𝑑𝑒 𝑟𝑒𝑖𝑛𝑎𝑠+#𝑑𝑒 𝑐𝑜𝑟𝑎𝑧𝑜𝑛𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 21


• = = = 0.4038
# 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑟𝑡𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 52

• Esto es incorrecto
Regla de probabilidad 3: ajuste para las ocurrencias
conjuntas

• 𝑝 𝑟𝑒𝑦 𝑜 𝑟𝑒𝑖𝑛𝑎 𝑜 𝑐𝑜𝑟𝑎𝑧𝑜𝑛 = 𝑝 𝑟𝑒𝑦 + 𝑝 𝑟𝑒𝑖𝑛𝑎 + 𝑝 𝑐𝑜𝑟𝑎𝑧𝑜𝑛 −


𝑝 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑎𝑠

# 𝑑𝑒 𝑟𝑒𝑦𝑒𝑠+# 𝑑𝑒 𝑟𝑒𝑖𝑛𝑎𝑠+# 𝑑𝑒 𝑐𝑜𝑟𝑎𝑧𝑜𝑛𝑒𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 2 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑎𝑠


• = −
# 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑟𝑡𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜 # 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑟𝑡𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑚𝑎𝑧𝑜

21 2 19
• = − = = 0.3654
52 52 52
Regla de probabilidad 4: la regla multiplicativa para
eventos compuestos

• A los eventos con partes múltiples los denominamos


eventos compuestos. La regla multiplicativa para eventos
compuestos estipula que la probabilidad de un evento
compuesto es igual a la multiplicación de las probabilidades
de las partes separadas del evento.
• Ejemplo: Como podríamos sacar un as, regresarlo, barajear
una vez mas y sacar un as de nuevo.

4 4 16
• 𝑝 𝑎𝑠 𝑙𝑢𝑒𝑔𝑜 𝑎𝑠 = 𝑝 𝑎𝑠 ∙ 𝑝 𝑎𝑠 = ∙ = = 0.0059
52 52 2704

• Un truco simple es reemplazar la palabra “y” con el signo de


multiplicación, ˙
Regla de probabilidad 4: la regla multiplicativa para
eventos compuestos
Regla de probabilidad 5: explicación del reemplazo
para eventos compuestos.

• Cuando ilustramos la regla 4, estipulamos que la


primera carta obtenida seria devuelta al mazo antes de
sacar la segunda.
4 4 16
• 𝑝 𝑎𝑠 𝑙𝑢𝑒𝑔𝑜 𝑎𝑠 = 𝑝 𝑎𝑠 ∙ 𝑝 𝑎𝑠 = ∙ = = 0.0059
52 52 2704

• Pero que pasaría si no se remplaza?

4 3 12
• 𝑝 𝑎𝑠 𝑙𝑢𝑒𝑔𝑜 𝑎𝑠 = 𝑝 𝑎𝑠 ∙ 𝑝 𝑎𝑠 = ∙ = = 0.0045
52 51 2652
Uso de la curva normal como distribución
de probabilidades
• Como pudimos observar, la desviación estándar se
utiliza para examinar la forma en que las puntuaciones
se dispersan en una distribución y para comparar la
dispersión de dos o mas muestras.

• También podemos calcular puntuaciones estandarizadas


(puntuaciones z) y emplearlas para determinar la
proporción (p) de puntuaciones de una distribución que
cae entre dos puntuaciones en la distribución.
Uso de la curva normal como una
distribución de probabilidades
• Pensamiento proporcional respecto de un grupo
de casos y casos únicos.
• Con una sola variable de intervalo/razón con la que
tenemos motivos para creer que está normalmente
distribuida en su población, podemos calcular
puntuaciones estandarizadas (puntuaciones Z) y
emplearlas para determinar la proporción (p) de
puntuaciones de una distribución que cae entre dos
puntuaciones en la distribución
Uso de la curva normal como distribución
de probabilidades
Uso de la curva normal como distribución
de probabilidades
• El procedimiento anterior se llama “partición de áreas
bajo la curva” y nos permite identificar parte de la
curva y calcular la proporción (p) de la curva total que
dicha parte representa.

• También nos ofrece una interpretación probabilística


(p) que describe la probabilidad de una sola extracción
al azar de un sujeto de esa población.
Uso de la curva normal como una
distribución de probabilidades

• De hecho, con la ayuda de una tabla estadística


podemos calcular puntuaciones Z y utilizarlas para
determinar cualquier área bajo la curva. Este
procedimiento se denomina "partición de áreas bajo la
curva normal", y en breve haremos algunas particiones
Partición de áreas bajo la curva
normal
• La partición de un área bajo la curva normal consiste en
identificar parte de la curva y calcular la proporción (p)
de la curva total que representa dicha parte.
• En este punto debemos enfatizar una cosa: la partición
de áreas empleando la media, la desviación estándar y
las puntuaciones Z, y la curva de distribución normal
sólo funciona si tenemos una razón para creer que las
puntuaciones en una población están normalmente
distribuidas.
Partición de áreas bajo la curva
normal
• La tabla de la curva normal proporciona lo necesario
para calcular con exactitud qué extensión del área está
bajo la curva entre dos puntuaciones cualesquiera o a
los lados de cualquier puntuación individual.
• Recuerda que un área bajo la curva representa una
proporción (p) de la población entre las puntuaciones
brutas correspondientes a esa sección de la curva. Estas
p se calculan con cuatro lugares decimales.
Partición de áreas bajo la curva
normal
Cómo dividir áreas bajo la curva
normal
1. Asegúrate de que Ja variable es de un nivel de
medición de intervalo/razón y que la distribución de
puntuaciones se supone ser normal.
2. Calcula la media y la desviación estándar de X (si estos
estadísticos no se proporcionan en el ejercicio).
3. Traza la curva normal y marca la ubicación de la media
y 3 desviaciones estándar en ambos lados de ella.
Marca en Ja curva las puntuaciones Z (es decir, de -3
SD a +3 SD).
Cómo dividir áreas bajo la curva
normal
4. Marca la curva para puntuaciones X. Inicia sumando la
desviación estándar a la media para obtener la puntuación
X que cae 1 desviación estándar arriba de la media.
5. Identifica y sombrea el área objetivo, p, según lo determine
el ejercicio. Con referencia a la tabla de la curva normal,
determina si el área objetivo es un área del tipo B o una
columna del tipo C. Calcula las puntuaciones Z para las
puntuaciones X estipuladas en el ejercicio.
6. Consulta la tabla de la curva normal para proporciones (p)
bajo la curva.
Ejemplo
1. Supongamos que hemos realizado entrevistas a 500 mujeres que
recibieron pagos de asistencia de ayuda familiar.
Ejemplo
1. Graficar
Problema tipo 1: p [de casos desde la media hasta una
puntuación X]

• Encuentra la proporción (p) de casos entre la media y


alguna puntuación X.
• Plan de solución:
4. Traza y marca la curva normal para la variable X; sombrea
el área objetivo (p) desde la media hacia la puntuación X
especificada
5. Calcula la puntuación Z para esa puntuación X; ubica la
puntuación Z en la columna A de la tabla de la curva
normal
6. Obtén p de la columna B; reporta la respuesta en términos
comunes.
Problema tipo 1: p [de casos desde la media hasta una
puntuación X]

1. Ejemplo: Donde X= puntuación de autoestima, ¿qué


porcentaje de destinatarias de asistencia tienen
puntuaciones de autoestima entre 5 y 8?
Problema tipo 1: p [de casos desde la media hasta una
puntuación X]

2. La columna B en la tabla de la curva normal


proporciona áreas bajo la curva desde media hacia
cualquier puntuación Z.
• Al trazar la curva, podemos ver que el área objetivo está
limitada por las medias; por tanto, p es un área "tipo
columna B" . El paso siguiente al resolver problemas es
para transformar una puntuación bruta en puntuación
Z:
Problema tipo 1: p [de casos desde la media hasta una
puntuación X]

3. Una destinataria de asistencia con puntuación de 5 y 8


en autoestima cae 1.50 SD debajo de la media la
puntuación Z negativa de -1.50; ella está entre aquéllas
con autoestima un tanto baja. la columna A de la tabla
de la curva normal, encuentra 1.5 y trátela como -1.5.
Consulta columna B y reporta la respuesta como
sigue:
Problema tipo 1: p [de casos desde la media
hasta una puntuación X]

• Por último, responde la cuestión en términos


comunes: poco más de 43% de las destinatarias de
asistencia tuvieron una puntuación entre 5 y 8 en la
medida de autoestima.
Problema tipo 2: p [de casos mayores que una
puntuación X]
• Determine la proporción (p) de casos mayores que una
puntuación X específica.
• Plan de solución:
4. Traza y marca la curva normal para la variable X;
sombrea el área objetivo (p) desde la puntuación X
hacia la cola en la dirección positiva o "mayor que";
5. calcula la puntuación Z y ubica en la columna A;
6. obtén p de la columna C.
Problema tipo 2: p [de casos mayores que una
puntuación X]
• Ejemplo: Donde X= puntuación de autoestima, ¿qué
proporción de recipientes de asistencia tuvieron una
puntuación de 13 o mayor en la escala de autoestima?
Problema tipo 2: p [de casos mayores que una
puntuación X]
• Calcula la puntuación Z para X= 13

• Encuentra 2.50 en Ja columna A de la tabla de la curva


normal. Consulta la columna C y reporta la proporción
del área mayor que o igual a 13, como sigue:
Problema tipo 2: p [de casos mayores que una
puntuación X]

• Responde la cuestión en términos comunes: sólo 62 de


cada 10 000 recipientes de asistencia tuvieron una
puntuación de 13 o mayor en la escala de autoestima.
(En una muestra de 500 esto sería casi 3 personas.)
Problema tipo 3: p [casos entre dos puntuaciones X
en lados distintos de la
media]
• Determina la proporción de casos entre dos
puntuaciones X, una debajo de la media y la otra aniba
de la media.
• Plan de solución: Traza y marca la curva normal;
sombrea el área objetivo (p) desde una puntuación X
hasta la otra
• calcula las puntuaciones Z para las dos puntuaciones X;
ubícalas en la columna A de la tabla de la curva normal
• obtén las áreas PA y PB (trazadas abajo) de la columna
B; calcula el área (p), que será la suma de PA y PB.
Problema tipo 3: p [casos entre dos puntuaciones X
en lados distintos de la
media]
• Ejemplo: Donde X = puntuación de autoestima, ¿qué
proporción de las destinatarias de asistencia tuvieron una
puntuación entre 4 y 10 en la escala de autoestima?
(Sugerencia de estudio: sólo trazando la curva podemos ver
fácilmente que este problema implica dos áreas adjuntas a la
media: dos áreas de tipo columna B.) Sombrea el área
objetivo, p:
Problema tipo 3: p [casos entre dos puntuaciones X
en lados distintos de la
media]
• Calcula las puntuaciones Z para X= 4 y X= 10:

• Ahora utiliza la tabla de la curva normal. En la columna A


encuentra cada una de las puntuaciones Z. Consulta la
columna B para obtener las áreas PA y PB y reporta la
respuesta como sigue:
Problema tipo 3: p [casos entre dos puntuaciones X
en lados distintos de la
media]

• Responde la cuestión en términos comunes: casi 82% de las


destinatarias de asistencia tiene puntuaciones de autoestima
entre 4 y 10. Si se elige al azar un nombre entre los
expediente de casos, hay una posibilidad de 82% de que esta
persona tendrá una puntuación de autoestima entre 4 y 10.
Problema tipo 4:p [de casos entre dos
puntuaciones X en un lado de la media]
• Determina la proporción (p) de casos entre dos
puntuaciones X en un lado de la media.
• Plan de solución: Traza y marca la curva; sombrea el
área objetivo (p) de una puntuación. X a la otra;
• calcula las puntuaciones Z y ubícalas en la columna A
de la tabla de la curva normal;
• obtén las áreas PA y PB de la columna B; calcula el área,
que es PA menos PB.
Problema tipo 4:p [de casos entre dos
puntuaciones X en un lado de la media]
• Ejemplo: ¿Qué proporción de las destinatarias de
asistencia tuvieron una puntuación entre 11 y 13 en la
escala de autoestima? En la muestra de 500, ¿cuántas
destinatarias de asistencia son?
• (Sugerencia de estudio: al trazar la curva, observamos
que el área objetivo no toca la media. Por tanto, no es
un área tipo columna B en la tabla de la curva normal;
ni es un área con forma de cola, tipo columna C. Por
tanto, para resolver esta ilustración, debemos calcular p
de manera indirecta.)
Problema tipo 4:p [de casos entre dos
puntuaciones X en un lado de la media]
4. Sombrea el área objetivo, p:
Problema tipo 4:p [de casos entre dos
puntuaciones X en un lado de la media]
5. Calcula las puntuaciones Z para X= 13 y X= 11:

• En la columna A encuentra cada una de las puntuaciones Z.


Consulta la columna B para obtener las áreas PA y PB, y
reporta la respuesta como sigue:
Problema tipo 4:p [de casos entre dos
puntuaciones X en un lado de la media]
6. El número de destinatarias de asistencia con puntuación
entre 11 y 13 en la escala de autoestima es:
Ejemplo
Ejemplo
• El tiempo promedio que los estudiantes demoran en llegar a la
universidad es de 35 minutos, con una desviación estándar de 10
min.
• Que % de los estudiantes llegan entre 18 y 41 minutos?
Ejemplo
• El tiempo promedio que los estudiantes demoran en llegar a la
universidad es de 35 minutos, con una desviación estándar de 10
min.
• Que % de los estudiantes llegan a partir de los 28 minutos?
Ejemplo
• El tiempo promedio que los estudiantes demoran en llegar a la
universidad es de 35 minutos, con una desviación estándar de 10
min.
• Que % de los estudiantes llegan a partir de los 42,5 minutos?
Datos bivariados
• Se llaman datos bivariados a aquellos que
provienen de dos variable medidas al mismo
tiempo sobre cada individuo.
• Por ejemplo: Edad y Género, Escolaridad e
Ingreso, Peso y Estatura, etc.
• Dependiendo de la naturaleza de cada variable se
da el tratamiento a los datos.
Datos bivariados
• Cuando los datos bivariados provienen de dos
variables cualitativas, resulta conveniente
organizarlos en una Tabla de Contingencia.
• Las columnas de esta tabla representan a las
categorías de la variable 1 y los renglones
representan a las categorías de la variable 2; la
frecuencia aparecerá en las celdas centrales de la
tabla.
Dos variables Cualitativas
• Analicemos este caso con un ejemplo.
• La siguiente tabla muestra el número de pacientes
hospitalizados por la misma enfermedad en los últimos
6 meses.
Dos variables Cualitativas
• Identifica las dos variables: ________ y _________ .
• El número 44 del primer renglón y la segunda columna
significa que:
• “44 pacientes eran hombres y estuvieron hospitalizados
en el hospital Médica Sur”
• El número 52 del tercer renglón y la tercera columna
significa que:
Dos variables Cualitativas
• Al sumar las frecuencias absolutas de cada fila y de cada
columna, se obtiene la frecuencia absoluta marginal.
Dos variables Cualitativas
• ¿Que información obtenemos de estos valores?
• “70 pacientes (en total) estuvieron hospitalizados en el
hospital Los Ángeles”
• “189 pacientes (en total) eran mujeres”
• “_____ pacientes (en total) estuvieron hospitalizados en
el 20 de Noviembre”
• “_____ pacientes (en total) eran mujeres”
• “_____ pacientes (en total) estuvieron hospitalizados en
________________” etc.
Dos variables Cualitativas
• Ahora, ¿podríamos saber sobre cuántos pacientes se
hizo el estudio?

• Claro!, tendríamos que sumar todas las celdas, lo que es


equivalente a sumar la última columna o el último
renglón que agregamos, y concluimos que: “Se hizo el
estudio con n = _____ pacientes”
Frecuencias relativas
• Si dividimos todas las celdas de la tabla sobre el tamaño
de muestra (total de pacientes), obtenemos una nueva
tabla, la cual nos proporciona la Frecuencia Relativa
respecto al total.
Frecuencias relativas
• ¿Qué porcentaje de pacientes eran hombres y
estuvieron hospitalizadas en Los Ángeles?

• Podemos responder la pregunta anterior utilizando la


primera celda de la tabla:

• “El 10.58% de los pacientes eran hombres y estuvieron


hospitalizados en Los Ángeles”
Frecuencias relativas
• Por otro lado, si dividimos los valores de cada renglón
por el total del mismo, obtenemos la Frecuencia
Relativa respecto al Genero.
Frecuencias relativas
• De aquí, obtenemos que:
• “El 23.84% de los pacientes hombres estuvieron
en el hospital Los Ángeles”
• “El 26.45% de los pacientes mujeres estuvieron
en el hospital Médica Sur”
• De los pacientes mujeres, el ________% estuvo
en el hospital López Mateos”

S-ar putea să vă placă și