Documente Academic
Documente Profesional
Documente Cultură
APUNTES DE METODOLOGÍA DE LA
INVESTIGACIÓN ESTADÍSTICA II
TEORÍA DE CONJUNTOS
El estudio de la teoría de conjuntos nos permite recordar conceptos que serán
empleados a lo largo de los apuntes.
a) A U B = {a,b,c,d,e,f,g,h,i,j,k,o,p,q}
b) A ∩ B = {d,e,f,g}
c) A U C = {a,b,c,d,e,f,g,h,i,j,k,l,m,n}
d) C U B= { d,e,f,g,h,i,j,k,l,m,n,o,p,q,}
e) A ∩ C= {f,g,h,i}
f) C ∩ B= {f,g,j,k}
g) A∩B∩C={f,g}
h) A U C U C= {a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q}
i) (A U B U C)’= {r,s}
j) B’ = {a,b,c,h,i,l,m,n,r,s}
k) (A U B)’= {m,l,n,r,s}
l) A – B ={a,b,c,h,i }
m) B - C = {d,e,o,p,q}
3
UNIÓN
La unión de dos conjunto A y B es el conjunto que consta de todos los elementos
de A o B o de ambas si se indica mediante el símbolo U o sea AUB
INTERSECCIÓN
La intersección de dos conjuntos A y B es el conjunto que contiene todos los
elementos de A y de B, se indica por medio de o ser A∩B.
4
COMPLEMENTO
o
5
Resta A - B.
A menos B es el conjunto de todas los elementos que se encuentran en EL
conjunto A que no se encuentran en B o bien se toma el conjunto A y se eliminan
los elementos que son del comunes con B.
LEYES DE MORGAN.
a) (A U B)’ = ( A’) ∩ ( B’).
b) (A ∩ B)’= ( A’ ) U( B’)
(A ∩ B)’
c) A C B si y solo si A´ כּB´
6
EJEMPLOS
1.- Se les pidió a 100 comerciantes que dijeran que tipo de programa de televisión
preferían , se clasificaron de acuerdo al nivel de estudios de los comerciantes y al
tipo de programa preferido, especificar el número de elementos de cada conjunto.
F=60%
B=25%
N=15%
11 4 FB=14%
46
BN=10%
3 FBN=3%
7
24
5
Rh+ = 65
A = 25
B = 30 A B
AB = 10 20
10
15
15+10+20=45
►65-45=20 O RH+
8
Rh- = 10 A B
A=3 3
B=4
AB = 1
1
2
2+1+3=6
►10-6=4 O RH¯
9
ESTADÍSTICA DESCRIPTIVA
Datos. Es cualquier observación.
Los números son un dato, pero no todos los daros son numero. Ejemplo:
Numero 4,(2,10) ojos cafés, dolor severo. Se clasifican en:
Datos agrupados. Es un dato que se representa por intervalos ejemplo.(a,b);
(2,10).
Datos no agrupados. Es un dato que se representa por puntos ejemplo. A, 4, 10. -
2
EJEMPLO:
En el examen final de ANATOMÍA de un grupo de 30 estudiantes se obtuvieron las
siguientes calificaciones:
4,3,7,5,3,1,6,8,0,5,3,4,10, 0, 2,8,3,0,6,4,6,2,5,5,2,3,6,2,5,1
NO Frecuencia.
AGRUPADOS
AGRUPADOS f
0 III 3 0≤X<2 5
1 II 2 2≤X<4 9
2 IIII 4 4≤X<6 8
3 IIII 5 6≤X<8 5
4 III 3 8≤X<10 2
5 IIII 5 10≤X<12 1
6 IIII 4 30
7 I 1
8 II 2
9 0
10 I 1
30
FRECUENCIA ACUMULADA.
FRECUENCIA RELATIVA.
DATOS NO AGRUPADOS.
F. Frecuencia
Xi f.
Frecuencia frecuencia acumulada
(calificaciones) frecuencia
Acumulada relativa. relativa
0 3 3 3/30 3/30
1 2 5 2/30 5/30
2 4 9 4/30 9/30
3 5 14 5/30 14/30
4 3 17 3/30 17/30
5 5 22 5/30 22/30
6 4 26 4/30 26/30
7 1 27 1/30 27/30
8 2 29 2/30 29/30
9 0 29 0/30 29/30
10 1 30 1/30 30/30
Total 30 30/30
11
DATOS AGRUPADOS.
.
F . Frecuencia
# f
intervalo Frecuencia Frecuencia acumulada
intervalo frecuencia
acumulada relativa. relativa
EJEMPLOS:
DATOS NO AGRUPADOS.
# HIJOS f F
0 2 2 2/25 2/25
1 5 7 5/25 7/25
2 5 12 5/25 12/25
3 6 18 6/25 18/25
4 4 22 4/25 22/25
5 2 24 2/25 24/25
6 1 25 1/25 25/25
Total 25 25/25
12
#
INTERVALO f f
DATOS AGRUPADOS. INTERVALO
1 0≤X<2 7 7 7/25 7/25
2 2≤X<4 11 18 11/25 18/25
3 4≤X<6 6 24 6/25 24/25
4 6≤X<8 1 25 1/25 25/25
25 25/25
A 60 estudiantes se les toman sus respectivas presiones sanguíneas,
leídas en mmhg. Los resultados para la presión sanguínea sistólica son:
142,142,134,110,98,130,136,120,118,130,116,140,118,122,132,128,128,114,138,
104,116,110,100,128,128,124,140,108,146,130,116,114,152,118,140,128,
116,110,138,132,118,120,122,120,102,108,112,94,130,130,118,120,128,108,
120, 124, 110, 124, 132,118.
9 4,8
Construir la tabla de frecuencias para
10 8,4,0,8,8,2
datos agrupados y no agrupados.
11 6,4,2,4,0,8,6,8,0,6,0,8,6,8,0,8,8
12 8,8,8,0,0,8,8,8,0,4,4,0,2,4,2,0
13 4,8,0,0,0,6,8,0,2,2,2,0
14 2,2,0,0,0,6
NO AGRUPADOS. 15 2
PRESIÓN f F
94 1 1 1/60 1/60
98 1 2 1/60 2/60
100 1 3 1/60 3/60
102 1 4 1/60 4/60
104 1 5 1/60 5/60
108 3 8 3/60 8/60
110 4 12 4/60 12/60
112 1 13 1/60 13/60
114 2 15 2/60 15/60
116 4 19 4/60 19/60
118 6 25 6/60 25/60
120 5 30 5/60 30/60
122 2 32 2/60 32/60
124 3 35 3/60 35/60
128 6 41 6/60 41/60
130 5 46 5/60 46/60
132 3 49 3/60 49/60
134 1 50 1/60 50/60
136 1 51 1/60 51/60
138 2 53 2/60 53/60
140 3 56 3/60 56/60
142 2 58 2/60 58/60
146 1 59 1/60 59/60
152 1 60 1/60 60/60
60 60/60
13
AGRUPADOS.
152-94=58÷5=11+1=12
# INTERVALO f F
1 94≤X<99 2 2 2/60 2/60
2 99≤X<105 2 4 2/60 4/60
3 104≤X<109 4 8 4/60 8/60
4 109≤X<114 5 13 5/60 13/60
5 114≤X<119 12 25 12/60 25/60
6 119≤X<124 7 32 7/60 32/60
7 124≤X<129 9 41 9/60 41/60
8 129≤X<134 8 49 8/60 49/60
9 134≤X<139 4 53 4/60 53/60
10 139≤X<144 5 58 5/60 58/60
11 144≤X<149 1 59 1/60 59/60
12 149≤X<154 1 60 1/60 60/60
60 60/60
152-94=58÷6=9+1=10
# INTERVALO f F
1 94≤X<100 2 2 2/60 2/60
2 100≤X<106 3 5 3/60 5/60
3 106≤X<112 7 12 7/60 12/60
4 112≤X<118 7 19 7/60 19/60
5 118≤X<124 13 32 13/60 32/60
6 124≤X<130 9 41 9/60 41/60
7 130≤X<136 9 50 9/60 50/60
8 136≤X<142 6 56 6/60 56/60
9 142≤X<148 3 59 3/60 59/60
10 148≤X<154 1 60 1/60 60/60
60 60/60
14
El valor medio debe cumplir la condición de ser representativo del conjunto. Los
valores que cumplen con ésta condición son; LA MEDIA ARITMÉTICA, LA
MEDIANA, Y LMODA.
MODA.
Es el valor que aparece con mayor frecuencia en un grupo de datos.
Del ejemplo de las calificaciones de los alumnos:
CALIFICACIÓN f F
0 3 3
1 2 5
2 4 9 # INTERVALO f F
3 5 14 1 0-2 5 5
4 3 17 2 2-4 9 14
5 5 22 3 4-6 8 22
6 4 26 4 6-8 5 27
7 1 27 5 8-10 2 29
8 2 29 6 10-12 1 30
9 0 29 30
10 1 30
30
BIMODAL 3 Y 5
MODA en datos agrupados
= 2 + 1.6 = 3.6
15
La moda no es una medida de tendencia central muy usual, sin embargo es vital
para determinar por ejemplo: que medicamento es el que más se vende o la dosis
que con mayor frecuencia se receta.
MEDIANA.
Ejemplo:
Si hay 115 datos la mediana es el valor del dato (115+1)/2 = 116/2 = 58
Ejemplo:
Si contamos con 98 datos, La mediana la obtendremos calculando la media
de los datos 98 / 2 y 100 / 2 o sea el promedio entre 49 y 50.
CALIFICACION f F PAR
0 3 3 30/2 y (30+2)/2
1 2 5
2 4 9
3 5 14 30/2 y 32/2
4 3 17
5 5 22
6 4 26 LUGAR
7 1 27
8 2 29 15 Y 16
9 0 29 POR LO TANTO LA MEDIA DEL VALOR:
10 1 30 ENTRE 4 Y 4 = 4
16
HIJOS f F IMPAR
0 2 2
1 5 7 (25+1) / 2 = 26/2
2 5 12
3 6 18
4 4 22 LUGAR 13
5 2 24 VALOR 3
6 1 25
# INTERVALO f F Li = 4
1 0≤X<2 5 5 FA = 14
2 2≤X<4 9 14 Fm = 8
3 4≤X<6 8 22 I=2
4 6≤X<8 5 27
5 8≤X<10 2 29
6 10≤X<12 1 30
Ejemplo:
SALARIO
LIMITE LIMITE f F
INF SUP n/2 = 65/2 = 32.5
50 59 8 8 Li = 70
60 69 10 18 Fa = 18
70 79 16 34 fm = 16
80 89 14 48 I = 10
90 99 10 58
100 109 5 63
110 119 2 65 Md = 70 + ((32.5-18)/16)*10
65
= 70 + (14.5/16)*10
= 70 + (0.906)*10
= 70 + 9.06 = 79.06
El 50% de los obreros gana menos de $79.06
MEDIA ARITMÉTICA.
Es la medida de tendencia central que se encuentra con más frecuencia, se
calcula sumando los valores que se tomaron en cuenta para la suma, o sea se
obtiene al dividir la suma de todos los valores observados entre el número de
ellos.
Considerando X1, X2, X3, X4…………Xn, a las observaciones de las variables, la
media aritmética es:
= (65+70+80+91+96) / 5 = 410/5 = 82
El número de horas que 10 estudiantes ven televisión son: 24, 25, 22, 20, 15, 25,
17, 16, 15,17.
18
Se debe recordar que cada valor Xi de la variable, se repite tantas veces como
indica su frecuencia fi; entonces la media es la suma de todas las observaciones
iguales; es decir es igual al producto Xi fi entonces la media es:
hijos f xf
0 2 0
1 5 5 = 65/25
2 5 10
3 6 18 = 2.6
4 4 16
5 2 10
6 1 6
25 65
19
Califacación fi Mi Mifi
0-2 5 1 5
2-4 9 3 27
4-6 8 5 40
6-8 5 7 35 = 136 / 30 = 4.53
8-10 2 9 18
10-12 1 11 11
30 136
Salarios fi Mi Mifi
50-59 8 55 440
60-69 10 65 650
70-79 16 75 1200
80-89 14 85 1190 = 5185 / 65 = 79.77
90-99 10 95 950
100-109 5 105 525
110-119 2 115 230
65 5185
Ejemplos
Los 17 juegos de la liga de fútbol de un equipo duraron 94, 93, 91, 93, 90, 92, 93,
93, 94, 90, 91, 92, 95, 90, 91 y 93 minutos. Determina su moda, mediana, media.
20
Xi f F xifi
90 3 3 270
91 3 6 273
92 2 8 184
93 6 13 558
94 2 16 188 Moda =93
95 1 17 95 Mediana= (n+1)/2 = 17+1 =18/2=9 ►93
17 1568
MEDIANA
n/2 = 150/2 = 75
= 105 + (0.777)*5
= 105 + 3.88 = 108.88
xi Médico xifi
residente
IMSS 3500 3450 12,075,000
ISSSTE 1200 1200 3,840,000
SSA 2800 2800 7,840,000
7400 23,755,000
= 3,210.13
22
MEDIDAS DE DISPERSIÓN
Una medida de la manera en que los variables individuales se desvían del valor
promedio. Si tenemos por ejemplo que la edad promedio de la fiesta de ayer fue
de 18 años, podemos pensar en una fiesta de adolescentes, pero resulta que fue
de una abuela de 73 años que ofreció la fiesta a su nieto de 5 años y a sus tres
primos de 3,5 y 4 años.
Entonces: 73 + 5 + 3 + 5 + 4 = 90 ÷ 5 = 18
Por lo que se requiere calcular otras medidas que nos orienten sobre el
comportamiento de los datos observados. Estas medidas llamadas de dispersión,
nos indican que tan dispersos están los datos obtenidos en cualquier observación
▌Xi ▌
Es la media aritmética de todas las desviaciones respecto a la media.
I Xi
▌Xi - ▌ II Xi ▌Xi - ▌
= 40 / 4 = 10 2 8 8 2
DM1 = 16 / 4 = 4 10 0 9 1
12 2 10 0
= 40 / 4 = 10 16 6 13 3
DM2 = 6 = 1.5 40 16 40 6
En los ejemplos se demuestra que no siempre el valor de la media nos indica
cómo se comportan nuestros datos, por lo que se deben realizar otro tipo de
cálculos.
VARIANZA
Es la suma de los cuadrados de las desviaciones entre el número de
observaciones.
Si las observaciones corresponden a una muestra de la población se considera
n-1
Esto es: la varianza es el promedio de la diferencias de las observaciones con
respeto al valor medio.
I Xi ▌Xi- ▌ ▌Xi- ▌²
2 8 64
10 0 0
12 2 4
16 6 36
40 104
II Xi ▌Xi- ▌ ▌Xi- ▌²
8 2 4
9 1 1
10 0 0
13 3 9
40 14
= 40/4 = 10 = 40/4 = 10
24
2 = 104/3 2 = 14/3
Si los datos están muy dispersos, la varianza es muy grande pero si, los datos
están concentrados la varianza es pequeña.
DESVIACIÓN ESTÁNDAR.
Dado que la varianza es un dato cuyo valor esta al cuadrado no tiene las mismas
unidades que los valores de las medidas de tendencia central por lo que se
requiere calcular la raíz cuadrada de la varianza y se denomina desviación
estándar.
Ejemplo Anterior:
X = 40/4 =10
Xi IX- (X- )²
² = 104/3 = 34.6 I
2 -8 64
= √34.6 10 0 0
= 5.88 12 2 4
16 6 36
40 104
25
II X X- (X- )²
= 40/4=10
8 2 4 ² 14/3= 4.6
9 1 1
10 0 0 = √4.6
13 -3 9
40 = 2.16
SERIE DE FRECUENCIAS
Ejemplo Hijos
Hijos X f F xf x- (X- )² (X- )²f
= 65/25=2.6 0 2 2 0 -2.6 6.76 13.52
²= 60/24=2.5 1 5 7 5 -1.6 2.56 12.8
2 5 12 10 -0.6 0.36 1.8
√2.5=1.58 3 6 18 18 0.4 0.16 .96
4 4 22 16 1.4 1.96 7.84
5 2 24 10 2.4 5.76 11.52
6 1 25 6 3.4 11.56 11.56
25 65 60.00
Ejemplo de salarios.
26
= 5152.5 / 65 = 79.77
= 15,837.82 / 64 = 247.466
= √247.466 = 15.731
Ejemplos:
= 197.464/ 29 = 6.809
= √6.809 = 2.609
Los datos pueden presentarse de manera gráfica para poder realizar un análisis
de ellos
28
HISTOGRAMA 1
Moda
30
Mediana
Media
= 93.7
Rango
Rango = Vmáx – Vmín = 149 - 30 = 119
Varianza
= 843.5454
Desviación estándar
= 29.0438
+σ
64.656 a 122.744
31
TÉCNICAS DE CONTEO
Principio de la multiplicación
Ejemplo
Para formar el anuario de la escuela, en una página que debe tener cinco
fotografías diferentes ¿Cuántos proyectos de páginas se pueden hacer si se
tienen 4 fotografías de un grupo de profesores, 10 fotografías de eventos
deportivos, 7 de salones de clase, 8 del terreno de la escuela y 5 de diferentes
actividades de los alumnos?
32
4 1 4*10*7*8*5=11,200
0
7
8 5
Una joven tiene 5 blusas; 4 faldas y 3 pares de zapatos, ¿Cuántos juegos de ropa
diferente puede ponerse?
5*4*3 =60 juegos
Diagrama de árbol
II
A I 2
1
I 2
1
B
II
1 2
C II Rutas = 3*3*2 = 18
1 2
II
I 2
33
baja
normal
alta
A
baja
normal
B
Tipos = 4*3 = 12
normal
O
alta
baja
normal
alta
Permutaciones
Sirven para contar el número de todos los diferentes arreglos u ordenamientos que
se pueden hacer con un conjunto de objetos. Nos interesa el orden en que se
presentan
Ejemplo
n * (n-1)*(n-2)*(n-3)*…*(1) = n!
1! = 1
0! = 1
2! = 2*1 = 2
3! = 3*2*1 = 6
(8-2)! = 6!
Ejemplo
P66 = 61 = 6*5*4*3*2*1=720
= 5040
Una investigadora compro 7 libros pero solo tiene espacio para acomodar 5, si le
importa el orden en que los va a acomodar de cuantas formas lo puede hacer?
35
= 2520
Si los elementos de un conjunto no son todos diferentes entre sí, es decir algunos
son idénticos. La formula de las permutaciones que se pueden formar en el caso
de “n” elementos, cuando hay n, elementos idénticos, n 2 elementos, de otro tipo
idénticos, etc. Entonces
Ejemplo
Cuantos tratamientos se pueden recetar con diez medicamentos utilizándolos
todos y son 4 antidepresivos; 3 antibióticos; 3 antihistamínicos.
Combinaciones
Es un arreglo de cierto número r de objetos tomados de un conjunto de n objetos
en tal forma que el orden en que se disponen no importa.
Ejemplos
Se debe nombrar un comité de tres personas de un grupo de 15 profesores.
¿Cuántos comités se pueden formar?
36
Con parte de su salario un joven decide comprar 3 de los 7 discos compactos que
le faltan del grupo TRI ¿Cuántas posibilidades tiene?
= 32’468,436
37
PROBABILIDAD
Probabilidad clásica
Ejemplos
Si tiramos un dado, la probabilidad de que caiga un 6 es:
Caras del dado = 6 = N
# de 6 en el dado = 1= NE
P 6 = 1/6
Si se toma una carta de una baraja la posibilidad de que salga “as” es:
Total de cartas = 13 X 4= 52 = N
# de “as” = 4
PAS = 4/52 = 1/3
Axiomas de probabilidad
A B
Ejemplo
En un grupo de 500 personas recién graduadas se sabe que 175 en se graduaron
en educación 150 en comercio; 100 en humanidades; 75 en ciencias de la salud.
Al azar se elige a una persona y se sabe que ninguna tiene más de 1 carrera
¿Cuál es la posibilidad de que sea de comercio o educación?
P(E) = 175/500,
P(C)= 150/500,
P(H) = 100/500,
P(S) = 75/500 ►
P(CUE) = 150/500 + 175/500 = 325/500 = 0.65
Si los eventos no son excluyentes o sea que tienen puntos muéstrales en común y
que en términos de conjunto se llama intersección tenemos que: dados dos
eventos A y B, la probabilidad de que ocurra el evento A del evento B ambos es
igual a la probabilidad de que ocurra el evento A mas la probabilidad de que
ocurra B menos la probabilidad de que ocurra ambos eventos.
39
A U B
Ejemplo.
Nivel estudios
Género Titulo Certificado Total
Hombre 7 3 10
Mujer 10 5 15
total 17 8 25
P = PM + PC – P(M⋂C)
P = 15 + 8 – 5 = 18
PROBABILIDAD CONDICIONAL
A B
40
Ejemplo
Regla de la multiplicación
Ejemplo
P(c)= 8/25
P(m/c) = 5/8
P(C∩M) = 8/25 * 5/8 = 40/200 = 1/5 = 0.20
P(m)= 15/25
P(c/m) = 5/15
P(M∩C) = 15/25 * 5/15 = 75/375 = 1/5 = 0.20
41
Ejemplos
En un estudio de una escuela se observo que el 90% de los alumnos tienen
caries, 40% padecen problemas visuales, 30% sufren ambas enfermedades. Si
son 100 alumnos y uno de ellos se selecciona al azar ¿Cuál es la probabilidad de
que tenga problemas visuales si se observó que padece caries?
P(c)= 90 C V
P(v) =40
P(v∩c)=30 60 3 10
0
P(R) = ½
P(A) = ½
P(B/R) = 4/6
P(B/A) = 2/10
P(B) =P(R) P (B/R) + P(A) P (B/A) = 1/2 (4/6) + (1/2) (2/10) = 4/12 + 2/20
= (20+6)/60 = 26/60 = 0.43
P(R)= ½
P(A)= ½
P(N/R)=2/6
P(N/A) = 8/10
P(N) =P(R) P (N/R) + P(A) P (N/A) = 1/2 (2/6) + (1/2) (8/10) = 2/12+8/20
= (10+24)/60 = 34/60 = 0.56
n = 6 x 6 = 36
Σ7 = (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) = 6
42
P7 = 6/36 = 1/6
n = 36
Σ6 = (1,5) (2,4) (3,3) (4,2) (5,1) = 5
P6 = 5/36
n = 36
Σ3 = (2,6) (3,5) (4,4) (5,3) (6,2) = 5
P5 = 5/36
En una familia de tres hijos, se registra el género de cada uno de ellos (mayor,
medio y menor). Encuentra la probabilidad de:
a) los hijos sean del mismo sexo
b) máximo existe un hijo varón
c) cuando mucho existen dos mujeres
M = masculino, F = femenino
S = {MMM, MMF; MFM, MFF; FMM, FMF; FFM, FFF}
S =8
a) mismo sexo
b) máximo un varón
c) cuando menos 2 mujeres (F) Sin F ó una ó dos F
43
Gusta Relación
20 12
1
5
n = 50
GT = 35
BR= 27
(GT∩BR)=15
DISTRIBUCIONES DE PROBABILIDAD
Ejemplos
6/36
5/36
4/36
3/36
2/36
1/36
2 3 4 5 6 7 8 9 10 11 12
45
Ejemplo:
Se lanza una moneda al aire dos veces: la variable aleatoria discreta se define X=
{No de águilas}. Elabora la tabla y graficas de distribución de probabilidad.
Águilas.
X P(xi) PA(xi)
2 1/4 1/4
1 2/4 3/4
0 1/4 4/4
46
4/4
2/4
1/4
1 2 3
No de águilas
4/4
3/4
2/4
1/4
1 2
No. De
águilas.
47
Ejemplo
0.5
0.4
0.3
0.2
F(x)
0.1
1.0
1 2 3 4 5 6 X
0.8
0.6
0.4
0.2
1 2 3 4 5 6 X
48
DISTRIBUCIÓN BINOMIAL
Suponiendo que un tratamiento para una alergia particular tiene una probabilidad
de que cada paciente se cure es de 0.6 El problema es encontrar la probabilidad
de que una serie de 5 pacientes tramitados, sanen exactamente dos de ellos.
Suponiendo que los resultados paciente “sano” o “no sano” son independientes y
mutuamente exclusivos.
A B C D E
1 S (0.6) S (0.6) N (0.4) N (0.4) N (0.4)
2 S (0.6) N (0.4) S (0.6) N (0.4) N (0.4)
3 S (0.6) N (0.4) N (0.4) S (0.6) N (0.4)
4 S (0.6) N (0.4) N (0.4) N (0.4) S (0.6)
5 N (0.4) S (0.6) S (0.6) N (0.4) N (0.4)
6 N (0.4) N (0.4) S (0.6) S (0.6) N (0.4)
7 N (0.4) N (0.4) N (0.4) S (0.6) S (0.6)
8 N (0.4) S (0.6) N (0.4) N (0.4) S (0.6)
9 N (0.4) N (0.4) S (0.6) N (0.4) S (0.6)
10 N (0.4) S (0.6) N (0.4) S (0.6) N (0.4)
Entonces:
Dos pacientes sanos = 5C2(0.6)2 (0.4)3
Un paciente sano = 5C1 (0.6)1(0.4)4 = 0.0768
Ejemplos.
El 20% de los pacientes dados de alta en un hospital durante los últimos 10 años
han sido adolescentes, al encargado de las historias clínicas le solicitan 3 historias
de adolescentes, ¿Qué probabilidad hay de obtener 3 historias de adolescentes
(éxitos) de 5 intentos que se obtienen al azar.
0 8
P(x=0/8, 0,6)= 8C0(0.6) (0.4) (1)(1) (0.001)= 0.001
1 7
P(x=1/8, 0,6)= 8C1(0.6) (0.4) (8)(0.6)(0.002)= 0.008
2 6
P(x=2/8, 0,6)= 8C2(0.6) (0.4) 28(0.36)(0.004)= 0.040
3 5
P(x=3/8, 0,6)= 8C3(0.6) (0.4) 56(0.26)(0.010)= 0.124
4 4
P(x=4/8, 0,6)= 8C4(0.6) (0.4) 70(0.129)(0.026)= 0.231
5 3
P(x=5/8, 0,6)= 8C5(0.6) (0.4) 56(0.077)(0.064)= 0.276
6 2
P(x=6/8, 0,6)= 8C6(0.6) (0.4) 28(0.046)(0.16)= 0.206
7 1
P(x=7/8, 0,6)= 8C7(0.6) (0.4) 8(0.028)(0.40)= 0.089
8 0
P(x=8/8, 0,6)= 8C8(0.6) (0.4) 1(0.017)(1)= 0.017
0.999= 1
50
0.30
0.25
0.20
0.15
0.110
0.05
0 1 2 3 4 5 6 7 8
P = 0.40 n = 10 X=3
51
10%
0 12
P(X=0/12,0.10)= 12C0(0.10) (0.90) = 1(1)(0.282) =0.282
1 11
P(X=1/12,0.10)= 12C1(0.10) (0.90) = 12(0.1)(0.314) =0.377 0.659
1 - 0.659 = 0.341
20%
0 12
P(X=0/12,0.20)= 12C0(0.20) (0.80) = 1(1)(0.0689) =0.069
1 11
P(X=1/12,0.20)= 12C1(0.20) (0.80) = 12(0.2)(0.0859) =0.206 0.275
1 - 0.275 = 0.725
30%
0 12
P(X=0/12,0.30)= 12C0(0.30) (0.70) = (1)(1)(0.0138) =0.0138
1 11
P(X=1/12,0.70)= 12C1(0.30) (070) = 12(0.3)(0.0197) =0.0712 0.085
1 - 0.085 = 0.915
40%
0 12
P(X=0/12,0.40)= 12C0(0.40) (0.60) = 1(1)(0.0022) =0.0022
1 11
P(X=1/12,0.10)= 12C1(0.40) (0.60) = 12(0.4)(0.0036) =0.0174 0.0196
1 - 0.0196 = 0.9804
52
Puntos 2 3 4 5 6 7 8 9 10 11 12
Probabilidad 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Si una variable aleatoria toma los valores X1, X2,X3…Xn con probabilidades P(X1,)P(
X2,)…P(XK) su VALOR ESPERADO es
X1 P(X1,)+ X2,P(X2,)+ X3 P(X3,)+ … Xn P(XK)
Ejemplo
De los autos robados donde se desea recuperar algunos de los 8 autos robados.
La media de la distribución de probabilidad representa el número esperado de
autos que la compañía de seguros desea recuperar teniendo:
Ejemplo.
Pacientes que se sometieron a un tratamiento para dejar de fumar y que vuelve a
fumar, es una variable binomial con n = 7, P = 0.4
Es semejante a la expresión original para calcula la desviación estándar de una
población con las probabilidades empleando P(X) en lugar de 1/N
Ejemplo
Del ejemplo anterior n = 8; P = 0.4; (1-P) = 0.6 podemos calcular la desviación
estándar por
√1.92 = 1.386
Un estudio muestra que el 60% de los pacientes de una clínica esperan más de
una hora antes de ser recibidos. Encuentra la media y la desviación estándar del
número de pacientes que esperan más de una hora de un grupo de 12 pacientes.
DISTRIBUCIÓN NORMAL
En el caso de variables aleatorias discretas como el ejemplo de los automóviles
que se roban la grafica puede ser:
0.276
0.3
0.25
0.231 0.206
0.2
0.15
0.124
0.1 0.089
0.008
0.05
0.041 0.017
0.001
0 1 2 3 4 5 6 7 8
3+4+5►0.124+0.232+0.277 = 0.633
c a b d
56
Distribución normal
Si graficamos los valores de las observaciones
encontramos que la Mayor probabilidad de encontrar
los valores se encuentra donde están las jorobas
comparadas con el centro o los extremos de la gráfica
porque es donde hay más área.
µ= 1 =0.3 µ= 2 =0.6
µ=0.70
µ=1
µ=1.5
µ = media
π = 3.14159
desviación estándar
e = 2.71828
Área entre a y b
Moda µ=
Mediana
50% 50%
µòX
58
3 2
1
0.8
0.95
0.997
Xa Xb
Ejemplo:
Se desea encontrar el área bajo la curva norma estándar entre 0 y 1.45
entonces:
Buscamos en la tabla 1.4 y en la fila 1º es 0; 2º es1; 3º es 2; 4º es 3; 5º es
4; 6º es 5; 7º es 6; 8º es 7; 9º es 8; 10º es 9 y entonces 1.45 se busca en la
columna 2 el 1.4 y en la columna 6º que corresponde al 5 se tiene: el área
entre 0 y 1.45= 0.4265.
0.83
00
59
El área es 0.5
Buscamos 1.07 en la tabla= 0.3577
Del total de este lado de la grafica (0.5)
0. Restamos el 0.3577
35
77
P = 0.5 - 0.3577 = 0.1423
1.7
00
El área bajo la cueva normal estándar entre 0.24 y
1.18
0.24 1.18
0
Encontrar el área bajo la curva normal estándar
entre -1.34 y 0
Tabla
0. Buscar – 1.34 es igual a buscar 1.34 = 0.4099
4
0
P = 0.5 – 0.4099 = 0.0901
9
9
-1.34
0
0
El área bajo la curva entre -0.97 y 1.14
Ejemplo. Supongamos que los C.I. de los individuos que componen una
determinada población tiene aproximadamente una distribución normal con una
media de 100 y una = 10 ¿Cuál es la proporción de individuos con CI mayores
que 125?
X = 125
µ = 100
2.5
tabla= 0.195
tabla= 0.4332
tabla = 0.4772
tabla = 0.1915
Entonces:
-2 -0.5
0 P = 0.4772 - 0.1915 = 0.2857
Esta aproximación es buena si np y n(1-P) son ambos mayores que cinco y que
n sea suficientemente grande para valores pequeños de n.
Ejemplo
La probabilidad de obtener 2 soles al tirar 10 veces una moneda es:
Tomamos n = 10 P = 0.5 entonces np = 5; n(1-P) = 5
Tabla = 0.4864
Ejemplo.
La proporción de complicaciones quirúrgicas en un proceso reconstructivo
cardiovascular es 20% esto incluye todas las complicaciones desde infecciones
ligeras hasta la muerte, en una serie de 50 operaciones ¿Cuál es la probabilidad
de que a lo más 5 pacientes presentan complicaciones quirúrgicas? Supongamos
que la ocurrencia o no ocurrencia de estas complicaciones en diferentes pacientes
es un evento independiente.
n = 50; P = 0.2; (1-P) = 0.8
Binomial = ∑B(X, 50,0.2)= 501∑50Cx(0.2) x (0.8)50-x y X = 0,1,2,3,4,5
62
Tabla = 0.4441
► P = 0.5- 0.4441= 0.0559
-1.59
0
Tabla 0.2486
Tabla 0.3686
0
.67 1.12 ► P= 0.3686 – 0.2486= 0.1200
tabla 0.4192
tabla 0.2257
P= 0.4192+ 0.2257 = 0.6449
-1.4 0.6
0
0
1.4
63
tabla 0.4192
P = 0.5 – 0.4192= 0.0808
Tabla 0.4738
1.94
P= 0.5 – 0.4738= 0.0262
Tabla 0.4429
Tabla 0.3599
-1.5 1.8
P=0.4429+0.3599=0.8028
Tabla 0.4595
P= 0.5 – 0.4595 = 0.0405
1.75
1.41
64
Tabla 0.2202
P= 0.5 + 0.2202 = 0.7202
Niño 1 2 3 4 5
altura 1.20 118 1.32 1.23 1.28
La media de la altura es
= 0.05154
Sabemos que la muestra que tomamos depende del azar, la media asociada a
cada muestra es una variable aleatoria teniendo así mismo cada muestra su
desviación estándar.
Entonces en el caso de muestras
= Media de la distribución muestral
la desviación estándar.
Desviación estándar de la distribución muestral
muestra 2
Ejemplo.
Una población de N = 900 con ¿Cómo cambia el error estándar de la muestra si
el tamaño de la muestra n disminuye de 100 a 50?
N=900
n1=100
n2=50
Supongamos que una población de niños de siete años que deseamos estudiar es
de N = 50,000 y que por estudios de la OMS sabemos que la desviación estándar
de las alturas es de = 10 cm. Tomamos una muestra al azar de n = 400 niños, si
la media es de = 122 cm. ¿Qué tan razonable es tomar la media de 122 cm.,
como la media de la población?
10
Ejemplo
Una región agrícola consta de 200,00 hectáreas donde se siembra trigo, para
estimar la producción media por hectárea se realiza una muestra de 900 ya que
tuvieron en promedio una productividad de = 3,4 toneladas.
La secretaria de agricultura estima que la desviación estándar de la productividad
del trigo en la región es de = 0.8 toneladas.
= 3.4 toneladas
Restamos
-0.05 < - < 0.05
Dividimos entre
Ejemplo.
30 lecturas del nivel de ozono en periodo invernal en la ciudad de México son:
178 190 228 211 187 165 172 244 229 208
193 203 215 226 231 209 220 258 278 235
246 227 211 195 202 212 219 216 204 193
El teorema del límite central permite asociar a un intervalo alrededor del valor
medio, en este caso = 213.5, una probabilidad o grado de certidumbre de que la
media estimada se encuentre realmente entre esos límites.
S= 24.87
Dado que n≥30 se considera el error estándar de la media a:
Multiplicando * 4.54
4.54*(-1.28) < 213- µ < 4.54*(1.28)
-5.81 < 213.5 - µ < 5.81
Restando 213.5
-5.81 – 213.5 < -µ < 5.81 – 213.5
-219.31 < -µ < - 207.69
Entonces la media µ se encuentra entre 207.7 y 219.3 con una probabilidad de 0.8
Intervalo de confianza
Limites de confianza
Grado de confianza (probabilidad)
Donde el área bajo la curva normal estándar entre 0 y Ƶ0 es /2 esto es, con un
grado de confianza el error al estimar la media por es menor a
Los grados de confianza más usados son 0.90, 0.95 y 0.99 y sus
correspondientes Ƶ0 son 1.645, 1.96 y 2.575.
Ejemplo
Del ejemplo de las 200,000 hectáreas n=900, = 3.4 con = 0.8 encontrar el
intervalo de confianza del 90%, 95% y 99%.
La expresión
Ejemplo.
Un fabricante de baumanómetros desea determinar la vida promedio de ellos con
un viaje de grado de certeza de 99% y con un error menor a 1000 se sabe que la
desviación estándar es de 3000. ¿Qué tan grande debe ser la muestra?
Si E = es el error máximo.
72
n = (7.725)2= 59.67 60
Distribución t (t de student)
Que tiene forma de campana pero depende de los grados de libertad que
simplemente se calculan como n-1 o sea el tamaño de la muestra menos 1.
Ejemplo
Una empresa realizo un estudio del nivel de nicotina para una muestra de 20
cigarrillos producidos por otra empresa. La tabla siguiente muestra la cantidad de
nicotina contenida en cada una de los cigarrillos de muestra.
Su desviación estándar
Renglón –19
O bien que al estudiar el nivel medio de nicotina como 24.9mg. Sabemos que con
un grado de confianza del 95% el error es menor a 0.72mg.
Al estimar el nivel medio de nicotina como 24.9 con un grado de confianza del
99% el error es de 0.98 o sea menor de 1mg.
£ - student
75
6 8 10
CHI CUADRADO
El área total limitada por la curva de una distribución Chi cuadrada y los ejes es
igual a uno pero la variable solo toma valores no negativos. La media es igual
a sus grados de libertad y la varianza es igual a dos veces sus grados de libertad.
Existen tablas para facilitar su empleo, recordando que las áreas son
probabilidades asociadas a intervalos limitados por valores determinados de .
Ejemplo.
La distribución Chi cuadrada con 10 grados de libertad que valor de tiene a su
izquierda 0.95 del área bajo la curva.
Como el área es igual a el 5% o sea el 0.05 del área esta a la derecha del 18.307.
Si se saca al azar un valor de de la distribución con 10 grados de libertad, la
probabilidad que sea mayor o igual es a 18.307 es 0.05
Ejemplo.
La varianza de los pesos jóvenes de 12 años es de 39 Kg. y que están
normalmente distribuidos ¿cuál es la probabilidad de que una muestra aleatoria de
25 niños de 12 años arroje una varianza igual o mayor que 57?
Tabla con 24 grados de libertad, el valor está entre 33.196 y 36.415 en las
columnas 0.90 y 0.95 respectivamente.
76
Ejemplo
En un experimento de cruzas de dos tipos de maíz se obtuvieron 773 plantas
verdes, 231 doradas, 238 verdes rayadas y 59 dorado-verde-rayada. Se desea
saber si estos resultados reafirman o contradicen la teoría mendeliana según los
cuatro grupos deben de estar en las proporciones 9:3:3:1 con = 5%
(significancia).
observadas Esperadas
P1= 9/16 773 1301(9/16)= 731.9
P2= 3/16 231 1301(3/16)= 243.9
P3= 3/16 238 1301(3/16)= 243.9
P4= 1/16 59 1301(1/16)= 81.3
1301 ←=→ 130.10
GL= 3
2
X CALCULADA= 9.25
Se rechaza la
5% probabilidad 9:3:3:1
H0
Hi
observado Esperado
GL= 2-1= 1 =0.05 tabla 0.05= 3.84 312 400(3/4)= 300
88 400(1/4)= 100
400 400
2
X = 1.94
X2= calculada< X2tabla
Acepta la proporción 3:1
¿Es el espesor del almíbar un factor determinante para distinguir las muestras?
*si el espesor del almíbar no es factor determinante significaría que la mitad de las
personas seleccionan la muestra “A”.
H0: P= ½ y Hi= P≠ ½
2
X = 0.80
Como calculada < tabla se acepta H0 que dice que el espesor del almíbar
no es determinante.
SNC 17 100*0.20= 20
fatiga 22 100*0.20= 20
100 100*0.20= 100