Sunteți pe pagina 1din 19

ESTADÍSTICA INFERENCIAL

TRABAJO COLABORATIVO

INTEGRANTES:

Sergio Alberto Valencia Cabrera Código No.1811983487


Juan Pablo Herrera Villareal Código No.1210013053
Mayra Alejandra Vargas Código No. 1811980985
Código No.

TUTOR:

Henry Bacca

INSTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO


FACULTAD DE INGENIERÍA
INGENIERÍA INDUSTRIAL
2019
INTRODUCCIÓN

Teniendo en cuenta la tabla suministrada y con las variables seleccionadas por cada uno de los
miembros del equipo, se dio desarrolló el presente trabajo y cada una de las participaciones en
los foros; con ello, logramos identificar y analizar que la estadística es la parte que nos ayudará
en la toma de decisiones, pues a través de ella obtenemos conclusiones generales para toda
población a partir del estudio de una muestra, el grado de fiabilidad o significación de los
resultados obtenidos los cuales permitimos evidencia en el presente trabajo.

Objetivo Principal

Aplicar los procedimientos y /o conocimientos estadísticos adquiridos en esta


asignatura y con ello definir los conceptos relacionados con los métodos y
distribuciones de muestreo para así mejorar la comprensión de hechos a partir de
datos.

Objetivos secundarios

● obtener una muestra y la media de la variable de estatura de la base de datos.


● calcular un estimado del intervalo de confianza del 95% tanto para hombres como
para mujeres basado en la media de estatura de la población de la base de datos
● implementar de una manera adecuada la aplicación de varios tipos de hipótesis
basada en los datos de estatura de la población obtenida con la muestra y con
base en ellos seleccionar o descartar la o las hipótesis más adecuadas para el
desarrollo de la actividad.
A. Seleccione una muestra de la variable escogida, haga uso de alguna del siguiente tipo
de muestreo, verifique que este no haya sido usado por ninguno de sus compañeros. En
el caso que haya más de 4 integrantes en el grupo con participaciones activas, será
posible repetir algunas de estas técnicas.

● Muestreo aleatorio simple.


● Muestreo estratificado.
● Muestreo sistemático.
● Muestreo por conglomerados.
Solución
Para efectos de resolución de este punto se utilizó el muestreo sistemático y la columna de
nombre edad.
Se tomó una muestra de 20 del total de la población dando como resultado:

al tomar el 2 como numero aleatorio para comenzar hacer la selección de los datos y la
frecuencia de 4 podemos ver que:

POBLACIÓN

EDAD

1 12,0

2 16,0

3 17,0

4 17,0

5 17,0

6 18,0

7 18,0

8 18,0

9 19,0

10 19,0

11 20,0
12 20,0

13 20,0

14 20,0

15 22,0

16 22,0

17 23,0

18 23,0

19 23,0

20 23,0

21 24,0

22 25,0

23 25,0

24 25,0

25 26,0

26 26,0

27 27,0

28 27,0

29 28,0

30 28,0

31 28,0

32 29,0

33 29,0

34 29,0

35 29,0

36 31,0
37 31,0

38 31,0

39 32,0

40 32,0

41 32,0

42 32,0

43 32,0

44 33,0

45 33,0

46 34,0

47 34,0

48 36,0

49 36,0

50 37,0

51 37,0

52 37,0

53 40,0

54 40,0

55 40,0

56 41,0

57 41,0

58 41,0

59 41,0

60 42,0

61 44,0
62 45,0

63 45,0

64 46,0

65 47,0

66 48,0

67 52,0

68 52,0

69 52,0

70 53,0

71 53,0

72 54,0

73 55,0

74 55,0

75 56,0

76 56,0

77 57,0

78 58,0

79 59,0

80 73,0

al depurar la información la muestra que queda es:

ELEMENTOS
SELECCIONADOS

2 16,0

6 18,0

10 19,0
14 20,0

18 23,0

22 25,0

26 26,0

30 28,0

34 29,0

38 31,0

42 32,0

46 34,0

50 37,0

54 40,0

58 41,0

62 45,0

66 48,0

70 53,0

74 55,0

78 58,0

B. Explique cuáles son las ventajas y desventajas que tiene el tipo de muestreo
seleccionado en comparación con el usado por sus compañeros.

Solución

● Una de las ventajas con respecto al muestreo estratificado es que no requiere mucha
información sobre la proporción de la población que pertenece a un estrato en específico.
● Al determinar la aleatoria bajo control de una fórmula matemática y un sistema en
específico para la selección de la muestra puede ser menos el sesgo permitiendo la
participación de la mayoría de actores de la población.
● Puede trabajarse con datos con gran número de variables a diferencia del muestreo
estratificado.
● Una de las desventajas es que no puede ser muy representativo con datos que tengan
sesgo o que tenga algo de particularidad. Ya que no tiene capacidad de hacer comparación
entre los estratos.
● Se toman como muestras a la totalidad de los hombres de la población en el caso
del inciso A y en el inciso B se toma como muestra las mujeres de la población
total.
● Inicialmente se desarrolla el ejercicio asumiendo que conocemos la desviación
estándar de las muestras

A.
X= 73,2
n= 40
σ= 10,41
Z= Se llama valor crítico al valor de Z necesario para construir un intervalo de confianza
para la distribución. El 95% de confianza corresponde a un valor (de 0,05. El valor crítico
Z correspondiente al área acumulativa de 0,975 es 1,96 porque hay 0,025 en la cola
superior de la distribución y el área acumulativa menor a Z = 1,96 es 0,975.
Z=1,96
Para calcular la estimación del intervalo de confianza de la media de la variable
seleccionada con desviación conocida se usa la siguiente ecuación:

10,41 10,41
73,2 − 1,96 ( ) ≤ 𝜇 ≤ 73,2 + 1,96 ( )
√40 √40

69,97 ≤ 𝜇 ≤ 76,42
R/= Existe un 95% de confianza de que la media poblacional para los hombres se
encuentre entre 69,97 y 76,42.

B.
X= 67,4
n= 40
σ= 10,69
Z= 1,96
10,69 10,69
67,4 − 1,96 ( ) ≤ 𝜇 ≤ 67,4 + 1,96 ( )
√40 √40
64,08 ≤ 𝜇 ≤ 70,71
R/= Existe un 95% de confianza de que la media poblacional para las mujeres se
encuentre entre 64,08 y 70,71
C. Se podría concluir que no son muy diferentes en términos de confianza debido a que la
diferencia entre los intervalos de confianza de los hombres es de 6,45 mientras que en
el caso de las mujeres es de 6,63 y esta diferencia entre hombres y mujeres puede
explicarse porque los cálculos se hicieron con un 95% de nivel de confianza y no con un
99%

POBLACION
Est
1 63,3
2 57
3 63
4 71
5 64,3
6 62,9
7 65,6
8 61,8
9 64,8
10 63,1
11 68,3
12 69,7
13 65,4
14 66,3
15 66,2
16 60,7
17 66,7
18 64,7
19 62,7
20 61,3
21 62,6
22 67,6
23 62,3
24 59,8
25 68,5
26 68
27 59,6
28 65,1
29 67,6
30 68
31 71,9
32 68
33 70
34 63,6
35 68
36 68,7
37 66,7
38 63,4
39 71,7
40 66,3
41 66,4
42 61,4
43 64,1
44 68,3
45 73
46 63,7
47 60,5
48 70,3
49 63,2
50 66,1
51 60,6
52 65
53 72,4
54 66,8
55 58,6
56 66,5
57 61,3
58 67,9
59 64,3
60 71,1
61 68,3
62 61,9
63 60,2
64 69,2
65 58,2
66 67
67 73,1
68 76,2
69 67,6
70 69,2
71 68,7
72 65,6
73 69,4
74 62,3
75 67,2
76 63,4
77 63,4
78 70,8
79 63,5
80 68,3

ELEMENTOS
SELECCIONADOS
2 16,0
6 18,0
10 19,0
14 20,0
18 23,0
22 25,0
26 26,0
30 28,0
34 29,0
38 31,0
42 32,0
46 34,0
50 37,0
54 40,0
58 41,0
62 45,0
66 48,0
70 53,0
74 55,0
78 58,0

MEDIA POBLACIONAL 65,8


VARIANZA 14,71302
POBLACIONAL 5

Muestreo estratificado:

VENTAJA
● Cuenta con mayor capacidad de hacer inferencia y comparaciones dentro de un
grupo.
● Presenta un mínimo de errores en las muestras del mismo tamaño, por lo que
necesita muestras de tamaño pequeño para que exista el mismo margen del error.
● Las muestras son más representativas ya que los elementos de cada estrato o
grupo son representados en la muestra.
● Se puede obtener mayor conocimiento del investigador sobre la población
abordada.
● Permite aplicar diversos métodos de investigación y procedimientos para ser
aplicados en los diferentes estratos.
● Hace posible el análisis de los patrones dentro del estrato y la notificación
separada de los resultados para cada uno de los estratos.
● DESVENTAJAS
● Es necesario información sobre la proporción de la población que pertenece a
cada estrato.
● Se requiere la información sobre las variables de estratificación de cada
elemento de la población, ya que de no contar con esta información puede ser muy
costosa la recopilación.
● Es un método más costoso, ya que implica tiempo y es un poco más complicado
en comparación con otros métodos.
● Si cuentas con un gran número de variables
● (Enlaces a un sitio externo.)
● , la selección de las de estratificación resultará más difícil

A continuación, se hace la estimación de los intervalos de confianza con


desviación desconocida

A.
µ= 70,3
X= 73,2
N= 80
n= 40
s= 10,41

Inicialmente se procede a calcular la proporción de la cola superior e inferior de la


distribución
∝ 100% − 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎
=
2 𝑁
∝ 100% − 95%
= = 0,000625
2 80

Se calculan los grados de libertad:


𝑛 − 1 = 40 − 1 = 39

Luego en la tabla del estadístico t de Student se busca el valor de t para un área de


0,000625 con 39 grados de libertad y se obtiene t=±3,575

Usando la siguiente ecuación se obtiene:

𝑆 𝑁−𝑛 𝑆 𝑁−𝑛
𝑋 − 𝑡𝑛−1 √ ≤ 𝜇 ≤ 𝑋 + 𝑡𝑛−1 √
√𝑛 𝑁 − 1 √𝑛 𝑁 − 1

10,41 80 − 40 10,41 80 − 40
73,2 − 3,575 √ ≤ µ ≤ 73,2 + 3,575 √
√40 80 − 1 √40 80 − 1

69,01 ≤ 𝜇 ≤ 77,38

R/= Existe un 95% de confianza de que la media poblacional para los hombres se encuentre
entre 69,01 y 77,38

B.
µ= 70,3
X= 67,4
n= 40
N= 80
S= 10,69
t= ±3,575

Usando la siguiente ecuación se obtiene:

𝑆 𝑁−𝑛 𝑆 𝑁−𝑛
𝑋 − 𝑡𝑛−1 √ ≤ 𝜇 ≤ 𝑋 + 𝑡𝑛−1 √
√𝑛 𝑁 − 1 √𝑛 𝑁 − 1
10,69 80 − 40 10,69 80 − 40
67,4 − 3,575 √ ≤ µ ≤ 67,4 + 3,575 √
√40 80 − 1 √40 80 − 1

63,10 ≤ 𝜇 ≤ 71,69
R/= Existe un 95% de confianza de que la media poblacional para las mujeres se encuentre
entre 63,10 y 71,69.

C. Se podría concluir que no son muy diferentes en términos de confianza debido a que
la diferencia entre los intervalos de confianza de los hombres es de 8,37 mientras que
en el caso de las mujeres es de 8,59 y esta diferencia entre hombres y mujeres puede
explicarse porque los cálculos se hicieron con un 95% de nivel de confianza y no con
un 99%
Parte 3

PRUEBA DE HIPOTESIS

Plantear una prueba de hipótesis para la media de la variable seleccionada, tenga presente un
nivel de significancia de 5%.

PASO 1

H0: p = 0.80 y la afirmación es verdadera


H1: p < 0.80 y la afirmación es falsa

PASO 2: Determinar el nivel de significancia

Este nivel representa la probabilidad de rechazar una hipótesis nula verdadera,


matemáticamente se puede considerar un valor entre 0 y 1, pero para estudios de probabilidad
este nivel está determinado por el analista y debe basarse en las características del estudio, y el
riesgo aceptable de cometer el error tipo I

Alfa= 0,05

PASO 3

Calcular los intervalos que implican ese nivel de confianza

NIVEL DE CONFIANZA 95,00%


z = 1,95996398 (Usar la distribución de probabilidad inversa)

INTERVALO -1,95996398 - 1,95996398

PASO4

Calcular el estadístico de Prueba


μ= 68,8
𝑋= 76
𝜎= 1,95
n= 80
Desviación estándar tipificada 0,21793837
Valor de z tipificado 33,0368634
Como se encuentra fuera de la región de aceptación, esta da pie para que se tome una hipótesis
alterna y la nula quede completamente descartada.

PRUEBA DE HIPOTESIS

Plantear una prueba de hipótesis para la media de la variable seleccionada, tenga presente un
nivel de significancia de 5%.

PASO 1

H0: p = 0.80 y la afirmación es verdadera

H1: p < 0.80 y la afirmación es falsa

PASO 2: Determinar el nivel de significancia

Este nivel representa la probabilidad de rechazar una hipótesis nula verdadera,


matemáticamente se puede considerar un valor entre 0 y 1, pero para estudios de probabilidad
este nivel está determinado por el analista y debe basarse en las características del estudio, y
el riesgo aceptable de cometer el error tipo I

Alfa= 0,05
PASO 3

Calcular los intervalos que implican ese nivel de confianza

NIVEL DE CONFIANZA 95,00%

z = 1,95996398 (Usar la distribución de probabilidad inversa)

INTERVALO -1,95996398 - 1,95996398

PASO 4

Calcular el estadístico de Prueba

Desviación estándar tipificada 0,21793837

Valor de z tipificado 33,0368634

Como se encuentra fuera de la región de aceptación, esta da pie para que se tome una
hipótesis alterna y la nula quede completamente descartada.
CONCLUSIONES

Después de realizar las evaluaciones correspondientes y utilizar los métodos ya conocidos y


mencionados con anterioridad, podemos concluir que la veracidad de la información
suministrada en el resultado depende en su gran mayoría por la forma en que tomamo s las
muestra y cómo estas pueden incluir gran parte de disparidades que existen en una población.
Gran parte del éxito de un estudio como el que entregamos anteriormente depende en su
mayoría por el nivel de confianza que este pueda tener o brindar al lector. Ya que si el resultado
es muy amplio con respecto a los límites y su interacción con la media nos diría que la muestra
escogida no es la correcta y que deberíamos cambiar la forma en que seleccionamos la misma.
La viabilidad del estudio fue determinada por la exposición a las hipótesis planteadas y como
estas determinaron resultados coherentes con respecto a las pruebas y de esta forma descartar
cualquier tipo respuesta que afecte la finalidad del estudio estadístico.

S-ar putea să vă placă și