Sunteți pe pagina 1din 19

TALLER No.

Parte I Inferencia para una Media

1. Un constructor está considerando la posibilidad de construir un centro


comercial en cierta localidad que llamaremos A. Como los ingresos de los
hogares de la comunidad son una consideración importante en esta
selección, se desea estudiar el ingreso promedio en A. Para apoyar la
decisión, se ha tomado una muestra aleatoria de 35 hogares seleccionados
en la localidad A, la cual muestra que el ingreso diario promedio es de
$51.500 con una desviación estándar de $3.600 .

Resumir en la tabla los procedimientos de inferencia necesarios para dar una


conclusión en cada uno de los escenarios planteados:

Escenario 1: El constructor esta interesado en saber si el ingreso promedio


ha cambiado respecto al censo del año anterior que indicaba que el ingreso
promedio en A era de $47.000 (s= $2.700)

 Parámetro de Interés: Evaluar si el ingreso promedio de la localidad A,


a cambiado respecto al censo del año anterior
 Hipótesis a probar: Ho: μ = 47.000 Vs Ha: μ ≠ 47.000
 Estadístico de Prueba

Z = 51.500 - 47.000
.=9,860
2.700
√ 35

 Región de Rechazo:

 Valor de P:

VALOR P
Z 7,395
Valor p 1,000 .Distr.norm.estand.n
Vr P _ Bilateral 2,000 .Distr.norm.estand.n * 2 grafica bilateral
 Conclusión: Tomando un nivel de confianza del 95% , entre los
limites (-1.96, 1.96), el estadístico de prueba cae en la zona de
rechazo , por tanto se rechaza Ho, el censo del año anterior indica
ninguna diferencia , siguen siendo el promedio para el presente año.
 IC para concluir en prueba Bilateral: Al construir un intervalo de 95%
de confianza se calcula:

𝑎 𝛿 𝑎 𝛿
𝑥̅ − 𝑍 ∗ < 𝜇 < 𝑥̅ + 𝑍 ∗
2 √𝑛 2 √𝑛

3600 3600
51500 − 1.96 ∗ < 𝜇 < 51500 + 1.96 ∗
√35 √35

Limite Inferior 50.307


Limite Superior 52.693

Escenario 2: El constructor también tiene como criterio que si hay evidencia


que el ingreso promedio es superior de $50.000 en una localidad, allí es
rentable la construcción del centro comercial . ¿Qué podemos decir al
respecto sobre la localidad A?.

 Parámetro de Interés: Evaluar que si el ingreso promedio de una


localidad es superior a 50,000, es rentable construir el centro
comercial, frente a la localidad A.

 Hipótesis a probar: Ho: μ < 50.000 Ha: μ > 50.000


 Estadístico de Prueba

Z = 51.500 - 50.000 .=2,465


3.600
35

 Región de Rechazo:
 Valor de P:

VALOR P
Z 2,465
Valor P 0,993 .Distr.norm.estand.n
Vr P _Der 0,007 Rechazo Ho

 Conclusión: Tomando un nivel de Confianza del 90%, con limite


superior del +1.64, el calculo recae sobre la zona de rechazo , por
tanto se rechaza la Ho, en donde la localidad A es rentable para
participar en la construcción, por que ingreso de lo habitantes es
superior a 50.000.

Escenario 3: Otra opción es considerar la posibilidad de que construir sólo


un supermercado, esto se haría si el ingreso promedio es inferior de $45.000.
¿Se debería construir el Supermercado en A?

 Parámetro de Interés: Evaluar el ingreso promedio, si es inferior a $45.000


para construir un supermercado en la localidad A
 Hipótesis a probar: Ho: μ > 45.000 Ha: μ < 45.000
 Estadístico de Prueba

Z = 51.500 - 45.000 .=10,682


3.600
35

 Región de Rechazo:

 Valor de P:

VALOR P
Z 10,682
Valor p_Izq 1,000 .Distr.norm.estand.n
 Conclusión: Se acepta Ho , ya que el valor de P es mayor al nivel de
significancia determinado . No obstante los habitantes de la población A,
ganan menos de 45.000.

2. Deseamos contrastar con un nivel de significación del ∝=3% si la altura


media de los habitantes hombres de una ciudad difiere de la estatura
masculina promedio nacional que es de 174 cm. Para ello nos basamos en
un estudio en el que con una muestra de n=35 personas se obtuvo una media
de 170 cm y una desviación estándar de 6cm. ¿A la luz de esos datos que
podemos concluir?. a) Responder utilizando una prueba de hipótesis. B)
Utilice el IC del 97% para responder.

 Parámetro de Interés: Constatar si el promedio de altura hombres


difiere con el promedio Nacional.
 Hipótesis a probar: Ho: µ = 174 Vs Ha: µ ≠ 174
 Estadístico de Prueba:

𝟏𝟕𝟎 − 𝟏𝟕𝟒 𝟒
𝒁= = − = −𝟑. 𝟗𝟒𝟎 𝑬𝒑
𝟔/√𝟑𝟓 𝟏. 𝟎𝟏𝟓

 Región de Rechazo:

 Valor P:

Valor P 0,000040 .+DISTR.NORM.ESTAND


Valor P 0,000080

 Conclusión: Con un nivel de significancia del 3%, se refleja que la


estatura promedio difiere de promedio nacional hombres, por tanto,
se rechaza Ho. Según valor P >3% = 0.000040 y 0.00080 se ubica
por encima del nivel de significancia.
 Prueba de Muestras en SPSS: Al realizar la ejecución en SPPS
Estadísticas de muestra única
Desviación Media de error
N Media estándar estándar
VAR00006 35 170,4763 5,18575 ,87655
3. Sin una preparación oficial los resultados de una prueba llamada SATM
varían normalmente con 𝜇 = 475 𝑦 𝜎 = 100.Pruebe la siguiente hipótesis en
cada uno de los casos citados: H0: 𝜇 = 475 vs Ha: 𝜇 > 475
a) De cien estudiantes que tomaron un curso de preparación para esta
prueba, el promedio fue 𝑥̅ = 478 y s = 95. Use un ∝= 5%

 Hipótesis a probar: Ho: ≠ 475 Ha = 475


 Estadístico de Prueba:

𝟒𝟕𝟖 − 𝟒𝟕𝟓 𝟑
𝒁= = = 𝟎. 𝟑𝟏 𝑬𝒑
𝟗𝟓/√𝟏𝟎𝟎 𝟗. 𝟓

 Región de Rechazo:

 Valor P:

P= 2*P (Z>|EP|)
P= 2*P (Z> 0.31)= 2* 0.3760= 0.752.

Estadísticas de muestra única


Desviación Media de error
N Media estándar estándar
VAR00004 100 478,9101 92,82159 9,28216
 Conclusiones: Resultado en SPSS arroja para cada cola 0.337 de
significación , entonces este (0.33) es mayor de 0.025 , no se
rechaza Ho , los resultados de la prueba SATM no es igual a 475
puntos.

b) Al año siguiente aumenta el número de participantes en el curso de


preparación, se toma una muestra de mil estudiantes que tomaron el
curso de preparación y presentaron la prueba, el promedio fue de 𝑥̅ =
478 y s = 95. Use un ∝= 5%
 Hipótesis a Probar: Ho: ≠ 475 Ha = 475
 Estadistico de Prueba:

𝟒𝟕𝟖 − 𝟒𝟕𝟓 𝟑
𝒁= = = 𝟏 𝑬𝒑
𝟗𝟓/√𝟏𝟎𝟎𝟎 𝟑. 𝟎𝟎

 Región de Rechazo:

Estadísticas de muestra única


Desviación Media de error
N Media estándar estándar
VAR00001 1000 478,6649 96,78586 3,06064
 Conclusiones: Teniendo en cuenta la significación, se acepta la Hoya que
los resultados de la prueba SATM, varían normalmente frente al curso de
preparación. Pasando a N=1000.

c) Después de una fuerte campaña publicitaria, muchos estudiantes asisten


al curso de preparación para la prueba. Se toma una muestra de 10000
estudiantes y se observa 𝑥̅ = 478 y s = 95. Use un ∝= 5%
 Hipótesis a Probar: Ho: ≠ 475 Ha = 475
 Estadístico de Prueba:

𝟒𝟕𝟖 − 𝟒𝟕𝟓 𝟑
𝒁= = = 𝟑. 𝟏𝟔 𝑬𝒑
𝟗𝟓/√𝟏𝟎𝟎𝟎𝟎 𝟎. 𝟗𝟓

 Región de Rechazo:
 Conclusiones: Teniendo en cuenta la significación, se acepta la Ho ya
que los resultados de la prueba SATM, varían normalmente frente al curso
de preparación. Pasando a N=10.000.

d) Observando los resultados anteriores, ¿qué podemos concluir sobre el


efecto del tamaño de muestra en las pruebas de hipótesis?

RTA: A medida que el número de las observaciones obtenidas aumenta, la


𝑥̅ de los valores observados se acerca más y más a la 𝜇 . Después de muchas
repeticiones, la proporción de resultados que toman un valor determinado se
acerca a la probabilidad de este valor y la media de los resultados de acerca
a la 𝜇 poblacional.

4. Leer Capítulo 6 del libro de Moore. Luego resolver 6.18 6.19. 6.36 6.38 6.39

6.18. ¿Por qué la gente prefiere las farmacias? Un estudio examinó la


percepción de los consumidores sobre la atención en los tres tipos de
establecimientos, utilizando un extenso cuestionario que preguntaba cosas
como “tienda agradable y atractiva”, “personal con conocimientos” y “ayuda
en la elección entre varios tipos de medicamentos sin receta”. El resultado
del estudio se basaba en 27 preguntas de ese tipo. Los sujetos fueron 201
personas escogidas al azar en la guía telefónica de Indianápolis.

(a) ¿De qué población crees que los autores del estudio quieren extraer las
conclusiones? ¿De qué población estás seguro que se pueden extraer?

RTA: Al llevar al apple en un intervalo de confianza por abajo 1.96 arroja las
siguientes probabilidades:
 Tiendas Alimentación: P 0.2515
 Grandes Superficies: P 0.181
 Farmacias: P 0.095

Por lo anterior se evidencia que los investigadores utilicen las “Tiendas de


Alimentación” ya que arroja una mayor probabilidad en la encuesta por puntos a
favor.
(b) Calcula intervalos de confianza del 95% para la media del desempeño
de cada tipo de tienda.

RTA:

̅ ∓ 𝒁 ∗ 𝜹/√𝒏
𝒙

Tiendas de Alimentación
𝟏𝟖. 𝟔𝟕 ∓ 𝟏. 𝟗𝟔𝟎 ∗ 𝟐𝟒. 𝟗𝟓/√𝟐𝟎𝟏
= 18.67 ∓ 3.449
= 15.221 𝑎 22.11

Grandes Superficies
𝟑𝟐. 𝟑𝟖 ∓ 𝟏. 𝟗𝟔𝟎 ∗ 𝟑𝟑. 𝟑𝟕/√𝟐𝟎𝟏
= 32.38 ∓ 4.61
= 27.76 𝑎 36.99
Farmacias

𝟒𝟖. 𝟔𝟎 ∓ 𝟏. 𝟗𝟔𝟎 ∗ 𝟑𝟓. 𝟔𝟐/√𝟐𝟎𝟏


= 48.60 ∓ 4.92
= 43.67 𝑎 53.52

(c) Basándote en los intervalos de confianza, ¿estás convencido de que los


consumidores creen que las farmacias son mejores que los otros tipos
de tiendas?

Según el error de estimación para cada almacén se determina el mayor grado de


confianza, que seria el que mayor amplitud de intervalo presente.

𝑬 = 𝒁 ∗ 𝜹/√𝒏

 T. Alimentación: E. Estimación = 3.449


 G. Superficies: E. Estimación = 4.61
 Farmacias: E. Estimación = 4.92

RTA: Por lo anterior las Farmacias calculan un mayor error de estimación con un
4.92, lo que significa que es el mayor grado de confianza frente a la encuentra, es
así que los consumidores creec que las farmacias son mejores que otros tipos de
tiendas, en cuanto “Tienda agradable y atractiva”, “personal con conocimiento” y
“ayuda en relación medicamentos sin recetas”.

6.19. Curación de heridas en la piel. Unos investigadores que estudiaban


la cicatrización de las heridas de la piel midieron la rapidez con la que se
cerraba uncorte hecho con una hoja de afeitar en la piel de un tritón
anestesiado. He aquí los resultados de 18 tritones, expresados en micras
(millonésima parte de un metro)
por hora: 29 27 34 40 22 28 14 35 26 35 12 30 23 18 11 22 23 33

(a) Dibuja un diagrama de tallos con estos datos (divide los tallos). Es difícil
valorar la normalidad a partir de 18 observaciones; sin embargo, busca si hay
observaciones atípicas o asimetrías extremas. ¿Qué hallaste?

Descriptivos

Estadístico Error estándar

VAR00002 Media 25,6667 1,96206

95% de intervalo de confianza Límite inferior 21,5271

para la media Límite superior 29,8062

Media recortada al 5% 25,6852

Mediana 26,5000

Varianza 69,294

Desviación estándar 8,32431

Mínimo 11,00

Máximo 40,00

Rango 29,00

Rango intercuartil 12,25

Asimetría -,253 ,536

Curtosis -,659 1,038

Gráfico de tallo y hojas

Frecuencia Stem & Hoja

1,00 1 . 1
1,00 1 . 2
1,00 1 . 4
,00 1 .
1,00 1 . 8
,00 2 .
4,00 2 . 2233
,00 2 .
2,00 2 . 67
2,00 2 . 89
1,00 3 . 0
1,00 3 . 3
3,00 3 . 455
,00 3 .
,00 3 .
1,00 4 . 0

Ancho del tallo: 10,00


Cada hoja: 1 caso(s)

RTA: No existen desviaciones de normalidad notables

(b) En general, los científicos dan por supuesto que los animales de la
muestra constituyen una muestra aleatoria simple de su especie o tipo
genético. Considera que estos tritones son una muestra aleatoria simple y
supón, además, que la desviación típica poblacional de la velocidad de cierre
de las heridas de esta especie es de 8 micras por hora. Calcula un intervalo
de confianza para la media de la velocidad de cierre de esta especie.

 RTA: Manualmente con Intervalo de Confianza del 90%

= 𝟐𝟓. 𝟔𝟔 ∓ 𝟏𝟏. 𝟔𝟒𝟓 ∗ 𝟖/√𝟏𝟖


= 𝟐𝟓. 𝟔𝟔 ∓ 𝟑. 𝟎𝟗𝟐𝟔
= 𝟐𝟐. 𝟓𝟎 𝒂 𝟐𝟖. 𝟕𝟓

c) Una amiga que casi no sabe nada de estadística utiliza la fórmula x¯ §


z¤ ps n que ha sacado de un manual de biología para calcular un intervalo
de confianza del 95% para la media. Su intervalo de confianza, ¿es más
ancho o más estrecho que el nuestro? Explica a tu amiga por qué una
mayor confianza cambia la anchura del intervalo.

RTA: Con un Intervalo de Confianza del 95% que es de mayor amplitud comparado
con el 90% calculado en (b), es de mas confianza por el rango aumenta pasando
de (22.50 a 28.75) a (21.97 a 29.35). Según error de estimación pasa de 6.24 a 7.38
con diferencia positiva de 1,14.

6.36. Llenando botellas de cola. Se supone que las botellas de una famosa
cola contienen 300 mililitros (ml). Existe una cierta variación entre las botellas
porque las máquinas embotelladoras no son absolutamente precisas. La
distribución de los contenidos de las botellas es normal con una desviación
típica s = 3 ml. Un inspector que sospecha que la embotelladora llena menos
de lo que debiera, mide el contenido de seis botellas. Los resultados son
299,4 297,7 301,0 298,9 300,2 297,0 Estos datos, ¿proporcionan suficiente
evidencia a favor de que el contenido medio de las botellas de cola es menor
de 300 ml?

(a) Plantea las hipótesis que contrastarás.


RTA: Ho >= 300 Ha < 300
(b) Calcula el estadístico de contraste.

Estadísticas de muestra única


Desviación Media de error
N Media estándar estándar
VAR00003 6 299,0333 1,50289 ,61355

Prueba de muestra única


Valor de prueba = 300
95% de intervalo de confianza de
Diferencia de la diferencia
t gl Sig. (bilateral) medias Inferior Superior
VAR00003 -1,576 5 ,176 -,96667 -2,5438 ,6105

c) Halla el valor P y expresa tus conclusiones.


 P (Z > EP) = 0.0879
= DISTRI.T.CD = (1.576;5) = 0.0879

 En SPSS : Sig. Bilateral ÷2 = 0.176 ÷ 2 =0.088

RTA: 0.088 es mayor que 0.05, entonces no rechazo Ho ya que arroja suficiente
evidencia a favor en el embotellamiento de 300 en cada botella.

6.38. Nicotina en cigarrillos. Para determinar si el contenido medio de


nicotina de una marca de cigarrillos es mayor que el valor anunciado de 1,4
miligramos, se contrasta: H0 : m = 1,4 Vs Ha : m > 1,4
El valor calculado del estadístico de contraste es z = 2,42.
(a) El resultado, ¿es significativo a un nivel del 5%?
RTA: P (Z > 2.42) = 0.9922+1= 1.9922
A un nivel de significancia del 5%, el nivel de nicotina es superior a 1.4,
por lo tanto, se rechaza la Ho.

(b) El resultado, ¿es significativo a un nivel del 1%?

RTA: P (Z > 2.42) = 1-0.9922= 0.0078


A un nivel de significancia del 1%, el nivel de nicotina es inferior a 1.4,
por lo tanto no se rechaza la Ho.

(c) Comparando z con los valores críticos de la última fila de la tabla C, ¿entre
qué dos valores se halla el valor P?

6.39. Coeficientes de inteligencia. He aquí los resultados de la prueba IQ de


31 estudiantes de primero de bachillerato:
Trata a las 31 chicas como una muestra aleatoria simple de todas las chicas
de primero de bachillerato de tu ciudad. Supón que la desviación típica de la
IQ de esta población es conocida y sea s = 15.
(a) Calcula un intervalo de confianza del 95% para la media de los IQ m de
la población.
N= 31
S= 15
𝑥̅ = 105.83
= 𝟏𝟎𝟓. 𝟖𝟑 ∓ 𝟏. 𝟗𝟔𝟎 ∗ 𝟏𝟓/√𝟑𝟏
= 𝟏𝟎𝟓. 𝟖𝟑 ∓ 𝟓. 𝟐𝟖𝟎
= 𝟏𝟎𝟎. 𝟓𝟓 𝒂 𝟏𝟏𝟏. 𝟏𝟏
(b) ¿Existe evidencia significativa a un nivel del 5% de que la media de los
IQ de la población es diferente de 100? Plantea las hipótesis y utiliza tu
intervalo de confianza para responder a la pregunta sin hacer más
cálculos
 Ho : 𝜇 = 100 Vs Ha 𝜇 = 100
 100 no se halla en el intervalo de confianza del 95%, rechaza Ho a un 𝛼 =
5%( para una alternativa de 2 colas )

Parte II Validar el supuesto de normalidad

Validar el supuesto de normalidad para la variable Salario actual de la base de datos


de empleados utilizando:
a) Histograma b) Boxplot o gráfico de caja y bigotes c) QQ plot d) Coeficiente
de asimetría e) Coeficiente de curtosis

RTA: Se observa una distribución sesgada hacia la derecha con


(Asimetría=2.125), lo que refleja algunos salarios fuera del comportamiento
normal.

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Salario actual ,208 474 ,000 ,771 474 ,000
a. Corrección de significación de Lilliefors
RTA: Al verificar la prueba de normalidad se utiliza Kolmogorov, ya que el numero
de datos es mayor a 50, y se evidencia que no hay normalidad en salario Actual
por que es menor de 0.05 (sig).

RTA: Existen puntos atípicos por esta razón no es normal, la cola de los bigotes
difieren en su tamaño, hay una mas larga que la otra.. igualmente evidencia la
falta de normalidad.
Estadísticos descriptivos

Desviaci

ón

N Mínimo Máximo Media estándar Asimetría Curtosis

Error

Estadí Estadísti Estadísti Estadísti Estadísti Estadís estánd Estadísti

stico co co co co tico ar co Error estándar

Salario 474 $15,750 $135,000 $34,419. $17,075. 2,125 ,112 5,378 ,224

actual 57 661

RTA: Respecto a Curtosis es alta la concentración ya que es mayor a 3, y según


la asimetría arroja un valor positivo diferente a cero, lo que indica que la cola esta
hacia la derecha tal como se encuentra en el histograma, el 2.125 refleja que la
concentración a l izquierda igualmente.
4. Coeficiente de Correlación

 Medida con grado de asociación lineal entre dos variables cualitativas.


 Diagrama de Dispersión: comparar cuando se traza la línea recta de Función.
 R: mide la fuerza y el sentido de relación
 Formula : 𝜌 = 𝑆 ∗ 𝑦/𝑆 ∗ 𝑠𝑦
 Resultados: -1 asociación lineal perfecta negativa , 0 no hay asociación, 1
asociación lineal perfecta positiva.
 Tabla:
.+- 1 .+- 1
.+- 0,9 .+- 0,95
.+- 0,7 .+- 0,84
.+- 0,5 .+- 0,69
.+- 0,2 .+- 0,49
.+- 0,1 .+- 0,19
.+- 0,1 .+- 0
A medida que R va disminuyendo va hacer nula

 Formula Excel:
DESARROLLO TALLER 4
Estadística Descriptiva

ANGELA KATERINE RANGEL LEAL


CD.

Tulia Esther Rivera

UNIVERSIDAD INDUSTRIAL DE SANTANDER


FACULTAD DE MATEMATICAS
ESPECIALIZACION EN ESTADISTICA
2019
Parte III Estadística Descriptiva: ver instructivo en el
Dropbox para completar lo aquí propuesto.

5. Conseguir una base de datos con las siguientes características: un tamaño


de muestra no tan pequeño (n > 50), un buen número de variables (más de
5) entre numéricas y categóricas, que se tenga acceso o manejo sobre el
contexto de los datos para poder interpretarlos adecuadamente.

6. Editar una base de datos en SPSS que sirva de base para la presentación
de un análisis descriptivo de la misma, esto incluye definir en vista de
variables aspectos como: nombre, tipo de variables, colocar etiquetas y
definir valores (en el caso de variables categóricas).

7. Explorar los datos: incluye acciones como: eliminar variables que no exhiban
relevancia, determinar la presencia de valores faltantes o valores extremos,
crear o definir nuevas variables (por ejemplo si tenemos las variables peso y
estatura podría ser útil definir la variable Indice de masa corporal (IMC), en
SPSS se usa la opción Calcular del menú Transformar), segmentar la base
de datos, seleccionar casos, etc. En clase se debieron hacer comentarios
sobre esto.

8. Explore el uso del coeficiente de correlación a través del applet disponible en


http://www.rossmanchance.com/applets/RegShuffle.htm , sólo activar la
opción Correlation coeficient y Move observations. Escribir conclusiones
sobre el uso de este coeficiente, en qué casos es útil, y pautas sobre su
interpretación.

Indique si es posible incorporar una correlación a su análisis descriptivo,


de ser así, no olvide reportar gráfico de dispersión y coeficiente de
correlación para mejorar la interpretación.

9. Consultar acerca de Tabla de contingencia o tabla cruzada. Dar un ejemplo


de una tabla de contingencia preferiblemente obtenida en SPSS y a partir
de la base de datos que sustentará su trabajo (la del punto 2 de esta
sección), revisar pautas sobre su uso.

http://www.learningaboutelectronics.com/Articulos/Calc
uladora-de-prueba-de-hipotesis-
estadistica.php#answer

https://www.geogebra.org/m/VME5NlAq

http://www.rossmanchance.com/applets/Dotplot.html?h
ideExtras=1

http://onlinestatbook.com/2/calculators/normal_dist.htm
l
http://www.rossmanchance.com/applets/ConfSim.html?
language=1

S-ar putea să vă placă și