Documente Academic
Documente Profesional
Documente Cultură
CICLO : II
GRUPO :B
PUCALLPA – 2016
DEDICATORIA
Quiero dedicarle este trabajo.
A Dios que me da vida, a mi maestro por los
conocimientos que nos imparte, para lograr mis
metas en mis estudios profesionales y nuestros
padres por su apoyo incondicional.
2
INDICE
DEDICATORIA ................................................................................................... 2
INDICE ............................................................................................................... 3
ANEXOS .......................................................................................................... 52
3
6. INTRODUCCION A LA INFERENCIA ESTADISTICA
4
confiabilidad que se espera de los resultados, las características propias
del fenómeno analizado, etcétera.
Ejemplo
Si se dice que la media de las alturas de los estudiantes varones del I.E.S.
Nº9-OO8 “Manuel Belgrano” es de 1,77 m
( =1,77m), se está dando una estimación
puntual. En cambio, si se dice que la media de las alturas es de 1,77m
Estimador.
5
Por ejemplo: es un posible estimador de µ.
µ=θ
: Estimación puntual de µ.
= Estimador puntual de P.
σ2 : Varianza Poblacional.
6
6.1.1. Estimación puntual
del parámetro .
EJEMPLO
Estimador puntual de σ.
7
µ1 - µ2: Diferencia de dos medias poblacionales.
P1 – P2
Estimador puntual de
θ=µ
Ejemplo
9
normal, con una desviación estándar de $5. Una muestra de de 64
fumadores reveló que = $20.
a)¿Cuál es el estimador de intervalo de confianza de 95% para la μ?
95%
n = 64 = 20 σ= 5 N.C = 95% = .9500
20 ± 1.96 × .625 Intervalo de confianza 18.77 20 21.25
20 ± 1.225 18.77 − 21.25
90 - (1.96 x 12) =
90 - 23.52 = 66.48
90 + (1.96 x 12) =
90 + 23.52 = 113.52
11
De esta fórmula se puede observar que tanto el tamaño de la muestra como el
valor de σ se deben conocer. Z se puede obtener de la tabla de la distribución
EJEMPLO
EJEMPLO
13
Realice el ejercicio si se toma una muestra de 200 hojas y con consideraciones
de desviación estándar y media poblacional idénticas? Considérese un intervalo
de confianza del 95%.
𝜎
El error estándar es 𝜎𝑋̅ = =
√𝑛
100%−95% 𝛼
Las colas: = 2.5%. Equivalente al área A = 0.025 =
2 2
𝛼 INTERVALO DE CONFIANZA
A= = 0.025
2
𝑍1 𝑍2
11
Halamos el valor de 𝑍1 = 𝑍2 =
𝜎
𝑋̅𝑖−𝑠 = 𝑋̅ ± 𝑍𝑖−𝑠
√𝑛
Si reemplazamos cada una de las variables, hallamos los límites del intervalo:
𝜎
Para 𝑍1 = Hallemos el límite inferior 𝑋̅𝑖 = 𝑋̅ − 𝑍1
√𝑛
𝜎
Para 𝑍2 = Hallemos el límite inferior 𝑋̅𝑠 = 𝑋̅ + 𝑍2
√𝑛
MUESTRAS INDEPENDIENTES
14
Si puede suponerse que las varianzas de ambas poblaciones son iguales, el
intervalo de confianza para la diferencia de medias poblacionales está centrado
en la diferencia de las medias muestrales, siendo sus límites superior e inferior:
15
Comparar medias
Prueba T para muestras independientes
Al aceptar se obtienen:
16
- resultados de la prueba de Levene para contrastar la igualdad de
varianzas *
MUESTRAS DEPENDIENTES.
En este caso las muestras están formadas por parejas de valores, uno de cada
población y el estadístico se obtiene a partir de las diferencias de los valores de
las dos variables correspondientes a cada caso o di que se define como di= xi-
yi.
Analizar
Comparar medias
17
Las variables se deben seleccionar por parejas. Haciendo clic sobre las variables
de la lista aparecen sus nombres en el cuadro Selecciones actuales; una vez
seleccionadas las dos variables se trasladan al recuadro Variables
relacionadas de la forma habitual. En cada sesión se pueden seleccionar tantos
pares de variables como medias se quieran comparar.
Solución:
18
Al calcularle raíz cuadrada a este valor nos queda que sp = 4.41
Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente,
para este nivel confianza, no puede concluirse la existencia de una diferencia
entre las medias.
19
Para calcular el intervalo de confianza para la diferencia de dos medias se debe
saber si las varianzas poblacionales son conocidas o desconocidas, y en caso
de que sean desconocidas, se debe probar si son igual es o diferentes. Cada
uno de estos tres casos se analizarán por separado Varianzas conocidas pero
diferentes, σ 1 2 ≠ σ Si las varianzas poblacionales son conocidas y diferentes,
los pasos a seguir para encontrar el intervalo de confianza son los siguientes: a)
El estadístico usado como estimador puntual de la diferencia de medias μ1 − μ
2, será T = x 1 − x 2, que es un estimador suficiente b) La variable aleatoria
asociada con el estimador será la variable normal estándar dada por:
EJEMPLO
20
desviación estándar de 80 horas. Encontrar los límites de confianza de 95%,
para la diferencia de los tiempos de vida media de las poblaciones de la marca
A y B. Para un nivel de confianza de 95%.
Solución:
Marca A Marca B
n1 = 150 bombillos n1 = 200 bombillos
̅1 = 1.400 horas
𝒙 𝑥̅ 1 = 1.200 horas
𝜹𝟏 = 120 horas 𝛿1 = 80 horas
α = 0.05
α/2 α/2
0.95
0.025 0.025
-Z = -1.96 Z = 1.96
1202 802
− 𝜇𝐵 = 𝑃 (1.400 –1.200) ± 1.96 √ 150 +
𝜇𝐴̂ 200
177,8 < 𝜇𝐴 ̂
− 𝜇𝐵 < 222,16
Interpretación:
21
6.1.2.6. Intervalo de confianza para la diferencia de proporciones
poblacionales
Sea X1, X2,..., Xn1 una muestra aleatoria extraída de una población Bernoulli. Sea
X la variable Binomial definida como el número de éxitos en esta muestra y con
parámetro π1, proporción poblacional de éxitos.
Sea Y1, Y2,..., Yn2 una muestra aleatoria extraída de una población Bernoulli. Sea
Y la variable Binomial definida como el número de éxitos en esta muestra y
tomemos a π2 como la proporción de éxitos en esta otra población. Supongamos
que ambas muestras son independientes.
Nota:
EJEMPLO
Una prueba de hipótesis es una prueba estadística que se utiliza para determinar
si existe suficiente evidencia en una muestra de datos para inferir que cierta
condición es válida para toda la población.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población:
la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que
se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay
efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se
desea poder concluir que es verdadero.
EJEMPLO
23
𝑋̅ − 𝜇0 240 − 260 −20
𝑍= = = = −2.79
𝜎𝑋̅ 7.17 7.17
𝑭(𝒁)
REGION DE REGION DE
RECHAZO RECHAZO
Región de aceptación
𝒁
-1.96 +1.96
Se utiliza una prueba de una muestra para probar una afirmación con respecto
a una media de una población única.
24
Nota: Se considera práctico utilizar la distribución t solamente cuando se
requiera que el tamaño de la muestra sea menor de 30, ya que para muestras
más grandes los valores t y z son aproximadamente iguales, y es posible
emplear la distribución normal en lugar de la distribución t.
EJEMPLO
Un gerente de ventas de libros universitarios afirma que en promedio sus
representantes de ventas realiza 40 visitas a profesores por semana. Varios de
estos representantes piensan que realizan un número de visitas promedio
superior a 40. Una muestra tomada al azar durante 8 semanas reveló un
promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice
un nivel de confianza del 99% para aclarar esta cuestión.
Datos:
= 40
𝑥̅ = 42
n=8
𝑆=2
25
𝑥̅ − 𝜇
𝑡𝑝𝑟𝑢𝑒𝑏𝑎 =
𝑆
√𝑛
Solución:
H0: = 40
H1: > 40
Grados de libertad: n-1 = 8-1 =7
𝑥̅ − 𝜇 42 − 40 2
𝑡𝑝𝑟𝑢𝑒𝑏𝑎 = = = = 2,83
𝑆 2 0,7071
√𝑛 √8
H0 es aceptada, ya que tprueba (2,83) es menor que ttabla (3,499), por lo que no es
acertado pensar que están realizando un número de visitas promedio superior a
40.
26
En Excel
27
Posteriormente este valor es comparado con el valor de Z, obtenido a partir de
una tabla normal a un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de
proporciones pueden ser de una o dos colas.
Ejemplo
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe
esta aseveración, a un nivel de significación de 0,025, respecto a la alternativa
de que la proporción real de los estudiantes universitarios trabajan es mayor de
28
lo que se afirma, si una muestra aleatoria de 600 estudiantes universitarios revela
que 200 de ellos trabajan. La muestra fue tomada de 10000 estudiantes.
Los datos son:
29
El gráfico elaborado en Winstats y Paint se muestra a continuación:
Decisión:
30
6.2.3. prueba de hipótesis para la diferencia de medias poblacionales
31
Como una conclusión de este capitulo es que es semejante al capitulo
anterior, ya que sus cambios son pocos y los procesos a seguir son los
mismos.
EJEMPLO
Lisa Monnin es directora de presupuesto en la empresa New Process
Company, desea comparar los gastos diarios de transporte del equipo de
ventas y del personal de cobranza. Recopiló la siguiente información
muestral ( importe en dólares).
Cobranza
($) 130 102 129 143 149 120 139
32
6.2.4. Prueba de hipótesis para la diferencia de medias poblacionales con
observaciones variadas
𝑛1 𝑝̂1 + 𝑛2 𝑝̂ 2
𝜋̂ =
𝑛1 − 𝑛2
33
𝜋̂(1 − 𝜋̂) 𝜋̂(1 − 𝜋̂)
𝜎̂𝑝̂1 −𝑝̂2 = √ +
𝑛1 𝑛2
𝐻𝑜 : 𝜋1 = 𝜋2 ó 𝐻𝑜 : (𝜋1 − 𝜋2 ) = 0
𝑝̂1 − 𝑝̂2
𝑧=
𝜎̂𝑝̂1 −𝑝̂2
EJEMPLO:
. 99
𝛼 = 1 − .01 = = .495
2
𝑍 = 2.57
34
𝜋̂(1 − 𝜋̂) 𝜋̂(1 − 𝜋̂) (. 25)(.75) (. 25). 75)
𝜎̂𝑝̂1 −𝑝̂2 = √ + =√ + = √. 00375 + .00375
𝑛1 𝑛2 50 50
= .087
0
-2.57 2.57
-1.15
35
la misma fuente, se puede pensar que las medidas están pareadas. En
consecuencia dos medidas que se obtienen del mismo conjunto de
fuentes son dependientes. Note que si dos muestras son dependientes,
entonces necesariamente tienen el mismo tamaño.
EJEMPLO
1. Diez hombres se sometieron a una dieta especial registrando sus pesos antes
de comenzarla y después de un mes de estar en ella. Los resultados de los
pesos, en libras, se muestran a continuación:
Hombre A B C D E F G H I J
Antes 181 172 190 186 210 202 166 173 183 184
Después 178 175 185 184 207 201 160 168 180 189
Haga una prueba con = 0.05 para determinar si la dieta logró alguna
diferencia, ya sea positiva o negativa. Calcule el valor de P.
Solución:
Ensayo de hipótesis:
Ho; A - D =0
H1; A - D 0
Regla de decisión:
36
Si la tc < -2.262 ó si tc > 2.262 se rechaza Ho.
Cálculos:
Hombre A B C D E F G H I J
Antes 181 172 190 186 210 202 166 173 183 184
Después 178 175 185 184 207 201 160 168 180 189
Diferencia 3 -3 5 2 3 1 6 5 3 -5
Justificación y decisión:
Como 1.79 está entre los dos valores críticos de –2.262 y 2.262, por lo
| Seleccionar la opción Regresión > Lineal del menú Analizar para acceder al
cuadro de diálogo Regresión lineal que muestra la figura 18.4.
Con sólo estas especificaciones, al pulsar el botón Aceptar el Visor ofrece los resultados
que muestran las tablas 18.1 a la 18.3.
Bondad de ajuste
( los residuos son las diferencias existentes entre las puntuaciones observadas y los
2
pronósticos obtenidos con la recta). Tal como hemos señalado ya, R expresa la
proporción de varianza de la variable dependiente que está explicada por la variable
independiente. En nuestro ejemplo (tabla 18.1), R toma un valor muy alto (su máximo
es 1); y R 2 nos indica que el 77,5 % de la variación de salario está explicada por salini.
Es importante resaltar en este momento que el análisis de regresión no permite afirmar
38
que las relaciones detectadas sean de tipo causal: sólo es posible hablar de grado de
relación. Tabla 18.1. Resumen del modelo.
R cuadrado Error típ. de la
Modelo R R cuadrado corregida estimación
1 ,880 ,775 ,774 $8,115.36
Ecuación de regresión
Coeficientes no Coeficientes
estandarizados estandarizados
B Error típ. Beta t Sig.
(Constante) 1928,206 888,680 2,170 ,031
39
Y el coeficiente correspondiente a Salario inicial es la pendiente de la recta de regresión
(lo que hemos llamado B1):
B1 indica el cambio medio que corresponde a la variable dependiente (salario) por cada
unidad de cambio de la variable independiente (salini) . Según esto, la ecuación de
regresión queda de la siguiente manera:
Pruebas de significación
Finalmente, los estadísticos t y sus niveles críticos (Sig.) nos permiten contrastar
las hipótesis nulas de que los coeficientes de regresión valen cero en la
población. Estos estadísticos t se obtienen dividiendo los coeficientes de
regresión B0 y B1 entre sus correspondientes errores típicos:
siendo:
40
Estos estadísticos t se distribuyen según el modelo de probabilidad t de Student
con nn2 grados de libertad. Por tanto, pueden ser utilizados para decidir si un
determinado coeficiente de regresión es significativamente distinto de cero y, en
consecuencia, si la variable independiente está significativamente relacionada
con la dependiente.
EJEMPLO
Nº de clientes (X) 8 7 6 4 2 1
Distancia (Y) 15 19 25 23 34 40
Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe
situarse?
41
xi yi xi ·yi xi2 yi2
8 15 120 64 225
7 19 133 49 361
6 25 150 36 625
4 23 92 16 529
2 34 68 4 1 156
1 40 40 1 1 600
EJEMPLO
42
6.3.2. El método de los mínimos cuadrados ordinarios
43
La diferencia radica en que le regresión se expresa en una función o
relación funcional mediante una ecuación con su uso predictivo, y la
correlación es un valor que mide la intensidad con que están
relacionadas linealmente las variables, se esta hablado de una
regresión o correlación simple cuando se relacionan 2 variables, si
existen mas se habla de una correlación múltiple (el alcance de este
curso se limita a la simple).
Lineales
De la forma matemática Y(x) = a+ bXi
De segundo grado
De la forma matemática Y(x) = a+ bXi+cXi2
Exponenciales
De la forma matemática Y(x) = abx
De potencia
De la forma matemática Y(x) = aXin
EJEMPLO
Se desea estimar una función de costes para la empresa Elegant Rugs que
relacione los costes semanales de mano de obra indirecta de fabricación (Yi) con
las horas-máquina (X2i) y la cantidad de lotes de producción (X3i), usando la
siguiente información contable
44
3 1004 62 13
4 917 72 11
5 770 60 10
6 1456 96 12
7 1180 78 17
8 710 46 7
9 1316 82 14
10 1032 94 12
11 752 68 7
12 963 48 14
Se pide:
La correlación entre dos variables es - otra vez puesto en los términos más
simples - el grado de asociación entre las mismas. Este es expresado por un
único valor llamado coeficiente de correlación (r), el cual puede tener valores que
ocilan entre -1 y +1. Cuando “r” es negativo, ello significa que una variable (ya
sea “x” o “y”) tiende a decrecer cuando la otra aumenta (se trata entonces de una
“correlación negativa”, correspondiente a un valor negativo de “b” en el análisis
45
de regresión). Cuando “r” es positivo, en cambio, esto significa que una variable
se incrementa al hacerse mayor la otra (lo cual corresponde a un valor positivo
de “b” en el análisis de regresión).
Los valores de “r” pueden calcularse fácilmente en base a una serie de pares de
datos de “x” e “y”, utilizando la misma table y montos que se indican en el Paso
2 de la sección “regresión” de este capítulo. De este modo “r” puede ser obtenido
- indirectamente - a partir de la relación:
46
Figura 1b Los mismos datos que en 1a Fig. 1a, pero ajustados en base a la
regresión y = 2,16 - 0,173x, con r = 0,75
Cuando se calculan los valores de “r” se querrá saber, sin embargo, hasta qué
punto la correlación identificada pudiera haber surgido únicamente por
casualidad. Esto puede ser establecido verificando si el valor estimado de “r” es
“significativo”, es decir si el valor absoluto de “r” es mayor o igual que un valor
“crítico” de “r” indicado en las tablas estadísticas (ver Tabla de valores críticos
de “r” en el Apéndice 1).
EJEMPLO
47
Calcule “a”, “b” y “r” a partir de los datos presentados en la Tabla 1 y verifique,
por medio de la Tabla del Apéndice 1, hasta qué punto el valor estimado de “r”
es significativo para valores de P = 0,01 y de P = 0,05
P(Ai) = pi·
P(Bj) = p·j
Los valores de pi· y p·j se estimarán, a partir de los valores observados en la tabla
de contingencia, por ni·/N y n·j/N respectivamente.
Los valores observados son nij. Los valores esperados bajo la hipótesis nula de
independencia se calculan de la manera siguiente:
48
El estadístico de contraste se calcula de la manera habitual:
grados de libertad = k · m − (k − 1) − (m − 1) − 1 = (k − 1) · (m − 1)
donde el último término es el valor crítico asociado con una distribución χ2,
con (k − 1) · (m − 1) grados de libertad, tal que deja a su derecha una
probabilidad igual a α.
La condición de validez es que las frecuencias esperadas eij sean mayores que
5.
EJEMPLO
49
No. De Entrevistas No. De Alumnos
0 6
1 16
2 23
3 9
4 2
Solución:
G.L.= Clasificaciones -1
G.L.= 5-1 = 4
50
Paso 4. Calcular las Esperanzas. Como el patrón esperado es que todos los
estudiantes realicen el mismo número de entrevistas se calcula un promedio
entre las observaciones y el número de
51
ANEXOS
52
EJEMPLOS DESARROLLADOS
53
54
55
56
57
58
59
EJERCICIOS PLANTEADOS
60
5. La media de las estaturas de una muestra aleatoria de 400 personas de una
ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es
una variable aleatoria que sigue una distribución normal con varianza σ 2 =
0,16 m2.
Construye un intervalo, de un 95% de confianza, para la media de las
estaturas de la población.
¿Cuál sería el mínimo tamaño muestral necesario para que pueda decirse
que la verdadera media de las estaturas está a menos de 2 cm de la media
muestral, con un nivel de confianza del 90%?
61
8. En una población una variable aleatoria sigue una ley normal de media
desconocida y desviación típica 2.
Observada una muestra de tamaño 400, tomada al azar, se ha obtenido
una media muestra al igual a 50. ¿Calcule un intervalo, con el 97 % de
confianza, para la media de la población.
Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener la
muestra para qué la amplitud del intervalo que se obtenga sea, como
máximo, 1?
10. La duración de la bombillas de 100 W que fabrica una empresa sigue una
distribución normal con una desviación típica de 120 horas de duración.
Su vida media está garantizada durante un mínimo de 800 horas. Se
escoge al azar una muestra de 50 bombillas de un lote y, después de
comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de
significación de 0,01, ¿habría que rechazar el lote por no cumplir la
garantía?
62