Documente Academic
Documente Profesional
Documente Cultură
UNIDAD NMERO 5
E S TA D I S T I C A A P L I C A D A
INTRODUCCIN
1
INDICE
2
Contenid
INTRODUCCIN............................................................................................................... 2
1 Inferencia Estadstica................................................................................................... 4
MUESTREOS.................................................................................................................... 5
Tipos de Muestreo.............................................................................................................. 5
PRUEBA DE HIPTESIS.................................................................................................... 6
Conclusiones de una Prueba de Hiptesis.............................................................................7
2
Estimacin puntual................................................................................................... 7
Propiedades de un estimador...............................................................................................8
Estimacin por intervalo...................................................................................................... 9
Estimacin puntual........................................................................................................... 10
Estimacin por intervalos................................................................................................... 10
Intervalos de confianza..................................................................................................... 11
Poblacin normal de varianza desconocida..........................................................................15
Intervalo de confianza para la diferencia entre medias...........................................................16
Intervalo de confianza para una proporcin..................................................................17
Aproximacin asinttica................................................................................................ 17
Intervalo exacto............................................................................................................ 18
Intervalo de confianza para razones de dos varianzas..................................................21
3 Prueba de Hiptesis.................................................................................................. 25
METODOLOGIA PARA LA PRUEBA DE HIPOTESIS.............................................................25
HIPOTESIS NULA..................................................................................................... 25
HIPOTESIS ALTERNATIVA......................................................................................... 25
ERROR TIPO UNO Y TIPO DOS........................................................................................ 26
ERROR TIPO 1......................................................................................................... 26
ERROR TIPO 2......................................................................................................... 26
PRUEBA DE HIPOTESIS PARA LA MEDIA..........................................................................26
PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIAS...................................................26
EJEMPLOS DE HIPTESIS NULA Y ALTERNATIVA.............................................................27
ERROR TIPO UNO Y TIPO DOS.......................................................................................28
ERROR TIPO 1............................................................................................................ 28
ERROR TIPO 2............................................................................................................ 28
PRUEBA DE HIPTESIS PARA LA MEDIA.........................................................................28
MUESTRAS GRANDES................................................................................................ 28
EJEMPLO................................................................................................................... 28
MUESTRAS PEQUEAS.............................................................................................. 29
EJEMPLO................................................................................................................... 29
PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIAS...................................................30
EJEMPLO................................................................................................................... 31
PRUEBA DE HIPOTESIS PARA PROPORCIONES...............................................................32
EJEMPLO................................................................................................................... 32
PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE PROPORCIONES.................................33
EJEMPLO................................................................................................................... 33
PRUEBA DE HIPTESIS PARA UNA VARIANZA................................................................34
EJEMPLO................................................................................................................... 35
PRUEBA DE HIPOTESIS PARA LA RAZON DE VARIANZAS................................................36
EJEMPLO................................................................................................................... 36
4 Correlacin y Regresin............................................................................................. 38
DISTRIBUCIONES BIDIMENSIONALES.............................................................................38
COVARIANZA................................................................................................................. 40
CORRELACIN............................................................................................................... 40
COEFICIENTE DE CORRELACIN LINEAL........................................................................42
RECTA DE REGRESIN.................................................................................................. 43
Bibliografa...................................................................................................................... 44
Conclusin...................................................................................................................... 46
1 INFERENCIA ESTADSTICA
4
TAMAOS DE ERRORES
6
H 0 Verdadera
H 0 Falsa
Rechazamos H 0
Decisin Correcta
No Rechazamos H 0
Decisin Correcta
ESTIMACIN PUNTUAL
Estimador
Un estimador de un parmetro es un estadstico T=T (X 1,..., Xn)
Usado para estimar el valor del parmetro de una poblacin.
El valor observado del estadstico t = T(x1,..., xn) es la estimacin de , y la
^
representamos por
PROPIEDADES
DE UN ESTIMADOR
x =
p , p =
p (1 p )
n
Parmetro
poblacional
Estimador
Estimacin
Media
Object 129
Varianza
Proporcin
i 1
2 S 2
Xi
n
1 n
( X i X )2
n 1 i 1
X
nmeroxitos
n nmeropruebas
x
i 1
s2
1 n
xi x
n 1 i 1
x
n
Ejercicio
Dada una poblacin X, que sigue una distribucin cualquiera con media y
desviacin estndar .
9
x =
x =
y desviacin
2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin
normal, aproximadamente un 95% de los datos estaban situados a una distancia
inferior a dos desviaciones estndar de la media.
De lo anterior se deduce que:
Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad
de que la media de la poblacin est contenida en l es de 0.95.
Este tipo de intervalos se llaman intervalos de confianza de un parmetro
poblacional. El nivel de confianza (1 - ) del intervalo es la probabilidad de que
ste contenga al parmetro poblacional. En el ejemplo anterior, el nivel de
confianza era del 95% ( = 0,05).
ESTIMACIN PUNTUAL
Consideremos el estimador T(X1, ..., Xn) = Max{X1, ..., Xn} = X(n) para estimar el
extremo superior del intervalo. Queremos determinar si es un estimador
insesgado. Necesitamos conocer su distribucin para calcular su esperanza...
La densidad de una uniforme en (0, ) es f (x) = 1/ , para 0 < x < , y su funcin
x
1 dt= x
0
10
ESTIMACIN
es
POR INTERVALOS
11
INTERVALOS
DE CONFIANZA
De forma que:
Al intervalo
se le llama intervalo
de confianza de al nivel de confianza del
.Es muy importante
observar que sera un error afirmar que la probabilidad indicada anteriormente, es
la probabilidad de que est entre los nmeros reales
y
parmetro que tendr un valor concreto, aunque sea desconocido. Las variables
aleatorias son
y
la muestra, luego la probabilidad anterior debe ser considerada como la
probabilidad de que el intervalo aleatorio
al variar
al
El esquema general para la estimacin de un intervalo de confianza es:
estimador coeficiente de confiabilidad error estndard
El coeficiente de confiabilidad ( z o t ) indica entre ms/menos cuntos errores
estndar del estimador est 1 del rea de la distribucin muestral del
estadstico.
La probabilidad de que los valores obtenidos a travs del estimador por medio de
un intervalo contenga el verdadero valor del parmetro que se pretende estimar de
la poblacin, es 1 . La probabilidad de estimar 1 de la poblacin se llama
tambin coeficiente de confianza o probabilidad de acertar. Los coeficientes de
confianza ms utilizados son: 0,90, 0,95 y 0,99.
La probabilidad (probabilidad de equivocarse) se divide en dos reas en los
extremos
Para
Para
Para
A la mitad de la amplitud del intervalo de confianza se le llama precisin del
estimador.
En todo intervalo de confianza hay un aspecto positivo y un aspecto negativo:
El positivo, se ha usado una tcnica que acierta en una alta proporcin de casos;
El negativo, se desconoce si en el caso concreto se ha acertado.
Operando, resulta:
14
tal que:
15
al que:
INTERVALO
16
Sean (X1, X2,, Xn) y (Y1, Y2,, Ym) muestras aleatorias simples
independientes.
(X1, X2,, Xn) es muestra aleatoria de una variable .X, que supondremos
(Y1, Y2,, Ym) es muestra aleatoria de una v.a. Y, que supondremos
Con ellas queremos construir intervalos de confianza para la diferencia de medias,
Con las muestras de X e Y obtenemos que
Tiene distribucin N (0, 1) y puede ser usado como estadstico pivote. Podemos
escribir la siguiente proposicin:
Remplazando P se obtiene
17
APROXIMACIN ASINTTICA
Tiene la ventaja de la simplicidad en la expresin y en los clculos, y es la ms
referenciada en la mayora de textos de estadstica. Se basa en la aproximacin
18
que sigue una distribucin N(0, 1), y aadiendo una correccin por continuidad al
pasar de una variable discreta a una continua, se obtiene el intervalo de confianza
asinttico:
donde z/2 es el valor de una distribucin Normal estndar que deja a su derecha
una probabilidad de /2 para un intervalo de confianza de (1 ) 100 %. Las
condiciones generalmente aceptadas para considerar vlida la aproximacin
asinttica anterior son:
INTERVALO EXACTO
Aun cuando las condiciones anteriores no se verifiquen, es posible la construccin
de un intervalo exacto, vlido siempre pero algo ms complicado en los clculos.
Es posible demostrar que un intervalo exacto para el parmetro p viene dado por
los valores siguientes:
19
, y varianzas conocidas
, respectivamente. Se
para la diferencia de
las proporciones
Sean
primera poblacin y
observaciones tomadas de la
observaciones
es un estimador puntual de
. La variable aleatoria
tiene una distribucin normal estndar si las dos poblaciones son normales, o es
aproximadamente normal estndar si se cumplen las condiciones del teorema del
lmite central, respectivamente.
se obtiene:
, donde se rechaza
El cual rechaza
si
Ejemplo
En una muestra aleatoria de 85 soportes para el cigeal de un motor de
automvil, 10 tienen un terminado que es ms rugoso de los que las
especificaciones permiten. Supngase que se hace una modificacin al proceso
de acabado de la superficie y que, de manera subsecuente, se toma una segunda
muestra de 85 ejes. El nmero de ejes defectuosos en esta segunda muestra es
de 8. Obtngase un intervalo de confianza del 95% para la diferencia en la
proporcin de los soportes defectuosos producidos por ambos procesos y pruebe
la hiptesis de que la proporcin de soportes defectuosos producidos por ambos
procesos es la misma.
Solucin.
21
.
El inters es la diferencia en la proporcin de los soportes defectuosos entre
:
Este intervalo de confianza incluye al cero, as que, con base en los datos
muestrales, parece poco probable que los cambios hechos en el proceso de
acabado de la superficie hayan reducido el nmero de soportes defectuosos para
cigeal producidos por el proceso.
Si se utiliza el estadstico presentado en (1), se encuentra:
Rechazndose tambin la hiptesis nula, por lo tanto se concluye que los cambios
hechos en el proceso de acabado de la superficie no han reducido el nmero de
soportes defectuosos para cigeal producidos por el proceso.
22
Recuerde que:
Por ejemplo,
Para construir un intervalo de confianza para
23
, ntese que:
cae fuera de este intervalo de confianza. Adems, para probar esta hiptesis se
puede hacer uso tambin del estadstico:
el cual rechaza
si
o si
Ejemplo
Una empresa ha estado experimentando con dos disposiciones fsicas distintas de
su lnea de ensamble.
24
Solucin.
a)
y
Luego reemplazando en el intervalo
de confianza obtenido para la razn de varianzas, se obtiene que:
Puesto que todos los valores en el intervalo (0.1634; 0.9176) son menores de 1, la
varianza de la lnea de ensamble 2 es ms grande que la varianza de la lnea 1.
b) Para las siguientes hiptesis,
puesto que
c) El valor p es igual a P(
Puesto que el valor p es menor que 5%, H es rechazada.
25
3 PRUEBA DE HIPTESIS
La prueba de hiptesis suele comenzar con alguna teora, afirmacin, o
aseveracin sobre un parmetro especifico de una poblacin.
H0
H0
H1
, es la aseveracin de que es
determinan una hiptesis alternativa que debe ser cierta si la hiptesis nula es
H1
H0.
falsa. La hiptesis alternativa
es opuesta a la hiptesis nula
26
HO
HO
Se tienen dos tipos de concretos. Se toma una muestra de tamao 42 de cada uno
y se obtiene un promedio muestral de la conductividad trmica para el primero de
0.486 con una desviacin estndar de 0.187 y un promedio de 0.359 de
conductividad trmica con una desviacin estndar de 0.158 para el segundo.Esta
informacin sugiere que el promedio verdadero de conductividad trmica del
primer concreto es mayor que la del segundo, con = 0.01.
a.
15
H0: = 32
b.
H1: 32
H0: p .65 c.
H0:
H1:
> 15
d.
H0: p .6
H1: p < .6
e.
H0: 4
H1: < 4
ERROR TIPO 2
Se presenta cuando no se rechaza la hiptesis nula H0 siendo falsa y debera
rechazarse. La probabilidad de que se presente un error tipo 2 es .
29
EJEMPLO
Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao
pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin
estndar poblacional de 8.9 aos. Queremos probar si la vida media hoy en da
es mayor a 70 aos con base en esa muestra. La muestra parecera indicar que
es as pero Cul es la probabilidad de que la media de la muestra no refleje la
verdadera media de la poblacin?
Utilizar un nivel de significancia de 0.05.
Solucin:
Se trata de una distribucin muestral de medias con desviacin estndar conocida.
Paso nmero 1. Datos.
=70 aos
s = 8.9 aos
X = 71.8 aos
n = 100
= 0.05
Paso nmero 2. Establecemos la hiptesis.
H0; = 70 aos.
H1; > 70 aos.
Paso nmero 3. Nivel de significancia.
z
= 0.05,
= 1.645
Paso nmero 4. Regla de decisin.
Si z 1.645 no se rechaza H0.
Si z > 1.645 se rechaza H0.
Paso nmero 5. Clculos del valor de z para los
datos.
Paso nmero 6. Decisin y justificacin.
Como 2.02 > 1.645 se rechaza H0 y se concluye con un nivel de significancia del
0.05 que la vida media hoy en da es mayor que 70 aos.
MUESTRAS PEQUEAS
Para el caso de muestras pequeas (n<30), el procedimiento a seguir es similar al
anterior, con la diferencia que
empleamos la
distribucin t de student.
EJEMPLO
El instituto elctrico Edison publica cifras del nmero anual de kilowatt hora que
gastan varios aparatos electrodomsticos. Se afirma que una aspiradora gasta un
30
31
33
y encuentra que el 23% estn en desacuerdo con dicho proyecto de ley. Se pide
comprobar si el rector tiene o no la razn con un nivel de significacin del 5%.
Solucin
No se sabe si la poblacin est normalmente distribuida, pero n=100>30, por lo
cual segn el teorema central del lmite, las proporciones muestrales se
distribuirn aproximadamente como una distribucin normal.
Paso numero 1: Hiptesis nula e hiptesis alternativa.
H0: P=0.15, H1: P>0.15. Puesto que el representante de los estudiantes, piensa
que la proporcin es superior a la afirmada por el seor rector.
Paso numero 2: Nivel de significacin.
0.05
Paso numero 3: Criterio de decisin.
Como la proporcin muestral se distribuye normalmente entonces, segn la tabla
el valor de z es: +1.64. Por lo tanto, el criterio de decisin ser el siguiente: Si el
valor de Z calculado es mayor que +1.64, se rechaza la hiptesis nula de que la
proporcin es del 15%.
Paso numero 4: Clculo del estadstico.
Sobre el cual se basar la decisin: n=100, p=0.23, q=0.77. Segn la frmula para
Z, en la distribucin en el muestreo de la proporcin, el correspondiente valor de z
ser:
35
Una prueba de hiptesis para la varianza debe tener una hiptesis nula que ser:
2
H0: =A, siendo A un valor hipottico, por lo cual la hiptesis alternativa podra
ser: H1:
A, H1:
< A H1:
X 0.025
2
valor de X
2
1
2
2
21
22
= 1.
EJEMPLO
Se quiere comprobar si la variabilidad en la duracin de unas lmparas marca A es
igualmente variable que la duracin de otra marca B de la competencia. Para tal
fin, se toma una muestra aleatoria de 13 lmparas tipo A y se encuentra que la
desviacin estndar muestral es S=8, mientras que en otra muestra aleatoria de
13 lmparas tipo B se encuentra que la desviacin estndar muestral es de S=4.
Se pide probar la hiptesis nula de que la variabilidad es igual en ambas
poblaciones con un nivel de significacin del 5%.
Solucin:
Se supone que la duracin de las lmparas se distribuye normalmente para ambas
marcas.
Paso numero 1: Hiptesis nula e hiptesis alternativa para prueba bilateral.
2
2
2
2
H0: 1 = 2 y H1: 1 2 .
Paso numero 2: Nivel de significacin.
0.05.
Paso numero 3: Criterio de decisin.
Si el valor de F calculado se encuentra fuera del intervalo sealado por los dos
valores de F segn la tabla, entonces rechazamos la hiptesis nula de que las dos
desviaciones estndar poblacionales son iguales. Es decir, si el valor de F
calculado est fuera del intervalo F(0.025,12,12) =3.28 y F(0.975,12,12) =
1/3.28 = 0.305, entonces se rechaza la hiptesis nula.
Paso numero 4: Clculo del estadstico sobre el cual se basar la decisin.
n1=13, S1=8, n2=13, S2=4
82
F= 42 = 4
38
4 CORRELACIN Y REGRESIN
DISTRIBUCIONES BIDIMENSIONALES
Dos variables x e y estn relacionadas funcionalmente cuando conocida la primera
se puede saber con exactitud el valor de la segunda.
Dos variables x e y estn relacionadas estadsticamente cuando conocida la
primera se puede estimar aproximadamente el valor de la segunda.
Una variable bidimensional es una variable en la que cada individuo est definido
por un par de caracteres, (X, Y).
39
Matemtic
as
Fsic
a
2
3
4
4
5
6
7
7
8
10
10
10
1
3
2
4
4
4
6
4
6
7
9
10
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor
posible, llamada recta de regresin.
Distribuciones Bidimensionales
12
10
8
6
4
2
0
40
10
11
COVARIANZA
La covarianza de una variable bidimensional es la media aritmtica de los
productos de las desviaciones de cada una de las variables respecto a sus medias
respectivas.
La covarianza se representa por sxy o xy.
41
CORRELACIN
La correlacin trata de establecer la relacin o dependencia que existe entre las
dos variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios
de la otra. En caso de que suceda, diremos que las variables estn
correlacionadas o que hay correlacin entre ellas.
1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.
2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta
decreciente.
42
3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las
variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene
una forma redondeada.
Propiedades
43
RECTA DE REGRESIN
La recta de regresin es la que mejor se ajusta a la nube de puntos.
La recta de regresin pasa por el punto
de gravedad.
BIBLIOGRAFA
Covarianza y Complementos
http://www.biostat.jhsph.edu/~lcollado/Courses/MEyAdDG/day2/Pruebas%20de
%20Hip%C3%B3tesis.pdf
Gua documentos Unidad 5
http://www.cecyt11.ipn.mx/Documents/estudiantes/guia_estudio/probabilidad%20y
%20estadistica.PDF
Regresin y correlacin
http://probyestfjad.blogspot.mx/2008/12/desarrollo-de-la-unidad-5-regresin-y.html
Libro de Probabilidad y Estadstica
http://www.mate.unlp.edu.ar/~maron/MaronnaHome_archivos/Probabilidad%20y
%20Estadistica%20Elementales.pdf
Libro de Probabilidad y Estadstica
http://www.x.edu.uy/inet/EstadisticayProbabilidad.pdf
45
2 Estimacin Puntual
http://www.est.uc3m.es/esp/nueva_docencia/getafe/ciencias_estadisticas/Tecnicas
InferenciaEstadistica/doc_grupo1/Intervalos-Grado%20en%20Est.%20y
%20Empr_9.pdf
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1
t11.htm
http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un3/cont_307_85.html
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1
t17.htm
http://www.geociencias.unam.mx/~ramon/EstInf/Clase11.pdf
3 Hiptesis
CONCLUSIN
47
48