Documente Academic
Documente Profesional
Documente Cultură
TEMA:
PRUEBA DE HIPOTESIS
CORRELACIONES Y REGRESIONES
REALIZADO POR:
ANDERSON OSPINO
BARRANQUILLA
2016
PRUEBA DE HIPTESIS
Prueba de Hiptesis es un procedimiento basado en evidencia muestral
(estadstico) y en la teora de probabilidad (distribucin muestral del estadstico)
para determinar si una hiptesis es razonable y no debe rechazarse, o si es
irrazonable y debe ser rechazada.
Identificacin de hiptesis
Hiptesis nula Ho
La que contrastamos
Los datos pueden refutarla
No debera ser rechazada sin una buena razn.
Hiptesis Alternativa H1
Niega a H0
Los datos pueden mostrar evidencia a favor
No debera ser aceptada sin una gran evidencia a favor.
1.60
1.60
H 0 : 1.60
20,000
GRAFICA
20,000
H 0 : 20,000
ERRORES
Ejemplo 1:
De acuerdo a las normas establecidas en una prueba de aptitud
acadmica, las personas que han concluido sus estudios secundarios
deban tener un promedio de 76.7 puntos. Si se sabe por una
investigacin anterior sobre el caso, que la desviacin estndar fue de
8.6 puntos y si 45 personas que concluyeron estudios secundarios son
elegidas aleatoriamente y alcanzan un promedio de 73.2, pruebe la
hiptesis de que el promedio ha disminuido.
Ho : 76.7
H1 : 76.7
0.01
Z0
Z=-2.33
Zo<Z
-2.73<-2.33
Ho se rechaza y se acepta H1
Ejemplo 2:
Durante los ltimos semestres, el profesor de Estadstica de una
universidad ha registrado que el rendimiento medio de sus alumnos es
de 14 puntos. Este ao le ha tocado 40 alumnos sobresalientes porque
su rendimiento medio ha sido 17 puntos y el profesor les proclama como
superiores a todos los alumnos que ha tenido en la fecha.
Qu hiptesis planteara?
H 0 : 14
H1 : 14
x
s
n
T(n-1)
Ejemplo 1:
Suponga que un estudio relativo a 28 familias de la urbanizacin El Sol,
arrojo un ingreso medio durante el 2001, de S/. 6548.00 con una
desviacin estndar de S/. 952.00. Pruebe la hiptesis de que el
verdadero ingreso familiar promedio en da urbanizacin es de S/.
6000.00 (en el ao), frente a la alternativa de que no fue S/. 6000.00 use
un nivel de significancia del 5%.
Ho : 6000
H1 : 6000
0.05
t0
x
s
n
t=-2.052
Ho se rechaza y se acepta H1
t=2.052
Ejemplo 2:
En una muestra aleatoria de 10 sacaos de arroz extra envasado, se
obtuvo una media de 9.4 Kg. con una desviacin estndar de 1.8 Kg.
Contiene esta muestra suficiente evidencia para indicar que el peso
medio es menor que 10 Kg. de arroz, a un nivel de significacin de 0.1?
Ho : 10
H1 : 10
0 .1
t0
x
s
n
P p0
p0 (1 p0 )
x
n
Ejemplo 1:
Se realiz una encuesta con el fin de estudiar las prcticas sanitarias dentales
y las actitudes, de cierta poblacin urbana de adultos. De 300 adultos
entrevistados, 123 dijeron que regularmente se sometan a una revisin dental
dos veces al ao. Pruebe la hiptesis nula de que p=0.5 (el 50 % de los
0.05
123
P
300
Z0
P p0
p0 (1 p0 )
Z=-1.96
Z=1.96
0.01
Z0
P p0
p0 (1 p0 )
550
625
La varianza como medida de dispersin es importante dado que nos ofrece una
mejor visin de dispersin de datos. Por ejemplo: si se determina que la
poblacin califica en promedio con 6 el desempeo del gobierno; al decir que la
varianza es de cero (y por lo tanto la desviacin estndar es de cero) podemos
confiar en que aproximadamente la misma calificacin le asignara toda la
poblacin, en otras palabras, en trminos generales la poblacin en su conjunto
ve al gobierno con la misma calificacin ya que no hay variacin o dispersin
en dicha calificacin.
Nuevamente consideramos que la poblacin sigue una distribucin de
probabilidad normal, para lo cual usamos el siguiente estadstico de prueba:
Ejemplo 1: Una empresa del giro alimenticio desea determinar si el lote de una
materia prima tiene o no una varianza poblacional mayor a 15 en su grado de
endulzamiento. Se realiza un muestreo de 20 elementos y se obtiene una
varianza muestral de 20.98; realizar la prueba de hiptesis con alfa = 0.05.
Paso 1. Determinar la hiptesis Nula Ho y Alternativa Ha. Ho: La varianza
poblacional es igual a 15. (Algunos autores colocaran La varianza poblacional
es igual o menor a 15). Es decir: Ho: 2 15 Ha: 2 > 15 (prueba de una cola)
Paso 2. Determinar el nivel de significancia. Definido por el analista, en este
caso se desea usar = 0.05
Esta es la forma grfica de ji cuadrada El rea sombreada representa alfa o la
fraccin de error. Ntese que es prueba de una cola por lo que alfa no se divide
en dos.
Paso 3. Calcular los intervalos o valores crticos que implican ese nivel de
significancia.
Leemos en la tabla:
x2
=varianza muestral
=varianza considerada por la hiptesis nula
= ji- cuadrada (tambin conocido como chi-cuadrada).
CORRELACIN
2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta
decreciente.
3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las
variables.
En este caso se dice que las variables son incorreladas y la nube de puntos
tiene una forma redondeada.
Frmula para r
Calculamos el coeficiente de correlacin de las frmulas siguientes.
r
( X X )(Y Y )
(n 1) s x s y
n (X
n(XY ) (X )(Y )
2
) (X ) 2 n Y 2 Y
Coeficiente de determinacin
El coeficiente de determinacin (r2) es la proporcin de la variacin total en la
variable dependiente (y) que se explica por la variacin en la variable
independiente (x).
Es el cuadrado del coeficiente de correlacin.
Su rango es de 0 a 1.
No da ninguna informacin sobre la direccin de la relacin entre las
variables.
Ejemplo
Juan Escobedo, presidente de la sociedad de alumnos de la
Universidad de Toledo, se ocupa de estudiar el costo de los libros de
texto. l cree que hay una relacin entre el nmero de pginas en el
texto y el precio de venta del libro. Para proporcionar una prueba,
selecciona una muestra de ocho libros de texto actualmente en venta en
la librera. Dibuje un diagrama de dispersin. Compruebe el coeficiente
de correlacin.
n(X
n(XY ) (X )( Y )
2
) (X ) 2 n Y 2 Y
8(397,200) (4,900)(636)
0.614
La correlacin entre el nmero de pginas y el precio de venta del libro
es 0.614. Esto indica una asociacin moderada entre las variables.
Pruebe la hiptesis de que no hay correlacin en la poblacin. Utilice un
nivel de la significancia del .02.
Paso 1: H0: La correlacin en la poblacin es cero.
H1: La correlacin en la poblacin no es cero.
Paso 2: H0 es rechazada si t>3.143 o si t<-3.143.
Hay 6 grados de libertad, encontrados cerca.
n2=82
= 6.
r n2
1 r2
.614 8 2
1 (.614) 2
1.905
ANLISIS DE REGRESIN
En anlisis de regresin utilizamos la variable independiente (X) para
estimar la variable dependiente (Y).
La relacin entre las variables es lineal.
Ambas variables deben ser por lo menos escala del intervalo.
El criterio de mnimos cuadrados se utiliza para determinar la ecuacin.
Este es el trmino (Y Y')2
Ejemplo
Desarrolle una ecuacin de regresin para la informacin dada en el
Ejemplo 1 que se puede utilizar para estimar el precio de venta basado
en el nmero de pginas.
b
8(397,200) (4,900)(636)
.05143
8(3,150,000) (4,900) 2
636
4,900
0.05143
48.0
8
8