Sunteți pe pagina 1din 18

ESTADISTICAS INFERENCIAL

TEMA:

PRUEBA DE HIPOTESIS
CORRELACIONES Y REGRESIONES

REALIZADO POR:

ANDERSON OSPINO

UNIVERSIDAD AUTONOMA DEL CARIBE

BARRANQUILLA

2016
PRUEBA DE HIPTESIS
Prueba de Hiptesis es un procedimiento basado en evidencia muestral
(estadstico) y en la teora de probabilidad (distribucin muestral del estadstico)
para determinar si una hiptesis es razonable y no debe rechazarse, o si es
irrazonable y debe ser rechazada.
Identificacin de hiptesis
Hiptesis nula Ho
La que contrastamos
Los datos pueden refutarla
No debera ser rechazada sin una buena razn.
Hiptesis Alternativa H1
Niega a H0
Los datos pueden mostrar evidencia a favor
No debera ser aceptada sin una gran evidencia a favor.

Cuando se desarrolla la prueba Se asume que la hiptesis nula es verdadera y


ser rechazada si se encuentran suficientes evidencias en base a la
informacin muestral
Siempre que se especifica una hiptesis nula se debe especificar una hiptesis
alternativa o una que debe ser verdadera si la hiptesis nula es falsa
EJEMPLOS
Problema: La altura media o promedio de los estudiantes de la
UNT es 1.60 m?
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:

1.60

1.60

Seleccionar la hiptesis nula

H 0 : 1.60

Problema: El tiempo de vida promedio de una determinada pieza


usada en el ensamblaje de una marca de computadoras es de
20,000 horas.
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:

20,000

Seleccionar la hiptesis nula

GRAFICA

20,000

H 0 : 20,000

En toda prueba de hiptesis se presentan 3 casos de zonas crticas o llamadas


tambin zonas de rechazo de la hiptesis nula, estos casos son los siguientes:

ERRORES

PRUEBA DE HIPTESIS SOBRE UNA MEDIA POBLACIONAL


Caso A: Cuando la varianza poblacional es conocida y el tamao de la
muestra es grande o se sabe que la poblacin tiene una distribucin
normal, la estadstica de prueba es:
Z0

Ejemplo 1:
De acuerdo a las normas establecidas en una prueba de aptitud
acadmica, las personas que han concluido sus estudios secundarios
deban tener un promedio de 76.7 puntos. Si se sabe por una
investigacin anterior sobre el caso, que la desviacin estndar fue de
8.6 puntos y si 45 personas que concluyeron estudios secundarios son
elegidas aleatoriamente y alcanzan un promedio de 73.2, pruebe la
hiptesis de que el promedio ha disminuido.
Ho : 76.7
H1 : 76.7

0.01
Z0

Z=-2.33

Zo<Z
-2.73<-2.33

Ho se rechaza y se acepta H1

Ejemplo 2:
Durante los ltimos semestres, el profesor de Estadstica de una
universidad ha registrado que el rendimiento medio de sus alumnos es
de 14 puntos. Este ao le ha tocado 40 alumnos sobresalientes porque
su rendimiento medio ha sido 17 puntos y el profesor les proclama como
superiores a todos los alumnos que ha tenido en la fecha.
Qu hiptesis planteara?
H 0 : 14
H1 : 14

Caso B: Cuando no se conoce la varianza poblacional es conocida y el


tamao de la muestra es pequea.
t

x
s
n

T(n-1)

Ejemplo 1:
Suponga que un estudio relativo a 28 familias de la urbanizacin El Sol,
arrojo un ingreso medio durante el 2001, de S/. 6548.00 con una
desviacin estndar de S/. 952.00. Pruebe la hiptesis de que el
verdadero ingreso familiar promedio en da urbanizacin es de S/.
6000.00 (en el ao), frente a la alternativa de que no fue S/. 6000.00 use
un nivel de significancia del 5%.
Ho : 6000
H1 : 6000

0.05
t0

x
s
n

t=-2.052

Ho se rechaza y se acepta H1

t=2.052

Ejemplo 2:
En una muestra aleatoria de 10 sacaos de arroz extra envasado, se
obtuvo una media de 9.4 Kg. con una desviacin estndar de 1.8 Kg.
Contiene esta muestra suficiente evidencia para indicar que el peso
medio es menor que 10 Kg. de arroz, a un nivel de significacin de 0.1?

Ho : 10
H1 : 10

0 .1
t0

x
s
n

Ho se acepta entonces podemos decir que No existe suficiente evidencia para


indicar que el peso medio de cada bolsa de arroz extra envasado, es menor
que 10 kg. a un nivel de significancia de 10%

Prueba de Hiptesis para la proporcin poblacional: p


Se trata de efectuar una prueba de hiptesis acerca de la proporcin p
de elementos con cierto atributo en una poblacin.
Z0

P p0
p0 (1 p0 )

x
n

Ejemplo 1:
Se realiz una encuesta con el fin de estudiar las prcticas sanitarias dentales
y las actitudes, de cierta poblacin urbana de adultos. De 300 adultos
entrevistados, 123 dijeron que regularmente se sometan a una revisin dental
dos veces al ao. Pruebe la hiptesis nula de que p=0.5 (el 50 % de los

adultos de dicha poblacin se someten regularmente a una revisin dental, dos


veces al ao)
Ho : p0 0.5
H 1 : p 0 0 .5

0.05

123
P
300

Z0

P p0
p0 (1 p0 )

Z=-1.96

Z=1.96

Ho se rechaza y se puede concluir por tanto que el 50% de la


poblacin no se hace una revisin dental dos veces al ao.
Ejemplo 2:
Suponga que se sabe que el porcentaje de artculos buenos producidos por un
cierto proceso es slo el 90%. Se elige una muestra aleatoria de 625 artculos
en un cierto momento y se encuentran que 550 son buenos. Si Ud. desea
rechazar una hiptesis verdadera no ms de una vez en 100. Concluira que el
porcentaje de artculos buenos producidos por el mencionado proceso, es
exagerado.
Ho : p0 0.9
H1 : p0 0.9

0.01
Z0

P p0
p0 (1 p0 )

550
625

Ho se acepta, es decir que no existe razn para concluir que el porcentaje de


artculos buenos producidos es exagerado.

Prueba de hiptesis para la varianza

La varianza como medida de dispersin es importante dado que nos ofrece una
mejor visin de dispersin de datos. Por ejemplo: si se determina que la
poblacin califica en promedio con 6 el desempeo del gobierno; al decir que la
varianza es de cero (y por lo tanto la desviacin estndar es de cero) podemos
confiar en que aproximadamente la misma calificacin le asignara toda la
poblacin, en otras palabras, en trminos generales la poblacin en su conjunto
ve al gobierno con la misma calificacin ya que no hay variacin o dispersin
en dicha calificacin.
Nuevamente consideramos que la poblacin sigue una distribucin de
probabilidad normal, para lo cual usamos el siguiente estadstico de prueba:
Ejemplo 1: Una empresa del giro alimenticio desea determinar si el lote de una
materia prima tiene o no una varianza poblacional mayor a 15 en su grado de
endulzamiento. Se realiza un muestreo de 20 elementos y se obtiene una
varianza muestral de 20.98; realizar la prueba de hiptesis con alfa = 0.05.
Paso 1. Determinar la hiptesis Nula Ho y Alternativa Ha. Ho: La varianza
poblacional es igual a 15. (Algunos autores colocaran La varianza poblacional
es igual o menor a 15). Es decir: Ho: 2 15 Ha: 2 > 15 (prueba de una cola)
Paso 2. Determinar el nivel de significancia. Definido por el analista, en este
caso se desea usar = 0.05
Esta es la forma grfica de ji cuadrada El rea sombreada representa alfa o la
fraccin de error. Ntese que es prueba de una cola por lo que alfa no se divide
en dos.

Paso 3. Calcular los intervalos o valores crticos que implican ese nivel de
significancia.

Usamos 0.05 y (grados de libertad)=20-1=19

Leemos en la tabla:

Grficamente queda de la siguiente forma:

Paso 4. Calcular el estadstico de la prueba.


gl = n -1 Donde:
gl = Grados de libertad
n = nmero de elementos en la muestra
S2

x2

=varianza muestral
=varianza considerada por la hiptesis nula
= ji- cuadrada (tambin conocido como chi-cuadrada).

Para este problema la sustitucin queda:


gl = n -1 = 20- 1 =19

Paso 5. Determinar si el estadstico cae dentro de la regin que hace la


Hiptesis nula verdadera.

Paso 6. Aceptar o rechazar la hiptesis nula. Se acepta que la varianza


poblacional es igual a 15 como hiptesis nula.
Ejemplo 2. Un negocio debe pagar horas extra dada la demanda incierta de su
producto, por lo cual en promedio se pagan 50 horas extra a la semana el
gerente de recursos humanos considera que siempre se ha tenido una varianza
de 25 en las horas extras demandadas. Si se toma una muestra de 16
semanas se obtiene una varianza muestral de 28.1. Determine con alfa = 0.10
si la varianza poblacional de las horas extras demandadas a la semana puede
considerarse igual a 25.
Paso 1. Determinar la hiptesis Nula Ho y Alternativa Ha. Ho: La varianza
poblacional es igual a 25. Ho: 2 = 25 Ha: La varianza poblacional No es igual
a 25. Ha: 2 25 Ntese que es una prueba de dos colas.
Paso 2. Determinar el nivel de significancia. En este caso se desea usar =
0.10 Paso 3. Calcular los intervalos o valores crticos que implican ese nivel de
significancia.
Se muestrean 16 semanas entonces hay 15 grados de libertad. Dado que es
un problema de dos colas: /2 = 0.05

Por lo tanto para ubicar la posicin de la variable ji-cuadrada, se considera una


cola con

Paso 4. Calcular el estadstico de la prueba.

Paso 5. Determinar si el estadstico cae dentro de la regin que hace la


Hiptesis nula verdadera. Al ubicar el estadstico de prueba notamos que cae
en la regin que hace verdadera la hiptesis nula.

Paso 6. Aceptar o rechazar la hiptesis nula. Se acepta que la varianza


poblacional es igual a 25 como hiptesis nula.

CORRELACIN

El anlisis de correlacin es un grupo de tcnicas estadsticas usadas


para medir la fuerza de la asociacin entre dos variables.
El coeficiente de correlacin, r
El coeficiente de correlacin (r) es una medida de la intensidad de la relacin
lineal entre dos variables.
Requiere datos de nivel de razn.
Puede tomar cualquier valor de -1.00 a 1.00.

Los valores de -1.00 o 1.00 indican la correlacin perfecta y fuerte.


Los valores cerca de 0.0 indican la correlacin dbil.
Los valores negativos indican una relacin inversa y los valores positivos
indican una relacin directa.
Tipos de correlacin
1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.

2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta
decreciente.

3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las
variables.

En este caso se dice que las variables son incorreladas y la nube de puntos
tiene una forma redondeada.

Frmula para r
Calculamos el coeficiente de correlacin de las frmulas siguientes.
r

( X X )(Y Y )
(n 1) s x s y

n (X

n(XY ) (X )(Y )
2

) (X ) 2 n Y 2 Y

Coeficiente de determinacin
El coeficiente de determinacin (r2) es la proporcin de la variacin total en la
variable dependiente (y) que se explica por la variacin en la variable
independiente (x).
Es el cuadrado del coeficiente de correlacin.
Su rango es de 0 a 1.
No da ninguna informacin sobre la direccin de la relacin entre las
variables.
Ejemplo
Juan Escobedo, presidente de la sociedad de alumnos de la
Universidad de Toledo, se ocupa de estudiar el costo de los libros de
texto. l cree que hay una relacin entre el nmero de pginas en el
texto y el precio de venta del libro. Para proporcionar una prueba,
selecciona una muestra de ocho libros de texto actualmente en venta en
la librera. Dibuje un diagrama de dispersin. Compruebe el coeficiente
de correlacin.

n(X

n(XY ) (X )( Y )
2

) (X ) 2 n Y 2 Y

8(397,200) (4,900)(636)

8(3,150,000 (4,900) 8(51,606) (636)


2

0.614
La correlacin entre el nmero de pginas y el precio de venta del libro
es 0.614. Esto indica una asociacin moderada entre las variables.
Pruebe la hiptesis de que no hay correlacin en la poblacin. Utilice un
nivel de la significancia del .02.
Paso 1: H0: La correlacin en la poblacin es cero.
H1: La correlacin en la poblacin no es cero.
Paso 2: H0 es rechazada si t>3.143 o si t<-3.143.
Hay 6 grados de libertad, encontrados cerca.
n2=82

= 6.

Paso 3: Para encontrar el valor del estadstico de prueba, utilizamos:


t

r n2
1 r2

.614 8 2
1 (.614) 2

1.905

Paso 4: H0 no se rechaza. No podemos rechazar la hiptesis de que no


hay correlacin en la poblacin. La cantidad de asociacin puede ser debido al
azar.

ANLISIS DE REGRESIN
En anlisis de regresin utilizamos la variable independiente (X) para
estimar la variable dependiente (Y).
La relacin entre las variables es lineal.
Ambas variables deben ser por lo menos escala del intervalo.
El criterio de mnimos cuadrados se utiliza para determinar la ecuacin.
Este es el trmino (Y Y')2

La ecuacin de regresin es: Y' = a + bX, donde:


Y' es el valor pronosticado de la variable Y para un valor seleccionado
de X.

a es la ordenada de la interseccin con el eje Y cuando X = 0. Es el valor


estimado de Y cuando X=0
b es la pendiente de la recta, o el cambio promedio en Y' para cada
cambio de una unidad en X.
el principio de mnimos cuadrados se utiliza para obtener a y b.
El principio de mnimos cuadrados se utiliza para obtener a y b. Las
ecuaciones para determinar a y b son:

Ejemplo
Desarrolle una ecuacin de regresin para la informacin dada en el
Ejemplo 1 que se puede utilizar para estimar el precio de venta basado
en el nmero de pginas.
b

8(397,200) (4,900)(636)
.05143
8(3,150,000) (4,900) 2

636
4,900
0.05143
48.0
8
8

La ecuacin de regresin es:


Y' = 48.0 + .05143X
La ecuacin cruza al eje Y en $48. Un libro sin las pginas costara $48.
La pendiente de la lnea es .05143. El costo de cada pgina adicional es
de cinco cntimos.
El signo del valor de b y el signo del valor de r sern siempre iguales.
Podemos utilizar la ecuacin de regresin para
Estimar valores de Y.
El precio de venta estimado de un libro de 800 pginas es $89.14,
encontrado por
Y 48.0 0.05143 X
48.0 0.05143(800) 89.14

S-ar putea să vă placă și