Sunteți pe pagina 1din 28

INGENIERIA BIOQUIMICA

MATERIA: ESTADISTICA

UNIDAD 3

PROFESORA: OSORIO GABRIEL JANETH

ALUMNA: ROSA MARIA ACATZI CRUZ

Contenido

Muestreo aleatorio

Estimacin puntual

Estimacin por intervalos de confianza

Prueba de hiptesis

Ajuste de distribuciones de frecuencia a distribuciones de probabilidad a


una distribucin normal

Estadstica no paramtrica

Introduccin
Con este trabajo podemos abarcar la estimacin y prueba de hiptesis, en eta
unidad podemos ver el muestreo aleatorio, estimacin puntual, estimacin por
intervalos de confianza, prueba de hiptesis, ajuste de distribuciones de frecuencia
a distribuciones de probabilidad a una distribucin normal, estadstica no
paramtrica. Ya que la Estimacin y la Prueba de Hiptesis son los componentes
principales de la inferencia estadstica. En la Prueba de Hiptesis queda implcita
la existencia de dos teoras o Hiptesis (nula y alternativa) que de alguna manera
reflejarn las ideas a priori que tenemos y que pretendemos contrastar con la
realidad
La inferencia estadstica puede dividirse en dos reas principales: estimacin y
pruebas de hiptesis. Consideramos los procedimientos asociados con estimacin
en este tema y los de pruebas de hiptesis en el tema siguiente.
En la injerencia estadstica (o estadstica inductiva) se realiza el proceso inverso.
Dadas algunas observaciones de una variable, es decir algunos datos, se intenta
injerir el modelo probabilstico asociado con la variable que ha generado estos
datos.
Con esto podemos decir que abarcaremos la tercera unidad.

Muestreo aleatorio
Consideremos una poblacin finita, de la que deseamos extraer una muestra.
Cuando el proceso de extraccin es tal que garantiza a cada uno de los elementos
del universo la misma oportunidad de ser incluidos en dicha muestra,
denominamos al proceso de seleccin muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
- Sin reposicin de los elementos;
- Con reposicin.

1. Muestreo aleatorio simple:


Muestreo aleatorio con reposicin o muestreo aleatorio simple
Sobre una poblacin de tamao N podemos realizar extracciones de n elementos,
pero de modo que cada vez el elemento extrado es repuesto al total del universo.
De esta forma un elemento puede ser extrado varias veces.
El muestreo aleatorio con reposicin es tambin denominado muestreo aleatorio
simple, que como hemos mencionado se caracteriza por qu:
- cada elemento del universo tiene la misma probabilidad de ser elegido,
- las observaciones se realizan con reemplazamiento. De este modo, cada
observacin es realizada sobre el mismo universo (no disminuye con las
extracciones sucesivas).
- Se garantiza la independencia entre las unidades seleccionadas.
Desventaja del muestreo con reposicin: una misma unidad puede ser
seleccionada varias veces en una misma muestra, por lo que no se incrementa la
informacin. Sin embargo, si el universo es muy grande la probabilidad de que
esto ocurra es muy pequea. P (obtener una determinada muestra) =
P(x1,x2,..,xn)= 1/N 1/N 1/N
El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada
individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de
una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una
calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para
completar el tamao de muestra requerido. Este procedimiento, atractivo por su

simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos
manejando es muy grande.

2. Muestreo aleatorio sin reposicin o muestreo irrestricto


Cada vez que se hace una extraccin, la unidad seleccionada no se devuelve al
universo.
Por lo tanto, no se permite que una misma unidad sea seleccionada ms de una
vez. Esto hace variar la probabilidad de obtener una determinada muestra: P
(obtener una determinada muestra) = P(x1,x2,..,xn)= 1/N 1/N-1 1/N-n
Cuando la poblacin sea muy grande, las diferencias entre estos dos tipos de
muestreo van a ser mnimas.
Vamos a considerar que trabajamos con poblaciones grandes, por lo que slo
vamos a considerar el muestreo aleatorio simple.
Aunque dependiendo del problema y con el objetivo de reducir los costes o
aumentar la precisin, otros tipos de muestreo aleatorios pueden ser
considerados: muestreo sistemtico, muestreo estratificado, muestreo por
conglomerados y muestreo polietpico.

3. Muestreo aleatorio sistemtico:


Este procedimiento exige, como el anterior, numerar todos los elementos de la
poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se
parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos
que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,..., i+(n-1)
k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el
tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que
empleamos como punto de partida ser un nmero al azar entre 1 y k.
El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en
la poblacin ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la poblacin.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un
muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo
hombres o slo mujeres, no podra haber una representacin de los dos sexos.

Cuando los elementos de la poblacin estn ordenados de 1 a N en fichas o en


una lista, una manera de muestrear consiste en:
- Elegir al azar un nmero m entre 1 y N, para empezar a seleccionar la muestra.
- Tomar como muestra los elementos de la lista a partir de ese m tomados de k en
k (por ejemplo de 20 en 20) hasta completar una muestra de tamao n. (k es el n
entero ms cercano a N/n) y teniendo en cuenta que la lista sea circular, es decir
que el elemento N+1 coincide con el primero. De esta forma, con una lista circular,
todos los elementos tiene la misma probabilidad de ser seleccionados.
Cuando el criterio de ordenacin de los elementos en la lista es tal que los
elementos ms parecidos tienden a estar ms cercanos, el muestreo sistemtico
suele ser ms preciso que el aleatorio simple, ya que recorre la poblacin de un
modo ms uniforme.
Por otro lado, es a menudo ms fcil no cometer errores con un muestreo
sistemtico que con este ltimo. Sin embargo, se corre el riesgo de obtener
resultados sesgados si en la poblacin se dan periodicidades o rachas.

Ejemplo
Si tenemos una poblacin formada por 100 elementos y queremos extraer una
muestra de 25 elementos, en primer lugar debemos establecer el intervalo de
seleccin que ser igual a 100/25 = 4. A continuacin elegimos el elemento de
arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a partir de l
obtenemos los restantes elementos de la muestra.
2, 6, 10, 14,..., 98

4. Muestreo aleatorio estratificado:


Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamao dado de la muestra.
Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen
gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por
ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil,
etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos
los estratos de inters estarn representados adecuadamente en la muestra. Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos el

muestreo aleatorio simple o el estratificado para elegir los elementos concretos


que formarn parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la poblacin.
(Tamao geogrfico, sexos, edades,...).
La distribucin de la muestra en funcin de los diferentes estratos se denomina
afijacin, y puede ser de diferentes tipos:
Afijacin Simple: A cada estrato le corresponde igual nmero de elementos
mustrales.
Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de
la poblacin en cada estrato.
Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de
modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin
ya que no se suele conocer la desviacin.
EJEMPLO
En una fbrica que consta de 600 trabajadores queremos tomar una muestra de
20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y
100 en la D.

5. Muestreo aleatorio por conglomerados:


Los mtodos presentados hasta ahora estn pensados para seleccionar
directamente los elementos de la poblacin, es decir, que las unidades mustrales
son los elementos de la poblacin.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos
de la poblacin que forman una unidad, a la que llamamos conglomerado. Las

unidades hospitalarias, los departamentos universitarios, una caja de determinado


producto, etc., son conglomerados naturales. En otras ocasiones se pueden
utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son reas geogrficas suele hablarse de
"muestreo por reas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
numero de conglomerados (el necesario para alcanzar el tamao muestral
establecido) y en investigar despus todos los elementos pertenecientes a los
conglomerados elegidos.

Ejemplo
1. Se planea hacer una encuesta entre universitarios de primer curso de un
pas. Se quieren entrevistar 5.000 universitarios. Ante la imposibilidad de
acceder (de acuerdo con los costos) a un muestreo estratificado, se piensa
en una muestra de 200 conglomerados de 25 alumnos, identificando el
conglomerado con un grupo de primer curso.
2. Suponga que una empresa desea conocer el consumo promedio anual por
familia en una ciudad. Si se dispone de una lista de las familias en la ciudad
es posible seleccionar al azar las muestras de familias. Sin embargo, an
cuando exista la lista de familias, es ms barato hacer la seleccin de
cuadras en la ciudad y en esa muestra de cuadras (conglomerados) se
entrevistarn todas las familias pertenecientes a cada conglomerado.
3. En una ciudad se quiere saber sobre caractersticas de las viviendas; en
este caso las unidades elementales seran las viviendas y los
conglomerados seran las cuadras o lotes de vivienda.
4. En una zona se desea saber el promedio de gastos en ropa que hacen las
personas que all viven. En este caso las unidades elementales seran las
personas y los conglomerados o unidades de muestreo seran las
viviendas.

ESTIMACION PUNTUAL
La estadstica provee tcnicas que permiten obtener conclusiones generales a
partir de un conjunto limitado pero representativo de datos. Cuando inferimos
no tenemos garanta de que la conclusin que obtenemos sea exactamente
correcta. Sin embargo, la estadstica permite cuantificar el error asociado a la
estimacin.
La mayora de las distribuciones de probabilidad dependen de cierto nmero de
parmetros. Por ejemplo:
etc. Salvo que estos parmetros se
conozcan, deben estimarse a partir de los datos.
El objetivo de la estimacin puntual es usar una muestra para obtener nmeros
que, en algn sentido, sean los que mejor representan a los verdaderos valores de
los parmetros de inters.
Supongamos que se selecciona una muestra de tamao n de una poblacin.
Antes de obtener la muestra no sabemos cul ser el valor de cada observacin.
As, la primera observacin puede ser considerada una v.a. X, la segunda una
v.a. X, etc. Por lo tanto, antes de obtener la muestra denotaremos
a
las observaciones y, una vez obtenida la muestra, denotaremos
a los
valores observados.
Del mismo modo, antes de obtener una muestra, cualquier funcin de ella ser
una v.a., por ejemplo:
etc. Una vez obtenida la muestra los
valores calculados sern denotados
etc.
Definicin: Un estimador puntual de un parmetro es un valor que puede ser
considerado representativo de y se indicar .
Se obtiene a partir de alguna funcin de la muestra.
Ejemplo: Con el fin de estudiar si un dado es o no equilibrado, se arroja el dado
100 veces en forma independiente, obtenindose 21 ases. Qu valor podra
utilizarse, en base a esa informacin, como estimacin de la probabilidad de as?
Parece razonable utilizar la frecuencia relativa de ases.
En este caso, si llamamos p a la probabilidad que queremos estimar,
Mtodo de los momentos los momentos caracterizan una distribucin de
probabilidad si dos variables aleatorias tienen los mismos momentos, entonces
dichas variables tienen o siguen la misma funcin de densidad

Podemos emplear los momentos mustrales para estimar los parmetros,


basndonos en la intuicin de que los momentos de la poblacin, r, se
parecern a los respectivos momentos de la muestra, ar
Igualamos los k primeros momentos ordinarios de una poblacional los
correspondientes momentos de una muestra
r-esimo momento ordinario ar de una muestra aleatoria (X1,..., Xn)

Entonces si una distribucin tiene k parmetros desconocidos, para su estimacin


se tendr lo siguiente:

Ejemplo 1. X Exp ():


Sea una variable aleatoria con distribucin exponencial de parmetro ; queremos
encontrar el estimador del parmetro usando el mtodo de los momentos.

Es decir, el estadstico usado para estimar el parmetro es el inverso de la


media muestral

2. Mtodo de mxima verosimilitud


Se utiliza la funcin de masa p o densidad f (conjunta) de la muestra como una
funcin de = (1,..., k) (funcin de verosimilitud)

Se maximiza la funcin de verosimilitud.


L () expresa la probabilidad (o densidad) que los diferentes valores de dan a la
muestra obtenida (maximizamos dicha probabilidad o densidad).
El mtodo permite construir buenos estimadores, de utilizacin universal,
denominados estimadores de mxima verosimilitud (EMV).
El estimador de mxima verosimilitud es siempre un valor del espacio paramtrico.

ESTIMACION POR INTERVALOS DE CONFIANZA


Hemos visto que la media muestral es un buen estimador puntual de la media
poblacional. El inconveniente principal es que un nico valor observado de
generalmente no es exactamente igual a ; habr cierta diferencia entre y .
Sera conveniente tener idea de lo cerca que est nuestra estimacin del
verdadero valor de la media poblacional. Tambin sera bueno poder dar
informacin de los seguros o confiados que estamos de la precisin de la
estimacin.
Para tener una idea, no solo del valor de la media, sino tambin de la precisin de
la estimacin, los investigadores optan por el mtodo de estimacin por intervalo o
intervalos de confianza. Un intervalo estimador es lo que su propio nombre indica,
un intervalo aleatorio, cuyos puntos extremos L 1 y L 2 son estadsticos. Esto se
utiliza para determinar un intervalo numrico a partir de la muestra. Se espera que
este contenga el parmetro de la poblacin que est siendo estimado. Si se
ampla el intervalo, se gana error, se pierde confianza. Un intervalo de confianza

de del 95% es tal que:


. Decir que un intervalo es un
intervalo de confianza del 95% de significa que, cuando se utiliza un muestreo
repetido de la poblacin, el 95% de los intervalos resultantes deber contener a ;
debido al azar, el 5% no incluir la verdadera media poblacional. El grado de
confianza deseado es controlado por el investigador.
Ejemplo
Hallemos un intervalo de confianza, del 95%, de , nmero medio de microgramos
de partculas en suspensin por metro cbico de aire, sobre la base de una
muestra aleatoria de tamao 5 dada en la que se ha calculado que una estimacin
puntual de es
. Supongamos que por experiencias anteriores se sabe que
, nmero de microgramos de partculas en suspensin por metro cbico de
aire, est normalmente distribuido, con varianza
. Queremos extender la
estimacin puntual a un intervalo, de forma talque podamos tener una confianza
del 95 % de que el intervalo obtenido contenga al verdadero valor de . Es decir,
queremos determinar

de forma que

As:

Para

hacerlo as, consideremos la particin de la curva normal tipificada dibujada


en la siguiente figura:

Particin de Z para obtener un intervalo de confianza de del 95


%
Puede verse que

En este caso,

, por tanto, podemos concluir que

Veamos que los lmites superior e inferior del intervalo de confianza del 95% son:

Puesto que se supone que


es 9, y
observados por la muestra son

, son estadsticos. Sus valores

Puesto que este intervalo se obtuvo usando un procedimiento que, en muestreos


repetidos, contendr a la media en un 95% de confianza de que est
verdaderamente entre 58.37y 63.63:

58.37 = 61 - 2.63 61 61 +2.63 = 63.63


PRUEBA DE HIPTESIS

La prueba de hiptesis es un procedimiento basado en la evidencia muestral y la


teora de probabilidad; se emplea para determinar si la hiptesis es una afirmacin
razonable.
Prueba de una hiptesis: se realiza mediante un procedimiento sistemtico de
cinco paso:
1. Se plantea la hiptesis nula y la alternativa.2. Se selecciona el nivel.3. Se
identifica el estadstico de prueba.4. Se forma la regla de decisin.5. Se toma una
muestra y se decide: I. No se rechaza HoII. O se rechaza Ho y se acepta Hi.
Objetivo de la prueba de hiptesis. El propsito de la prueba de hiptesis no es

cuestionar el valor calculado del estadstico (muestral), sino hacer un juicio con
respecto a la diferencia entre estadstico de muestra y un valor planteado del
parmetro.
PASO 1: PLANTEAR LA HIPTESIS NULA HO Y LA HIPTESIS ALTERNATIVA
H1.
Cualquier investigacin estadstica implica la existencia de hiptesis o
afirmaciones acerca de las poblaciones que se estudian. La hiptesis nula (Ho) se
refiere siempre a un valor especificado del parmetro de poblacin, no a una
estadstica de muestra. La letra H significa hiptesis y el subndice cero no hay
diferencia. Por lo general hay un "no" en la hiptesis nula que indica que "no hay
cambio" Podemos rechazar o aceptar Ho. La hiptesis nula es una afirmacin que
no se rechaza a menos que los datos maestrales proporcionen evidencia
convincente de que es falsa. El planteamiento de la hiptesis nula siempre
contiene un signo de igualdad con respecto al valor especificado del parmetro. La
hiptesis alternativa (H1) es cualquier hiptesis que difiera de la hiptesis nula. Es
una afirmacin que se acepta si los datos maestrales proporcionan evidencia
suficiente de que la hiptesis nula es falsa. Se le conoce tambin como la
hiptesis de investigacin. El planteamiento de la hiptesis alternativa nunca
contiene un signo de igualdad con respecto al valor especificado del
PASO 2: SELECCIONAR
SIGNIFICANCIA

EL

NIVEL

DESIGNIFICANCIA

NIVEL

DE

Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le denota


mediante la letra griega , tambin es denominada como nivel de riesgo, este
trmino es ms adecuado ya que se corre el riesgo de rechazar la hiptesis nula,
cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que
realiza la prueba. Si suponemos que la hiptesis planteada es verdadera,
entonces, el nivel de significacin indicar la probabilidad de no aceptarla, es
decir, estn fuera de rea de aceptacin. El nivel de confianza (1-), indica la
probabilidad de aceptar la hiptesis planteada, cuando es verdadera en la
poblacin.
PASO 3: CLCULO DEL VALOR ESTADSTICODE PRUEBA
Valor determinado a partir de la informacin muestral, que se utiliza para
determinar si se rechaza la hiptesis nula., existen muchos estadsticos de prueba
para nuestro caso utilizaremos los estadsticos z y t. La eleccin de uno de estos
depende de la cantidad de muestras que se toman, si las muestras son de la
prueba son iguales a 30 o ms se utiliza el estadstico z, en caso contrario se
utiliza el estadstico t. Tipos de prueba a) Prueba bilateral o de dos extremos: la

hiptesis planteada se formula con la igualdadEjemploH0 : = 200H1 : 200b)


Pruebas unilateral o de un extremo: la hiptesis planteada se formula con o H0
: 200 H0 : 200H1 : < 200 H1 : > 200
En las pruebas de hiptesis para la media (), cuando se conoce la desviacin
estndar () poblacional, o cuando el valor de la muestra es grande (30 o ms), el
valor estadstico de prueba es z y se determina a partir de: El valor estadstico z,
para muestra grande y desviacin estndar poblacional desconocida se determina
por la ecuacin: En la prueba para una media poblacional con muestra pequea y
desviacin estndar poblacional desconocida se utiliza el valor estadstico t.
TIPOS DE ERRORES
Cualquiera sea la decisin tomada a partir de una prueba de hiptesis, ya sea de
aceptacin del Ho o de la Ha, puede incurrirse en error: Un error tipo I se presenta
si la hiptesis nula Ho es rechazada cuando es verdadera y deba ser aceptada.
La probabilidad de cometer un error tipo I se denomina con la letra alfa Un error
tipo II, se denota con la letra griega se presenta si la hiptesis nula es aceptada
cuando de hecho es falsa y deba ser rechazada. En cualquiera de los dos casos
se comete un error al tomar una decisin equivocada. En la siguiente tabla se
muestran las decisiones que pueden tomar el investigador y las consecuencias
posibles.
ETAPAS BSICAS EN PRUEBAS DE HIPTESISA l realizar pruebas de
hiptesis, se parte de un valor supuesto (hipottico) en parmetro poblacional.
Despus de recolectar una muestra aleatoria, se compara la estadstica muestral,
as como la media (x), con el parmetro hipottico, se compara con una supuesta
media poblacional ().Despus se acepta o se rechaza el valor hipottico, segn
proceda. Se rechaza el valor hipottico slo si el resultado muestral resulta muy
poco probable cuando la hiptesis es cierta.
Etapa 1.- Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H0)
es el valor hipottico del parmetro que se compra con el resultado muestral
resulta muy poco probable cuando la hiptesis es cierta. Etapa 2.- Especificar el
nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces
se rechaza la hiptesis nula solamente si el resultado muestral es tan diferente del
valor hipottico que una diferencia de esa magnitud o mayor, pudiera ocurrir
aleatoria mente con una probabilidad de 1.05 o menos. Etapa 3.- Elegir la
estadstica de prueba. La estadstica de prueba puede ser la estadstica muestral
(el estimador no segado del parmetro que se prueba) o una versin transformada
de esa estadstica muestral. Por ejemplo, para probar el valor hipottico de una
media poblacional, se toma la media de una muestra aleatoria de esa distribucin

normal, entonces es comn que se transforme la media en un valor z el cual, a su


vez, sirve como estadstica de prueba.
Etapa 4.- Establecer el valor o valores crticos de la estadstica de prueba.
Habiendo especificado la hiptesis nula, el nivel de significancia y la estadstica de
prueba que se van a utilizar, se produce a establecer el o los valores crticos de
estadstica de prueba. Puede haber uno o ms de esos valores, dependiendo de si
se va a realizar una prueba de uno o dos extremos. Etapa 5.- Determinar el valor
real de la estadstica de prueba. Por ejemplo, al probar un valor hipottico de la
media poblacional, se toma una muestra aleatoria y se determina el valor de la
media muestral. Si el valor crtico que se establece es un valor de z, entonces se
transforma la media muestral en un valor de z. Etapa 6.- Tomar la decisin. Se
compara el valor observado de la estadstica muestral con el valor (o valores)
crticos de la estadstica de prueba. Despus se acepta o se rechaza la hiptesis
nula. Si se rechaza sta, se acepta la alternativa; a su vez, esta decisin tendr
efecto sobre otras decisiones de los administradores operativos, como por
ejemplo, mantener o no un estndar de desempeo o cul de dos estrategias de
mercadotecnia utilizar.
La distribucin apropiada de la prueba estadstica se divide en dos regiones: una
regin de rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima
regin no se puede rechazar la hiptesis nula y se llega a la conclusin de que el
proceso funciona correctamente. Al tomar la decisin con respecto a la hiptesis
nula, se debe determinar el valor crtico en la distribucin estadstica que divide la
regin del rechazo (en la cual la hiptesis nula no se puede rechazar) de la regin
de rechazo. A hora bien el valor crtico depende del tamao de la regin de
rechazo
PASOS DE LA PRUEBA DE HIPTESIS
1. Expresar la hiptesis nula 2. Expresar la hiptesis alternativa 3. Especificar el
nivel de significancia 4. Determinar el tamao de la muestra 5. Establecer los
valores crticos que establecen las regiones de rechazo de las de no rechazo. 6.
Determinar la prueba estadstica. 7. Coleccionar los datos y calcular el valor de la
muestra de la prueba estadstica apropiada. 8. Determinar si la prueba estadstica
ha sido en la zona de rechazo a una de no rechazo. 9. Determinar la decisin
estadstica. 10. Expresar la decisin estadstica en trminos del problema
HIPTESIS ESTADSTICA:
Al intentar alcanzar una decisin, es til hacer hiptesis (o conjeturas) sobre la
poblacin aplicada. Tales hiptesis, que pueden ser o no ciertas, se llaman

hiptesis estadsticas. Son, en general, enunciados acerca de las distribuciones de


probabilidad de las poblaciones.
HIPTESIS NULA. La hiptesis nula es aquella que nos dice que no existen
diferencias significativas entre los grupos. Por ejemplo, supongamos que un
investigador cree que si un grupo de jvenes se somete a un entrenamiento
intensivo de natacin, stos sern mejores nadadores que aquellos que no
recibieron entrenamiento. Para demostrar su hiptesis toma al azar una muestra
de jvenes, y tambin al azar los distribuye en dos grupos: uno que llamaremos
experimental, el cual recibir entrenamiento, y otro que no recibir entrenamiento
alguno, al que llamaremos control. La hiptesis nula sealar que no hay
diferencia en el desempeo de la natacin entre el grupo de jvenes que recibi el
entrenamiento y el que no lo recibi.
HIPTESIS ALTERNATIVA. Toda hiptesis que difiere de una dada se llamar
una hiptesis alternativa. Por ejemplo: Si una hiptesis es p = 0,5, hiptesis
alternativa podran ser p = 0,7, p " 0,5 p > 0,5.Una hiptesis alternativa a la
hiptesis nula se denotar por H1.Al responder a un problema, es muy
conveniente proponer otras hiptesis en que aparezcan variables independientes
distintas de las primeras que formulamos. Por tanto, para no perder tiempo en
bsquedas intiles, es necesario hallar diferentes hiptesis alternativas como
respuesta a un mismo problema y elegir entre ellas cules y en qu orden vamos
a tratar su comprobacin.
PRUEBAS DE HIPTESIS PARA LA MEDIA Y PROPORCIONES Debido a la
dificultad de explicar este tema se enfocar un problema basado en un estudio en
una fbrica de llantas. En este problema la fbrica de llantas tiene dos turnos de
operarios, turno de da y turno mixto. Se selecciona una muestra aleatoria de 100
llantas producidas por cada turno para ayudar al gerente a sacar conclusiones de
cada una de las siguientes preguntas: 1.- Es la duracin promedio de las llantas
producidas en el turno de da igual a 25 000 millas?2.- Es la duracin promedio
de las llantas producidas en el turno mixto menor de 25 000 millas?3.- Se
revienta ms de un 8% de las llantas producidas por el turno de da antes de las
10 000 millas? Prueba De Hiptesis Para La Media En la fbrica de llantas la
hiptesis nula y alternativa para el problema se plantearon como sigue: Ho: = 25
000H1: 25 000
Si se considera la desviacin estndar las llantas producidas en el turno de da,
entonces, con base en el teorema de limite central, la distribucin en el muestreo
de la media seguira la distribucin normal, y la prueba estadstica que est
basada en la diferencia entre la media de la muestra y la media hipottica se
encontrara como sigue: Para ver el grfico seleccione la opcin "Descargar" del

men superior Si el tamao de la regin de rechazo se estableciera en 5%


entonces se podran determinar los valores crticos de la distribucin. Dado que la
regin de rechazo est dividida en las dos colas de la distribucin, el 5% se divide
en dos partes iguales de 2.5%.Dado que ya se tiene la distribucin normal, los
valores crticos se pueden expresar en unidades de desviacin. Una regin de
rechazo de 0.25 en cada cola de la distribucin normal, da por resultado un rea
de .475 entre la media hipottica y el valor crtico. Si se busca est rea en la
distribucin normal, se encuentra que los valores crticos que dividen las regiones
de rechazo y no rechazo son + 1.96 y - 1.96
Por tanto, la regla para decisin sera: Rechazar Ho si Z > + 1.96O si Z < - 1.96De
lo contrario, no rechazar Ho No obstante, en la mayor parte de los casos se
desconoce la desviacin estndar de la poblacin. La desviacin estndar se
estima al calcular S, la desviacin estndar de la muestra. Si se supone que la
poblacin es normal la distribucin en el muestreo de la media seguira una
distribucin t con n-1 grados de libertad. En la prctica, se ha encontrado que
siempre y cuando el tamao de la muestra no sea muy pequeo y la poblacin no
est muy sesgada, la distribucin t da una buena aproximacin a la distribucin de
muestra de la media. La prueba estadstica para determinar la diferencia entre la
media de la muestra y la media de la poblacin cuando se utiliza la desviacin
estndar S de la muestra.

AJUSTE DE DISTRIBUCIONES DE FRECUENCIA A DISTRIBUCIONES DE


PROBABILIDAD A UNA DISTRIBUCIN NORMAL
Distribucin normal
Un proceso opera en condiciones normales, si tiene los materiales dentro de de
especificaciones y del mismo lote, un mtodo consistente, un medio ambiente
adecuado, el operador capacitado, y el equipo ajustado correctamente, si se
toman mediciones en alguna caracterstica del producto, mostrar el siguiente
comportamiento:

Distribucin grfica de la variacin


La Curva normal
LAS PIEZAS VARAN DE UNA A OTRA:

TAMAO

TAMAO

TAMAO

TAMAO

Pero ellas forman un patrn, tal que si es estable, se denomina distr. Normal
SIZE

TAMAO

TAMAO

LAS DISTRIBUCIONES PUEDEN DIFERIR EN:


UBICACIN

TAMAO

DISPERSIN

TAMAO

FORMA

TAMAO
. . . O TODA COMBINACIN DE STAS

Fig. 1 Construccin de la distribucin normal

La distribucin normal es una de las distribuciones ms usadas e importantes. Se


ha desenvuelto como una herramienta indispensable en cualquier rama de la
ciencia, la industria y el comercio.

Muchos eventos reales y naturales tienen una distribucin de frecuencias cuya


forma es muy parecida a la distribucin normal. La distribucin normal es llamada
tambin campana de Gauss por su forma acampanada.

Cuando se incluyen todos los datos de un proceso o poblacin, sus parmetros se


indican con letras griegas, tales como: promedio o media = (mu), y desviacin
estndar (indicador de la dispersin de los datos) = (sigma).

Para el caso de estadsticos de una muestra se tiene media = X y desv. est.= s.

Propiedades de la distribucin normal estndar

La distribucin normal estndar tiene media = 0 y desviacin estndar =1.


La media, Mmediana y Moda coinciden, son iguales y se localizan en el pico.

La desviacin estndar
sigma representa la
distancia de la media al
punto de inflexin de la
curva normal

X
x-3

x-2

x-

x+

x+2

x+3

z
-3

-2

-1

El rea bajo la curva o probabilidad de menos infinito a ms infinito vale 1.

La distribucin normal es simtrica, la mitad de curva tiene un rea de 0.5.

La escala horizontal de la curva se mide en desviaciones estndar.

La forma y la posicin de una distribucin normal dependen de los parmetros

, , por lo que hay un nmero infinito de distribuciones normales.


Curvas
Curvas Normales
Normales con
con Medias
Medias iguales
iguales pero
pero
Desviaciones
Desviaciones estndar
estndar diferentes
diferentes

3.9
3.9
== 5.0
5.0

Lmite inferior de especs. Lmite superior de especificaciones


Fig. 3 Distribuciones normales con varias desv. Estndar

Normales
Normales con
con Medias
Medias yy
Desviaciones
estndar
Desviaciones estndar diferentes
diferentes

=
= 5,
5, == 33
== 9,
9, =
= 66
== 14,
14, == 10
10

LIE

LSE

Fig. 4 Distribuciones normales con varias medias y desviaciones estndar


Existe una relacin del porcentaje de probabilidad o rea bajo la curva normal a la
desviacin estndar. En la figura observamos por ejemplo que el rea bajo la
curva para 1 tiene un porcentaje de 68.26%, 2 = 95.46% y
.

-3s -2s -1s

+1s +2s +3s


68.26%
95.46%
99.73%

3 99.73%

Fig. 5 rea bajo la curva de Distribucin normal

Lo anterior se puede calcular con la Tabla de distribucin normal o con Excel (Fx
=distr.norm.estand (Z) proporciona el rea desde menos infinito hasta Z).
En la tabla normal, se busca el valor de Z y se encuentra el rea bajo la curva.
Ejemplo
a) Determinar el rea bajo la curva de menos infinito a Z = - 1.
P (Z<= -1) = 0.1587
b) Determinar el rea bajo la curva de menos infinito a Z = - 2.
P (Z<= - 2) = 0.0228
c) Determinar el rea bajo la curva entre Z >= -2. Hasta Z <= -1
P (- 2 <= Z<= -1) = 0.1259

Estadstica no paramtrica
La mayor parte de los procedimientos de prueba de hiptesis que se presentan en
las unidades anteriores se basan en la suposicin de que las muestras aleatorias
se seleccionan de poblaciones normales. Afortunadamente, la mayor parte de
estas pruebas an son confiables cuando experimentamos ligeras desviaciones de
la normalidad, en particular cuando el tamao de la muestra es grande.
Tradicionalmente, estos procedimientos de prueba se denominan mtodos
paramtricos. En esta seccin se consideran varios procedimientos de prueba
alternativos, llamados no paramtricos mtodos de distribucin libre, que a
menudo no suponen conocimiento de ninguna clase acerca de las distribuciones
de las poblaciones fundamentales, excepto que stas son continuas.
Los procedimientos no paramtricos o de distribucin libre se usan con mayor
frecuencia por los analistas de datos. Existen muchas aplicaciones en la ciencia y
la ingeniera donde los datos se reportan no como valores de un continuo sino

ms bien en una escala ordinal tal que es bastante natural asignar rangos a los
datos.
Un ejemplo donde se aplica una prueba no paramtrica es el siguiente, dos jueces
deben clasificar cinco marcas de cerveza de mucha demanda mediante la
asignacin de un grado de 1 a la marca que se considera que tiene la mejor
calidad global, un grado 2 a la segunda mejor, etctera. Se puede utilizar entonces
una prueba no paramtrica para determinar donde existe algn acuerdo entre los
dos jueces.
Se debe sealar que hay varias desventajas asociadas con las pruebas no
paramtricas. En primer lugar, no utilizan la informacin que proporciona la
muestra, y por ello una prueba no paramtrica ser menos eficiente que el
procedimiento paramtrico correspondiente, cuando se pueden aplicar ambos
mtodos. En consecuencia, para lograr la misma potencia, una prueba no
paramtrica requerir la correspondiente prueba no paramtrica.
Como se indic antes, ligeras divergencias de la normalidad tienen como resultado
desviaciones menores del ideal para las pruebas paramtricas estndar. Esto es
cierto en particular para la prueba t y la prueba F. En el caso de la prueba t y la
prueba F, el valor P citado puede ser ligeramente errneo si existe una violacin
moderada de la suposicin de normalidad.
En resumen, si se puede aplicar una prueba paramtrica y una no paramtrica al
mismo conjunto de datos, debemos aplicar la tcnica paramtrica ms eficiente.
Sin embargo, se debe reconocer que las suposiciones de normalidad a menudo no
se pueden justificar, y que no siempre se tienen mediciones cuantitativas.

PRUEBA DEL SIGNO

La prueba del signo se utiliza para probar la hiptesis sobre la mediana


de una
distribucin continua. La mediana de una distribucin es un valor de la variable
aleatoria X tal que la probabilidad de que un valor observado de X sea menor o
igual, o mayor o igual, que la mediana es 0.5. Esto es,

Puesto que la distribucin normal es simtrica, la media de una distribucin normal


es igual a la mediana. Por consiguiente, la prueba del signo puede emplearse para

probar

hiptesis

sobre

la

media

de

una

poblacin

normal.

Suponga que las hiptesis son:

Supngase que X1, X2, . . . , Xn es una muestra aleatoria tomada de la poblacin


de inters. Frmense las diferencias

Ahora

bien

si

la

hiptesis

nula

es

verdadera,

cualquier

diferencia
tiene la misma probabilidad de ser negativa o positiva. Un
estadstico de prueba apropiado es el nmero de estas diferencias que son
positivas, por ejemplo R+. Por consiguiente, la prueba de la hiptesis nula es en
realidad una prueba de que el nmero de signos positivos es un valor de una
variable aleatoria binomial con parmetro P = . Puede calcularse un valor P para
el nmero observado de signos positivos r+ directamente de la distribucin
binomial. Al probar la hiptesis que se muestra al principio, se rechaza H0 en favor
de H1 slo si la proporcin de signos positivos es suficientemente menor que (o
de manera equivalente, cada vez que el nmero observado de signos positivos
r+ es muy pequeo). Por tanto, si el valor P calculado
P = P(R+

r+ cuando p = 1/2)

Es menor o igual que algn nivel de significancia seleccionado previamente,


entonces se
rechaza
H0 y se
concluye
que
H1 es verdadera.
Para probar la otra hiptesis unilateral

Se rechaza H0 en favor de H1 slo si el nmero observado de signos ms, r+, es


grande o, de manera equivalente, cada vez que la fraccin observada de signos
positivos es significativamente mayor que . En consecuencia, si el valor P
calculado P = P(R+ r+ cuando p = 1/2) es menor que
rechaza y se concluye que H1 es verdadera.

, entonces H0 se

Tambin puede probarse la alternativa bilateral. Si las hiptesis son:

Se rechaza H0 si la proporcin de signos positivos difiere de manera significativa


de (ya sea por encima o por debajo). Esto es equivalente a que el nmero
observado de signos r+ sea suficientemente grande o suficientemente pequeo.
Por tanto, si r+ >n/2 el valor P es
P=2P(R+

r+ cuando p = )

Y si r+ >n/2 el valor P es
P=2P(R+

r+ cuando p = )

Si el valor P es menor que algn nivel preseleccionado


H0 y se concluye que H1 es verdadera.

, entonces se rechaza

Ejemplos:
Un artculo informa cerca de un estudio en el que se modela el motor de un cohete
reuniendo el combustible y la mezcla de encendido dentro de un contenedor
metlico. Una caracterstica importante es la resistencia al esfuerzo cortante de la
unin entre los dos tipos de sustancias. En la siguiente tabla se muestran los
resultados obtenidos al probar 20 motores seleccionados al azar. Se desea probar
la hiptesis de que la mediana de la resistencia al esfuerzo cortante es 2000 psi,
utilizando
= 0.05.
Solucin: Se mostrar la tabla del ejercicio y es funcin del investigador poner los
signos

con

respecto

la

mediana.

Signo de
la
diferencia
xi-2000

Observacin

Resistencia
al esfuerzo
cortante
xi

Observacin

Resistencia
al esfuerzo
cortante
xi

Signo de
la
diferencia
xi-2000

2158.70

11

2165.20

1678.15

12

2399.55

2316.00

13

1779.80

2061.30

14

2336.75

2207.50

15

1765.30

1708.30

16

2053.50

1784.70

17

2414.40

2575.10

18

2200.50

2357.90

19

2654.20

10

2256.70

20

1753.70

De la tabla se puede observar que el estadstico de prueba r+ = 14.


Regla de decisin:
Si el valor de P correspondiente a r+=14 es menor o igual que
rechaza H0.

=0.05 se

Clculos:
Puesto que r+=14 es mayor que n/2=20/2=10, el valor de P se calcula de
P=2P(R+

14 cuando p = )

La P se calcula con la frmula de la distribucin binomial:

CONCLUSIN

Con esto podemos decir que abarcamos todo la unidad 3 y que lo que pude ver
que este temas es un poco complicado para m, no saba varios conceptos y tuve
que buscarlos en diferentes fuentes para poder tener un nocin sobre de este
tema, tambin se me quedaron unas pocas dudas sobre estos temas.

BIBLIOGRAFA

http://www.uv.es/~rmartine/inferencia_ADE/tipos%20de%20muestreo.PDF
http://www.estadistica.mat.uson.mx/Material/elmuestreo.pdf
https://www.uam.es/personal_pdi/ciencias/atorrent/docencia/0910/temas/2.2.estimadores.pdf
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estimacion/es
timacion.htm
http://es.slideshare.net/crg110886/prueba-de-hiptesis-12589447
www.fca.unl.edu.ar/InferEst/TestHipot1.htm
www.oac.uncor.edu/documentos/materias/clase7.pdf

S-ar putea să vă placă și