Documente Academic
Documente Profesional
Documente Cultură
MATERIA: ESTADISTICA
UNIDAD 3
Contenido
Muestreo aleatorio
Estimacin puntual
Prueba de hiptesis
Estadstica no paramtrica
Introduccin
Con este trabajo podemos abarcar la estimacin y prueba de hiptesis, en eta
unidad podemos ver el muestreo aleatorio, estimacin puntual, estimacin por
intervalos de confianza, prueba de hiptesis, ajuste de distribuciones de frecuencia
a distribuciones de probabilidad a una distribucin normal, estadstica no
paramtrica. Ya que la Estimacin y la Prueba de Hiptesis son los componentes
principales de la inferencia estadstica. En la Prueba de Hiptesis queda implcita
la existencia de dos teoras o Hiptesis (nula y alternativa) que de alguna manera
reflejarn las ideas a priori que tenemos y que pretendemos contrastar con la
realidad
La inferencia estadstica puede dividirse en dos reas principales: estimacin y
pruebas de hiptesis. Consideramos los procedimientos asociados con estimacin
en este tema y los de pruebas de hiptesis en el tema siguiente.
En la injerencia estadstica (o estadstica inductiva) se realiza el proceso inverso.
Dadas algunas observaciones de una variable, es decir algunos datos, se intenta
injerir el modelo probabilstico asociado con la variable que ha generado estos
datos.
Con esto podemos decir que abarcaremos la tercera unidad.
Muestreo aleatorio
Consideremos una poblacin finita, de la que deseamos extraer una muestra.
Cuando el proceso de extraccin es tal que garantiza a cada uno de los elementos
del universo la misma oportunidad de ser incluidos en dicha muestra,
denominamos al proceso de seleccin muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
- Sin reposicin de los elementos;
- Con reposicin.
simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos
manejando es muy grande.
Ejemplo
Si tenemos una poblacin formada por 100 elementos y queremos extraer una
muestra de 25 elementos, en primer lugar debemos establecer el intervalo de
seleccin que ser igual a 100/25 = 4. A continuacin elegimos el elemento de
arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a partir de l
obtenemos los restantes elementos de la muestra.
2, 6, 10, 14,..., 98
Ejemplo
1. Se planea hacer una encuesta entre universitarios de primer curso de un
pas. Se quieren entrevistar 5.000 universitarios. Ante la imposibilidad de
acceder (de acuerdo con los costos) a un muestreo estratificado, se piensa
en una muestra de 200 conglomerados de 25 alumnos, identificando el
conglomerado con un grupo de primer curso.
2. Suponga que una empresa desea conocer el consumo promedio anual por
familia en una ciudad. Si se dispone de una lista de las familias en la ciudad
es posible seleccionar al azar las muestras de familias. Sin embargo, an
cuando exista la lista de familias, es ms barato hacer la seleccin de
cuadras en la ciudad y en esa muestra de cuadras (conglomerados) se
entrevistarn todas las familias pertenecientes a cada conglomerado.
3. En una ciudad se quiere saber sobre caractersticas de las viviendas; en
este caso las unidades elementales seran las viviendas y los
conglomerados seran las cuadras o lotes de vivienda.
4. En una zona se desea saber el promedio de gastos en ropa que hacen las
personas que all viven. En este caso las unidades elementales seran las
personas y los conglomerados o unidades de muestreo seran las
viviendas.
ESTIMACION PUNTUAL
La estadstica provee tcnicas que permiten obtener conclusiones generales a
partir de un conjunto limitado pero representativo de datos. Cuando inferimos
no tenemos garanta de que la conclusin que obtenemos sea exactamente
correcta. Sin embargo, la estadstica permite cuantificar el error asociado a la
estimacin.
La mayora de las distribuciones de probabilidad dependen de cierto nmero de
parmetros. Por ejemplo:
etc. Salvo que estos parmetros se
conozcan, deben estimarse a partir de los datos.
El objetivo de la estimacin puntual es usar una muestra para obtener nmeros
que, en algn sentido, sean los que mejor representan a los verdaderos valores de
los parmetros de inters.
Supongamos que se selecciona una muestra de tamao n de una poblacin.
Antes de obtener la muestra no sabemos cul ser el valor de cada observacin.
As, la primera observacin puede ser considerada una v.a. X, la segunda una
v.a. X, etc. Por lo tanto, antes de obtener la muestra denotaremos
a
las observaciones y, una vez obtenida la muestra, denotaremos
a los
valores observados.
Del mismo modo, antes de obtener una muestra, cualquier funcin de ella ser
una v.a., por ejemplo:
etc. Una vez obtenida la muestra los
valores calculados sern denotados
etc.
Definicin: Un estimador puntual de un parmetro es un valor que puede ser
considerado representativo de y se indicar .
Se obtiene a partir de alguna funcin de la muestra.
Ejemplo: Con el fin de estudiar si un dado es o no equilibrado, se arroja el dado
100 veces en forma independiente, obtenindose 21 ases. Qu valor podra
utilizarse, en base a esa informacin, como estimacin de la probabilidad de as?
Parece razonable utilizar la frecuencia relativa de ases.
En este caso, si llamamos p a la probabilidad que queremos estimar,
Mtodo de los momentos los momentos caracterizan una distribucin de
probabilidad si dos variables aleatorias tienen los mismos momentos, entonces
dichas variables tienen o siguen la misma funcin de densidad
de forma que
As:
Para
En este caso,
Veamos que los lmites superior e inferior del intervalo de confianza del 95% son:
cuestionar el valor calculado del estadstico (muestral), sino hacer un juicio con
respecto a la diferencia entre estadstico de muestra y un valor planteado del
parmetro.
PASO 1: PLANTEAR LA HIPTESIS NULA HO Y LA HIPTESIS ALTERNATIVA
H1.
Cualquier investigacin estadstica implica la existencia de hiptesis o
afirmaciones acerca de las poblaciones que se estudian. La hiptesis nula (Ho) se
refiere siempre a un valor especificado del parmetro de poblacin, no a una
estadstica de muestra. La letra H significa hiptesis y el subndice cero no hay
diferencia. Por lo general hay un "no" en la hiptesis nula que indica que "no hay
cambio" Podemos rechazar o aceptar Ho. La hiptesis nula es una afirmacin que
no se rechaza a menos que los datos maestrales proporcionen evidencia
convincente de que es falsa. El planteamiento de la hiptesis nula siempre
contiene un signo de igualdad con respecto al valor especificado del parmetro. La
hiptesis alternativa (H1) es cualquier hiptesis que difiera de la hiptesis nula. Es
una afirmacin que se acepta si los datos maestrales proporcionan evidencia
suficiente de que la hiptesis nula es falsa. Se le conoce tambin como la
hiptesis de investigacin. El planteamiento de la hiptesis alternativa nunca
contiene un signo de igualdad con respecto al valor especificado del
PASO 2: SELECCIONAR
SIGNIFICANCIA
EL
NIVEL
DESIGNIFICANCIA
NIVEL
DE
TAMAO
TAMAO
TAMAO
TAMAO
Pero ellas forman un patrn, tal que si es estable, se denomina distr. Normal
SIZE
TAMAO
TAMAO
TAMAO
DISPERSIN
TAMAO
FORMA
TAMAO
. . . O TODA COMBINACIN DE STAS
La desviacin estndar
sigma representa la
distancia de la media al
punto de inflexin de la
curva normal
X
x-3
x-2
x-
x+
x+2
x+3
z
-3
-2
-1
3.9
3.9
== 5.0
5.0
Normales
Normales con
con Medias
Medias yy
Desviaciones
estndar
Desviaciones estndar diferentes
diferentes
=
= 5,
5, == 33
== 9,
9, =
= 66
== 14,
14, == 10
10
LIE
LSE
3 99.73%
Lo anterior se puede calcular con la Tabla de distribucin normal o con Excel (Fx
=distr.norm.estand (Z) proporciona el rea desde menos infinito hasta Z).
En la tabla normal, se busca el valor de Z y se encuentra el rea bajo la curva.
Ejemplo
a) Determinar el rea bajo la curva de menos infinito a Z = - 1.
P (Z<= -1) = 0.1587
b) Determinar el rea bajo la curva de menos infinito a Z = - 2.
P (Z<= - 2) = 0.0228
c) Determinar el rea bajo la curva entre Z >= -2. Hasta Z <= -1
P (- 2 <= Z<= -1) = 0.1259
Estadstica no paramtrica
La mayor parte de los procedimientos de prueba de hiptesis que se presentan en
las unidades anteriores se basan en la suposicin de que las muestras aleatorias
se seleccionan de poblaciones normales. Afortunadamente, la mayor parte de
estas pruebas an son confiables cuando experimentamos ligeras desviaciones de
la normalidad, en particular cuando el tamao de la muestra es grande.
Tradicionalmente, estos procedimientos de prueba se denominan mtodos
paramtricos. En esta seccin se consideran varios procedimientos de prueba
alternativos, llamados no paramtricos mtodos de distribucin libre, que a
menudo no suponen conocimiento de ninguna clase acerca de las distribuciones
de las poblaciones fundamentales, excepto que stas son continuas.
Los procedimientos no paramtricos o de distribucin libre se usan con mayor
frecuencia por los analistas de datos. Existen muchas aplicaciones en la ciencia y
la ingeniera donde los datos se reportan no como valores de un continuo sino
ms bien en una escala ordinal tal que es bastante natural asignar rangos a los
datos.
Un ejemplo donde se aplica una prueba no paramtrica es el siguiente, dos jueces
deben clasificar cinco marcas de cerveza de mucha demanda mediante la
asignacin de un grado de 1 a la marca que se considera que tiene la mejor
calidad global, un grado 2 a la segunda mejor, etctera. Se puede utilizar entonces
una prueba no paramtrica para determinar donde existe algn acuerdo entre los
dos jueces.
Se debe sealar que hay varias desventajas asociadas con las pruebas no
paramtricas. En primer lugar, no utilizan la informacin que proporciona la
muestra, y por ello una prueba no paramtrica ser menos eficiente que el
procedimiento paramtrico correspondiente, cuando se pueden aplicar ambos
mtodos. En consecuencia, para lograr la misma potencia, una prueba no
paramtrica requerir la correspondiente prueba no paramtrica.
Como se indic antes, ligeras divergencias de la normalidad tienen como resultado
desviaciones menores del ideal para las pruebas paramtricas estndar. Esto es
cierto en particular para la prueba t y la prueba F. En el caso de la prueba t y la
prueba F, el valor P citado puede ser ligeramente errneo si existe una violacin
moderada de la suposicin de normalidad.
En resumen, si se puede aplicar una prueba paramtrica y una no paramtrica al
mismo conjunto de datos, debemos aplicar la tcnica paramtrica ms eficiente.
Sin embargo, se debe reconocer que las suposiciones de normalidad a menudo no
se pueden justificar, y que no siempre se tienen mediciones cuantitativas.
probar
hiptesis
sobre
la
media
de
una
poblacin
normal.
Ahora
bien
si
la
hiptesis
nula
es
verdadera,
cualquier
diferencia
tiene la misma probabilidad de ser negativa o positiva. Un
estadstico de prueba apropiado es el nmero de estas diferencias que son
positivas, por ejemplo R+. Por consiguiente, la prueba de la hiptesis nula es en
realidad una prueba de que el nmero de signos positivos es un valor de una
variable aleatoria binomial con parmetro P = . Puede calcularse un valor P para
el nmero observado de signos positivos r+ directamente de la distribucin
binomial. Al probar la hiptesis que se muestra al principio, se rechaza H0 en favor
de H1 slo si la proporcin de signos positivos es suficientemente menor que (o
de manera equivalente, cada vez que el nmero observado de signos positivos
r+ es muy pequeo). Por tanto, si el valor P calculado
P = P(R+
r+ cuando p = 1/2)
, entonces H0 se
r+ cuando p = )
Y si r+ >n/2 el valor P es
P=2P(R+
r+ cuando p = )
, entonces se rechaza
Ejemplos:
Un artculo informa cerca de un estudio en el que se modela el motor de un cohete
reuniendo el combustible y la mezcla de encendido dentro de un contenedor
metlico. Una caracterstica importante es la resistencia al esfuerzo cortante de la
unin entre los dos tipos de sustancias. En la siguiente tabla se muestran los
resultados obtenidos al probar 20 motores seleccionados al azar. Se desea probar
la hiptesis de que la mediana de la resistencia al esfuerzo cortante es 2000 psi,
utilizando
= 0.05.
Solucin: Se mostrar la tabla del ejercicio y es funcin del investigador poner los
signos
con
respecto
la
mediana.
Signo de
la
diferencia
xi-2000
Observacin
Resistencia
al esfuerzo
cortante
xi
Observacin
Resistencia
al esfuerzo
cortante
xi
Signo de
la
diferencia
xi-2000
2158.70
11
2165.20
1678.15
12
2399.55
2316.00
13
1779.80
2061.30
14
2336.75
2207.50
15
1765.30
1708.30
16
2053.50
1784.70
17
2414.40
2575.10
18
2200.50
2357.90
19
2654.20
10
2256.70
20
1753.70
=0.05 se
Clculos:
Puesto que r+=14 es mayor que n/2=20/2=10, el valor de P se calcula de
P=2P(R+
14 cuando p = )
CONCLUSIN
Con esto podemos decir que abarcamos todo la unidad 3 y que lo que pude ver
que este temas es un poco complicado para m, no saba varios conceptos y tuve
que buscarlos en diferentes fuentes para poder tener un nocin sobre de este
tema, tambin se me quedaron unas pocas dudas sobre estos temas.
BIBLIOGRAFA
http://www.uv.es/~rmartine/inferencia_ADE/tipos%20de%20muestreo.PDF
http://www.estadistica.mat.uson.mx/Material/elmuestreo.pdf
https://www.uam.es/personal_pdi/ciencias/atorrent/docencia/0910/temas/2.2.estimadores.pdf
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estimacion/es
timacion.htm
http://es.slideshare.net/crg110886/prueba-de-hiptesis-12589447
www.fca.unl.edu.ar/InferEst/TestHipot1.htm
www.oac.uncor.edu/documentos/materias/clase7.pdf