Sunteți pe pagina 1din 38

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

UNIDAD # 1 DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO


La estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de
datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para
explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de
ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es
decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con
la investigacin cientfica.
La palabra viene del latn statisticus que significa del estado. Las estadsticas como las
conocemos hoy da tomaron en desarrollarse varios siglos y muchas mentes privilegiadas.
John Graunt (1620-1674), un ingls que estudiaba los expedientes de los nacimientos y
muertes descubri que nacan ms nios que nias, pero tambin encontr que por estar
los hombres ms expuestos a accidentes ocupacionales , a enfermedades y la guerra, el
nmero de hombres y mujeres en la edad de casarse era ms o menos la misma. Graunt fue
el primero en publicar sobre el anlisis estadstico y su trabajo llev al desarrollo de las ciencias
actuariales utilizadas por las compaas de seguros.

Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales.


La estadstica se divide en dos grandes reas:
La estadstica descriptiva: se dedica a la descripcin, visualizacin y resumen de
datos originados a partir de los fenmenos de estudio. Los datos pueden ser
resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos
son: la media y la desviacin estndar, tabla de frecuencia. Algunos ejemplos
grficos son: histograma, pirmide poblacional, grfico circular, etc.
La estadstica inferencial: se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la
aleatoriedad de las observaciones y Se usa para modelar patrones en los datos y
extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones
de unas caractersticas numricas (estimacin), pronsticos de futuras
observaciones, descripciones de asociacin (correlacin) o modelamiento de
relaciones entre variables (anlisis de regresin).
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada
En todas las ingenieras se usa para control de calidad: (muestreo de aceptacin y grficos
de control). Tambin en todas y especficamente en civil y mecnica, para calcular la
cantidad de replicaciones de un ensayo para conseguir una precisin dada.
Cuando se cambia de materia prima, mquinas, mtodo productivo y similar se usa en test
de hiptesis para ver si hubo cambios significativos. Tambin se usa para proyecciones de
series de tiempo como por ejemplo para hallar la demanda esperada para el prximo
perodo

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1.1 Introduccin a la Estadstica Inferencial


La estadstica inferencial es una parte de la estadstica que comprende los mtodos y
procedimientos que por medio de la induccin determina propiedades de una poblacin
estadstica, a partir de una pequea parte de la misma.
La Estadstica inferencial o Inferencia estadstica estudia cmo sacar conclusiones
generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad
o significacin de los resultados obtenidos. La Estadstica Inferencial se refiere al proceso
de lograr generalizaciones a cerca de las propiedades del todo, poblacin, partiendo de lo
especfico, muestra las cuales llevan implcitos una serie de riesgos. Para que stas
generalizaciones sean vlidas la muestra deben ser representativa de la poblacin y la
calidad de la informacin debe ser controlada, adems puesto que las conclusiones as
extradas estn sujetas a errores, se tendr que especificar el riesgo o probabilidad que con
que se pueden cometer esos errores. La estadstica inferencial es el conjunto de tcnicas
que se utiliza para obtener conclusiones que sobrepasan los lmites del conocimiento
aportado por los datos, busca obtener informacin de un colectivo mediante un metdico
procedimiento del manejo de datos de la muestra. Se usan esencialmente para determinar
la probabilidad de que una conclusin sacada a partir de los datos de una muestra sea cierta
en la poblacin muestreada. Las poblaciones pueden ser ventas, personal de una empresa,
consumidores de un producto, etc. El proceso conocido como inferencia estadstica,
requiere consideraciones de cmo fue seleccionada la muestra y cunto varan las
observaciones de una muestra a otra. De esta manera, los mtodos de seleccin de los
individuos que se usarn en la investigacin son de considerable importancia para la
obtencin de resultados y conclusiones vlidas. El requisito fundamental de una buena
muestra es que sea representativa de la poblacin que se trata de describir

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

La estadstica inferencial comprende aspectos importantes como:

La toma de muestras o muestreo, que se refiere a la forma adecuada de considerar


una muestra que permita obtener conclusiones estadsticamente vlidas y
significativas.

La estimacin de parmetros o variables estadsticas, que permite estimar valores


poblacionales a partir de muestras de mucho menor tamao.

El contraste de hiptesis, que permite decidir si dos muestras son estadsticamente


diferentes, si un determinado procedimiento tiene un efecto estadstico
significativo, etc.

El diseo experimental(es una tcnica estadstica que permite identificar y


cuantificar las causas de un efecto dentro de un estudio experimental)

La inferencia bayesiana(las evidencias u observaciones se emplean para actualizar o


inferir la probabilidad de que una hiptesis pueda ser cierta.)

Los mtodos no paramtricos(Prueba de X2 de Bondad de Ajuste, Prueba de


Kolmogorov-Smirnov con una Muestra, Prueba de Kolmogorov-Smirnov con dos
Muestras, Prueba de Rangos de Wilcoxon, Prueba de Wilcoxon-Mann-Whitney con
Dos Muestras, Prueba de Kruskal-Wallis con k Muestras, Prueba de los Signos,
Prueba de la Mediana, entre otras)

La estadstica inferencial puede dar respuestas a muchas de las necesidades que la sociedad
actual puede requerir. Su tarea fundamental es el anlisis de los datos que se obtienen a
partir de experimentos, con el objetivo de representar la realidad y conocerla. La estadstica
inferencial se centra en tomar una pequea muestra representativa de la poblacin y a
partir de sta, infiere que el resto de la poblacin tiene el mismo comportamiento.

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1.2 Muestreo: Introduccin al muestreo y Tipos de muestreo


Muestreo: Significa la Seleccin de un conjunto de personas o cosas que se consideran
representativos del grupo al que pertenecen, con la finalidad de estudiar o determinar las
caractersticas del grupo.
En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a
partir de una poblacin.
Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables
a la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados
parecidos a los que se alcanzaran si se realizase un estudio de toda la poblacin.
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio
adecuado (que consienta no solo hacer estimaciones de la poblacin sino estimar tambin
los mrgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos
requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una
muestra representativa, pero s podemos actuar de manera que esta condicin se alcance
con una probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin,
se puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que
se pueden obtener de la poblacin se denomina espacio muestral. La variable que asocia a
cada muestra su probabilidad de extraccin, sigue la llamada distribucin muestral

Tipos de

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

MUESTREO NO PROBABILSTICO
Es aqul para el que no se puede calcular la probabilidad de extraccin de una determinada
muestra. Por tal motivo, se busca seleccionar a individuos que tienen un conocimiento
profundo del tema bajo estudio y se considera que la informacin aportada por esas
personas es vital para la toma de decisiones. A veces, para estudios exploratorios, el
muestreo probabilstico resulta excesivamente costoso y se acude a mtodos no
probabilsticos, aun siendo consciente de que no sirven para realizar generalizaciones, pues
no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los
sujetos de la poblacin tienen la misma probabilidad de ser elegidos

1. Muestreo por cuotas


Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En
primer lugar es necesario dividir la poblacin de referencia en varios estratos definidos por
algunas variables de distribucin conocida (como el gnero o la edad). Posteriormente se
calcula el peso proporcional de cada estrato, es decir, la parte proporcional de poblacin
que representan. Finalmente se multiplica cada peso por el tamao de n de la muestra para
determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que
una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra
dentro de cada estrato. Ejemplo: En un estudio en donde el investigador quiere comparar
el rendimiento acadmico de los
diferentes niveles de clases del
secundario, su relacin con el
gnero
y
la
situacin
socioeconmica, el investigador
identifica primero los subgrupos.
Por lo general, los subgrupos son
las caractersticas o variables del
estudio. El investigador divide a
toda la poblacin en niveles de
clase, cruzados con el gnero y el
nivel socioeconmico. Luego,
toma nota de las proporciones de
estos subgrupos en toda la
poblacin y a continuacin hace
un muestreo de cada subgrupo

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

2. Muestreo de bola de nieve


Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en
contacto entre s. Consiste en identificar sujetos que se incluirn en la muestra a partir de
los propios entrevistados. Partiendo de una pequea cantidad de individuos que cumplen
los requisitos necesarios, servirn como localizadores de otros con caractersticas anlogas.
Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

3. Muestreo subjetivo por decisin razonada


En este caso las unidades de la muestra se eligen en funcin de algunas de sus
caractersticas de manera racional y no casual. Una variante de esta tcnica es el muestreo
compensado o equilibrado, en el que se seleccionan las unidades de tal forma que la media
de la muestra para determinadas variables se acerque a la media de la poblacin. La cual
funciona en base a referencias o por recomendacin despus se reconoce por medio de la
estadstica.

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

4. Muestreo Discrecional
Se lleva acabo de acuerdo el criterio del investigador, los elementos son elegidos sobre lo
que l cree que pueden aportar al estudio. Los sujetos se seleccionan a base del
conocimiento y juicio del investigador. El investigador selecciona a los individuos a travs
de su criterio profesional. Puede basarse en la experiencia de otros estudios anteriores o
en su conocimiento sobre la poblacin y el comportamiento de sta frente a las
caractersticas que se estudian.

5. Muestreo de Conveniencia
Consiste en seleccionar a los individuos que convienen al investigador para la muestra. Esta
conveniencia se produce porque al investigador le resulta ms sencillo examinar a estos
sujetos, ya sea por proximidad geogrfica, por ser sus amigos, etc. Es el tipo de muestreo
que pretende seleccionar unidades de anlisis que cumplen los requisitos de la poblacin
objeto de estudio, sin embargo, no son seleccionadas al azar. Se utiliza preferentemente en
estudios exploratorios. Las pruebas pilotos, tambin usan con frecuencia ste tipo de
muestreo

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

MUESTREO PROBABILSTICO
Es el muestreo en el cual todos los elementos de la poblacin tienen la posibilidad de ser
seleccionados, suele ser ms objetivo que el determinstico, pero tambin ms costoso,
requiere ms tiempo y es ms difcil de aplicar. Solo estos mtodos de muestreo
probabilisticos nos aseguran la representatividad de la muestra extraida y son por tanto los
mas recomendable

1. Muestreo aleatorio simple


Para obtener una muestra, se numeran los
elementos de la poblacin y se seleccionan al
azar los n elementos que contiene la muestra.

2. Muestreo aleatorio sistemtico


En un muestreo aleatorio sistemtico se elige un individuo al azar y a partir de l, a
intervalos constantes, se eligen los dems hasta completar la muestra. Suponemos que
queremos saber la opinin sobre un profesor de una clase de 60 personas. Dichas personas
estn ordenadas por orden alfabtico en la lista de alumnos de clase. Para realizar la
encuesta, seleccionamos a 12 personas. Por lo tanto, N=60 y n=12. El intervalo fijo entre

60
sujetos es: = = 12 = 5
Ahora elegimos al azar un nmero entre 1 y k = 5. Suponemos que nos sale i = 2. La muestra
resultado mediante el muestreo sistemtico ser:

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

3. Muestreo estratificado
Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de
individuos de cada estrato proporcional al nmero de componentes de cada estrato.
Ejemplo: En una fbrica que consta de 600 trabajadores queremos tomar una muestra de
20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la
D.

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

4. Muestreo por etapas mltiples


Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de
referencia o bien cuando por medio de la tcnica de muestreo simple o estratificado se
obtiene una muestra con unidades distribuidas de tal forma que resultan de difcil acceso.
En el muestreo a estadios mltiples se subdivide la poblacin en varios niveles ordenados
que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se
desarrolla en varias fases o extracciones sucesivas para cada nivel. (otra muestra si se
necesitan ms datos).
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un pas
determinado, stos pueden subdividirse en unidades primarias representadas por
circunscripciones didcticas y unidades secundarias que seran los propios profesores. En
primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener
la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una
muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera
extraccin.

5. Muestreo por conglomerados


En el muestreo por conglomerados, en lugar de seleccionar a todos los sujetos de la
poblacin inmediatamente, el investigador realiza varios pasos para reunir su muestra de
la poblacin. Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en
grupos que se supone que contienen toda la variabilidad de la poblacin, es decir, la
representan fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo
algunos de estos grupos o conglomerados para la realizacin del estudio. Dentro de los
grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las personas a
encuestar, y podra aplicrsele el instrumento de medicin a todas las unidades, es decir,
los miembros del grupo, o slo se le podra aplicar a algunos de ellos, seleccionados al azar.
Este mtodo tiene la ventaja de simplificar la recogida de informacin muestral. Cuando,
dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la
muestra, el diseo se llama muestreo bietpico.

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1.3 Teorema del lmite central


El teorema del lmite central o teorema central del lmite indica que, en condiciones muy
generales, la distribucin de la suma de variables aleatorias tiende a una distribucin
normal cuando la cantidad de variables es muy grande. Este teorema, perteneciente a la
teora de la probabilidad, encuentra aplicacin en muchos campos relacionados, tales como
la inferencia estadstica o la teora de renovacin.
El teorema en un curso de estadstica inferencial para pregrado se puede enunciar de la
siguiente forma:
TEOREMA: Sea 1 , 2 , . . , una muestra aleatoria de una poblacin cuya
distribucin tiene por media y por desviacin estndar . Entonces si n es
suficientemente grande la variable aleatoria:
=

=1

Tiene una distribucin aproximadamente normal con media = =

de esta

forma la variable:
=

Se distribuye aproximadamente normal estndar conforme n se hace grande.


DATOS:
=
=
=
=
=

NOTA: Para poder determinar la probabilidad de una muestra aleatoria es preciso hacer
uso de las tablas de distribucin normal estndar

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Ejemplo # 1. Una empresa elctrica industrial fabrica focos que tienen una duracin que
se distribuye aproximadamente en forma normal, con media de 800 horas y desviacin
estndar de 40 horas.
Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida
promedio de menos de 775 horas.
Solucin:
De acuerdo con el enunciado, se conoce la variable como la duracin del i-esimo foco en la
muestra tomada. As la variable aleatoria proviene de una poblacin con media = 800 Horas
y desviacin = 40 . De esta forma por el teorema del lmite central, si se toman muestras
de esta poblacin de tamao n = 16 y se calculan sus promedios la variable aleatoria se distribuye
aproximadamente normal con media = 800 y desviacin = 40. El problema requiere el
clculo de la probabilidad.

DATOS:
= 725
= 800
= 40
= 16
Sustituimos en la formula

( < 775) = ( )

= (

775800
40
16

775800

= (

10

= ( < 2.5) Buscar valor en la tabla de distribucin normal estndar


= 0.0062
= 0.62%

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1ra. ACTIVIDAD DE APRENDIZAJE


Resolver los siguientes ejercicios por el Teorema de Limite Central
Ejercicio # 1. La renta media de los habitantes de un pas se distribuye uniformemente entre 4.0
millones ptas. y 10.0 millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100
personas la suma de sus rentas supere los 725 millones ptas., si la media es de 700 y su desviacin
estndar de 173 ptas.
Sol. 7.49%

Ejercicio # 2. En un proceso qumico la cantidad de cierto tipo de impurezas en el producto es difcil


de controlar y por ello es una variable aleatoria. Se especula que la cantidad media de poblacin de
impurezas es de 0.20 gramos por gramo del producto. Se sabe que la desviacin estndar es 0.1
gramos por gramos del producto. Se realiza un experimento para aprender ms con respecto a la
especulacin de que = . . El proceso se lleva a cabo 50 veces en un laboratorio y el promedio
que sea menor resulta ser 0.23 gramos por gramos. Un ingeniero industrial quiere
de la muestra
especular la cantidad media de impurezas es 0.20 gramos por gramos. Utilice el teorema de lmite
central para su respuesta.
Sol: 1.74%

Ejercicio # 3 Las bolsas de sal envasadas por una mquina tienen = 500 g y = 35 g. Las
bolsas se empaquetaron en cajas de 100 unidades. Calcular la probabilidad de que la media
de los pesos de las bolsas de un paquete sea menor que 495 g.
Sol: 7.64%

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1.4 Distribuciones fundamentales para el muestreo


1.4.1 Distribucin muestral de la media
Una distribucin muestral de medias se define como el conjunto de toda la media que se
pueden calcular en todas las muestras posibles que se pueden extraer con o sin reemplazo
de una determinada poblacin. Recordemos que la media es el promedio aritmtico de las
medias del conjunto de datos; ya sea de la poblacin o de la muestra:
=

(Media poblacional)

Varianza
Es el promedio de la suma de los cuadrados de las desviaciones. Se entiende por desviacin
la diferencia de una media respecto a la media:

=( )

Como puede verse la varianza es una medida de dispersin, indica en promedio que tan
alejados estn los datos respecto a la media.

Desviacin estndar
Es la raz cuadrada de la varianza: =
Por simplicidad, en las expresiones anteriores se su prime el subndice, as como los lmites de las
sumatorias quedando de la siguiente manera:

Media poblacional

=.+.+.+.

( )

Varianza
poblacional

2 =

(1 )2 (1 )+(2 )2 (2 )+..( )2 ( )+

Media de todas la medias

Varianza de la Media
muestral

Cuando la distribucin de X es normal la distribucin de la media muestral es normal con media m

y desviacin estndar sin importar el tamao de la muestra:

El tamao de la muestra depende del grado de no normalidad de la poblacin. Sin embargo, una
regla emprica seala que una muestra de tamao 30 es suficiente, en la mayora de las situaciones,
para aplicar el teorema del lmite central.

Resolvamos un ejemplo donde se calcule las muestras posibles que se pueden


extraer con y sin reemplazo de una determinada poblacin
Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Ejemplo # 1. Con Reemplazo


Calcule las muestras posibles de la funcin de distribucin de la media muestral de una
pequea poblacin conformada por el nmero de huevos de N=5 tortugas Lad que
desovaron en cierta playa.
- El nmero de huevos por tortuga fue de 68 70 72 74 y 76
- El nmero de muestras posibles de tamao n = 2 con sustitucin es de 25
(68,68), (68,70), (68,72), (68,74), (68,76), (70,68), (70,70), (70,72), (70,74), (70,76), (72,68),
(72,70), (72,72), (72,74), (72,76), (74,68), (74,70), (74,72), (74,74), (74,76), (76,68), (76,70),
(76,72), (76,74), (76,76)
SOLUCIN
Cules son los valores que podramos esperar encontrar ya que el nmero de huevos que
produce cada tortuga es una variable contina

68

70

68

68

69

70

69

72

74

76
72

Construyendo su
distribucin de
frecuencia tendramos

~
f

68

0.04

69

0.08

70

72
74
76

75
72

75

76

Representndolo en un
histograma

0.2
0.16
0.12
0.08
0.04
0
68 69 70 71 72 73 74 75 76
Elabor: MDCD. Ing. Alejandro Arana Paredes

75

0.08

76

0.04

Estadstica Inferencial 1

I.T.S.R

Media de la poblacional

=
=

La varianza de la poblacin es
=
=

++++

3er semestre Ing. Industrial

()

() +() +() +() +()

++++

Calculamos ahora la media de todas las medias:

68(1) 69(2) 70(3) 71(4) 72(5) 73(4) 74(3) 75(2) 76(1)

25

68 138 210 284 360 292 222 150 76

25

= =
Por lo tanto:

Calculamos ahora la varianza de la media muestral:

2
x

2
2
2
2
2

68 72 (1) 69 72 2 70 72 3 71 72 (4) 72 72 (5)

25

73 722 (4) 74 722 (3) 75 722 2 76 722 1


25

16 18 12 4 0 4 12 18 16 100

4
25
25
Por lo tanto:

x2

2
n

8
4=
2

=
Los resultados anteriores se obtuvieron suponiendo que el muestreo es con reemplazo o
que las muestras se han extrado de una poblacin finita.
Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Ejemplo # 1. Sin reemplazo


En el ejemplo, bajo un muestreo sin reemplazo, el nmero de muestras posibles es 10
(las que estn por encima de la diagonal en la tabla).
x

68

70

72

74

76

68

68

69

70

71

72

70

69

70

71

72

73

72

70

71

72

73

74

74

71

72

73

74

75

76

72

73

74

75

76

El nmero de muestras de tamao n en una poblacin de tamao N est dado por la


combinacin:
N
N!

n n!( N n)!

En el ejemplo:
5 5!

10
2 2!3!

(68,70), (68,72), (68,74), (68,76), (70,72), (70,74), (70,76), (72,74), (72,76), (74,76)
Con medias

69, 70, 71, 72, 71, 72, 73, 73, 74, y 75, respectivamente y las medias de estas son:
x

69(1) 70(1) 71(2) 72(2) 73(2) 74(1) 75(1)

10

69 70 142 144 146 74 75 720

72
10
10

Y ahora la varianza de la media muestral


2
2
2
2
2

69 72 1 70 72 (1) 71 72 (2) 72 72 (2) 73 72 2


2
x

10

74 72 (1) 75 72 (1) 9 4 2 0 2 4 9
2

30
3
10

10
10
En este caso la varianza de la media muestral no es igual a la varianza poblacional entre el tamao
de la muestra. Sin embargo, existe una relacin entre estas y est dada por:

x2

2
n

2 N n
n

N 1

N n
8 52
3

4 3
N 1
2 5 1
4

Elabor: MDCD. Ing. Alejandro Arana Paredes

Por lo tanto =

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

2da. ACTIVIDAD DE APRENDIZAJE


Resolver los siguientes ejercicios de Distribucin muestral de la media
Ejercicio # 1. Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin
de valores 0, 2, 4 y 6. Encuentre:
a) = la media poblacional.
b) 2 = la varianza poblacional.
c) = la media de la distribucin de todas las medias.
d) 2 la varianza de la media muestral
e) Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de
medias.
Sol: = , = , = , 2 = 2.5

Ejercicio # 2. Se eligen muestras ordenadas de tamao 2, sin reemplazo, de la poblacin de


valores 0, 2, 4 y 6. Encuentre:
a) = la media poblacional.
b) 2 = la varianza poblacional.
c) = la media de la distribucin de todas las medias.
d) 2 la varianza de la media muestral
e) Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de
medias.
Sol: = , = , = , 2 = 2.5

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1.4.2 Distribucin muestral de la diferencia de medias


Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviacin
estndar 1 , y la segunda con media 2 2 y desviacin estndar 2 . Ms an, se elige una
muestra aleatoria de tamao n1 de la primera poblacin y una muestra independiente
aleatoria de tamao n2 de la segunda poblacin; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias. La coleccin de todas esas diferencias se llama
distribucin muestral de las diferencias entre medias o la distribucin muestral del
estadstico 1 2

Suponga que se eligen muestra ordenadas de tamao 2, con reemplazo, de la poblacin de


valores 0, 2, 4 y 6.
La distribucin es aproximadamente normal para n1 30 y n2 30. Si las poblaciones son normales,
entonces la distribucin muestral de medias es normal sin importar los tamaos de las muestras.

En ejercicios anteriores se haba demostrado que = y que


2

, por lo que no es

difcil deducir que 1 2 = 1 2 y que 1 2 = 1 + 2 .


La frmula que se utilizar para el clculo de probabilidad de la distribucin muestral de
diferencia de medias es:
=

(1 2 ) (1 2 )
2 2
1 + 2 .
1 2

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Ejemplo # 1. En un estudio para comparar los pesos promedio de nios y nias de sexto
grado en una escuela primaria se usar una muestra aleatoria de 20 nios y otra de 25 nias.
Se sabe que tanto para nios como para nias los pesos siguen una distribucin normal. El
promedio de los pesos de todos los nios de sexto grado de esa escuela es de 100 libras y
su desviacin estndar es de 14.142, mientras que el promedio de los pesos de todas las
nias del sexto grado de esa escuela es de 85 libras y su desviacin estndar es de 12.247
libras. Si 1 representa el promedio de los pesos de 20 nios y 2 es el promedio de los pesos
de una muestra de 25 nias, encuentre la probabilidad de que el promedio de los pesos de
los 20 nios sea al menos 20 libras ms grande que el de las 25 nias.
Solucin:

Datos:

1 = 100 libras
2 = 85 libras
1 = 14.142 libras
2 = 12.247 libras
n1 = 20 nios
n2 = 25 nias
(1 2 )20) =?
=

(1 2 ) (1 2 )
2
1
1

22
2

20 (100 85)
2
2
(14.142) + (12.247) .
20
25

= 1.25

Buscamos en la tabla de distribucin normal estndar 1.25=0.89435


Como el valor 1.25 no es mayor que los 20 le restamos 1 al resultado

1-0.89435 = 0.10565
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al
menos 20 libras ms grande que el de la muestra de las nias es 0.1056.

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

3ra. ACTIVIDAD DE APRENDIZAJE


Resolver los siguientes ejercicios de Distribucin muestral de la diferencia de medias
Ejercicio # 1. Uno de los principales fabricantes de televisores compra los tubos de rayos
catdicos a dos compaas. Los tubos de la compaa A tienen una vida media de 7.2 aos
con una desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de
6.7 aos con una desviacin estndar de 0.7. Determine la probabilidad de que una muestra
aleatoria de 34 tubos de la compaa A tenga una vida promedio de al menos un ao ms
que la de una muestra aleatoria de 40 tubos de la compaa B.
Sol: 0.23%

Ejercicio # 2 Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una


desviacin estndar de 1.23km/L para la primera gasolina y una desviacin estndar de
1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda
en 42 autos.
a) Cul es la probabilidad de que la primera gasolina de un rendimiento promedio
mayor de 0.45km/L que la segunda gasolina?
b) Cul es la probabilidad de que la diferencia en rendimientos promedio se
encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?.
Solucin: En este ejercicio no se cuenta con los parmetros de las medias en ninguna de las dos
poblaciones, por lo que se supondrn que son iguales.
Sol:
a) 6.42%
b)

1.17 %

Ejercicios # 3. Uno de los principales fabricantes de radios compra cables a dos empresas.
Los cables de la empresa A tienen una vida media de 4.2 aos con una desviacin estndar
de 0,4 aos, mientras que los de la empresa B tienen una vida media de 3.5 aos con una
desviacin estndar de 0,9.Determine la probabilidad de que una muestra aleatoria de 63
tubos de la empresa A tenga una vida promedio de al menos 2 ao ms que la de una
muestra aleatoria de 60 cables de la empresa B

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1.4.3 Distribucin muestral de la proporcin


Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos
reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para
dar respuesta a estas situaciones. Esta distribucin se genera de igual manera que la
distribucin muestral de medias, a excepcin de que al extraer las muestras de la poblacin
se calcula el estadstico proporcin (p=x/n en donde x es el nmero de xitos u
observaciones de inters y n el tamao de la muestra) en lugar del estadstico media.

Una poblacin binomial est estrechamente relacionada con la distribucin muestral de


proporciones; una poblacin binomial es una coleccin de xitos y fracasos, mientras que
una distribucin muestral de proporciones contiene las posibilidades o proporciones de
todos los nmeros posibles de xitos en un experimento binomial, y como consecuencia de
esta relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden
evaluarse usando la aproximacin normal a la binomial, siempre que np 5 y n(1-p) 5.
Cualquier evento se puede convertir en una proporcin si se divide el nmero obtenido
entre el nmero de intento.
La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de
proporciones est basada en la aproximacin de la distribucin normal a la binomial. Esta
frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en
la muestra.

=
=

Elabor: MDCD. Ing. Alejandro Arana Paredes

Aproximacin de la distribucin
normal a la binomial

Distribucin muestral de proporciones

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Ejemplo # 1. Se ha determinado que 60% de los estudiantes de una universidad grande


fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad
de que la proporcin de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solucin: Este ejercicio se puede solucionar por dos mtodos.
El primero: Aproximacin de la distribucin normal a la binomial

Datos:
n=800 estudiantes
p=0.60
x= (0.55).(800) = 440 estudiantes
p(x<440) = ?
Media= np= (800)(0.60)= 480

q = 1-0.60=0.40

.
(.)(.)

= .

p(x<440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una
muestra de 800 estudiantes, menos de 440 fuman cigarrillos buscando su valor en la tabla de
distribucin normal estndar

Solucin: 2do Mtodo: Utilizando la frmula de la distribucin muestral de proporcione


n=800 estudiantes
P=0.60
p=0.55
p(p<0.55) = ?

0.5493750.60

(0.60)(0.40)
800

= .

Observe que este valor es igual al obtenido en el mtodo de la aproximacin de la distribucin


normal a la binomial, por lo que si lo buscamos en la tabla de z nos da la misma probabilidad de
0.0017.
Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

4ta. ACTIVIDAD DE APRENDIZAJE


Resolver los siguientes ejercicios de Distribucin muestral de la Proporcin
Ejercicio # 1. Un medicamento para malestar estomacal tiene la advertencia de que algunos
usuarios pueden presentar una reaccin adversa a l, ms an, se piensa que alrededor del
3% de los usuarios tienen tal reaccin. Si una muestra aleatoria de 150 personas con
malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporcin
de la muestra de los usuarios que realmente presentan una reaccin adversa, exceda el 4%.
a) Resolverlo mediante la aproximacin de la normal a la binomial
b) Resolverlo con la distribucin muestral de proporciones
Sol: a)16.85%
b) 16.85%

Ejercicio # 2. Se sabe que la verdadera proporcin de los componentes defectuosos


fabricados por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria
de tamao 60 tenga:
a) Menos del 3% de los componentes defectuosos.
Sol: 23.27%

Ejercicio # 3. Disponemos de los datos del I.N.E sobre el aumento del empleo durante el
ao 98, el cual se encuentra en un 45%. Si tomamos una muestra aleatoria de 200
ciudadanos. Cul es la probabilidad de que al menos el 50% tenga empleo?
Sol: 8.7%

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1.4.4 Distribucin muestral de la diferencia de proporciones


Muchas aplicaciones involucran poblaciones de datos cualitativos que debe compararse
utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:
Educacin.- Es mayor la proporcin de los estudiantes que aprueban matemticas que
las de los que aprueban ingls?
Medicina.- Es menor el porcentaje de los usuarios del medicamento A que presentan una
reaccin adversa que el de los usuarios del frmaco B que tambin presentan una reaccin
de ese tipo?
Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales.
Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que genera la
mquina A a los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos
proporciones muestrales, la distribucin muestral de diferencia de proporciones es
aproximadamente normal para tamaos de muestra grande (n1 p1 5, n1 q1 5, n2 p2 5 y
n2 q2 5). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales,
as que su diferencia p1 p2 tambin tiene una distribucin muestral aproximadamente
normal.

Cuando se estudi a la distribucin muestral de proporciones se comprob que:

= = por lo que no es difcil deducir que: 1 2 = 1 2 y que:


1 2 =

1 1 2 2
+
1
2

La frmula que se utilizar para el clculo de probabilidad del estadstico de diferencia de


proporciones:
=

(1 2 ) (1 2 )
1 1
2 2
1 + 2

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Ejemplo # 1.
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus
opiniones sobre la promulgacin de la pena de muerte para personas culpables de
asesinato. Se cree que el 12% de los hombres adultos estn a favor de la pena de muerte,
mientras que slo 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras
aleatorias de 100 hombres y 100 mujeres su opinin sobre la promulgacin de la pena de
muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos
3% mayor que el de las mujeres
Solucin:
Datos:
PH= 0.12
1- 0.12=0.88=q1
PM= 0.10
1- 0.10=0.90=q2
nH= 100
nM= 100
p (pH p M 0.03) = ?

Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin
binomial y se est utilizando la distribucin normal
=

(1 2 ) (1 2 )
1 1
2 2
1 + 2

.(..)
(0.12)(0.88) (0.10)(0.90)

+
100
100

= .

Buscando en la tabla 0.11 = 0.54395. Por lo tanto 1-0.54395=0.456


Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de
muerte, al menos 3% mayor que el de mujeres es de 0.456

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

5ta. ACTIVIDAD DE APRENDIZAJE


Resolver los siguientes ejercicios de Distribucin muestral de la diferencia de Proporcin

Ejercicio # 1. Una encuesta del Boston College const de 320 trabajadores de Michigan que
fueron despedidos entre 1979 y 1984, encontr que 20% haban estado sin trabajo durante
por lo menos dos aos. Supngase que tuviera que seleccionar otra muestra aleatoria de
320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. Cul sera
la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o
ms?
Sol: 6.3 %
En este ejercicio se cuenta nicamente con una poblacin, de la cual se estn extrayendo dos muestras y se quiere saber
la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se debe de utilizar la distribucin
muestral de proporciones con P1= P2, ya que es una misma poblacin.

Ejercicio # 2. Se sabe que 3 de cada 6 productos fabricados por la mquina 1 son


defectuosos y que 2 de cada 5 objetos fabricados por la mquina 2 son defectuosos; se
toman muestras de 120 objetos de cada mquina:
a. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina
2 rebase a la mquina 1 en por lo menos 0.10?
b. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina
1 rebase a la mquina 2 en por lo menos 0.15?
Solucin: a) 0.11%
b) 23.57%

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

1.4.5 Distribucin t-Student


En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de
probabilidad que surge del problema de estimar la media de una poblacin normalmente
distribuida cuando el tamao de la muestra es pequeo. Las distribuciones t de Student
fueron descubiertas por William S. Gosset (1876-1937) en 1908 cuando trabajaba para la
compaa de cervezas Guinness en Dubln (Irlanda). Aparece de manera natural al realizar
la prueba t de Student para la determinacin de las diferencias entre dos medias muestrales
y para la construccin del intervalo de confianza para la diferencia entre las medias de dos
poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser
estimada a partir de los datos de una muestra

El estadstico T tiene una distribucin que se denomina distribucin T de Student, que est
tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calcul la
desviacin standard. La distribucin T tiene en cuenta la incertidumbre en la estimacin de
la desviacin standard de la poblacin, porque en realidad la tabla de T contiene las
distribuciones de probabilidades para distintos grados de libertad. La distribucin T es ms
ancha que la distribucin normal tipificada Para un nmero de grados de libertad pequeo.
Cuando los grados de libertad tienden a infinito, la distribucin T tiende a coincidir con la
distribucin normal standard. Es decir, en la medida que aumentemos el nmero de
observaciones de la muestra, la desviacin standard calculada estar ms prxima a la
desviacin standard de la poblacin y entonces la distribucin T correspondiente se acerca
a la distribucin normal standard. El uso de la distribucin T presupone que la poblacin
con que estamos trabajando tiene una distribucin normal. Si el tamao de la muestra es n
entonces decimos que la distribucin t tiene n-1 grados de libertad. Hay una distribucin t
diferente para cada tamao de la muestra. Estas distribuciones son una familia de
distribuciones de probabilidad continuas. Las curvas de densidad son simtricas y con forma
de campana como la distribucin normal estndar. Sus medias son 0 y sus varianzas son
mayores que 1 (tienen colas ms pesadas). Las colas de las distribuciones t disminuyen ms
lentamente que las colas de la distribucin normal. Si los grados de libertad son mayores
ms prxima a 1 es la varianza y la funcin de densidad es ms parecida a la densidad
normal.
Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Definicin:
Es una distribucin de probabilidad. Se utiliza para hacer estimaciones de la media de una
variable, (que est distribuida normalmente), en una poblacin, cuando el tamao de la
muestra es pequeo. Tambin se utiliza para hacer estimaciones de parmetros de las
poblaciones a partir de los valores de los estadsticos correspondientes en las muestras,
cuando desconoce el valor de la varianza o la desviacin estndar de la poblacin
Definicin de Grados de Libertad:
Los valores de los estadsticos en una muestra deben ser valores cercanos a los parmetros
correspondientes en las poblaciones. Los grados de libertad representan al nmero de
datos independientes que se pueden tomar de la poblacin para construir la muestra, de
tal manera que los valores de los estadsticos en la muestra sean cercanos a los valores de
los parmetros correspondientes en la poblacin. Por tanto cuando se escoge una muestra
de tamao n, el nmero de datos independientes que se pueden tomar de la poblacin para
construir la muestra es n-1, ya que el ltimo dato que se escoja, es el que viene a definir el
valor del estadstico en la muestra. Podemos concluir entonces que para calcular los grados
de libertad, al nmero que representa el tamao de la muestra(n) le restamos 1, es decir
aplicamos la formula gl=n-1

Propiedades de la Distribucin t student

1. El valor de la media es 0
2. Tiene forma de campana y es simtrica con respecto a la media
3. La distribucin t tiene una varianza mayor que 1, pero en la medida en que aumentan los
grados, el valor de la varianza se aproxima a 1, lo cual lleva a que la distribucin t se
aproxime a la distribucin normal estndar en la medida en que aumenta el valor de los
grados de libertad.
Nota: Podemos Utilizar 2 tabla de Distribucin t Student
- Tabla de los Valores de las rea en una cola y rea en 2 colas de la grfica y una columna que son los
grados de libertad (los valores encontrados en la tabla corresponden a los valores crticos es decir los que
se ubican en el eje horizontal)

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Ejemplo # 1. Encontrar t (12, 0.01)


Solucin: Encontrar los valores crticos en la distribucin tStudent si el valor de los grados de
libertad es 12 (el tamao de la muestra es 13) y el rea en una cola o en dos colas es de 0.01

UNA COLA: Si el rea de 0.01 est en una cola, puede estar a la izquierda o a la derecha
Cola izquierda

Cola derecha

0.01

0.01

Si el rea dada es en una cola, entonces buscamos el valor correspondiente en la tabla: que para 12
grados de libertad y un rea de una cola de 0.01 el valor critico de t es de: 2.681

DOS COLAS: Si el rea de 0.01 est en dos colas, se tiene que en cada cola hay un rea de
0.01/2 es decir 0.005

0.005

0.005

Si el rea dada es en dos colas, entonces buscamos el valor correspondiente en la tabla: que para
12 grados de libertad y un rea de 0.01 en dos colas , es decir un rea de 0.005 en una cola el valor
critico de t es de: 3.055

CONCLUSION:

Por tanto los valores de t en el eje horizontal son:


-2.68 si el rea dada est en la cola izquierda
2.68 si el rea dada est en la cola derecha
-3.055 y 3.055 si el rea dada es dos colas

Cola izquierda

Cola derecha

Elabor: MDCD. Ing. Alejandro Arana Paredes

Dos colas

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Ejemplo # 2. Dada la grfica, identificar los valores crticos en la distribucin t-Student

= .
=

En este caso debemos hallar el valor de t para una muestra de = y un rea en una cola de 0.05.
Obtenemos entonces el valor de los grados de libertad gl= n - 1= 20 - 1= 19
Buscamos el valor correspondiente a t en la tabla es igual a 1.729. Por lo tanto, el valor de t en el eje horizontal
es: -1.73 ya que el rea dada est en la cola izquierda.

-1.73

Ejemplo # 3. Dada la grfica, identificar los valores crticos en la distribucin t - Student

= .
=

En este caso debemos hallar el valor de t para una muestra de n = 4 y un rea en dos colas de 0.10 es decir
que en cada cola hay un rea de 0.10/2= 0.05. Obtenemos entonces el valor de los grados de libertad gl=n1=4-1=3. Buscamos el valor correspondiente a t en la tabla es igual a 2.365. Por lo tanto, el valor de t en el
eje horizontal es - 2.365 y 2.365 ya que el rea dada est en las 2 colas.

-2.365

Elabor: MDCD. Ing. Alejandro Arana Paredes

2.365

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

ACTIVIDAD DE APRENDIZAJE
Para cada ejercicio, identificar los posibles casos y hacer la grfica correspondiente
1. Encontrar
A) T(22, 0.025)
B) T(25, 0.05)
C) T(15, 0.01)
D) T(10, 0.10)
E) T(8, 0.02)

2. Dada las grficas, identificar los valores crticos en la distribucin t Student

= .
=

= .
=

= .
=

Elabor: MDCD. Ing. Alejandro Arana Paredes

= .
=

Estadstica Inferencial 1

1.4.6

I.T.S.R

3er semestre Ing. Industrial

Distribucin muestral de la varianza

En este tema se analizara las distribucin muestra teora de s2 para muestras aleatorias de
poblaciones normales. Como s2 no puede ser negativa, debemos esperar que esta
distribucin muestral no se una curva normal: y efectivamente se encuentra ligada a una

distribucin gamma de parmetros = 2 = 2 llamada distribucin x cuadrada (chicuadrado). Concretando se tiene que:
Si s2 es la varianza de una muestra aleatoria de tamao n tomada de una poblacin normal
que tiene la varianza , entonces:
( )
=

Es un valor de una variable aleatoria que tiene la distribucin x-cuadrada con el parmetro v = n -1

Ver tabla que contiene valores seleccionados de x2 para distintos valores de v, llamado de
nuevo, numero de grados de libertad, donde x2 es tal que el rea bajo la curva de la
distribucin x cuadrada(tomada a la derecha) es igual a .

En la tabla la columna de la izquierda contiene valores de v, los valores que encabezan las
columnas son reas de la cola derecha de la curva de la distribucin x- cuadrada y las
entradas son valores de 2 . A diferencia de la distribucin t, es necesario tabular valores de
2 > 0.50, que la distribucin x cuadrada no es simtrica.

Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

I.T.S.R

3er semestre Ing. Industrial

Veamos un ejemplo: Una compaa de ptica compra cristal para fabricar lentes, y que
experiencias anteriores han demostrado que la varianza del ndice de refacciones de esta
clase de cristal es 126.0 x 10-4. Para convertir el cristal en lentes de una longitud focal dada,
es importante que las distintas piezas de cristal tengan, aproximadamente el mismo ndice
de refraccin; en consecuencia, supondremos que en envi de cristal de esta clase se
rechaza si la varianza muestral de 20 piezas seleccionadas al azar excede a 200.0 x 10-4.
Suponiendo adems que los valores de las muestras se pueden tratar como si provinieran
de una poblacin normal con 2 = 126.0 104 , la probabilidad de que en un envi se
rechace errneamente se puede determinar de la manera siguiente.
=
=
2 = 126.0 104 =

( )

(20 )200.0104
= 30.2
126.0104

0.0126
= 0.05
2

Posteriormente encontramos en la tabla de puntos porcentuales de la distribucin x2, que


2
para 19 grados de libertad, 0.05
= 30.1
Entonces la probabilidad de que en un envio bueno se rechace errneamente, por este
criterio, es menor que 0.05
Un problema relacionado muy de cerca con el de encontrar la distribucin de la varianza
muestral es el de encontrar la distribucin de la razn de las varianzas de dos muestras
aleatorias independiente. Este problema es importante porque aparece en pruebas en las
queremos determinar si dos muestras provienen de poblaciones que tienen varianzas
iguales. Si esto ocurre, las dos muestras tendrn aproximadamente, la misma varianza; esto
es, su razn ser, aproximadamente, 1.
Para determinar si la razn de dos varianzas de muestras es muy pequeo o muy grande se
utiliza el siguiente teorema:
Si 12 22 son las varianzas de muestras aleatorias independiente de tamaos 1 2
respectivamente, tomadas de dos poblaciones normales que tienen la misma varianza,
entonces:
12
= 2
2
Es un valor de una variable aleatoria que tiene la distribucin F con parmetros
1 = 1 1 y 2 = 2 1.
La distribucin F tiene los dos parmetros 1 que representa los grados de libertad de la
varianza de la muestra del numerador, y 2 que representa los grados de libertad de la
varianza de la muestra del denominador; al referirnos a una distribucin F particular, damos
siempre en primer lugar los grados de libertad del numerador
Elabor: MDCD. Ing. Alejandro Arana Paredes

Estadstica Inferencial 1

Elabor: MDCD. Ing. Alejandro Arana Paredes

I.T.S.R

3er semestre Ing. Industrial

Estadstica Inferencial 1

Elabor: MDCD. Ing. Alejandro Arana Paredes

I.T.S.R

3er semestre Ing. Industrial

Estadstica Inferencial 1

I.T.S.R

TABLA DE DISTRIBUCIN NORMAL ESTANDAR

Elabor: MDCD. Ing. Alejandro Arana Paredes

3er semestre Ing. Industrial

Estadstica Inferencial 1

I.T.S.R

TABLA DE DISTRIBUCIN NORMAL ESTANDAR

Elabor: MDCD. Ing. Alejandro Arana Paredes

3er semestre Ing. Industrial

S-ar putea să vă placă și