Documente Academic
Documente Profesional
Documente Cultură
INTRODUCCIÓN AL MUESTREO
El UNIVERSO queda determinado cuando se definen los objetivos del trabajo que se lleva-
rá a cabo, como así también las UNIDADES EXPERIMENTALES sobre las que se realizarán las
observaciones.
De acuerdo con esta definición, se puede colegir que cada UNIVERSO puede generar va-
rias POBLACIONES. Una por cada una de las variables cuya medición sea de interés para alcanzar
los objetivos fijados. En otras palabras, al establecer cuáles serán las variables que se observarán
en cada una de las UNIDADES EXPERIMENTALES que conforman el UNIVERSO, quedan determi-
nadas las distintas POBLACIONES (1).
Se llama CENSO a la medición, en la totalidad de las UNIDADES EXPE-
RIMENTALES que conforman el UNIVERSO, de todas las variables que
previamente hayan sido declaradas relevantes, para la investigación a
llevar a cabo.
La nomenclatura que se utilizará en este trabajo para designar al tamaño del UNIVERSO, o
al tamaño de la POBLACIÓN, que necesariamente es el mismo, es:
N: Tamaño del UNIVERSO o tamaño de la POBLACIÓN (cuando corresponda)
Los UNIVERSOS pueden ser finitos o infinitos, dependiendo de la cantidad de elementos
que los conforman y, consecuentemente, las POBLACIONES serán finitas o infinitas.
Ejemplo 1.1
Dadas las siguientes situaciones, identificar a los Universos y a las correspondientes Poblaciones:
1 Como es costumbre, las poblaciones se representan con las últimas letras del alfabeto latino V; W; X; Y; Z
ESTADISTICA – C. Capriglioni PÁGINA 11
1.Introducción al Muestreo
Una de esas técnicas, como se ha dicho, y cuya definición precisa se brindará mas adelan-
te, es el Muestreo. El Muestreo consiste en observar y medir a algunos elementos del universo y
con ellos, obtener la información necesaria para cumplir con los objetivos fijados para concretar
el trabajo.
Esto significa que se INFIERE la población a partir de la muestra. De esta manera, las con-
clusiones a que se llegan, por estar basadas en "ignorancias parciales", producen un cierto grado
de duda, el cual podría ser controlado probabilísticamente, si la muestra se toma utilizando méto-
dos que garanticen aleatoriedad.
1.1.3. MUESTREO
Para obtener una MUESTRA que permita INFERIR adecuadamente la población en estudio,
es necesario tener en cuenta algunas reglas y operaciones, las cuales dependerán de los objetivos
fijados.
Las siguientes definiciones ponen de manifiesto, someramente, algunas de ellas.
Las unidades experimentales que intervienen en una muestra, pueden ser tomadas con
mayor o menor grado de subjetividad por parte del sujeto que se encarga de realizar la muestra.
De esta manera, se originan distintos tipos de MUESTREO. Algunos de ellos se detallan en los
parágrafos siguientes.
Ejemplo 1.2
En un bosque formado por 500 ejemplares de pinos se desea estudiar el diámetro del tronco al-
canzado luego de un determinado tiempo de ser plantado, para ello se decide utilizar una muestra
de 20 ejemplares.
Se pide, identificar a la población y a la muestra.
SOLUCIÓN
Población - X: Diámetro del tronco
A cada árbol que pertenecerá a la muestra le corresponderá un valor de la variable "Diámetro del
tronco". El valor correspondiente al árbol 1, puede ser cualquiera, por lo tanto es variable y, hasta
que no haya sido medido, el diámetro es desconocido, por lo tanto, es aleatorio. Lo mismo ocurre
con el ejemplar 2, el ejemplar 3, etcétera, por lo tanto, la muestra es el conjunto
{X1 ; X2 ; X3 ;... ; X20}
La naturaleza de las Poblaciones que serán objeto del muestreo puede ser de lo más varia-
da. Por ejemplo, puede tratarse de una población homogénea o de una población heterogénea; las
unidades experimentales pueden presentarse sistemáticamente con una determinada periodicidad,
o pueden estar agrupadas formando conglomerados; etcétera. Estas particularidades que presentan
las poblaciones dan origen a los Métodos de obtención de las muestras que resulten más adecua-
dos, algunos de los cuáles se describirán brevemente en los próximos acápites.
N 1
Cantidad de muestras favorables n 1 n
Cantidad de muestras posibles N N
n
por lo tanto, todos los elementos tienen la misma probabilidad de ser extraídos.
ESTADISTICA – C. Capriglioni PÁGINA 15
1.Introducción al Muestreo
Ejemplo 1.3
Dado el Universo del Ejemplo 1.2, si las condiciones del suelo son las mismas en todo el predio
que ocupa el bosque, entonces puede suponerse que la población "Diámetro del tronco" es homo-
génea. Determinar el método de muestreo adecuado para tomar una muestra de tamaño 20.
SOLUCIÓN
La población es
X: Diámetro del tronco
Población finita: N = 500
Tamaño de la muestra: n = 20
Bajo el supuesto de homogeneidad de la población, cualquiera de los 500 ejemplares puede brin-
dar datos similares, por lo tanto, el método de muestreo adecuado es el Muestreo Simple al Azar.
h
Nj N
j=1
Si el tamaño de la muestra es n, y de cada uno de los estratos se toma una muestra de ta-
maño nj, entonces se debe cumplir que:
h
nj n
j =1
Una cuestión importante a resolver es cuánto del total n deberá asignarse a cada uno de
los estratos.
La asignación del tamaño de la muestra a cada uno de los distintos estratos se llama AFI-
JACIÓN, y puede realizarse de alguna de las siguientes formas:
a. Afijación igual o uniforme: El tamaño de muestra que le corresponde a cada es-
trato es igual para todos. Este tamaño se calcula, entonces, haciendo el cociente entre
el tamaño de la muestra, n, y la cantidad de estratos, h.
n
n1 n2 nj
h
b. Afijación proporcional: El tamaño de la muestra que le corresponde a cada
estrato es proporcional al tamaño del estrato. Se calcula haciendo el producto
entre la fracción de muestreo y el tamaño de cada estrato.
n n n
n1 N1 ; n 2 N2 ; ; nh Nh
N N N
c. Afijación Óptima: El tamaño de la muestra para cada estrato es proporcional al
tamaño del estrato y al desvío estándar correspondiente. De esta manera se tiene
en cuenta la falta de homogeneidad entre las subpoblaciones.
n N1 1 n N2 2 n Nh h
n1 ; n2 ; ; nh
h h h
Nii Nii Nii
i1 i1 i1
Ejemplo 1.4
En una ciudad de 28000 hogares se desea estudiar, utilizando una muestra de 210 hogares, el ni-
vel de ingreso por cada hogar. Investigaciones previas permitieron comprobar que, en dicha ciu-
dad, en general, las personas tienden a vivir en barrios con otras personas cuyos niveles de ingre-
so son similares.
Se detectaron cuatro barrios, a saber:
Norte (barrio 1), con 12000 hogares; Sur (barrio 2), con 8000 hogares; Este (barrio 3), con 1600
hogares y Oeste (barrio 4), con 6400 hogares.
También se ha detectado que la variabilidad de los ingresos dentro de cada uno de los barrios es
casi la misma. Determinar el Método de Muestreo más adecuado para seleccionar la muestra.
SOLUCIÓN
La población es,
X : Nivel de ingreso
Tamaño del Universo : N = 28000
Tamaño de la muestra : n = 210
Dado que las personas están agrupadas en barrios dentro de los cuales las familias presentan ca-
racterísticas similares y casi no hay variabilidad entre los ingresos, el método de muestreo más
adecuado es el Método Estratificado al Azar, con afijación proporcional, donde cada barrio puede
considerarse un estrato.
Los tamaños de cada estrato son, entonces
N1 = 12000 ; N2 = 8000 ; N3 = 1600 ; N4= 6400
El tamaño de la muestra proporcional para cada estrato se calcula haciendo
n 210 n 210
n1 N1 12000 90 ; n2 N2 8000 60
N 28000 N 28000
n 210 n 210
n3 N3 1600 12 ; n 4 N4 6400 48
N 28000 N 28000
Los tamaños de muestra para cada estrato, utilizando afijación proporcional, son:
n1 = 90 ; n2 = 60 ; n3 = 12 ; n4 = 48
Ejemplo 1.5
Se desea estudiar, mediante el uso del muestreo, el coeficiente intelectual de los alumnos que
cursan el séptimo grado del nivel primario en todo el país. Investigaciones previas permiten su-
poner que hay homogeneidad entre los coeficientes intelectuales. Describir el procedimiento para
aplicar el Método de Muestreo por Conglomerado Polietápico, hasta tres etapas de muestreo.
SOLUCIÓN
- Una etapa de muestreo
Cada provincia se considera un conglomerado. Se toma una muestra de provincias, y se mide el
coeficiente intelectual a cada uno de los alumnos de séptimo grado, que cursan en las escuelas de
las provincias que pertenecen a la muestra.
- Dos etapas de muestreo
Cada provincia se considera un conglomerado, y cada departamento provincial, un subconglome-
rado. Se toma una muestra de provincias (primera etapa de muestreo). De cada una de las provin-
cias que pertenecen a la muestra, se toma una muestra de departamentos (segunda etapa de mues-
treo). Se mide el coeficiente intelectual a cada uno de los alumnos de séptimo grado que cursan
en las escuelas de los partidos o departamentos que pertenecen a la muestra.
- Tres etapas de muestreo
Cada provincia se considera un conglomerado; cada departamento provincial un subconglomera-
do y cada escuela un sub-subconglomerado. Se toma una muestra de provincias (primera etapa de
muestreo). De cada una de las provincias que pertenecen a la muestra, se toma una muestra de
departamentos (segunda etapa de muestreo). De cada uno de los departamentos que pertenecen a
PÁGINA 18 ESTADISTICA – C. Capriglioni
1. Introducción al Muestreo
la muestra, se toma una muestra de escuelas (tercera etapa de muestreo). Se mide el coeficiente
intelectual a cada uno de los alumnos de séptimo grado que cursan en las escuelas que pertenecen
a la muestra.
Ejemplo 1.6
En una empresa que trabaja los 365 días del año, se desea estudiar, mediante la utilización de una
muestra de tamaño 10, el comportamiento del monto diario de las ventas realizadas en el año an-
terior, utilizando como fuente los partes diarios remitidos por el correspondiente departamento.
Estos partes están numerados de 1 a 365.
Calcule el número c correspondiente si se quiere aplicar el método de Muestreo Sistemático y
determinar el número de orden correspondiente para cada parte diario.
SOLUCIÓN
N = 365 ; n = 10
El valor c se calcula haciendo
N 365
c ent ent ent (36,5) 36
n 10
Mediante la utilización de una tabla de dígitos al azar o de un bolillero, se toma al azar un número
entre 1 y 36.
A los efectos de la solución de este problema, se supondrá que el número desinsaculado ha sido el
21.Éste es el número de orden del primer parte diario de la muestra. A partir de él se elige uno
cada 36. Luego, los partes diarios que forman la muestra serán los identificados con los números
21 ; 57 ; 93 ; 129 ; 165 ; 201 ; 237 ; 273 ; 309 ; 345
Ejemplo 1.7
En un taller de expresión corporal, están interesados en estudiar determinadas características de
las personas que se inscriben, como por ejemplo la edad, y si alcanzan o no la mayoría de edad.
Las edades de las ocho personas que se inscribieron, en años cumplidos, son las que se detallan a
continuación, de menor a mayor: 15 ; 16 ; 19 ; 22 ; 23 ; 27 ; 36 ; 38
Se pide:
a) Identifique el Universo
b) Identifique a las Poblaciones
c) Calcule el valor de los Parámetros
SOLUCIÓN
a) El universo es la totalidad de personas inscriptas en el taller y su tamaño es
N=8
Una de las variables en estudio es la edad de las personas, entonces se define la población:
X: Edad de las personas
cuyos valores son
{15 ; 16 ; 19 ; 22 ; 23 ; 27 ; 36 ; 38}
-El valor del parámetro Media Poblacional en la Población edad es:
N
Xi 15 16 19 22 23 27 36 38
i1
X 24,5
N 8
X = 24,5
-El valor del parámetro Varianza Poblacional en la Población edad es:
N N
2 2
(X i ) Xi 2
2X i1
i1
N N
15 16 19 2 22 2 232 27 2 36 2 38 2
2 2
24,5 2 65, 25
8
2X = 65,25
Otra de las características que se quiere estudiar al universo es la cantidad de personas mayores
de edad.
-El valor del parámetro Total de personas mayores de edad en el Universo es: = 5
-El valor del parámetro Proporción de personas mayores de edad en el Universo es:
5
0,625
8
La expresión
X f (X / )
se lee
"La población X se distribuye con función de densidad de probabilidad f (X) y PARÁMETRO ".
Los PARÁMETROS no son constantes matemáticas; son números reales que pueden asumir
cualquier valor que se encuentre dentro de un conjunto específico. Este conjunto de números
reales se llama ESPACIO PARAMÉTRICO y su símbolo es la letra griega omega .
Ejemplo 1.8
-Sea X una población cuya función de densidad de probabilidad f (X) es la función normal.
1 X 2
1
f (X ) e 2
2π
Esta función tiene dos parámetros matemáticos
y
pudiéndose demostrar que también representan los PARÁMETROS ESTADÍSTICOS:
Media poblacional o Esperanza Matemática de la población: X = E(X)
Varianza de la población: 2X = V(X) = E(X - )2
Desvío Estándar de la población: X = V (X)
-Sea la distribución Binomial
p (~r ) ~nr r 1 n r
~ ~
Esta función tiene dos parámetros matemáticos
n y
n no es un parámetro estadístico
: Es un parámetro estadístico. Es la proporción poblacional
PROPOSICIÓN 1
Toda operación algebraicas realizada con PARÁMETROS, también es un
PARÁMETROS
A manera de ejemplo de la PROPOSICIÓN 1 se puede enunciar lo siguiente:
Sea X1 una población con función de densidad f (X1) cuya media poblacional es 1 y X2 otra po-
blación con función de densidad de probabilidad f (X2) cuya media poblacional es 2, entonces,
(1 2)
es un PARÁMETRO. Éste se llama PARÁMETRO DIFERENCIA DE MEDIAS POBLACIO-
NALES.
Sea 1 la cantidad de elementos con atributo que pertenecen a un universo de tamaño N1 y 2 la
cantidad de elementos con atributo que pertenecen a un universo de tamaño N2, entonces,
(1 - 2)
es un PARÁMETRO. Éste se llama PARÁMETRO DIFERENCIA DE PROPORCIONES PO-
BLACIONALES.
El uso del muestreo se justifica porque, como ya ha sido explicado oportunamente, es fac-
tible que no sea mucho lo que se sepa acerca de las poblaciones.
Si fuese posible realizar un censo, entonces, se podrían conocer los verdaderos valores de
PÁGINA 22 ESTADISTICA – C.Capriglioni
1. Introducción al Muestreo
los parámetros correspondientes a las poblaciones que son objeto de la investigación, pero, si por
alguna razón el censo es impracticable, estos valores serán desconocidos.
En estos casos, los parámetros se pueden inferir, utilizando determinadas funciones que se
generan con las variables muestrales y cuyas definiciones formales se presentan en el siguiente
punto.
Dado que los ESTADÍGRAFOS son funciones generadas por variables aleatorias, también
son variables aleatorias, luego, existirá una función de densidad de probabilidad, o una función de
probabilidad, lo que corresponda, que describa su comportamiento probabilístico, como así tam-
bién es posible que tengan una Esperanza Matemática finita y una Varianza finita.
Los ESTADÍGRAFOS cumplen distintos roles dentro del análisis inferencial, algunos de los
cuales se estudiarán en capítulos posteriores, no obstante, a continuación se definirá un tipo espe-
cial de ESTADÍGRAFO que se utiliza para inferir concretamente a los parámetros.
1.2.3. ESTIMACIÓN
Dado que en la mayoría de los trabajos en donde se aplica el análisis estadístico, los pará-
metros de las poblaciones son desconocidos, hay que llevar a cabo el proceso de inferir o sacar
conclusiones acerca de éstos a través de las variables muestrales.
Los métodos que se utilizan para ello son dos, que generalmente se complementan, a saber:
ESTIMACIÓN PUNTUAL
ESTIMACIÓN POR INTERVALO
2 El símbolo sobre la letra que simboliza a un PARÁMETRO significa: ESTIMADOR de dicho PARÁMETRO.
ESTADISTICA – C. Capriglioni PÁGINA 23
1.Introducción al Muestreo
Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ; ; Xn};
sea ̂ = g ( X1 ; X2 ; ; Xn ) un estimador de dicho parámetro cuya esperanza matemática,
E( ̂ ), sea finita y su varianza, V( ̂ ), también sea finita;
y sean { x1 ; x2 ; ; xn }los correspondientes valores que asumen cada una de las variables
luego de tomar la muestra y realizar las correspondientes mediciones.
Dada una población finita de tamaño N, si se pudiese tomar todas las muestras posibles de
tamaño n y se calculase el valor numérico del estimador ̂ para cada una de ellas, entonces las
funciones que representan a las DISTRIBUCIONES DE LOS ESTIMADORES podrían ser
generadas empíricamente.
Esto es casi imposible en situaciones reales, por ello, a cada estimador se le asocia un de-
terminado modelo teórico, algunos de ellos ya fueron estudiados oportunamente, y otros se pre-
sentarán en parágrafos posteriores.
Si el estimador ̂ es una variable aleatoria discreta y p( ̂ )es su función de probabilidad,
entonces, la Esperanza Matemática y la Varianza del estimador son, respectivamente,
E(ˆ) ˆ i p (ˆ i )
V(ˆ) E ˆ E(ˆ) 2
ˆi E(ˆ) 2
p (ˆ i )
Si el estimador ̂ es una variable aleatoria continua y f ( ̂ ) es su función de densidad de
probabilidad, entonces, la Esperanza Matemática y la Varianza del estimador son, respectivamen-
te,
E(ˆ) ˆ f (ˆ) dˆ
2
2
V (ˆ) E ˆ E(ˆ) ˆ E(ˆ) f (ˆ) dˆ
(3)
1.2.5. SESGO
Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n, {X1 ; X2 ; ; Xn};
sea ̂ = g ( X1 ; X2 ; ; Xn ) un estimador de dicho parámetro cuya esperanza matemática,
E( ̂ ), sea finita y su varianza, V( ̂ ), también sea finita;
3 Según el Diccionario de la Real Academia Española. SESGO: Oblicuidad o torcimiento de una cosa hacia un lado,
o en el corte, o en la situación, o en el movimiento.
ESTADISTICA – C. Capriglioni PÁGINA 25
1.Introducción al Muestreo
El ERROR MEDIO CUADRÁTICO mide la variabilidad del estimador con respecto al pará-
metro que está estimando.
si
E (ˆ)
entonces
E (ˆ ) 2 E ˆ E (ˆ) 2 V (ˆ)
O, si
Lim E (ˆ)
n
entonces
2 2
Lim E (ˆ ) E ˆ Lim E (ˆ) V (ˆ)
n n
1.3.2. CONSISTENCIA
Es razonable desear que un estimador del parámetro proporcione más información acer-
ca de éste, cuanto mayor sea el tamaño de la muestra.
Si se tomase una muestra de tamaño tan grande como el tamaño de la población, cabría es-
perar, en un buen estimador, que la estimación puntual resultase igual al parámetro.
Sea una población X, cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ; ; Xn};
sea ̂ = g ( X1 ; X2 ; ; Xn ) un estimador INSESGADO de dicho parámetro cuya esperanza
matemática, E ( ˆ ) , sea finita y su varianza, V (
ˆ ) , también sea finita;
1.3.3. EFICIENCIA
Otra de las condiciones con las que debería cumplir un estimador, para que pueda ser con-
siderado un BUEN ESTIMADOR, es que su VARIABILIDAD con respecto al parámetro, que como
ya fue explicado, se mide con el error medio cuadrático, debería ser MÍNIMA.
Si el estimador es insesgado, esta variabilidad está expresada en la varianza del estimador.
Por este motivo, sería importante que un estimador, además del insesgamiento, tenga la menor
varianza que pueda tener cualquier estimador insesgado del mismo parámetro. La importancia de
ello radica en el hecho de que ésta es, quizá, la medida más importante para decidir acerca de su
bondad para proporcionar información sobre el parámetro.
Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ; ; Xn};
sea ̂ = g ( X1 ; X2 ; ; Xn ) un estimador INSESGADO de dicho parámetro cuya esperanza
matemática, E ( ˆ ) , sea finita y su varianza, V (
ˆ ) , también sea finita;
1
V (ˆ) 2
ln f (X / )
E
n.
Esta desigualdad recibe el nombre de COTA DE CRAMER-RAO, e indica cual es la menor
varianza que puede tener un estimador.
Si los estimadores son sesgados, entonces la EFICIENCIA RELATIVA entre los estimadores
se establece comparando el ERROR MEDIO CUADRÁTICO de cada uno de ellos.
1.3.4. SUFICIENCIA
Cuando es necesario construir un estimador para un determinado parámetro , en algunos
casos se lo hará utilizando todas y cada una de las n variables muestrales, y en otros el estimador
estará basado solamente en algunas de las variables de la muestra.
Intuitivamente, se puede apreciar que la cantidad de información acerca del parámetro ,
que brinda aquel estimador que utiliza a todos los datos de la muestra, será superior a la cantidad
de información proporcionada por aquellos estimadores que utilizan sólo a algunos de ellos.
Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ; ; Xn};
sea ̂ = g ( X1 ; X2 ; ; Xn ) un estimador INSESGADO de dicho parámetro cuya esperanza
matemática, E (̂) , sea finita y su varianza, V (̂) , también sea finita;
Ejemplo 1.9
Dada una Tabla de Contingencia de 2 Filas 2 Columnas donde ya están fijados los correspon-
dientes Totales Marginales (Total de las Filas y Total de las Columnas)
Totales de
A A Filas
B 40
B 110
Totales de
80 70
Columnas
Si se considera a cada intersección de Filas y Columnas como una variable, entonces esta tabla
tiene cuatro variables, a saber:
X1 = (AB) ; X2 = (A B ) ; X3 = ( A B) ; X4 = ( A B )
Si se elige una variable cualquiera, libremente, y se le asigna un valor numérico, entonces el va-
lor numérico de las otras tres variables queda determinado. Por ejemplo, si a la variable X1 se le
asigna el valor 10, entonces el valor numérico de las otras tres será, necesariamente:
PÁGINA 30 ESTADISTICA – C. Capriglioni
1. Introducción al Muestreo
X2 = 70 ; X3 = 30 ; X4 = 40
Totales de
A A Filas
B X1 = 10 X2 = 30 40
B X3 =70 X4 = 40 110
Totales de
80 70
Columnas
Esto quiere decir que, de las cuatro variables, sólo una es independiente. Entonces, la Tabla de
Contingencia 2 2 tiene 1 grado de libertad (1 g.l.)
Ejemplo 1.10
Sea una población X con Media Poblacional y Varianza Poblacional 2; sea
{ X1 ; X2 ; ... ; Xn }
una muestra aleatoria independiente de tamaño n proveniente de dicha población;
y sean
( X1 X ) ; ( X2 X ) ; … ; ( Xn X )
n variables aleatorias que indican las desviaciones entre cada valor de la muestra y la media arit-
mética muestral.
Dado que la suma de las desviaciones con respecto a la media aritmética debe ser nula (6)
(X i X ) 0
solamente se podrán asignar libremente valores a (n – 1) variables. En efecto, suponiendo una
muestra de tamaño 5, se tendrán 5 desviaciones:
La primera desviación puede ser cualquier número real, por ejemplo: ( X1 X ) = (39)
La segunda desviación puede ser cualquier número real, por ejemplo: ( X2 X ) = (-15)
La tercera desviación puede ser cualquier número real, por ejemplo: ( X3 X ) = (-30)
La cuarta desviación puede ser cualquier número real, por ejemplo: ( X4 X ) = (-10)
La quinta desviación no puede ser cualquier número real. Solamente podrá ser el número que
haga cero la suma de las desviaciones. En este caso el único número es: ( X5 X ) = (16)
(Xi X) (39) + (-15) + (-30) + (-10) + (16) = 0
Esto quiere decir que hay 4 grados de libertad [(n-1) g.l.]
Consecuentemente, la Suma del Cuadrado de los desvíos, S.C.X, también tiene 4 grados de liber-
tad [(n-1) g.l.]
2
(X i X ) (39)2 + (-15)2 + (-30)2 + (-10)2 + (16)2
Como se ha dicho, el último valor no puede ser cualquiera porque se debe cumplir que la suma de
las desviaciones debe ser cero.
Teniendo en cuenta la propiedad referida a la suma de las desviaciones con respecto a la
media aritmética
(X i X ) 0
6 Ver Estadística Tomo1 C. CAPRIGLIONI. Capítulo 3.
ESTADISTICA – C. Capriglioni PÁGINA 31
1.Introducción al Muestreo
y lo mostrado en el Ejemplo 1.10, se pueden enunciar, sin demostrar, las siguientes PROPOSI-
CIÓNES:
PROPOSICIÓN 3
La cantidad de GRADOS DE LIBERTAD que tiene la suma del cuadrado
de las desviaciones con respecto a la media aritmética muestral es igual
al tamaño de la muestra menos uno [(n-1) g.l.](7).
n
2
(X i X ) (n 1) g . l .
i 1
PROPOSICIÓN 4
Si en un estadígrafo intervienen k estimadores de otros tantos paráme-
tros, los GRADOS DE LIBERTAD correspondientes a la suma del cuadra-
do de las desviaciones con respecto a dicho estadígrafo, es igual al ta-
maño de la muestra menos la cantidad de cantidad de parámetros a es-
timar [(n – k) g.l.]
En la generación de los distintos estadígrafos, es frecuente que, por alguna circunstancia,
no todas las variables muestrales que intervienen en él, sean estadísticamente independientes. Los
GRADOS DE LIBERTAD, entonces, serán inferiores al tamaño de la muestra.
Oportunamente se estudiará cómo se determinan los GRADOS DE LIBERTAD correspon-
diente a las distintas funciones que se utilizan para la estimación de algunos parámetros.
Ejemplo 1.11
Dado el universo del Ejemplo 1.7, referido a las ocho personas que concurren a un taller de ex-
presión corporal, cuyas edades se transcriben a continuación,
{15 ; 16 ; 19 ; 22 ; 23 ; 27 ; 36 ; 38}
se pide:
a) Determine todas las muestras posibles de tamaño 5.
b) Calcule la media muestral y la varianza muestral de cada una de las muestras.
c) Calcule la proporción de personas mayores de edad de cada una de las muestras.
d) Calcule la Esperanza Matemática y la Varianza de cada uno de los estimadores.
SOLUCIÓN
El universo es finito y de tamaño ocho (N = 8)
{15 ; 16 ; 19 ; 22 ; 23 ; 27 ; 36 ; 38}
a) La cantidad de muestras posibles de tamaño cinco (n = 5) que se pueden obtener de dicho uni-
verso es
N 8 56
n 5
A continuación se presentan las 56 muestras posibles de tamaño 5 que pueden tomarse de un uni-
ESTADISTICA – C. Capriglioni PÁGINA 33
1.Introducción al Muestreo
verso de tamaño 8:
MUESTRAS DE TAMAÑO 5 TOMADAS DE UN UNIVERSO DE TAMAÑO 8
Muestra 1: {15 ; 16 ; 19 ; 22 ; 23} Muestra 29: {15 ; 19 ; 23 ; 36 ; 38}
Muestra 2: {15 ; 16 ; 19 ; 22 ; 27} Muestra 30: {15 ; 19 ; 27 ; 36 ; 38}
Muestra 3: {15 ; 16 ; 19 ; 22 ; 36} Muestra 31: {15 ; 22 ; 23 ; 27 ; 36}
Muestra 4: {15 ; 16 ; 19 ; 22 ; 38} Muestra 32: {15 ; 22 ; 23 ; 27 ; 38}
Muestra 5: {15 ; 16 ; 19 ; 23 ; 27} Muestra 33: {15 ; 22 ; 23 ; 36 ; 38}
Muestra 6: {15 ; 16 ; 19 ; 23 ; 36} Muestra 34: {15 ; 22 ; 27 ; 36 ; 38}
Muestra 7: {15 ; 16 ; 19 ; 23 ; 38} Muestra 35: {15 ; 23 ; 27 ; 36 ; 38}
Muestra 8: {15 ; 16 ; 19 ; 27 ; 36} Muestra 36: {16 ; 19 ; 22 ; 23 ; 27}
Muestra 9: {15 ; 16 ; 19 ; 27 ; 38} Muestra 37: {16 ; 19 ; 22 ; 23 ; 36}
Muestra 10: {15 ; 16 ; 19 ; 36 ; 38} Muestra 38: {16 ; 19 ; 22 ; 23 ; 38}
Muestra 11: {15 ; 16 ; 22 ; 23 ; 27} Muestra 39: {16 ; 19 ; 22 ; 27 ; 36}
Muestra 12: {15 ; 16 ; 22 ; 23 ; 36} Muestra 40: {16 ; 19 ; 22 ; 27 ; 38}
Muestra 13: {15 ; 16 ; 22 ; 23 ; 38} Muestra 41: {16 ; 19 ; 22 ; 36 ; 38}
Muestra 14: {15 ; 16 ; 22 ; 27 ; 36} Muestra 42: {16 ; 19 ; 23 ; 27 ; 36}
Muestra 15: {15 ; 16 ; 22 ; 27 ; 38} Muestra 43: {16 ; 19 ; 23 ; 27 ; 38}
Muestra 16: {15 ; 16 ; 22 ; 36 ; 38} Muestra 44: {16 ; 19 ; 23 ; 36 ; 38}
Muestra 17: {15 ; 16 ; 23 ; 27 ; 36} Muestra 45: {16 ; 19 ; 27 ; 36 ; 38}
Muestra 18: {15 ; 16 ; 23 ; 27 ; 38} Muestra 46: {16 ; 22 ; 23 ; 27 ; 36}
Muestra 19: {15 ; 16 ; 23 ; 36 ; 38} Muestra 47: {16 ; 22 ; 23 ; 27 ; 38}
Muestra 20: {15 ; 16 ; 27 ; 36 ; 38} Muestra 48: {16 ; 22 ; 23 ; 36 ; 38}
Muestra 21: {15 ; 19 ; 22 ; 23 ; 27} Muestra 49: {16 ; 22 ; 27 ; 36 ; 38}
Muestra 22: {15 ; 19 ; 22 ; 23 ; 36} Muestra 50: {16 ; 23 ; 27 ; 36 ; 38}
Muestra 23: {15 ; 19 ; 22 ; 23 ; 38} Muestra 51: {19 ; 22 ; 23 ; 27 ; 36}
Muestra 24: {15 ; 19 ; 22 ; 27 ; 36} Muestra 52: {19 ; 22 ; 23 ; 27 ; 38}
Muestra 25: {15 ; 19 ; 22 ; 27 ; 38} Muestra 53: {19 ; 22 ; 23 ; 36 ; 38}
Muestra 26: {15 ; 19 ; 22 ; 36 ; 38} Muestra 54: {19 ; 22 ; 27 ; 36 ; 38}
Muestra 27: {15 ; 19 ; 23 ; 27 ; 36} Muestra 55: {19 ; 23 ; 27 ; 36 ; 38}
Muestra 28: {15 ; 19 ; 23 ; 27 ; 38} Muestra 56: {22 ; 23 ; 27 ; 36 ; 38}
b) El valor de la edad media muestral,
X
x i
n
para cada una de las muestras, se presentan en el cuadro de la página 35.
El valor de la varianza muestral
(x
2
X)
S x2
i
n 1
para cada una de las muestras, se presentan en el cuadro de la página 35.
c) El valor de la proporción muestral de personas mayores de edad,
~r
p
n
para cada una de las muestras, se presentan en el cuadro de la página 35.
e) Los valores de la esperanza matemática (promedio) y la varianza de cada uno de lo estimado-
res, calculados con los datos de las 56 muestras presentadas en la página 35, son:
56 56
Xi 24,5
2
Xi
E( X ) i 1 24,5 ; V ( X ) i 1 5,59
56 56
56 56
Si2 74,57
2
Si2
E(S 2 ) i1 74,57 ; V (S 2 ) i1 659,28
56 56
56 56
pi pi 0,6252
E( p ) i 1 0,625 ; V ( p ) i 1 0,0201
56 56
PÁGINA 34 ESTADISTICA – C.Capriglioni
1. Introducción al Muestreo
65, 25 8 5
2X = 65,25 ; V( X ) = 5,59 y V( X ) = 5,59
5 8 1
2
σX N n
entonces V ( X )
n N1
i1
El cociente entre una variable normal estandarizada y la raíz cuadrada de una variable
ji-cuadrada con V grados de libertad, dividida por V, tiene distribución t de Student con
V grados de libertad.
Sean
Z ~ No (0;1) y ~ V G.L.
entonces
Z
~ t V G.L.
V
El cociente entre una variables ji-cuadrado con V1 grados de libertad, dividida por V1, y
otra variable ji-cuadrado pero con V2 grados de libertad, dividida por V2, tiene distribu-
ción F de Snedecor con V1 grados de libertad en el numerador y V2 grados de libertad en
el denominador.
Sean
1 ~ V1 G.L. y 2 ~ V2 G.L.
entonces
1
V1
2
~ F(V1;V2)
V2
X
Z
Nn
n N 1
y para POBLACIONES INFINITAS es:
X
Z
n
Este último estadígrafo, para algunas demostraciones que se harán en secciones posterio-
res, también puede se escrito como:
n (X )
Z
Esto significa que, para el cálculo de probabilidad, y para toda la tarea inferencial donde
se utilice la media aritmética muestral, de muestras obtenidas de poblaciones normales cuya
varianza sea conocida, hay que utilizar la distribución Normal Estandarizada.
Se recuerda que la FRACCIÓN DE MUESTREO es el cociente entre el tamaño de la muestra
y el tamaño de la población.
n
Fm
N
y mide la proporción del tamaño de la muestra con respecto al tamaño de la población.
Nn
Si el tamaño del universo tiende a infinito, entonces el factor tiende a 1.
N1
Nn
N 1
N1
A los fines prácticos, si el tamaño de la muestra es, a lo sumo el diez por ciento del tama-
ño de la población, o sea, si la FRACCIÓN DE MUESTREO es menor o igual a 0,10, la población
Nn
puede considerarse infinita y, consecuentemente, el factor se puede considerar que tien-
N1
de a 1.
Si
Nn
Fm 0,10 N 1
N1
entonces
X X
Z Z
Nn
n N 1 n
Ejemplo 1.12
¿Cuál es la probabilidad de que la media de una muestra de tamaño 25 esté entre 397 y 401, si
proviene de una población normal con media 400 y varianza 100 ?
SOLUCIÓN
Si la población es normal la media de la muestra tiene distribución normal con
2
EX ; V X
n
ESTADISTICA – C. Capriglioni PÁGINA 39
1.Introducción al Muestreo
Ejemplo 1.13
De una población normal de 150 elementos, cuya media es 3847 y desvío estándar 247, se sacó
una muestra de tamaño 25.
¿Cuál es la probabilidad de que la media muestral sea superior a 3950 ?
SOLUCIÓN
El tamaño de la población es conocido, por lo tanto se trata de una población finita.
N = 150 ; = 3847 ; = 247 ; n = 25
P( X >3950) = ¿...?
La variable estandarizada es
X
Z
Nn
n N 1
X 3950 3847
Z 2, 28
Nn 247 150 25
n N 1 25 150 1
Nn
PNo ( X >3950 / = 3847 ; 45,2469) = P(Z > 2,28 / 0 ; 1) =
n N 1
= 1 - F(2,28) = 0,0113
i 1
la suma del cuadrado de las desviaciones con respecto a la media aritmética mues-
tral,
y sea,
n
(X i X )
2
i1
S X2
n 1
la varianza muestral de dicha muestra.
entonces, el estadígrafo
n
(Xi ) 2
i1
2
tiene distribución ji-cuadrado con n G.L. (grados de libertad) por ser la suma del cuadra-
do de n variables normales independientes,
El estadígrafo
2
n (X )
2
tiene distribución ji-cuadrado con 1 G.L. por ser el cuadrado de una variable con distri-
bución normal, luego, su diferencia
n n
(X i X ) (X i )
2 2
n (X )
2
i1 i1
2 2
2
i1
2(n-1) G.L.
2
i1
S X2
n 1
Sea
{ X1 ; X2 ; . . . ; X n }
una muestra de tamaño n.
y sea
n
Xi
X i =1
n
la media muestral de dicha muestra.
Multiplicando y dividiendo, en (1) por n se obtiene un estadígrafo de transformación para
la media muestral.
X
Z
n
Cuando el tamaño de la muestra tiende a infinito, por aplicación del Teorema Central del
Límite, el estadígrafo de transformación tiende asintóticamente a la distribución Normal Estanda-
rizada.
X
n Z No(0;1)
n
Esto significa que, para el cálculo de probabilidad, y para toda la tarea inferencial referida
a la media muestral, de muestras obtenidas de poblaciones no Normales, hay que utilizar la distri-
bución Normal Estandarizada.
En este trabajo se considera que el tamaño de la muestra tiende a infinito cuando n > 30
Ejemplo 1.14
¿Cuál es la probabilidad de que la media de una muestra de tamaño 100 sea superior a 1238, si
proviene de una población con media 1194 y desvío típico 305?
SOLUCIÓN
No se conoce la distribución de la población, pero el tamaño de la muestra es suficientemente
grande (n>30), entonces, por aplicación del Teorema Central del Límite, el estadígrafo
X
n
tiene distribución asintóticamente Normal Estandarizada, cualquiera fuese la distribución de la
población, por lo tanto, el cálculo de probabilidad se realiza con la distribución normal.
= 1194 ; = 305 ; n = 100
P( X > 1238) = ¿...?
X 1238 1194
Z 1, 44
305
n 100
PNo( X >1238 / = 1194 ; 30,5) = PNo(Z > 1,44 / 0 ; 1) =
n
=1 - F(1,44) = 0,07493
n
y tiene distribución asintóticamente normal estandarizada, dado que la variable tiene distribu-
~
ción binomial con esperanza matemática E( r ) = n y varianza V( ~r ) = n r (1-) (11)
~
Si el universo es finito, bajo determinadas condiciones, el ESTADÍGRAFO DE TRANS-
FORMACIÓN para la proporción muestral de universos finitos es
p
Z
(1 ) N n
n N1
y también tiene distribución asintóticamente normal estandarizada.
Esto significa que, para el cálculo de probabilidad, y para toda la tarea inferencial referida
a la proporción muestral, hay que utilizar la distribución Normal Estandarizada.
Ejemplo 1.14
Se sacó una muestra de tamaño 2500 de una población que tiene un 55% de elementos con un
determinado atributo. ¿Cuál es la probabilidad de que la proporción de la muestra sea inferior a
0,53?
SOLUCIÓN
~r : cantidad de elementos con un determinado atributo en una muestra de tamaño n, pro-
veniente de una población con proporción .
n = 2500 ; = 0,55 ; (1 ) = 0,45
P( p < 0,53) = ¿...?
Ejemplo 1.15
En una población de 8340 elementos hay 2919 que tienen cierto atributo. Se saca una muestra de
950 elementos. ¿Cuál es la probabilidad de que la proporción de elementos con atributo de la
muestra sea inferior a 0,33 ?
SOLUCIÓN
El tamaño de la población es conocido, por lo tanto se trata de una población finita.
2919
N = 8340 ; = 2919 ; ; n = 950
N 8340
P( p <0,33) = ¿...?
La variable estandarizada es
p
Z
(1 - ) N n
n N1
0,33 0,35
z 1,37
0,35 0,65 8340 95
950 8340 1
(
PNo p < 0,33 / = 0,35 ;
1 N n
n N1
0,0146 = )
= P(Z< -1,37) = F(-1,37) = 0,0853