Sunteți pe pagina 1din 36

1.

INTRODUCCIÓN AL MUESTREO

1.1. DEFINICIONES BÁSICAS


En la tarea estadística cotidiana, raramente se conocen exactamente cuáles son las distin-
tas funciones que describen probabilísticamente el comportamiento de la, o las variables, que
representan las características de aquello que se está investigando.
A veces, de acuerdo a determinadas experiencias, se está en condiciones de suponer algu-
nas formas funcionales de las distribuciones de probabilidad. Aún así, comúnmente se ignoran
los valores de los parámetros de dichas distribuciones.
Uno de los propósitos de la disciplina Estadística es poder inferir las distribuciones de
probabilidad, sus propiedades y sus parámetros.
Para ello, la técnica básica que se utiliza, y de la que en este capítulo se analizarán aspec-
tos elementales, es el Muestreo. Por ello, se hace necesario recordar y profundizar algunas de las
definiciones que ya fueron formuladas en la parte introductoria del Análisis Estadístico desarro-
llada en el Tomo 1 de este trabajo.

1.1.1. UNIVERSO, POBLACIÓN Y MUESTRA


Se llama UNIVERSO al conjunto de Unidades Experimentales que po-
seen características comunes observables, y que se utilizan para obtener
información sobre un hecho particular.

El UNIVERSO queda determinado cuando se definen los objetivos del trabajo que se lleva-
rá a cabo, como así también las UNIDADES EXPERIMENTALES sobre las que se realizarán las
observaciones.

Se llama POBLACIÓN a cualquier variable particular que se estudia a


un UNIVERSO.

De acuerdo con esta definición, se puede colegir que cada UNIVERSO puede generar va-
rias POBLACIONES. Una por cada una de las variables cuya medición sea de interés para alcanzar
los objetivos fijados. En otras palabras, al establecer cuáles serán las variables que se observarán
en cada una de las UNIDADES EXPERIMENTALES que conforman el UNIVERSO, quedan determi-
nadas las distintas POBLACIONES (1).
Se llama CENSO a la medición, en la totalidad de las UNIDADES EXPE-
RIMENTALES que conforman el UNIVERSO, de todas las variables que
previamente hayan sido declaradas relevantes, para la investigación a
llevar a cabo.
La nomenclatura que se utilizará en este trabajo para designar al tamaño del UNIVERSO, o
al tamaño de la POBLACIÓN, que necesariamente es el mismo, es:
N: Tamaño del UNIVERSO o tamaño de la POBLACIÓN (cuando corresponda)
Los UNIVERSOS pueden ser finitos o infinitos, dependiendo de la cantidad de elementos
que los conforman y, consecuentemente, las POBLACIONES serán finitas o infinitas.

Ejemplo 1.1
Dadas las siguientes situaciones, identificar a los Universos y a las correspondientes Poblaciones:

1 Como es costumbre, las poblaciones se representan con las últimas letras del alfabeto latino V; W; X; Y; Z
ESTADISTICA – C. Capriglioni PÁGINA 11
1.Introducción al Muestreo

a) Se desea tener información acerca de la rentabilidad de un monte de 2000 plantas de manzanas,


para ello, se deberá determinar la cantidad y el peso total de los frutos que tiene cada planta.
b) Se desea tener información sobre las condiciones de vida de las 380 familias que viven en un
determinado barrio de la ciudad, para ello, a cada familia se la consultará acerca de la cantidad de
personas que integran el grupo familiar, el ingreso mensual del grupo y el gasto mensual del gru-
po en alimentación.
c) Se desea analizar el comportamiento de las ventas, para ello, de cada factura emitida se regis-
trará la cantidad de unidades y el monto correspondiente.
d) Se quieren analizar determinadas características de los recién nacidos cuyas madres presentan
una determinada patología, para ello, a cada uno se le medirá la talla, el peso y la frecuencia car-
diaca.
SOLUCIÓN
a) El Universo está formado por la totalidad de plantas de manzanas del monte. Dado que se co-
noce la cantidad total de plantas que contiene el monte (2000 plantas), el Universo es finito.
Las variables a estudiar, de acuerdo al objetivo fijado son dos, por lo tanto hay dos poblaciones, a
saber:
POBLACIÓN 1. X: CANTIDAD DE MANZANAS POR PLANTA. {X / X  0  X  o}
POBLACIÓN 2. Y: PESO TOTAL DE LAS MANZANAS DE CADA PLANTA. {Y / Y  0  Y  }
b) El Universo está formado por la totalidad de familias del barrio. Dado que se conoce la canti-
dad de familias que viven en el barrio, el Universo es finito (380 familias).
Las variables a estudiar, de acuerdo al objetivo fijado son tres, por lo tanto, hay tres poblaciones,
a saber:
POBLACIÓN 1. X: CANTIDAD DE PERSONAS QUE INTEGRAN EL GRUPO FAMILIAR. {X / X > 0 
X }
POBLACIÓN 2. Y: INGRESO MENSUAL DEL GRUPO FAMILIAR. {Y / Y  0  Y  }
POBLACIÓN 3. Z: GASTO MENSUAL DEL GRUPO EN ALIMENTOS. {Z / Z  0  Z  }
El Universo está formado por la totalidad de facturas confeccionadas como consecuencia de las
ventas. Dado que no se hace referencia a la cantidad total de facturas existentes, el Universo es
considerado infinito.
Las variables a estudiar, de acuerdo al objetivo fijado son dos, por lo tanto hay dos poblaciones, a
saber:
POBLACIÓN 1. X: CANTIDAD DE UNIDADES VENDIDAS EN CADA VENTA. {X / X > 0  X  }
POBLACIÓN 2. Y: MONTO DE CADA VENTA. {Y / Y > 0  Y  }
El Universo está formado por la totalidad de personas recién nacidas cuyas madres presentan
una determinada patología. Dado que no se hace referencia a la cantidad total de nacimientos, el
Universo es considerado infinito. Las variables a estudiar, de acuerdo al objetivo fijado son tres,
luego, por definición, hay tres poblaciones, a saber:
POBLACIÓN 1. X: PESO DEL RECIÉN NACIDO. {X / X > 0 v X 0 }
POBLACIÓN 2. Y: TALLA DEL RECIÉN NACIDO. {Y / Y > 0  Y  }
POBLACIÓN 3. Z: FRECUENCIA CARDÍACA DEL RECIÉN NACIDO. {Z / Z > 0  Z  }
Si fuese necesario tener información precisa sobre la totalidad de los elementos que for-
man el UNIVERSO, entonces se debería realizar un CENSO. Si el tamaño del UNIVERSO es dema-
siado grande, la tarea censual resulta muy onerosa y, consecuentemente, impracticable. Por otro
lado, la ejecución de un CENSO es imposible en aquellos casos donde hay que enfrentar a un
UNIVERSO infinito, o cuando el proceso de medida o investigación de las características de cada
elemento es destructivo. Por estos motivos, hay que utilizar otras técnicas estadísticas a los efec-
tos de obtener datos útiles y confiables, necesarios para tener información acerca de la POBLA-
CIÓN.

PÁGINA 12 ESTADISTICA – C. Capriglioni


1. Introducción al Muestreo

Una de esas técnicas, como se ha dicho, y cuya definición precisa se brindará mas adelan-
te, es el Muestreo. El Muestreo consiste en observar y medir a algunos elementos del universo y
con ellos, obtener la información necesaria para cumplir con los objetivos fijados para concretar
el trabajo.

Se llama MUESTRA a un subconjunto o parte de una POBLACIÓN to-


mada de forma tal, que con ella se pueda hacer un juicio acerca de esa
POBLACIÓN completa.

La nomenclatura que se utilizará en este trabajo para designar al tamaño de la MUESTRA


es:
n: Tamaño de la MUESTRA.

Se llama FRACCIÓN DE MUESTREO al cociente entre el tamaño de


la MUESTRA y el tamaño de la POBLACIÓN.
n
Fm =
N

1.1.2. INFERENCIA ESTADÍSTICA


Uno de los problemas cruciales que debe resolver el Estadístico es la obtención de infor-
mación acerca de una determinada población. Si, por algunas de las razones ya expuestas, no es
posible practicar un censo, éste debe recurrir a los datos de una muestra y con ellos realizar las
correspondientes afirmaciones.

Se llama INFERENCIA ESTADÍSTICA a cualquier afirmación que se


realiza sobre una determinada población, basándose en los datos obte-
nidos con una muestra, pudiéndose obtener, a partir del cálculo de pro-
babilidad, una determinada medida de la incertidumbre que se genera.

Esto significa que se INFIERE la población a partir de la muestra. De esta manera, las con-
clusiones a que se llegan, por estar basadas en "ignorancias parciales", producen un cierto grado
de duda, el cual podría ser controlado probabilísticamente, si la muestra se toma utilizando méto-
dos que garanticen aleatoriedad.

1.1.3. MUESTREO
Para obtener una MUESTRA que permita INFERIR adecuadamente la población en estudio,
es necesario tener en cuenta algunas reglas y operaciones, las cuales dependerán de los objetivos
fijados.
Las siguientes definiciones ponen de manifiesto, someramente, algunas de ellas.

Se llama MUESTREO al procedimiento mediante el cual se obtienen


una o más MUESTRAS de una POBLACIÓN dada.

Se llama UNIDAD DE MUESTREO a cada unidad experimental, o


grupo de unidades experimentales, que son tomadas para obtener una
MUESTRA.

Se llama DISEÑO MUESTRAL a un plan de MUESTREO específico


donde se establece cuáles serán los procedimientos a seguir para tomar
una o más MUESTRAS.

ESTADISTICA – C. Capriglioni PÁGINA 13


1.Introducción al Muestreo

Las unidades experimentales que intervienen en una muestra, pueden ser tomadas con
mayor o menor grado de subjetividad por parte del sujeto que se encarga de realizar la muestra.
De esta manera, se originan distintos tipos de MUESTREO. Algunos de ellos se detallan en los
parágrafos siguientes.

1.1.3.1. MUESTREO PROBABILÍSTICO


Un muestreo es PROBABILÍSTICO cuando las Unidades Experimentales que componen
la muestra son tomadas al azar, pudiéndose calcular a priori, la probabilidad que tiene cada mues-
tra y, como consecuencia, cada Unidad Experimental, de ser la obtenida.
Esto significa que el proceso de obtención de cada uno de los elementos que integrará la
muestra, es un experimento aleatorio.
El MUESTREO PROBABILÍSTICO es un tipo de muestreo objetivo porque, como la obten-
ción de las Unidades Experimentales es realizada al azar, la inclusión de cada una de ellas en la
muestra, no depende del sujeto que se encarga de tomar la muestra.

1.1.3.2. MUESTREO INTENCIONAL


Un muestreo es INTENCIONAL, cuando las Unidades Experimentales que componen la
muestra son obtenidas siguiendo una regla o norma preestablecida.
Esto significa que cada elemento que integrará la muestra, será "elegido" por el "sujeto"
que realiza el trabajo, de acuerdo a un criterio que se fija previamente.
El MUESTREO INTENCIONAL es un tipo de muestreo subjetivo y carece de una base teóri-
ca satisfactoria. La representatividad de la muestra depende de la intención del “sujeto” que toma
la muestra, y la composición de ésta puede estar influenciada por sus preferencias o tendencias.

1.1.3.3. MUESTREO SIN NORMA


Un muestreo es SIN NORMA cuando, por razones de comodidad, costo, o cualquier otra
circunstancia, la obtención de las Unidades Experimentales que componen la muestra se realiza
sin una norma, o regla o criterio definido.
Esto significa que cada elemento que integrará la muestra es elegido por el sujeto, pero sin
un criterio fijado. Por tal motivo se considera que la obtención es cuasi-aleatoria, luego, el mues-
treo es cuasi-objetivo.
El MUESTREO SIN NORMA se puede utilizar cuando hay elementos de juicio suficientes
como para suponer que la población es homogénea. Si este supuesto es cierto, la representatividad
de la muestra puede ser satisfactoria.

1.1.4. MÉTODOS DE OBTENCIÓN DE MUESTRAS


En este trabajo se estudiará la aplicación de los Métodos Estadísticos en el Muestreo Pro-
babilístico, por lo tanto, se supone que cada elemento que interviene en la muestra es tomado al
azar. Para garantizar que la obtención de cada uno de ellos sea realmente aleatoria, es conveniente
la utilización de un bolillero o de una TABLA DE DÍGITOS AL AZAR.
Una muestra de tamaño n, cuyos elementos se obtienen al azar de una población con fun-
ción de densidad de probabilidad f(X), o función de probabilidad p(X), según corresponda, es un
conjunto formado por n variables aleatorias que tienen la misma distribución de probabilidad.
MUESTRA: { X1 ; X2 ; ... ; Xn }
f(X1) = f(X2) = · · · = f(Xn)
o
p(X1) = p(X2) = · · · = p(Xn)
según corresponda.
PÁGINA 14 ESTADISTICA – C.Capriglioni
1. Introducción al Muestreo

Ejemplo 1.2
En un bosque formado por 500 ejemplares de pinos se desea estudiar el diámetro del tronco al-
canzado luego de un determinado tiempo de ser plantado, para ello se decide utilizar una muestra
de 20 ejemplares.
Se pide, identificar a la población y a la muestra.
SOLUCIÓN
Población - X: Diámetro del tronco
A cada árbol que pertenecerá a la muestra le corresponderá un valor de la variable "Diámetro del
tronco". El valor correspondiente al árbol 1, puede ser cualquiera, por lo tanto es variable y, hasta
que no haya sido medido, el diámetro es desconocido, por lo tanto, es aleatorio. Lo mismo ocurre
con el ejemplar 2, el ejemplar 3, etcétera, por lo tanto, la muestra es el conjunto
{X1 ; X2 ; X3 ;... ; X20}
La naturaleza de las Poblaciones que serán objeto del muestreo puede ser de lo más varia-
da. Por ejemplo, puede tratarse de una población homogénea o de una población heterogénea; las
unidades experimentales pueden presentarse sistemáticamente con una determinada periodicidad,
o pueden estar agrupadas formando conglomerados; etcétera. Estas particularidades que presentan
las poblaciones dan origen a los Métodos de obtención de las muestras que resulten más adecua-
dos, algunos de los cuáles se describirán brevemente en los próximos acápites.

1.1.4.1. MUESTREO SIMPLE AL AZAR (SIN REEMPLAZO)


El método MUESTREO SIMPLE AL AZAR (Sin reemplazo) consiste en obtener al azar, una
muestra de n elementos, de entre los N que constituyen el Universo.
Hay que tener en cuenta que todas las muestras posibles de tamaño n deben tener la mis-
ma probabilidad de ser tomadas, como así también, que todos los elementos que integrarán la
muestra tengan, en el momento de cada extracción, la misma probabilidad de ser obtenidas.
Considérese, a modo de ejemplo, un Universo finito de tamaño N. Dado que las unidades
que se extraen para la muestra no se reponen, la cantidad de muestras distintas, igualmente posi-
bles, de tamaño n que pueden obtenerse de dicho Universo, es una combinación de N elementos
tomados de a n.
CN;n
Esta combinación se puede calcular con el número combinatorio
 N
 n
Por lo tanto, la probabilidad de que una muestra particular sea la obtenida es, de acuerdo a
la definición clásica,
1
 N 
n
Sobre la base de esto, por ser equiprobables todas las muestras de tamaño n, la probabili-
dad de que un elemento cualquiera de la población forme parte de la muestra, se puede calcular

 N  1
Cantidad de muestras favorables  n  1  n
 
Cantidad de muestras posibles  N  N
n
 
por lo tanto, todos los elementos tienen la misma probabilidad de ser extraídos.
ESTADISTICA – C. Capriglioni PÁGINA 15
1.Introducción al Muestreo

Si la población es infinita y las variables muestrales son independientes, la probabilidad


de que una de ellas asuma un determinado valor, es la misma que para cualquier valor que asu-
man las otras. Caso contrario, si hay dependencia estadística, dicha probabilidad dependerá del
valor de las que ya fueron obtenidas.
En el método de MUESTREO SIMPLE AL AZAR, las Unidades Experimentales son tomadas
al azar, cualquiera sea la posición que ocupen en el universo. Por lo tanto, para que se cumpla la
condición de igualdad de probabilidad para todas ellas, este método debería ser utilizado sola-
mente, cuando se tiene real evidencia de la homogeneidad de la población de la cual se tomará la
muestra.

Ejemplo 1.3
Dado el Universo del Ejemplo 1.2, si las condiciones del suelo son las mismas en todo el predio
que ocupa el bosque, entonces puede suponerse que la población "Diámetro del tronco" es homo-
génea. Determinar el método de muestreo adecuado para tomar una muestra de tamaño 20.
SOLUCIÓN
La población es
X: Diámetro del tronco
Población finita: N = 500
Tamaño de la muestra: n = 20
Bajo el supuesto de homogeneidad de la población, cualquiera de los 500 ejemplares puede brin-
dar datos similares, por lo tanto, el método de muestreo adecuado es el Muestreo Simple al Azar.

1.1.4.2. MUESTREO ESTRATIFICADO AL AZAR


En aquellos casos en los cuales la población presenta una gran variabilidad, o sea, una po-
blación heterogénea, la utilización del Muestreo Simple al Azar puede proporcionar muestras no
representativas y las conclusiones que surjan del análisis ellas no serán del todo confiables.
Cuando se presentan estas situaciones, el método de muestreo más adecuado a utilizar es el
MUESTREO ESTRATIFICADO AL AZAR. Este método consiste en particionar al Universo en estra-
tos (o clases o subpoblaciones), dentro de los cuales sí la variable debe presentar homogeneidad.
De cada uno de los estratos se obtiene una muestra Simple al Azar.
Los símbolos a utilizar en este trabajo son:
N: tamaño del Universo
h: cantidad de estratos
Nj: tamaño del j-ésimo estrato

h
 Nj  N
j=1
Si el tamaño de la muestra es n, y de cada uno de los estratos se toma una muestra de ta-
maño nj, entonces se debe cumplir que:
h
 nj  n
j =1
Una cuestión importante a resolver es cuánto del total n deberá asignarse a cada uno de
los estratos.
La asignación del tamaño de la muestra a cada uno de los distintos estratos se llama AFI-
JACIÓN, y puede realizarse de alguna de las siguientes formas:
a. Afijación igual o uniforme: El tamaño de muestra que le corresponde a cada es-

PÁGINA 16 ESTADISTICA – C.Capriglioni


1. Introducción al Muestreo

trato es igual para todos. Este tamaño se calcula, entonces, haciendo el cociente entre
el tamaño de la muestra, n, y la cantidad de estratos, h.
n
n1  n2      nj     
h
b. Afijación proporcional: El tamaño de la muestra que le corresponde a cada
estrato es proporcional al tamaño del estrato. Se calcula haciendo el producto
entre la fracción de muestreo y el tamaño de cada estrato.
n n n
n1   N1 ; n 2   N2  ;    ;  nh   Nh
N N N
c. Afijación Óptima: El tamaño de la muestra para cada estrato es proporcional al
tamaño del estrato y al desvío estándar correspondiente. De esta manera se tiene
en cuenta la falta de homogeneidad entre las subpoblaciones.
n  N1  1 n  N2   2 n  Nh   h
n1  ; n2  ;    ; nh 
h h h
 Nii  Nii  Nii
i1 i1 i1

Ejemplo 1.4
En una ciudad de 28000 hogares se desea estudiar, utilizando una muestra de 210 hogares, el ni-
vel de ingreso por cada hogar. Investigaciones previas permitieron comprobar que, en dicha ciu-
dad, en general, las personas tienden a vivir en barrios con otras personas cuyos niveles de ingre-
so son similares.
Se detectaron cuatro barrios, a saber:
Norte (barrio 1), con 12000 hogares; Sur (barrio 2), con 8000 hogares; Este (barrio 3), con 1600
hogares y Oeste (barrio 4), con 6400 hogares.
También se ha detectado que la variabilidad de los ingresos dentro de cada uno de los barrios es
casi la misma. Determinar el Método de Muestreo más adecuado para seleccionar la muestra.
SOLUCIÓN
La población es,
X : Nivel de ingreso
Tamaño del Universo : N = 28000
Tamaño de la muestra : n = 210
Dado que las personas están agrupadas en barrios dentro de los cuales las familias presentan ca-
racterísticas similares y casi no hay variabilidad entre los ingresos, el método de muestreo más
adecuado es el Método Estratificado al Azar, con afijación proporcional, donde cada barrio puede
considerarse un estrato.
Los tamaños de cada estrato son, entonces
N1 = 12000 ; N2 = 8000 ; N3 = 1600 ; N4= 6400
El tamaño de la muestra proporcional para cada estrato se calcula haciendo
n 210 n 210
n1   N1   12000  90 ; n2   N2   8000  60
N 28000 N 28000
n 210 n 210
n3   N3   1600  12 ; n 4   N4   6400  48
N 28000 N 28000
Los tamaños de muestra para cada estrato, utilizando afijación proporcional, son:
n1 = 90 ; n2 = 60 ; n3 = 12 ; n4 = 48

ESTADISTICA – C. Capriglioni PÁGINA 17


1.Introducción al Muestreo

1.1.4.3. MUESTREO POR CONGLOMERADOS POLIETÁPICO


Cuando se toman muestras, utilizando el método de Muestreo Simple al Azar o el método
de Muestreo Estratificado al Azar, las unidades de muestreo coinciden con las unidades experi-
mentales. El método que se presenta en este parágrafo, es un caso más general que tiene como
particularidad, que la unidad de muestreo está formada por un grupo de unidades experimentales.
El método de MUESTREO POR CONGLOMERADOS POLIETÁPICO consiste en agrupar los
elementos que conforman el Universo en conglomerados, de modo tal que entre ellos haya la su-
ficiente homogeneidad, como para representar a la población.
El proceso de obtención de la muestra se hace sobre la base de estos conglomerados, que
constituyen las unidades de muestreo, y no sobre la base de las unidades físicas, con excepción de
la última etapa.
Este método es adecuado para utilizarlo cuando las unidades experimentales, naturalmen-
te, están agrupadas en conglomerados y cada una de ellas puede ser, a su vez, considerada como
unidad de muestreo.
Generalmente los conglomerados son superficies o áreas en que se ha dividido el ámbito
ocupado por el Universo.
Si es a una etapa, se toma una muestra simple al azar de conglomerados, y en cada uno de
ellos se miden todos los elementos que constituyen el conglomerado.
Si se trata de dos etapas de muestreo o bietápico, se toma una muestra simple al azar de
conglomerados (primera etapa de muestreo), y de cada uno de estos conglomerados, se toma una
muestra de unidades experimentales (segunda etapa de muestreo).
Si se trata de tres etapas de muestreo o trietápico, primero se constituyen los conglomera-
dos y, dentro de cada uno de ellos se forman los subconglomerados, luego, se toma una muestra
simple al azar de conglomerados (primera etapa de muestreo), de cada uno de ellos una muestra
simple al azar de subconglomerados (segunda etapa de muestreo) y, por último, de cada subcon-
glomerado una muestra simple al azar de unidades físicas (tercera etapa de muestreo).
Este procedimiento, puede generalizarse obteniéndose un muestreo con varias etapas o
Muestreo Polietápicos.

Ejemplo 1.5
Se desea estudiar, mediante el uso del muestreo, el coeficiente intelectual de los alumnos que
cursan el séptimo grado del nivel primario en todo el país. Investigaciones previas permiten su-
poner que hay homogeneidad entre los coeficientes intelectuales. Describir el procedimiento para
aplicar el Método de Muestreo por Conglomerado Polietápico, hasta tres etapas de muestreo.
SOLUCIÓN
- Una etapa de muestreo
Cada provincia se considera un conglomerado. Se toma una muestra de provincias, y se mide el
coeficiente intelectual a cada uno de los alumnos de séptimo grado, que cursan en las escuelas de
las provincias que pertenecen a la muestra.
- Dos etapas de muestreo
Cada provincia se considera un conglomerado, y cada departamento provincial, un subconglome-
rado. Se toma una muestra de provincias (primera etapa de muestreo). De cada una de las provin-
cias que pertenecen a la muestra, se toma una muestra de departamentos (segunda etapa de mues-
treo). Se mide el coeficiente intelectual a cada uno de los alumnos de séptimo grado que cursan
en las escuelas de los partidos o departamentos que pertenecen a la muestra.
- Tres etapas de muestreo
Cada provincia se considera un conglomerado; cada departamento provincial un subconglomera-
do y cada escuela un sub-subconglomerado. Se toma una muestra de provincias (primera etapa de
muestreo). De cada una de las provincias que pertenecen a la muestra, se toma una muestra de
departamentos (segunda etapa de muestreo). De cada uno de los departamentos que pertenecen a
PÁGINA 18 ESTADISTICA – C. Capriglioni
1. Introducción al Muestreo

la muestra, se toma una muestra de escuelas (tercera etapa de muestreo). Se mide el coeficiente
intelectual a cada uno de los alumnos de séptimo grado que cursan en las escuelas que pertenecen
a la muestra.

1.1.4.4. MUESTREO SISTEMÁTICO AL AZAR


El MUESTREO SISTEMÁTICO AL AZAR consiste en ordenar a las N Unidades Ex-
perimentales que conforman el Universo, de acuerdo a como se fueron presentando, y obtener la
muestra eligiendo, sistemáticamente (de aquí la denominación del método), un elemento cada c
unidades, tomado el primero de ello en forma aleatoria.
Si el universo es finito, el número c es la parte entera del cociente entre el tamaño del uni-
verso y el tamaño de la muestra.
 N
c  ent  
n
Si el universo es infinito, el número c se elige arbitrariamente, sobre la base del buen sa-
ber y entender del Estadístico que realiza el trabajo.
Este método es adecuado para ser utilizado en aquellos casos en los cuales las Unidades
Experimentales que forman el Universo se presentan con una determinada periodicidad. En este
caso, hay que evitar que el número c sea igual al período con que se presentan las unidades expe-
rimentales en el universo, porque, si ello ocurriese se perdería representatividad en la muestra.

Ejemplo 1.6
En una empresa que trabaja los 365 días del año, se desea estudiar, mediante la utilización de una
muestra de tamaño 10, el comportamiento del monto diario de las ventas realizadas en el año an-
terior, utilizando como fuente los partes diarios remitidos por el correspondiente departamento.
Estos partes están numerados de 1 a 365.
Calcule el número c correspondiente si se quiere aplicar el método de Muestreo Sistemático y
determinar el número de orden correspondiente para cada parte diario.
SOLUCIÓN
N = 365 ; n = 10
El valor c se calcula haciendo
 N  365 
c  ent    ent    ent (36,5)  36
n  10 
Mediante la utilización de una tabla de dígitos al azar o de un bolillero, se toma al azar un número
entre 1 y 36.
A los efectos de la solución de este problema, se supondrá que el número desinsaculado ha sido el
21.Éste es el número de orden del primer parte diario de la muestra. A partir de él se elige uno
cada 36. Luego, los partes diarios que forman la muestra serán los identificados con los números
21 ; 57 ; 93 ; 129 ; 165 ; 201 ; 237 ; 273 ; 309 ; 345

1.2. CARACTERÍSTICAS POBLACIONALES Y MUESTRALES


Los conceptos que se desarrollarán en el resto de este trabajo, estarán referidos solamente
a las muestras que se obtienen mediante el método de Muestreo Simple al Azar.

1.2.1. PARÁMETRO ESTADÍSTICO


De acuerdo con lo definido oportunamente, toda población es una variable aleatoria; por
tal motivo, su comportamiento probabilístico está explicado por una función de probabilidad, si la
variable es discreta, o por una función de densidad de probabilidad, si se trata de una variable
continua.
ESTADISTICA – C. Capriglioni PÁGINA 19
1.Introducción al Muestreo

En cualquier caso, como ya se ha estudiado ampliamente, existen medidas que caracteri-


zan a estas funciones, como las de tendencia central, variabilidad, etcétera. Estas medidas cum-
plen un importante papel en el análisis inferencial y, por ese motivo, se las define especialmente,
distinguiendo dos tipos de universos.

1.2.1.1. UNIVERSO FINITO Y PEQUEÑO


Si se tiene un universo finito, y lo suficientemente pequeño, como para que el comporta-
miento probabilístico de las poblaciones no esté explicado por un modelo teórico específico, se
define

Se llama PARÁMETRO ESTADÍSTICO a toda medida que resume


información calculada con las variables poblacionales.

Si no hay posibilidad de una equivocada interpretación, a los PARÁMETROS ESTADÍSTI-


COS se los denominará simplemente PARÁMETROS, y serán simbolizados con letras griegas.
Son ejemplos de parámetros: El total de elementos que presenta un determinado atributo,
la proporción de elementos que presentan un determinado atributo, la media aritmética, la varian-
za, el desvío estándar, etcétera.
En el presente trabajo se utilizará la siguiente nomenclatura, para simbolizar a los paráme-
tros:
 Cuando se quiera representar a un parámetro indefinido se utilizará la letra griega Theta, 
 Para representar a la media de la población o media poblacional, se utilizará la letra griega
Mu, , indicando en el subíndice a qué población corresponde.
N
 Xi
X  i1
N
 Para representar a la varianza de la población o varianza poblacional, se utilizará la letra
griega sigma, , con el supra índice 2 (Sigma cuadrado), indicando en el subíndice a qué
población corresponde
N
2
 (X i  )
 2X  i1
N
 Sea X una población dicotómica finita de tamaño N, quién puede asumir sólo dos valores
X = 1 si la unidad experimental medida tiene un determinado atributo A.
X = 0 si la unidad experimental medida no tiene un determinado atributo A.
Para representar el total de elementos que tienen un determinado atributo en el universo,
se utilizará la letra 
N
   Xi
i1

 Para representar a la proporción de elementos que tienen un determinado atributo en el


universo, se utilizara la letra griega Pi, 


N
PÁGINA 20 ESTADISTICA – C.Capriglioni
1. Introducción al Muestreo

Ejemplo 1.7
En un taller de expresión corporal, están interesados en estudiar determinadas características de
las personas que se inscriben, como por ejemplo la edad, y si alcanzan o no la mayoría de edad.
Las edades de las ocho personas que se inscribieron, en años cumplidos, son las que se detallan a
continuación, de menor a mayor: 15 ; 16 ; 19 ; 22 ; 23 ; 27 ; 36 ; 38
Se pide:
a) Identifique el Universo
b) Identifique a las Poblaciones
c) Calcule el valor de los Parámetros
SOLUCIÓN
a) El universo es la totalidad de personas inscriptas en el taller y su tamaño es
N=8
Una de las variables en estudio es la edad de las personas, entonces se define la población:
X: Edad de las personas
cuyos valores son
{15 ; 16 ; 19 ; 22 ; 23 ; 27 ; 36 ; 38}
-El valor del parámetro Media Poblacional en la Población edad es:
N
 Xi 15  16  19  22  23  27  36  38
i1
X    24,5
N 8
X = 24,5
-El valor del parámetro Varianza Poblacional en la Población edad es:
N N
2 2
 (X i  )  Xi 2
2X  i1
 i1
 
N N
15  16  19 2  22 2  232  27 2  36 2  38 2
2 2
  24,5 2  65, 25
8
2X = 65,25
Otra de las características que se quiere estudiar al universo es la cantidad de personas mayores
de edad.
-El valor del parámetro Total de personas mayores de edad en el Universo es: = 5
-El valor del parámetro Proporción de personas mayores de edad en el Universo es:
5
   0,625
8

1.2.1.2. UNIVERSO FINITO Y GRANDE O UNIVERSO INFINITO


Si la población es finita y lo suficientemente grande, o infinita, como para que su comportamiento
probabilístico esté explicado por una función de probabilidad, si la variable es discreta; o por una
función de densidad de probabilidad, si se trata de una variable continua, entonces se define.

Se llama PARÁMETRO ESTADÍSTICO a todo parámetro matemáti-


co de una función de probabilidad o de densidad de probabilidad, que
brinda información acerca de una POBLACIÓN.

ESTADISTICA – C. Capriglioni PÁGINA 21


1.Introducción al Muestreo

La expresión
X  f (X /  )
se lee
"La población X se distribuye con función de densidad de probabilidad f (X) y PARÁMETRO ".
Los PARÁMETROS no son constantes matemáticas; son números reales que pueden asumir
cualquier valor que se encuentre dentro de un conjunto específico. Este conjunto de números
reales se llama ESPACIO PARAMÉTRICO y su símbolo es la letra griega omega .

Ejemplo 1.8
-Sea X una población cuya función de densidad de probabilidad f (X) es la función normal.
1  X   2
1   
f (X )  e 2  
2π
Esta función tiene dos parámetros matemáticos
 y 
pudiéndose demostrar que también representan los PARÁMETROS ESTADÍSTICOS:
 Media poblacional o Esperanza Matemática de la población: X = E(X)
 Varianza de la población:  2X = V(X) = E(X - )2
 Desvío Estándar de la población:  X = V (X)
-Sea la distribución Binomial
p (~r )  ~nr  r 1  n r 
~ ~

 
Esta función tiene dos parámetros matemáticos
n y 
 n no es un parámetro estadístico
 : Es un parámetro estadístico. Es la proporción poblacional

PROPOSICIÓN 1
Toda operación algebraicas realizada con PARÁMETROS, también es un
PARÁMETROS
A manera de ejemplo de la PROPOSICIÓN 1 se puede enunciar lo siguiente:
Sea X1 una población con función de densidad f (X1) cuya media poblacional es 1 y X2 otra po-
blación con función de densidad de probabilidad f (X2) cuya media poblacional es 2, entonces,
(1  2)
es un PARÁMETRO. Éste se llama PARÁMETRO DIFERENCIA DE MEDIAS POBLACIO-
NALES.
Sea 1 la cantidad de elementos con atributo que pertenecen a un universo de tamaño N1 y 2 la
cantidad de elementos con atributo que pertenecen a un universo de tamaño N2, entonces,
(1 - 2)
es un PARÁMETRO. Éste se llama PARÁMETRO DIFERENCIA DE PROPORCIONES PO-
BLACIONALES.
El uso del muestreo se justifica porque, como ya ha sido explicado oportunamente, es fac-
tible que no sea mucho lo que se sepa acerca de las poblaciones.
Si fuese posible realizar un censo, entonces, se podrían conocer los verdaderos valores de
PÁGINA 22 ESTADISTICA – C.Capriglioni
1. Introducción al Muestreo

los parámetros correspondientes a las poblaciones que son objeto de la investigación, pero, si por
alguna razón el censo es impracticable, estos valores serán desconocidos.
En estos casos, los parámetros se pueden inferir, utilizando determinadas funciones que se
generan con las variables muestrales y cuyas definiciones formales se presentan en el siguiente
punto.

1.2.2. ESTADÍGRAFO Y ESTIMADOR


Oportunamente se definió a una muestra aleatoria de tamaño n, como un conjunto forma-
do por n variables aleatorias, todas con la misma distribución de probabilidad.
MUESTRA: { X1 ; X2 ;  ; Xn }

Se llama ESTADÍGRAFO a toda función escalar, h ( X1 ; X2 ;  ; Xn ),


generada con las variables muestrales

Dado que los ESTADÍGRAFOS son funciones generadas por variables aleatorias, también
son variables aleatorias, luego, existirá una función de densidad de probabilidad, o una función de
probabilidad, lo que corresponda, que describa su comportamiento probabilístico, como así tam-
bién es posible que tengan una Esperanza Matemática finita y una Varianza finita.
Los ESTADÍGRAFOS cumplen distintos roles dentro del análisis inferencial, algunos de los
cuales se estudiarán en capítulos posteriores, no obstante, a continuación se definirá un tipo espe-
cial de ESTADÍGRAFO que se utiliza para inferir concretamente a los parámetros.

Se llama ESTIMADOR DE UN PARÁMETRO  a todo ES-


TADÍGRAFO que proporcione información acerca de dicho pa-
rámetro.

Se llama ESTADÍGRAFO DE TRANSFORMACIÓN a aquel


estadígrafo que permite transformar al estimador, en una variable
que tenga una determinada distribución de probabilidad.

Para tener una adecuada información acerca de un parámetro desconocido , perteneciente


a una población X, finita o infinita, se debería obtener una muestra aleatoria de tamaño n
{ X1 ; X2 ;  ; Xn }
y con ella generar un ESTADÍGRAFO específico
̂ = g ( X1 ; X2 ;  ; Xn ) (2)
Si este ESTADÍGRAFO puede proporcionar información acerca del Parámetro  entonces,
̂ es un ESTIMADOR DEL PARÁMETRO .

1.2.3. ESTIMACIÓN
Dado que en la mayoría de los trabajos en donde se aplica el análisis estadístico, los pará-
metros de las poblaciones son desconocidos, hay que llevar a cabo el proceso de inferir o sacar
conclusiones acerca de éstos a través de las variables muestrales.
Los métodos que se utilizan para ello son dos, que generalmente se complementan, a saber:
 ESTIMACIÓN PUNTUAL
 ESTIMACIÓN POR INTERVALO


2 El símbolo sobre la letra que simboliza a un PARÁMETRO significa: ESTIMADOR de dicho PARÁMETRO.
ESTADISTICA – C. Capriglioni PÁGINA 23
1.Introducción al Muestreo

Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador de dicho parámetro cuya esperanza matemática,
E( ̂ ), sea finita y su varianza, V( ̂ ), también sea finita;
y sean { x1 ; x2 ;  ; xn }los correspondientes valores que asumen cada una de las variables
luego de tomar la muestra y realizar las correspondientes mediciones.

Se llama ESTIMACIÓN PUNTUAL del parámetro , a un método de


estimación que consiste en calcular el valor numérico único que asume
el estimador, luego de tomar la muestra y realizar las mediciones co-
rrespondientes.
Este valor numérico se llama PUNTO DE ESTIMACIÓN.
̂p = g ( x1 ; x2 ;  ; xn )

Se llama ESTIMACIÓN POR INTERVALO del parámetro  a un mé-


todo de estimación que consiste en calcular, con los datos de la muestra,
los límites de un conjunto cerrado y acotado de números reales.
Este conjunto se llama INTERVALO DE ESTIMACIÓN.
Li (̂p)    Ls ( p) .
Nótese que los límites del INTERVALO DE ESTIMACIÓN dependen de la ESTIMACIÓN PUNTUAL.
En el próximo capítulo se desarrollará ampliamente el método de estimación por intervalo.

1.2.4. DISTRIBUCIÓN DE LOS ESTIMADORES


Por lo ya definido, a toda variable aleatoria le corresponderá una función de probabilidad,
o una función de densidad de probabilidad, según si se trata de una variable aleatoria continua o
discreta, que explique su comportamiento probabilístico. El conocimiento de estas funciones hará
posible el cálculo de la esperanza matemática, o promedio esperado de la variable, y de la varian-
za de la variable.
Recordando que por definición, todo ESTIMADOR es una variable aleatoria, se define for-
malmente lo siguiente:
Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador de dicho parámetro cuya esperanza matemática,
E( ̂ ), sea finita y su varianza, V( ̂ ), también sea finita;

Se llama DISTRIBUCIÓN DE PROBABILIDAD DEL ESTIMA-


DOR ̂ , a aquella función de densidad de probabilidad, o función de
probabilidad, según corresponda, que describe su comportamiento pro-
babilístico.

En otras palabras, si se considera al muestreo probabilístico como un experimento aleato-


rio, como fue puntualizado anteriormente y, si para cada muestra posible se calculase el valor
numérico del ESTIMADOR, estos valores, acompañados del correspondiente valor de probabili-
dad, o densidad de probabilidad, constituyen la DISTRIBUCIÓN DE PROBABILIDAD DEL ESTI-
MADOR.
PÁGINA 24 ESTADISTICA – C. Capriglioni
1. Introducción al Muestreo

Dada una población finita de tamaño N, si se pudiese tomar todas las muestras posibles de
tamaño n y se calculase el valor numérico del estimador ̂ para cada una de ellas, entonces las
funciones que representan a las DISTRIBUCIONES DE LOS ESTIMADORES podrían ser
generadas empíricamente.
Esto es casi imposible en situaciones reales, por ello, a cada estimador se le asocia un de-
terminado modelo teórico, algunos de ellos ya fueron estudiados oportunamente, y otros se pre-
sentarán en parágrafos posteriores.
Si el estimador ̂ es una variable aleatoria discreta y p( ̂ )es su función de probabilidad,
entonces, la Esperanza Matemática y la Varianza del estimador son, respectivamente,

E(ˆ)   ˆ i p (ˆ i )


V(ˆ)  E ˆ E(ˆ)  2

  ˆi  E(ˆ)  2
p (ˆ i )
Si el estimador ̂ es una variable aleatoria continua y f ( ̂ ) es su función de densidad de
probabilidad, entonces, la Esperanza Matemática y la Varianza del estimador son, respectivamen-
te,

E(ˆ)  ˆ f (ˆ) dˆ

 
2
 2
V (ˆ)  E ˆ  E(ˆ)   ˆ  E(ˆ) f (ˆ) dˆ 
(3)
1.2.5. SESGO
Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n, {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador de dicho parámetro cuya esperanza matemática,
E( ̂ ), sea finita y su varianza, V( ̂ ), también sea finita;

Se llama SESGO a la diferencia entre, la esperanza matemática del es-


timador y el parámetro a estimar
ˆ)
SESGO = E(

1.2.6. ERROR MEDIO CUADRÁTICO


Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador de dicho parámetro cuya esperanza matemática,
E( ̂ ), sea finita y su varianza, V( ̂ ), también sea finita;

Se llama ERROR MEDIO CUADRÁTICO, a la esperanza matemáti-


ca del cuadrado de la diferencia entre el estimador ̂ y el parámetro .
ˆ  ) 2 
EMC ( ̂ ) = E(

3 Según el Diccionario de la Real Academia Española. SESGO: Oblicuidad o torcimiento de una cosa hacia un lado,
o en el corte, o en la situación, o en el movimiento.
ESTADISTICA – C. Capriglioni PÁGINA 25
1.Introducción al Muestreo

El ERROR MEDIO CUADRÁTICO mide la variabilidad del estimador con respecto al pará-
metro que está estimando.

1.3. PROPIEDADES DE LOS BUENOS ESTIMADORES


De todos los estimadores que se pueden construir para inferir a un determinado parámetro,
los mejores, son aquellos que cumplen con ciertas condiciones generales o propiedades, con las
cuales es posible garantizar la buena información que puedan proporcionar, acerca del parámetro
a estimar.
Intuitivamente, se puede pensar que un “buen” estimador, debería tener su función de den-
sidad de probabilidad (o función de probabilidad, según corresponda), concentrada lo mejor posi-
ble alrededor del parámetro que se pretende estimar. Además, debería brindar toda la información
que contiene la muestra, y a medida que aumente el tamaño de la muestra, disminuya la diferen-
cia entre la estimación y el parámetro.
Las propiedades más importantes que debe tener un estimador ̂ , para ser considerado un
"buen" estimador del parámetro  son las siguientes:
 INSESGAMIENTO
 EFICIENCIA
 CONSISTENCIA
 SUFICIENCIA.
Estas propiedades serán definidas y explicadas brevemente en los próximos parágrafos.

1.3.1. ESTIMADOR INSESGADO


Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f (X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador de dicho parámetro, cuya esperanza matemática,
E( ̂ ), sea finita y su varianza, V( ̂ ), también sea finita;

El estimador ̂ es un ESTIMADOR INSESGADO del parámetro  sí,


y sólo si la esperanza matemática del estimador ̂ es igual al paráme-
tro 
E( ̂ ) = 
En otras palabras, el estimador es INSESGADO si su sesgo es igual a cero.
SESGO = E(ˆ)   = 0
Esto significa que, si se toman todas la muestras posibles de tamaño n, de una población
de tamaño N, se calcula el valor numérico de un determinado estimador en cada una de las mues-
tras, y se calcula el promedio aritmético entre todos ellos, si dicho promedio resultase igual al
valor del parámetro, entonces el estimador es INSESGADO, en caso contrario el estimador es SES-
GADO.
En algunas ocasiones, esta propiedad puede no cumplirse directamente. Sin embargo, sí
podría cumplirse si se hiciese crecer indefinidamente al tamaño de la muestra.
En este caso, para establecer la PROPIEDAD DE INSESGAMIENTO, se utiliza un
concepto límite. Hay que pasar al límite la esperanza matemática del estimador.

PÁGINA 26 ESTADISTICA – C.Capriglioni


1. Introducción al Muestreo

El estimador ̂ es un estimador ASINTÓTICAMENTE INSESGADO


del parámetro , sí, y sólo si el límite de la esperanza matemática del es-
timador ̂ , cuando el tamaño de la muestra n tiende a infinito, es igual
al parámetro 
Lim E (ˆ )  
n

Si el estimador ̂ , del parámetro ,es INSESGADO, o ASINTÓTICAMENTE INSESGADO,


el ERROR MEDIO CUADRÁTICO es igual a la varianza del estimador, directamente o en el límite,
cuando n tiende a infinito.
Recordando que el ERROR MEDIO CUADRÁTICO es
E.M.C. ( ̂ ) = E(̂  ) 2
y que la VARIANZA DEL ESTIMADOR es

V(ˆ)  E ˆ E(ˆ) 
2

si
E (ˆ)  
entonces
 
E (ˆ  ) 2  E ˆ  E (ˆ) 2  V (ˆ)
O, si
Lim E (ˆ)  
n
entonces
2  2
Lim E (ˆ  )  E  ˆ  Lim E (ˆ)   V (ˆ)
n  n 

1.3.2. CONSISTENCIA
Es razonable desear que un estimador del parámetro  proporcione más información acer-
ca de éste, cuanto mayor sea el tamaño de la muestra.
Si se tomase una muestra de tamaño tan grande como el tamaño de la población, cabría es-
perar, en un buen estimador, que la estimación puntual resultase igual al parámetro.
Sea una población X, cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador INSESGADO de dicho parámetro cuya esperanza
matemática, E ( ˆ ) , sea finita y su varianza, V (
ˆ ) , también sea finita;

El estimador ̂ es un ESTIMADOR CONSISTENTE del parámetro 


sí y sólo, si se cumple que el estimador ̂ converge en probabilidad al
parámetro cuando el tamaño de la muestra n tiende a infinito.
Lim P ( ˆ     )  1 para todo  positivo.
n

En otras palabras, un ESTIMADOR es CONSISTENTE si, a medida que el tamaño de la


muestra crece indefinidamente (tiende a infinito), la probabilidad de que la diferencia entre el
estimador y el valor del parámetro pueda hacerse tan pequeña como se quiera, tiende a la unidad.
ESTADISTICA – C. Capriglioni PÁGINA 27
1.Introducción al Muestreo

TEOREMA SOBRE LA VERIFICACIÓN DE LA CONSISTENCIA (4)


Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f (X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador INSESGADO de dicho parámetro cuya esperanza
matemática, E ( ˆ ) , sea finita y su varianza, V (
ˆ ) , también sea finita;
si la varianza del estimador ̂ tiende a cero cuando el tamaño de la muestra tiende a infinito, en
caso de poblaciones infinitas; o tiende al tamaño de la población en caso de poblaciones finitas,
entonces el estimador ̂ es un ESTIMADOR CONSISTENTE del parámetro  .
Simbólicamente se puede expresar
Si
E(ˆ)   y Lim V(ˆ)  0 en caso de POBLACIÓN INFINITA
n
ó
E(ˆ)   y Lim V(ˆ)  0 en caso de POBLACIÓN FINITA
nN

entonces ̂ es un ESTIMADOR CONSISTENTE de 

1.3.3. EFICIENCIA
Otra de las condiciones con las que debería cumplir un estimador, para que pueda ser con-
siderado un BUEN ESTIMADOR, es que su VARIABILIDAD con respecto al parámetro, que como
ya fue explicado, se mide con el error medio cuadrático, debería ser MÍNIMA.
Si el estimador es insesgado, esta variabilidad está expresada en la varianza del estimador.
Por este motivo, sería importante que un estimador, además del insesgamiento, tenga la menor
varianza que pueda tener cualquier estimador insesgado del mismo parámetro. La importancia de
ello radica en el hecho de que ésta es, quizá, la medida más importante para decidir acerca de su
bondad para proporcionar información sobre el parámetro.
Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador INSESGADO de dicho parámetro cuya esperanza
matemática, E ( ˆ ) , sea finita y su varianza, V (
ˆ ) , también sea finita;

El estimador ̂ es un ESTIMADOR EFICIENTE del parámetro


sí, y sólo si se cumple que el estimador ̂ tiene la menor varian-
za que puede tener un estimador del parámetro .

La búsqueda de un estimador que posea esta cualidad se facilita con la aplicación de un


teorema denominado TEOREMA DE CRAMER-RAO en el que se demuestra que la VARIANZA DEL
ESTIMADOR ̂ necesariamente debe satisfacer la siguiente desigualdad:

4 La demostración de este teorema está fuera del alcance de este trabajo

PÁGINA 28 ESTADISTICA – C.Capriglioni


1. Introducción al Muestreo

1
V (ˆ)  2
  ln f (X / ) 
E
n. 


 
Esta desigualdad recibe el nombre de COTA DE CRAMER-RAO, e indica cual es la menor
varianza que puede tener un estimador.

TEOREMA SOBRE LA VARIANZA DE LOS ESTIMADORES (5)


Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador INSESGADO de dicho parámetro cuya esperanza
matemática, E (̂) , sea finita y su varianza, V (̂) , también sea finita;
un estimador es EFICIENTE, si el valor numérico de su varianza coincide con la cota inferior de
la desigualdad de CRAMER-RAO.
Simbólicamente se puede expresar
Si
1
V (ˆ)  2
  ln f (X / ) 
n.  E 

 
entonces el estimador ̂ es un ESTIMADOR EFICIENTE.
EFICIENCIA RELATIVA
En caso de que haya más de un estimador para un mismo parámetro, en la realización de
determinados tipos de trabajos, es posible que al Estadístico no le interese demasiado la EFI-
CIENCIA de uno de ellos en especial, sino que desee utilizar aquel que tenga la menor Varianza.
Por ello se incorpora el concepto de EFICIENCIA RELATIVA.
Dado dos estimadores de un mismo parámetro  ,
̂1 = g1 ( X1 ; X2 ;  ; Xn ) ; ̂ 2 = g2 ( X1 ; X2 ;  ; Xn )
el estimador ̂1 tiene una EFICIENCIA RELATIVA mayor que el esti-
mador ̂ 2 sí, y sólo si la varianza del estimador ̂1 es menor que la va-
rianza del estimador ̂ 2

Si los estimadores son sesgados, entonces la EFICIENCIA RELATIVA entre los estimadores
se establece comparando el ERROR MEDIO CUADRÁTICO de cada uno de ellos.

1.3.4. SUFICIENCIA
Cuando es necesario construir un estimador para un determinado parámetro , en algunos
casos se lo hará utilizando todas y cada una de las n variables muestrales, y en otros el estimador
estará basado solamente en algunas de las variables de la muestra.
Intuitivamente, se puede apreciar que la cantidad de información acerca del parámetro ,
que brinda aquel estimador que utiliza a todos los datos de la muestra, será superior a la cantidad
de información proporcionada por aquellos estimadores que utilizan sólo a algunos de ellos.

5 La demostración de este teorema está fuera del alcance de este trabajo


ESTADISTICA – C. Capriglioni PÁGINA 29
1.Introducción al Muestreo

Sea una población X cuya distribución de probabilidad tiene un parámetro estadístico des-
conocido . X f(X / );
sea una muestra de tamaño n {X1 ; X2 ;  ; Xn};
sea ̂ = g ( X1 ; X2 ;  ; Xn ) un estimador INSESGADO de dicho parámetro cuya esperanza
matemática, E (̂) , sea finita y su varianza, V (̂) , también sea finita;

El estimador ̂ es un ESTIMADOR SUFICIENTE del parámetro ,


sí, y sólo si se cumple que el estimador ̂ utiliza toda la información re-
levante acerca del parámetro ,contenida en la muestra aleatoria.

Se enuncia, sin demostrar, la siguiente PROPOSICIÓN:


PROPOSICIÓN 2
Si un ESTIMADOR INSESGADO del parámetro , es un ESTIMADOR SU-
FICIENTE, entonces su varianza será menor que la varianza de aquel
ESTIMADOR INSESGADO pero que no sea un ESTIMADOR SUFICIENTE
de dicho parámetro.
Los criterios para determinar si un estimador es suficiente están fuera del alcance de este
trabajo.

1.4. GRADOS DE LIBERTAD


El concepto que se introduce ahora, está presente en la definición de algunos estimadores
de parámetros específicos y es utilizado asiduamente en toda la tarea inferencial, cuando es me-
nester la utilización de determinadas distribuciones de probabilidad asociadas al proceso de mues-
treo.

Se llama GRADOS DE LIBERTAD a la cantidad de variables libres, o


estadísticamente independientes, que intervienen en un problema o en
una distribución asociada a un problema.

Ejemplo 1.9
Dada una Tabla de Contingencia de 2 Filas  2 Columnas donde ya están fijados los correspon-
dientes Totales Marginales (Total de las Filas y Total de las Columnas)
Totales de
A A Filas
B 40
B 110
Totales de
80 70
Columnas
Si se considera a cada intersección de Filas y Columnas como una variable, entonces esta tabla
tiene cuatro variables, a saber:
X1 = (AB) ; X2 = (A B ) ; X3 = ( A B) ; X4 = ( A B )
Si se elige una variable cualquiera, libremente, y se le asigna un valor numérico, entonces el va-
lor numérico de las otras tres variables queda determinado. Por ejemplo, si a la variable X1 se le
asigna el valor 10, entonces el valor numérico de las otras tres será, necesariamente:
PÁGINA 30 ESTADISTICA – C. Capriglioni
1. Introducción al Muestreo

X2 = 70 ; X3 = 30 ; X4 = 40
Totales de
A A Filas
B X1 = 10 X2 = 30 40

B X3 =70 X4 = 40 110
Totales de
80 70
Columnas
Esto quiere decir que, de las cuatro variables, sólo una es independiente. Entonces, la Tabla de
Contingencia 2  2 tiene 1 grado de libertad (1 g.l.)

Ejemplo 1.10
Sea una población X con Media Poblacional  y Varianza Poblacional 2; sea
{ X1 ; X2 ; ... ; Xn }
una muestra aleatoria independiente de tamaño n proveniente de dicha población;
y sean
( X1  X ) ; ( X2  X ) ; … ; ( Xn  X )
n variables aleatorias que indican las desviaciones entre cada valor de la muestra y la media arit-
mética muestral.
Dado que la suma de las desviaciones con respecto a la media aritmética debe ser nula (6)
 (X i  X )  0
solamente se podrán asignar libremente valores a (n – 1) variables. En efecto, suponiendo una
muestra de tamaño 5, se tendrán 5 desviaciones:
La primera desviación puede ser cualquier número real, por ejemplo: ( X1  X ) = (39)
La segunda desviación puede ser cualquier número real, por ejemplo: ( X2  X ) = (-15)
La tercera desviación puede ser cualquier número real, por ejemplo: ( X3  X ) = (-30)
La cuarta desviación puede ser cualquier número real, por ejemplo: ( X4  X ) = (-10)
La quinta desviación no puede ser cualquier número real. Solamente podrá ser el número que
haga cero la suma de las desviaciones. En este caso el único número es: ( X5  X ) = (16)
 (Xi  X)  (39) + (-15) + (-30) + (-10) + (16) = 0
Esto quiere decir que hay 4 grados de libertad [(n-1) g.l.]
Consecuentemente, la Suma del Cuadrado de los desvíos, S.C.X, también tiene 4 grados de liber-
tad [(n-1) g.l.]
2
 (X i  X )  (39)2 + (-15)2 + (-30)2 + (-10)2 + (16)2

Como se ha dicho, el último valor no puede ser cualquiera porque se debe cumplir que la suma de
las desviaciones debe ser cero.
Teniendo en cuenta la propiedad referida a la suma de las desviaciones con respecto a la
media aritmética
 (X i  X )  0
6 Ver Estadística Tomo1 C. CAPRIGLIONI. Capítulo 3.
ESTADISTICA – C. Capriglioni PÁGINA 31
1.Introducción al Muestreo

y lo mostrado en el Ejemplo 1.10, se pueden enunciar, sin demostrar, las siguientes PROPOSI-
CIÓNES:

PROPOSICIÓN 3
La cantidad de GRADOS DE LIBERTAD que tiene la suma del cuadrado
de las desviaciones con respecto a la media aritmética muestral es igual
al tamaño de la muestra menos uno [(n-1) g.l.](7).
n
2
 (X i  X )  (n  1) g . l .
i 1
PROPOSICIÓN 4
Si en un estadígrafo intervienen k estimadores de otros tantos paráme-
tros, los GRADOS DE LIBERTAD correspondientes a la suma del cuadra-
do de las desviaciones con respecto a dicho estadígrafo, es igual al ta-
maño de la muestra menos la cantidad de cantidad de parámetros a es-
timar [(n – k) g.l.]
En la generación de los distintos estadígrafos, es frecuente que, por alguna circunstancia,
no todas las variables muestrales que intervienen en él, sean estadísticamente independientes. Los
GRADOS DE LIBERTAD, entonces, serán inferiores al tamaño de la muestra.
Oportunamente se estudiará cómo se determinan los GRADOS DE LIBERTAD correspon-
diente a las distintas funciones que se utilizan para la estimación de algunos parámetros.

1.5. ALGUNOS ESTIMADORES IMPORTANTES


1.5.1. MEDIA ARITMÉTICA MUESTRAL
Sea una población X con Esperanza Matemática, o Media Poblacional Finita,  y
Varianza Poblacional Finita 2
y sea
{ X1 ; X2 ; ... ; Xn }
una muestra aleatoria de tamaño n proveniente de dicha población.
Se llama MEDIA ARITMÉTICA MUESTRAL (o, simplemente ME-
DIA MUESTRAL) a un estimador de la MEDIA POBLACIONAL, que se
genera haciendo el cociente entre la suma de las variables muestrales y
el tamaño de la muestra
n
 Xi
ˆ X  X  i1

n

1.5.2. VARIANZA MUESTRAL


Sea una población X con Esperanza Matemática, o Media Poblacional Finita,  y Varian-
za Poblacional Finita 2
y sea
{ X1 ; X2 ; ... ; Xn }
una muestra aleatoria de tamaño n proveniente de dicha población.

7 Esta demostración está fuera del alcance de este trabajo


PÁGINA 32 ESTADISTICA – C.Capriglioni
1. Introducción al Muestreo

Se llama VARIANZA MUESTRAL a un estimador de la VARIANZA


POBLACIONAL que se genera haciendo el cociente entre la Suma del
Cuadrado de las desviaciones con respecto a la media aritmética mues-
tral y los correspondientes grados de libertad.
n
2
 (X i  X )
ˆ 2  S X2 
 i1
n 1

1.5.3. PROPORCIÓN MUESTRAL


Cuando el objetivo del trabajo inferencial es tener información sobre la presencia o no de
un determinado atributo en un universo, entonces la población X es dicotómica. Esto significa que
los valores de la variable sólo pueden asumir los valores 0 o 1.
Si el elemento observado no tiene el atributo, entonces X = 0
Si el elemento observado sí tiene el atributo, entonces X = 1
Sea una muestra aleatoria de tamaño n
{ X1 ; X2 ; ... ; Xn }
~
y una variable aleatoria, r , que representa la cantidad de elementos que sí poseen un determina-
do atributo, dentro de la muestra de tamaño n.
n
~r 

i 1

Se llama PROPORCIÓN DE ELEMENTOS QUE TIENEN UN DE-


TERMINADO ATRIBUTO EN LA MUESTRA o, simplemente,
PROPORCIÓN MUESTRAL, a un estimador de la PROPORCIÓN
POBLACIONAL, que se genera mediante el cociente entre la cantidad de
elementos que sí poseen un determinado atributo en la muestra y el ta-
maño de la muestra.
~r
ˆ  p 
n

Ejemplo 1.11
Dado el universo del Ejemplo 1.7, referido a las ocho personas que concurren a un taller de ex-
presión corporal, cuyas edades se transcriben a continuación,
{15 ; 16 ; 19 ; 22 ; 23 ; 27 ; 36 ; 38}
se pide:
a) Determine todas las muestras posibles de tamaño 5.
b) Calcule la media muestral y la varianza muestral de cada una de las muestras.
c) Calcule la proporción de personas mayores de edad de cada una de las muestras.
d) Calcule la Esperanza Matemática y la Varianza de cada uno de los estimadores.
SOLUCIÓN
El universo es finito y de tamaño ocho (N = 8)
{15 ; 16 ; 19 ; 22 ; 23 ; 27 ; 36 ; 38}
a) La cantidad de muestras posibles de tamaño cinco (n = 5) que se pueden obtener de dicho uni-
verso es
 N    8   56
 n   5
   
A continuación se presentan las 56 muestras posibles de tamaño 5 que pueden tomarse de un uni-
ESTADISTICA – C. Capriglioni PÁGINA 33
1.Introducción al Muestreo

verso de tamaño 8:
MUESTRAS DE TAMAÑO 5 TOMADAS DE UN UNIVERSO DE TAMAÑO 8
Muestra 1: {15 ; 16 ; 19 ; 22 ; 23} Muestra 29: {15 ; 19 ; 23 ; 36 ; 38}
Muestra 2: {15 ; 16 ; 19 ; 22 ; 27} Muestra 30: {15 ; 19 ; 27 ; 36 ; 38}
Muestra 3: {15 ; 16 ; 19 ; 22 ; 36} Muestra 31: {15 ; 22 ; 23 ; 27 ; 36}
Muestra 4: {15 ; 16 ; 19 ; 22 ; 38} Muestra 32: {15 ; 22 ; 23 ; 27 ; 38}
Muestra 5: {15 ; 16 ; 19 ; 23 ; 27} Muestra 33: {15 ; 22 ; 23 ; 36 ; 38}
Muestra 6: {15 ; 16 ; 19 ; 23 ; 36} Muestra 34: {15 ; 22 ; 27 ; 36 ; 38}
Muestra 7: {15 ; 16 ; 19 ; 23 ; 38} Muestra 35: {15 ; 23 ; 27 ; 36 ; 38}
Muestra 8: {15 ; 16 ; 19 ; 27 ; 36} Muestra 36: {16 ; 19 ; 22 ; 23 ; 27}
Muestra 9: {15 ; 16 ; 19 ; 27 ; 38} Muestra 37: {16 ; 19 ; 22 ; 23 ; 36}
Muestra 10: {15 ; 16 ; 19 ; 36 ; 38} Muestra 38: {16 ; 19 ; 22 ; 23 ; 38}
Muestra 11: {15 ; 16 ; 22 ; 23 ; 27} Muestra 39: {16 ; 19 ; 22 ; 27 ; 36}
Muestra 12: {15 ; 16 ; 22 ; 23 ; 36} Muestra 40: {16 ; 19 ; 22 ; 27 ; 38}
Muestra 13: {15 ; 16 ; 22 ; 23 ; 38} Muestra 41: {16 ; 19 ; 22 ; 36 ; 38}
Muestra 14: {15 ; 16 ; 22 ; 27 ; 36} Muestra 42: {16 ; 19 ; 23 ; 27 ; 36}
Muestra 15: {15 ; 16 ; 22 ; 27 ; 38} Muestra 43: {16 ; 19 ; 23 ; 27 ; 38}
Muestra 16: {15 ; 16 ; 22 ; 36 ; 38} Muestra 44: {16 ; 19 ; 23 ; 36 ; 38}
Muestra 17: {15 ; 16 ; 23 ; 27 ; 36} Muestra 45: {16 ; 19 ; 27 ; 36 ; 38}
Muestra 18: {15 ; 16 ; 23 ; 27 ; 38} Muestra 46: {16 ; 22 ; 23 ; 27 ; 36}
Muestra 19: {15 ; 16 ; 23 ; 36 ; 38} Muestra 47: {16 ; 22 ; 23 ; 27 ; 38}
Muestra 20: {15 ; 16 ; 27 ; 36 ; 38} Muestra 48: {16 ; 22 ; 23 ; 36 ; 38}
Muestra 21: {15 ; 19 ; 22 ; 23 ; 27} Muestra 49: {16 ; 22 ; 27 ; 36 ; 38}
Muestra 22: {15 ; 19 ; 22 ; 23 ; 36} Muestra 50: {16 ; 23 ; 27 ; 36 ; 38}
Muestra 23: {15 ; 19 ; 22 ; 23 ; 38} Muestra 51: {19 ; 22 ; 23 ; 27 ; 36}
Muestra 24: {15 ; 19 ; 22 ; 27 ; 36} Muestra 52: {19 ; 22 ; 23 ; 27 ; 38}
Muestra 25: {15 ; 19 ; 22 ; 27 ; 38} Muestra 53: {19 ; 22 ; 23 ; 36 ; 38}
Muestra 26: {15 ; 19 ; 22 ; 36 ; 38} Muestra 54: {19 ; 22 ; 27 ; 36 ; 38}
Muestra 27: {15 ; 19 ; 23 ; 27 ; 36} Muestra 55: {19 ; 23 ; 27 ; 36 ; 38}
Muestra 28: {15 ; 19 ; 23 ; 27 ; 38} Muestra 56: {22 ; 23 ; 27 ; 36 ; 38}
b) El valor de la edad media muestral,

X
x i

n
para cada una de las muestras, se presentan en el cuadro de la página 35.
El valor de la varianza muestral
 (x
2

 X)
S x2 
i

n 1
para cada una de las muestras, se presentan en el cuadro de la página 35.
c) El valor de la proporción muestral de personas mayores de edad,
~r
p
n
para cada una de las muestras, se presentan en el cuadro de la página 35.
e) Los valores de la esperanza matemática (promedio) y la varianza de cada uno de lo estimado-
res, calculados con los datos de las 56 muestras presentadas en la página 35, son:
56 56
 Xi  24,5
2
 Xi
E( X )  i 1  24,5 ; V ( X )  i 1  5,59
56 56
56 56
 Si2  74,57
2
 Si2
E(S 2 )  i1  74,57 ; V (S 2 )  i1  659,28
56 56
56 56
 pi  pi  0,6252
E( p )  i 1  0,625 ; V ( p )  i 1  0,0201
56 56
PÁGINA 34 ESTADISTICA – C.Capriglioni
1. Introducción al Muestreo

MEDIA MUESTRAL, PROPORCIÓN MUESTRAL Y VARIANZA MUESTRAL


CORRESPONDIENTE ACADA UNA DE LAS 56 MUESTRAS QUE SE
OBTUVIERON EN EL EJEMPLO 1.11
2
x1 x2 x3 x4 x5 Xi S i ri pi
Muestra 1 15 16 19 22 23 19,0 12,50 2 0,4
Muestra 2 15 16 19 22 27 19,8 23,70 2 0,4
Muestra 3 15 16 19 22 36 21,6 72,30 2 0,4
Muestra 4 15 16 19 22 38 22,0 87,50 2 0,4
Muestra 5 15 16 19 23 27 20,0 25,00 2 0,4
Muestra 6 15 16 19 23 36 21,8 72,70 2 0,4
Muestra 7 15 16 19 23 38 22,2 87,70 2 0,4
Muestra 8 15 16 19 27 36 22,6 78,30 2 0,4
Muestra 9 15 16 19 27 38 23,0 92,50 2 0,4
Muestra 10 15 16 19 36 38 24,8 126,70 2 0,4
Muestra 11 15 16 22 23 27 20,6 25,30 3 0,6
Muestra 12 15 16 22 23 36 22,4 70,30 3 0,6
Muestra 13 15 16 22 23 38 22,8 84,70 3 0,6
Muestra 14 15 16 22 27 36 23,2 74,70 3 0,6
Muestra 15 15 16 22 27 38 23,6 88,30 3 0,6
Muestra 16 15 16 22 36 38 25,4 119,80 3 0,6
Muestra 17 15 16 23 27 36 23,4 74,30 33 0,6
Muestra 18 15 16 23 27 38 23,8 87,70 0,6
Muestra 19 15 16 23 36 38 25,6 118,30 3 0,6
Muestra 20 15 16 27 36 38 26,4 116,30 3 0,6
Muestra 21 15 19 22 23 27 21,2 20,20 3 0,6
Muestra 22 15 19 22 23 36 23,0 62,50 3 0,6
Muestra 23 15 19 22 23 38 23,4 76,30 3 0,6
Muestra 24 15 19 22 27 36 23,8 65,70 3 0,6
Muestra 25 15 19 22 27 38 24,2 78,70 3 0,6
Muestra 26 15 19 22 36 38 26,0 107,50 3 0,6
Muestra 27 15 19 23 27 36 24,0 65,00 3 0,6
Muestra 28 15 19 23 27 38 24,4 77,80 3 0,6
Muestra 29 15 19 23 36 38 26,2 105,70 3 0,6
Muestra 30 15 19 27 36 38 27,0 102,50 3 0,6
Muestra 31 15 22 23 27 36 24,6 59,30 4 0,8
Muestra 32 15 22 23 27 38 25,0 71,50 4 0,8
Muestra 33 15 22 23 36 38 26,8 96,70 4 0,8
Muestra 34 15 22 27 36 38 27,6 92,30 4 0,8
Muestra 35 15 23 27 36 38 27,8 89,70 4 0,8
Muestra 36 16 19 22 23 27 21,4 17,30 3 0,6
Muestra 37 16 19 22 23 36 23,2 58,70 3 0,6
Muestra 38 16 19 22 23 38 23,6 72,30 3 0,6
Muestra 39 16 19 22 27 36 24,0 61,50 3 0,6
Muestra 40 16 19 22 27 38 24,4 74,30 3 0,6
Muestra 41 16 19 22 36 38 26,2 102,20 3 0,6
Muestra 42 16 19 23 27 36 24,2 60,70 3 0,6
Muestra 43 16 19 23 27 38 24,6 73,30 3 0,6
Muestra 44 16 19 23 36 38 26,4 100,30 3 0,6
Muestra 45 16 19 27 36 38 27,2 96,70 3 0,6
Muestra 46 16 22 23 27 36 24,8 54,70 4 0,8
Muestra 47 16 22 23 27 38 25,2 66,70 4 0,8
Muestra 48 16 22 23 36 38 27,0 91,00 4 0,8
Muestra 49 16 22 27 36 38 27,8 86,20 4 0,8
Muestra 50 16 23 27 36 38 28,0 83,50 4 0,8
Muestra 51 19 22 23 27 36 25,4 43,30 4 0,8
Muestra 52 19 22 23 27 38 25,8 54,70 4 0,8
Muestra 53 19 22 23 36 38 27,6 76,30 4 0,8
Muestra 54 19 22 27 36 38 28,4 70,30 4 0,8
Muestra 55 19 23 27 36 38 28,6 67,30 4 0,8
Muestra 56 22 23 27 36 38 29,2 54,70 5 1,0

ESTADISTICA – C. Capriglioni PÁGINA 35


1.Introducción al Muestreo

1.5.4. ESPERANZA Y VARIANZA DE LOS ESTIMADORES


1.5.4.1. MEDIA MUESTRAL
Aplicando las propiedades de la esperanza matemática y la varianza de la suma de varia-
bles aleatorias independientes, se puede demostrar que:
 La esperanza matemática de la MEDIA MUESTRAL siempre es la MEDIA POBLACIONAL
E( X )  μX
Por lo tanto, la MEDIA MUESTRAL es un estimador INSESGADO de la MEDIA POBLACIO-
NAL
 La varianza de la MEDIA MUESTRAL de universos infinitos es
2

VX 
X
n
Por lo tanto, si el universo es infinito, la MEDIA MUESTRAL es un estimador CONSISTEN-
TE de la MEDIA POBLACIONAL
 La varianza de la MEDIA MUESTRAL de universos finitos es
2
σ Nn
V(X)  X  
n  N1 
Por lo tanto, si el universo es finito, la MEDIA MUESTRAL es un estimador CONSISTENTE
de la MEDIA POBLACIONAL.
Estas demostraciones están fuera del alcance de este trabajo. No obstante, se puede verifi-
car empiricamente con los datos de los Ejemplos 1.7 y 1.11 que:

μ X = 24,5 y E(X )  24,5 entonces E( X )  μX

65, 25  8  5 
 2X = 65,25 ; V( X ) = 5,59 y V( X )    = 5,59
5  8 1 
2
σX  N  n 
entonces V ( X )   
n  N1 

1.5.4.2. PROPORCIÓN MUESTRAL


Aplicando las propiedades de la esperanza matemática y la varianza de la suma de varia-
bles aleatorias independientes, se puede demostrar que:
 La esperanza matemática de la PROPORCIÓN MUESTRAL siempre es la PROPORCIÓN
POBLACIONAL
E(p)  π
Por lo tanto la PROPORCIÓN MUESTRAL es un estimador INSESGADO de la PROPORCIÓN
POBLACIONAL

 La varianza de la PROPORCIÓN MUESTRAL de universos infinitos es


  1  
V (p) 
n
Por lo tanto, si el universo es infinito, la PROPORCIÓN MUESTRAL es un estimador CON-
SISTENTE de la PROPORCIÓN POBLACIONAL

 La varianza de la PROPORCIÓN MUESTRAL de universos finitos es


 1    N  n 
V ( p)   
n  N1 
PÁGINA 36 ESTADISTICA –C. Capriglioni
1. Introducción al Muestreo

Por lo tanto, si el universo es finito, la PROPORCIÓN MUESTRAL es un estimador CON-


SISTENTE de la PROPORCIÓN POBLACIONAL
Estas demostraciones están fuera del alcance de este trabajo, no obstante, se puede verifi-
car empíricamente, con los datos de los Ejemplos 1.7 y 1.11, que
 = 0,625 y E(p)  0,625 entonces E(p)  π
0,625  1  0,625  8  5 
V( p ) = 0,0201 y V( p )    = 0,0201
5  8 1 
1    N  n 
entonces V ( p)   
n  N1 

1.5.4.3. VARIANZA MUESTRAL


Se puede demostrar que:
 La esperanza matemática de la VARIANZA MUESTRAL, en universos infinitos, siempre es
la VARIANZA POBLACIONAL
E(S 2x )   2x
Por lo tanto la VARIANZA MUESTRAL es un estimador INSESGADO de la VARIANZA PO-
BLACIONAL
 La varianza de la VARIANZA MUESTRAL de universos infinitos es
2
2 X
V( S x ) =
2n
Las demostraciones analíticas están fuera del alcance de este trabajo. La comprobación
empírica no se puede realizar dado que el universo utilizado en los Ejemplos 1.7 y 1.11 es finito.

1.6. DISTRIBUCIÓN DE ALGUNOS ESTIMADORES. POBLA-


CIONES NORMALES.
Para estudiar la distribución de los estimadores es necesario recordar las siguientes defini-
ciones:
 La suma del cuadrado V variables normales estandarizadas independientes tiene distribu-
ción ji-cuadrado con V grados de libertad.
Sean
Zi ~ No (0;1) i  1, V independientes
entonces
V
 Zi ~  V G.L.
2

i1
 El cociente entre una variable normal estandarizada y la raíz cuadrada de una variable
ji-cuadrada con V grados de libertad, dividida por V, tiene distribución t de Student con
V grados de libertad.
Sean
Z ~ No (0;1) y  ~  V G.L.
entonces
Z
~ t V G.L.

V

ESTADISTICA – C. Capriglioni PÁGINA 37


1.Introducción al Muestreo

 El cociente entre una variables ji-cuadrado con V1 grados de libertad, dividida por V1, y
otra variable ji-cuadrado pero con V2 grados de libertad, dividida por V2, tiene distribu-
ción F de Snedecor con V1 grados de libertad en el numerador y V2 grados de libertad en
el denominador.
Sean
1 ~  V1 G.L. y  2 ~  V2 G.L.
entonces
1
V1
2
~ F(V1;V2)
V2

1.6.1. DISTRIBUCIÓN DE LA MEDIA MUESTRAL CUANDO LA VA-


RIANZA POBLACIONAL ES CONOCIDA
En este punto se establecerá, utilizando definiciones y propiedades estudiados en seccio-
nes anteriores, la distribución de la media aritmética muestral correspondiente a muestras toma-
das de poblaciones con distribución normal cuando la varianza poblacional es conocida.
Sea una población X cuya distribución es normal con Esperanza Matemática, o Media
Poblacional, μ X y varianza poblacional  2X
y sea
{ X1 ; X2 ; . . . ; X n }
una muestra aleatoria de tamaño n proveniente de dicha población.
El estimador MEDIA ARITMÉTICA MUESTRAL, por estar originado en
una suma de variables normales, es una combinación lineal de variables
aleatorias normales, por lo tanto, también tiene distribución normal.
n
 Xi
X i =1
 No (8)
n
Como ya se ha estudiado en el punto anterior, la ESPERANZA MATEMÁTICA de la media
aritmética muestral es:
E( X ) = µ
y la VARIANZA de la media aritmética muestral, si la población es FINITA, es:
2
V X  
 Nn
 
n  N1 
y la VARIANZA de la media aritmética muestral, si la población es INFINITA, es:
2

VX 

n
por lo tanto, la VARIABLE ESTANDARIZADA, o ESTADÍGRAFO DE TRANSFORMACIÓN de la me-
dia aritmética muestral, para POBLACIONES FINITAS es:

8 Ver Estadística – Tomo 1 C. Capriglioni. Capítulo 6.


PÁGINA 38 ESTADISTICA –C. Capriglioni
1. Introducción al Muestreo

X
Z
 Nn
n N 1
y para POBLACIONES INFINITAS es:
X
Z

n
Este último estadígrafo, para algunas demostraciones que se harán en secciones posterio-
res, también puede se escrito como:
n (X  )
Z

Esto significa que, para el cálculo de probabilidad, y para toda la tarea inferencial donde
se utilice la media aritmética muestral, de muestras obtenidas de poblaciones normales cuya
varianza sea conocida, hay que utilizar la distribución Normal Estandarizada.
Se recuerda que la FRACCIÓN DE MUESTREO es el cociente entre el tamaño de la muestra
y el tamaño de la población.
n
Fm 
N
y mide la proporción del tamaño de la muestra con respecto al tamaño de la población.
Nn
Si el tamaño del universo tiende a infinito, entonces el factor   tiende a 1.
 N1 
Nn
N    1
 N1 
A los fines prácticos, si el tamaño de la muestra es, a lo sumo el diez por ciento del tama-
ño de la población, o sea, si la FRACCIÓN DE MUESTREO es menor o igual a 0,10, la población
Nn
puede considerarse infinita y, consecuentemente, el factor   se puede considerar que tien-
 N1 
de a 1.
Si
Nn
Fm  0,10  N      1
 N1 
entonces
X X
Z  Z
 Nn 
n N 1 n

Ejemplo 1.12
¿Cuál es la probabilidad de que la media de una muestra de tamaño 25 esté entre 397 y 401, si
proviene de una población normal con media 400 y varianza 100 ?
SOLUCIÓN
Si la población es normal la media de la muestra tiene distribución normal con

 
2

EX  ; V X 
n
ESTADISTICA – C. Capriglioni PÁGINA 39
1.Introducción al Muestreo

por ser combinación lineal de variables aleatorias normales.


  
2
X

X  No  ; Z  No (0 ; 1)
 n  
 
n
El cálculo de probabilidad, entonces, se realiza utilizando la distribución normal
 = 400 ; 2 = 100   = 10
n = 25
P( 397  X  401) = ¿…?
X 397  400 3 401  400 1
Z  z1     1,5 ; z 2    0,5
 10 2 10 2
n 25 25
  
PNo  397  X  401 /   400;  2  = PNo (-1,5 ≤ Z ≤ 0,5 / 0;1) =
 n 
= F(0,5) – F(-1,5) = 0,69146 – 0,06681 = 0,62465

La probabilidad de que la media de la muestra esté entre 397 y 401 es 0,62465.

Ejemplo 1.13
De una población normal de 150 elementos, cuya media es 3847 y desvío estándar 247, se sacó
una muestra de tamaño 25.
¿Cuál es la probabilidad de que la media muestral sea superior a 3950 ?
SOLUCIÓN
El tamaño de la población es conocido, por lo tanto se trata de una población finita.
N = 150 ;  = 3847 ;  = 247 ; n = 25
P( X >3950) = ¿...?
La variable estandarizada es
X
Z
 Nn

n N 1
X 3950  3847
Z   2, 28
 Nn 247 150  25
 
n N 1 25 150  1

PÁGINA 40 ESTADISTICA –C. Capriglioni


1. Introducción al Muestreo

 Nn
PNo ( X >3950 /  = 3847 ;   45,2469) = P(Z > 2,28 / 0 ; 1) =
n N 1
= 1 - F(2,28) = 0,0113

La probabilidad de que la media de la muestra sea superior a 3950 es 0,0113.

1.6.2. DISTRIBUCIÓN DE LA VARIANZA MUESTRAL


En este punto se establecerá, utilizando definiciones y propiedades estudiados en seccio-
nes anteriores, la distribución de la varianza muestral correspondiente a muestras tomadas de po-
blaciones con distribución normal (9).
Sean
una población X cuya distribución es normal con esperanza matemática o media
poblacional µ y varianza poblacional 2,
sea
{ X1 ; X2; ... ; Xn}
una muestra aleatoria de tamaño n proveniente de dicha población,
sea
n
SC X   (X i  X )
2

i 1
la suma del cuadrado de las desviaciones con respecto a la media aritmética mues-
tral,
y sea,
n
 (X i  X )
2
i1
S X2 
n 1
la varianza muestral de dicha muestra.
entonces, el estadígrafo
n
 (Xi  ) 2
i1
2
tiene distribución ji-cuadrado con n G.L. (grados de libertad) por ser la suma del cuadra-
do de n variables normales independientes,
El estadígrafo
2
n  (X  )
2

9 Las demostraciones están fuera del alcance de este trabajo


ESTADISTICA – C. Capriglioni PÁGINA 41
1.Introducción al Muestreo

tiene distribución ji-cuadrado con 1 G.L. por ser el cuadrado de una variable con distri-
bución normal, luego, su diferencia
n n
 (X i  X )  (X i   )
2 2

n  (X  )
2
i1 i1
 
2 2

2

es un estadígrafo que tiene distribución ji-cuadrado con (n – 1) G.L.


n
 (X i  X )
2

i1
 2(n-1) G.L.
 2

Si en el numerador de este estadígrafo se multiplica y divide por los grados de libertad se


tiene el ESTADÍGRAFO DE TRANSFORMACIÓN de la varianza muestral
2
(n  1)  S
 2(n-1) G.L.
 2
Esto significa que, para el cálculo de probabilidad, y para toda la tarea inferencial referida
a la varianza muestral, de muestras obtenidas de poblaciones normales, hay que utilizar la distri-
bución ji-cuadrado con (n-1) G.L..

1.6.3. DISTRIBUCIÓN DE LA MEDIA ARITMÉTICA MUESTRAL CUAN-


DO LA VARIANZA POBLACIONAL ES DESCONOCIDA
En la mayoría de los trabajos donde hay que aplicar la inferencia estadística, el valor de la
varianza poblacional 2 es desconocido, por lo tanto, cuando esto ocurre, se hace necesario obte-
ner una distribución de probabilidad para la media aritmética muestral que contemple esta situa-
ción.
El cociente entre una variable normal estandarizada y la raiz cuadrada de una variable ji-
cuadrado divida por sus correspondientes grados de libertad, es una variable aleatoria cuya distri-
bución de probabilidad se llama “t” de Student y tiene como parámetro matemático los grados de
libertad de la ji-cuadrado empleada.(10).
Sea una población X cuya distribución es normal con esperanza matemática o media po-
blacional µ y varianza poblacional 2,
sea
{ X1 ; X2; ... ; Xn}
una muestra aleatoria de tamaño n proveniente de dicha población,
sea
n
 Xi
X i =1
n
la media muestral de dicha muestra,
y sea
n
 (X i  X )
2

i1
S X2 
n 1

10 Las demostraciones están fuera del alcance de este trabajo


PÁGINA 42 ESTADISTICA –C. Capriglioni
1. Introducción al Muestreo

la varianza muestral de dicha muestra.


Entonces el cociente entre
2
( n  1)  S
X 
2
Z y
 n 1
n
es el ESTADÍGRAFO DE TRANSFORMACIÓN para la media muestral de poblaciones infinitas
cuando no se conoce la varianza poblacional y en su lugar hay que utilizar una estimación de ella
X
t
S
n
Este estadígrafo tiene distribución t de Student con (n-1) grados de libertad por ser el
cociente entre una variable con distribución normal y la raíz cuadrada de una variable con distri-
bución ji-cuadrado dividida por sus correspondientes grados de libertad.
X
t  t(n-1)g.l.
S
n
Bajo condiciones especiales, si la población es finita, el estadígrafo el ESTADÍGRAFO DE
TRANSFORMACIÓN para la media muestral es
X
t
S Nn
n N1
y también tiene distribución t de Student con (n-1) grados de libertad
X
t  t(n-1)g.l.
S Nn
n N1
Esto significa que, para el cálculo de probabilidad, y para toda la tarea inferencial referida
a la media muestral, de muestras obtenidas de poblaciones normales, cuya varianza sea descono-
cida, hay que utilizar la distribución t de Student.

1.7. DISTRIBUCIÓN DE ALGUNOS ESTIMADORES. POBLA-


CIONES NO NORMALES.
1.7.1. DISTRIBUCIÓN DE LA MEDIA MUESTRAL DE POBLACIONES
NO NORMALES. MUESTRAS GRANDES.
Ya se ha estudiado que, por el Teorema Central del Límite (TCL), la variable estandariza-
da de la suma de n variables aleatorias independientes
n
 X i  n
Z  i1 (1)
 n
tiene distribución asintóticamente normal cuando la cantidad de sumandos tiende a infinito, cual-
quiera que sea la distribución de las variables que se suman.
ESTADISTICA – C. Capriglioni PÁGINA 43
1.Introducción al Muestreo

Sea
{ X1 ; X2 ; . . . ; X n }
una muestra de tamaño n.
y sea
n
 Xi
X i =1
n
la media muestral de dicha muestra.
Multiplicando y dividiendo, en (1) por n se obtiene un estadígrafo de transformación para
la media muestral.
X
Z

n
Cuando el tamaño de la muestra tiende a infinito, por aplicación del Teorema Central del
Límite, el estadígrafo de transformación tiende asintóticamente a la distribución Normal Estanda-
rizada.
X
n  Z  No(0;1)

n
Esto significa que, para el cálculo de probabilidad, y para toda la tarea inferencial referida
a la media muestral, de muestras obtenidas de poblaciones no Normales, hay que utilizar la distri-
bución Normal Estandarizada.
En este trabajo se considera que el tamaño de la muestra tiende a infinito cuando n > 30

Ejemplo 1.14
¿Cuál es la probabilidad de que la media de una muestra de tamaño 100 sea superior a 1238, si
proviene de una población con media 1194 y desvío típico 305?
SOLUCIÓN
No se conoce la distribución de la población, pero el tamaño de la muestra es suficientemente
grande (n>30), entonces, por aplicación del Teorema Central del Límite, el estadígrafo
X

n
tiene distribución asintóticamente Normal Estandarizada, cualquiera fuese la distribución de la
población, por lo tanto, el cálculo de probabilidad se realiza con la distribución normal.
 = 1194 ;  = 305 ; n = 100
P( X > 1238) = ¿...?

X   1238  1194
Z   1, 44
 305
n 100

PNo( X >1238 /  = 1194 ;  30,5) = PNo(Z > 1,44 / 0 ; 1) =
n
=1 - F(1,44) = 0,07493

PÁGINA 44 ESTADISTICA –C. Capriglioni


1. Introducción al Muestreo

La probabilidad de que la media de la muestra supere 1238 es de 0,07493.

1.7.2. DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL


Sea una muestra aleatoria de tamaño n, tomada de un universo infinito
{ X1 ; X2 ; ... ; Xn }
~
y una variable aleatoria, r , que representa la cantidad de elementos que sí poseen un determina-
do atributo, dentro de la muestra de tamaño n, y sea,
~r
p
n
la proporción de elementos con un determinado atributo en la muestra de tamaño n, entonces, si
el tamaño de la muestra es suficientemente grande, el ESTADÍGRAFO DE TRANSFORMACIÓN
para la proporción muestral de universos infinitos es
p
Z
  (1  )

n
y tiene distribución asintóticamente normal estandarizada, dado que la variable tiene distribu-
~
ción binomial con esperanza matemática E( r ) = n   y varianza V( ~r ) = n r   (1-) (11)
~
Si el universo es finito, bajo determinadas condiciones, el ESTADÍGRAFO DE TRANS-
FORMACIÓN para la proporción muestral de universos finitos es
p
Z
 (1  )  N  n 
 
n  N1 
y también tiene distribución asintóticamente normal estandarizada.
Esto significa que, para el cálculo de probabilidad, y para toda la tarea inferencial referida
a la proporción muestral, hay que utilizar la distribución Normal Estandarizada.

Ejemplo 1.14
Se sacó una muestra de tamaño 2500 de una población que tiene un 55% de elementos con un
determinado atributo. ¿Cuál es la probabilidad de que la proporción de la muestra sea inferior a
0,53?
SOLUCIÓN
~r : cantidad de elementos con un determinado atributo en una muestra de tamaño n, pro-
veniente de una población con proporción .
n = 2500 ;  = 0,55 ; (1  ) = 0,45
P( p < 0,53) = ¿...?

11 Ver Estadística – Tomo 1 C. Capriglioni.


ESTADISTICA – C. Capriglioni PÁGINA 45
1.Introducción al Muestreo

p 0,53  0,55


Z    2,01
 ( 1  ) 0,55 • 0, 45
n 2500
 ( 1  )
(
PNo p < 0,53 / = 0,55 ;
n
)
= 0,00995 = P(Z < -2,01)= F(-2,01) = 0,02222

La probabilidad de que la proporción de la muestra sea inferior a 0,53 es de 0,02222

Ejemplo 1.15
En una población de 8340 elementos hay 2919 que tienen cierto atributo. Se saca una muestra de
950 elementos. ¿Cuál es la probabilidad de que la proporción de elementos con atributo de la
muestra sea inferior a 0,33 ?
SOLUCIÓN
El tamaño de la población es conocido, por lo tanto se trata de una población finita.
 2919
N = 8340 ;  = 2919 ;   ; n = 950
N 8340
P( p <0,33) = ¿...?
La variable estandarizada es
p
Z
  (1 - )  N  n 
 
n  N1 

0,33  0,35
z   1,37
0,35  0,65 8340  95

950 8340  1

(
PNo p < 0,33 /  = 0,35 ;
1    N  n 

n  N1 
  0,0146 = )
= P(Z< -1,37) = F(-1,37) = 0,0853

La probabilidad de que la proporción de la muestra sea inferior al 33% es de 0,0853.

PÁGINA 46 ESTADISTICA –C. Capriglioni

S-ar putea să vă placă și