Sunteți pe pagina 1din 10

Estadstica Inferencial

ESTADISTICA INFERENCIAL
1. METODOS DE MUESTREO DE PROBABILIDAD
Hay dos tipos de muestro: muestreo probabilsticos y muestreo no probabilsticos.
1.1 MUESTREO PROBABILSTICO
Los mtodos de muestreo probabilstico son aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra. Slo
estos mtodos de muestreo probabilstico aseguran la representatividad de la muestra
extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de
probabilstico se encuentran los siguientes tipos:
MUESTREO ALEATORIO SIMPLE
El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de
la poblacin, y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas
de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador,
etc.) se eligen tantos sujetos como sea necesario para completar el tamao de muestra
requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando
la poblacin que se est manejando es muy grande.
MUESTREO ALEATORIO SISTEMTICO
Este procedimiento exige numerar todos los elementos de la poblacin, pero en lugar de
extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que
es un nmero elegido al azar, y los elementos que integran la muestra son los que
ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en
k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra:
k=N/n. El nmero i que se emplea como punto de partida ser un nmero al azar entre 1
y k.
El riesgo de este tipo de muestreo est en los casos en que se dan periodicidades en la
poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante
(k) se puede introducir una homogeneidad que no se da en la poblacin.
MUESTREO ALEATORIO ESTRATIFICADO
Trata de obviar las dificultades que presentan los anteriores, ya que simplifica los
procesos y suele reducir el error muestral para un tamao dado de la muestra. Consiste
1

Estadstica Inferencial
en considerar categoras tpicas diferentes entre s (estratos) que poseen gran
homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo,
segn la profesin, el gnero, el estado civil, etc.). Lo que se pretende con este tipo de
muestreo es asegurarse de que todos los estratos de inters estarn representados
adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los
elementos concretos que formarn parte de la muestra. En ocasiones, las dificultades
que plantea son demasiado grandes, pues exige un conocimiento detallado de la
poblacin (tamao geogrfico, sexos, edades...).
La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin,
y puede ser de diferentes tipos:
Afijacin simple: a cada estrato le corresponde igual nmero de elementos mustrales.
Afijacin proporcional: la distribucin se hace de acuerdo con el peso (tamao) de la
poblacin en cada estrato.
Afijacin ptima: se tiene en cuenta la previsible dispersin de los resultados, de modo
que se consideran la proporcin y la desviacin tpica.Tiene poca aplicacin ya que no
se suele conocer la desviacin.
Por ejemplo, se est interesado en estudiar el grado de aceptacin que la implantacin
de la reforma educativa ha tenido entre los padres de una zona. A tal efecto se seleccion
una muestra de 600 padres de familia. Se conoce por los datos del Ministerio de
Educacin que de los 10.000 nios escolarizados en la bsica, 7.000 acuden a colegios
pblicos y 3.000 a colegios privados. Como el inters es que en la muestra estn
representados todos los tipos de colegio, se realiza un muestreo estratificado empleando
como variable de estratificacin el tipo de colegio.
Si se emplea una afijacin simple seran 300 nios de cada tipo de centro, pero en este
caso parece ms razonable utilizar una afijacin proporcional pues hay bastante
diferencia en el tamao de los estratos. Por consiguiente, se calcula la proporcin para
cada uno de los estratos respecto de la poblacin, para poder reflejarlo en la muestra.
Colegios pblicos: 7.000/10.000 = 0.70
Colegios privados: 3.000/10.000 = 0.30

Estadstica Inferencial
Para conocer el tamao de cada estrato en la muestra se multiplica la proporcin por el
tamao muestral.
Colegios pblicos: 0.70x600 = 420 estudiantes
Colegios privados: 0.30x600 = 180 estudiantes
MUESTREO ALEATORIO POR CONGLOMERADOS
Los mtodos presentados hasta ahora estn pensados para seleccionar directamente
los elementos de la poblacin, es decir, que las unidades mustrales son los elementos
de la poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la poblacin que forman una unidad, a la que se denomina conglomerado.
Las unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc. son conglomerados naturales. En otras ocasiones, se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son reas geogrficas suele hablarse de "muestreo por reas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero
de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en
investigar despus todos los elementos pertenecientes a los conglomerados elegidos.
Por ejemplo, en una investigacin se trata de conocer el grado de satisfaccin laboral de
los empleados de una cadena de almacenes; se toma una muestra de 700 empleados.
Ante la dificultad de acceder individualmente a estos empleados, se decide hacer una
muestra por conglomerados. Sabiendo que el nmero de empleados por almacn es
aproximadamente de 35, los pasos a seguir seran:

Recoger un listado de todos los almacenes.

Asignar un nmero a cada uno de ellos.

Elegir por muestreo aleatorio simple o sistemtico los 20 almacenes (700/35 = 20)
que proporcionarn los 700 empleados que se necesitan.

1.2 MTODOS DE MUESTREO NO PROBABILSTICOS


A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente
costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no
sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra
extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma
3

Estadstica Inferencial
probabilidad de ser elegidos. En general, se selecciona a los sujetos siguiendo
determinados criterios procurando que la muestra sea representativa.
MUESTREO POR CUOTAS
Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base
de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms
"representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de
aleatoriedad de aqul. En este tipo de muestreo se fijan unas "cuotas" que consisten en
un nmero de individuos que renen determinadas condiciones, por ejemplo: 20
individuos de 25 a 40 aos, de sexo femenino y residentes en una misma ciudad. Una
vez determinada la cuota, se eligen los primeros que se encuentre que cumplan esas
caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin.
Por ejemplo, una universidad desea estudiar la incidencia de las drogas en la
adolescencia. Lo que debera hacer sera: conocer por los informes del Estado cules
son los centros educativos ms afectados por el problema, fijar un nmero de sujetos a
entrevistar, proporcional a cada uno de los estratos (cuotas) y, finalmente, dejar en
manos de los responsables del trabajo de campo a qu sujetos concretos se deber
entrevistar.
MUESTREO INTENCIONAL
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos.
Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto.
MUESTREO CASUAL O INCIDENTAL
Se trata de un proceso en el que el investigador selecciona directa e intencionadamente
los individuos de la poblacin. El caso ms frecuente de este procedimiento es el utilizar
como muestra los individuos a los que se tiene fcil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los
voluntarios.
BOLA DE NIEVE

Estadstica Inferencial
Se localiza a algunos individuos, los cuales conducen a otros, y stos a otros, y as hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se
hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos
de enfermos, egresados de una institucin, etc.
2 ELECCION DEL TAMAO DE LA MUESTRA
El tamao de la muestra, un tema que siempre preocupa, no tiene fcil solucin y va
estrechamente unido a la representatividad.
No existe un tamao ideal de la muestra. A efectos descriptivos, se considera una
muestra grande cuando n > 30. Una muestra debe ser lo suficientemente grande como
para ser representativa, pero el nmero de elementos necesarios para lograr la
representatividad vara de una investigacin a otra.
Cuanto ms homognea es una poblacin en las caractersticas objeto de estudio, ms
fcil resulta obtener muestras representativas sin necesidad de que sean grandes. Es
decir, el tamao de la muestra est en relacin directa con la desviacin tpica de las
puntuaciones en las caractersticas de la variable a investigar.
El tamao necesario de la muestra depende de tres factores:
1. El nivel de confianza deseado
2. El margen de error que el investigador est dispuesto a tolerar
3. La variabilidad de la poblacin que se estudia

Nivel de confianza: Es el porcentaje de confiabilidad con el cual se estima la verdadera


proporcin de xito. El nivel de confianza tiene relacin directa con el tamao de la
muestra, por lo tanto, se dir que a mayor nivel de confianza ms grande debe ser el
tamao de la muestra. Los niveles de confianza ms usados son 95% y 99%, pero se
puede usar cualquier otro. El nivel de confianza del 95% corresponde al valor de z=1.96,
el del 99% a z=2.55 (ver tabla de apndice D).
El margen de error lo designaremos con E. Si el error permitido es pequeo, se
necesitar una muestra grande. Si el error permitido es grande, se coger una muestra
ms pequea.

Estadstica Inferencial
El tercer factor est relacionado con la desviacin estndar poblacional. Si la poblacin
est muy dispersa, se requerir una muestra grande. Si la poblacin es homognea, se
requerir una poblacin pequea
La frmula que nos permitir hallar el tamao de la muestra para estimar la media
poblacional est dado por:
z
n

Donde:
n es el tamao de la muestra
z es el valor normal estndar que corresponde al tamao de la muestra

es una estimacin de la desviacin estndar de la poblacin


E es el mximo error permitido

EJEMPLO
Se quiere determinar el ingreso medio mensual de los trabajadores de un cantn. El error
al estimar la media debe ser inferior a $100 con un nivel de confianza de 95%. Por
estudios anteriores se sabe que la desviacin estndar es de $1000. De qu tamao
debe ser la muestra?
Como datos tenemos:
El valor de z para un nivel de confianza del %95 que es de z 1.96 (ver tabla de apndice
D), E 100 y 1000, al reemplazar en la frmula tenemos:

1.96 * $1000
2
n
(19.6) 384.16
$100

El valor se redondea a 384, es decir se necesita una muestra de 384 trabajadores.


Si quisiramos aumentar el nivel de confianza a 99% el valor de z sera z 2.58, y con
las dems condiciones anteriores el tamao de la muestra sera:

2.58 * $1000
2
n
(25.8) 665.64
$100

Estadstica Inferencial

El tamao de la muestra recomendada sera de 666.


El aumento de un nivel de confianza de 95% a 99%, ocasiona un aumento de 282
trabajadores. Esto podra incrementar enormemente el costo de la investigacin, tanto
en trminos de tiempo, como de dinero. Por lo tanto se tiene que ser muy cuidadoso al
seleccionar el nivel de confianza.
Otra frmula que nos permitir hallar el tamao de la muestra es:

K 2 Npq
e 2 ( N 1) K 2 pq

N = Tamao de la poblacin.
K = Constante que depende del nivel de confianza que asignemos.
p = Proporcin de individuos que poseen en la poblacin la caracterstica de estudio,
este dato es generalmente desconocido por lo que se usa p=0.5.
q = Proporcin de individuos que no poseen esa caracterstica, es decir q 1 p .
e = Lmite aceptable de error muestral, suele utilizarse un valor que vara entre el 1% y
9%, valor que queda a criterio del investigador.
n = tamao de la muestra
Por ejemplo, si en la investigacin se utiliza un nivel de confianza del 95 % con su valor
crtico K 1.96,

N 27, p q 0.5 y e 0.05 . Cul es el tamao de la muestra?.

3 PRUEBA DE HIPOTESIS DE UNA MUESTRA


Una prueba de hiptesis es una afirmacin o conjetura que se lanza sobre un parmetro
poblacional; su objetivo en un nivel de significancia o error es demostrar por medio de
resultados mustrales, si existe suficiente evidencia o no que apoye la hiptesis.
PASOS PARA UNA PRUEBA DE HIPOTESIS DE UNA MUESTRA
PASO 1. Plantear la hiptesis nula (Ho) y la hiptesis alternativa (H1)
La hiptesis nula (Ho) es una afirmacin acerca del valor de un parmetro poblacional.
La hiptesis alternativa (H1) es una afirmacin que se acepta si los datos mustrales
proporcionan evidencia suficiente de que la hiptesis nula es falsa.
EJEMPLO 1
1.1 El peso promedio de los artculos exportados es diferente a 20 kilos.
7

Estadstica Inferencial

H 0 : 20
H1 : 20
1.2 El tiempo promedio para atender a una persona en una cafetera es ms de 8
minutos.

H0 : 8
H1 : 8
PASO 2. Seleccionar el nivel de significancia
El nivel de significancia es la probabilidad de rechazar la hiptesis nula cuando es
verdadera. Se le denota mediante la letra griega , tambin es denominada como nivel
de riesgo; este trmino es ms adecuado, ya que se corre el riesgo de rechazar la
hiptesis nula, cuando en realidad es verdadera. Este nivel est bajo el control de la
persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin
indicar la probabilidad de no aceptarla, es decir, que est fuera de rea de aceptacin.
El nivel de confianza (1-) indica la probabilidad de aceptar la hiptesis planteada,
cuando es verdadera en la poblacin.
Tradicionalmente se selecciona el nivel 0.05 (5%) para proyectos de investigacin sobre
consumo, el nivel 0.01 (1%) para el aseguramiento de calidad, y el 0.10 (10%) para
encuestas polticas. El investigador es el que debe decidir qu nivel de significancia usar
antes de formular una regla de decisin y recopilar los datos mustrales.
PASO 3. Calcular el valor estadstico de prueba
Existen algunos estadsticos de prueba: La prueba F (Fisher), la prueba 2 (Ji cuadrada),
la prueba z y t. Nosotros utilizaremos las dos ltimas.
Si se conoce la desviacin estndar de la poblacin, el estadstico de prueba es la
distribucin normal estndar, y se determina a partir de:

X
/ n

Estadstica Inferencial
Si no se conoce la desviacin estndar de la poblacin , pero se tiene al menos 30
observaciones en la muestra, se sustituye s por . El estadstico de prueba es la
distribucin normal estndar, y se determina a partir de:

X
s/ n

Si no se conoce la desviacin estndar poblacional,

pero se tiene menos de 30

observaciones en la muestra, se sustituye s por . El estadstico de prueba es la


distribucin t, y se determina a partir de:

X
s/ n

PASO 4. Definir la regin de rechazo


Es necesario definir estadsticamente, y sujetos al nivel de significancia, el rea a partir
de qu valores vamos a aceptar la hiptesis nula y rechazar la hiptesis alternativa. Esto
es lo que se conoce como regin de rechazo. La regin de rechazo define la ubicacin
de todos los valores que son tan grandes o tan pequeos, que la probabilidad de que se
presenten bajo la suposicin de que la hiptesis nula es verdadera, es muy remota.

La figura muestra la regin de


rechazo slo en la cola derecha de
la distribucin normal.

La figura muestra la regin de


rechazo slo en la cola izquierda de
la distribucin normal.

Estadstica Inferencial
La figura muestra la regin de rechazo
en la cola izquierda y derecha de la
distribucin normal.

En resumen, una prueba es de una cola cuando la hiptesis alternativa indica una
direccin, por ejemplo:
H0: El ingreso medio de ejecutivos es de $65000 por ao
H1: El ingreso medio de ejecutivos es superior a $65000 por ao
Si no se especifica direccin en la hiptesis alternativa, la prueba sera de dos colas.
H0: El ingreso medio de ejecutivos es de $65000 por ao
H1: El ingreso medio de ejecutivos no es igual a $65000 por ao
Si se rechaza la hiptesis nula H0 , y se acepta la H1 , en el caso de dos colas, el ingreso
medio podra ser significativamente mayor que $65000 anuales o significativamente
menor que $65000 anuales.
PASO 5. Tomar una decisin
El quinto y ltimo paso en una prueba de hiptesis es comparar el valor estadstico
calculado con el valor crtico, y tomar la decisin de rechazar o no la hiptesis nula.
Si el estadstico calculado es mayor que el valor crtico entonces se rechaza la hiptesis
nula. Si el estadstico calculado es menor o igual que el valor crtico, hiptesis nula no
se rechaza..

10

S-ar putea să vă placă și