Documente Academic
Documente Profesional
Documente Cultură
Ejemplos:
Marque a qu categora de sueldo pertenece usted:
a. Menos de $300.000
b. $300.001 a $800.000
c. Ms de $800.000.
En qu grupo etreo se ubica el jefe de hogar:
a. Menos de 30 aos
b. Entre 30 y 45 aos
c. Entre 46 y 60 aos
d. Ms de 60 aos
Finalmente hay variables que se categorizan, es decir, los nmeros se
transforman en una clasificacin no numrica. Si se trata slo de dos
categoras, se dice que la variable se ha dicotomizado.
Grupo etreo del jefe de hogar: Joven (18-40), Adulto (41-59), Adulto
mayor (ms de 60).
Grupo de nivel socioeconmico: A, B, C. D. E.
Viven menores de edad en el domicilio? S (1 ms menores de edad),
No (0 menores de edad).
El sueldo per cpita es superior a $200.000? Si ($200.000 ms), No
(menos de $200.000).
Distribuciones de Probabilidad importantes:
Variable Aleatoria Discreta Importante:
Binomial:
Un experimento es cualquier situacin que genera diversos resultados.
Un experimento Bernoulli es un experimento dicotmico a cuyos resultados se
denomina xito y fracaso, para el cual las realizaciones son independientes (si
la muestra es aleatoria se asegura la independencia) y la probabilidad de xito
es constante (si la muestra es extraa de una poblacin o subpoblacin
homognea se asegura que la probabilidad de xito es igual para todos los
individuos). La probabilidad de xito se denota por p.
Una v.a. Binomial se puede definir como: nmero de xitos en n realizaciones
de un experimento Bernoulli. Se denota por X ~ b(n, p). El n de realizaciones
n es fijo.
Ejemplo:
Se encuesta a 100 personas extradas al azar (independientes) de la fuerza de
trabajo femenina de la ciudad de Concepcin (ser homogneo este grupo?),
para consultarles respecto una modificacin en la ley laboral (experimento),
que les afecta.
Poblacin: fuerza laboral femenina de la ciudad.
X: N de personas (de un total de 100 encuestadas) que estn a favor (xito)
de la modificacin. X ~ b(n=100, p), donde p es la proporcin real en la
poblacin de personas a favor de la modificacin.
Histograma: Grfico de barras verticales, que ubica en el eje horizontal los
valores de la variable en intervalos de tamao constante, y en el eje vertical la
frecuencia o el nmero de ocurrencias en cada intervalo (se puede reemplazar
la frecuencia por el porcentaje).
% de individuos
Ejemplo:
Edad
Probabilidad
Probabilidad
Exponencial:
Los valores bajos son altamente probables y las probabilidades decrecen
rpidamente para valores altos. Si se construye un histograma la figura es
semejante a la siguiente:
Probabilidad
Normal:
El histograma resulta simtrico (un lado corresponde al reflejo del otro, como
visto en un espejo) y unimodal (un solo valor mximo). Los valores centrales
son ms probables y las probabilidades decrecen rpidamente para valores
alejados del centro. Si se construye un histograma la figura es semejante a la
siguiente:
Verificacin de Modelos:
Para verificar si un modelo es binomial, se debe realizar un anlisis intelectual
del problema. Para verificar los modelos continuos en cambio, es conveniente
realizar la grfica del histograma.
Parmetros y Estimadores
Binomial:
El parmetro de inters es la proporcin poblacional p y el estimador es la
proporcin muestral p . El clculo de p requiere un clculo sobre toda la
poblacin, cuyo tamao es N: p =
homogneas, p = X
n
N xitos en la muestra
N realizacio nes
N xitos en la poblacin
N
. En poblaciones
Normal:
El parmetro de inters es la media poblacional o esperanza y el estimador
es la media muestral o promedio .
N
X
i =1
N
n
= X = i=1
(X
i =1
X) 2
tiene que = S =
2
(X
i =1
X) 2
n -1
Medidas:
Proporcin, media y varianza no son las nicas medidas que existen. Las
medidas, en general, se dividen en medidas de localizacin y variabilidad, y se
pueden clasificar del modo siguiente:
E(X) =
X
i =1
E( X i ) =
i=1
E(X )
i=1
n E(X).
Igual Distribucin
Varianza Poblacional:
N
V(X) =
(X
i =1
X) 2
media en la Poblacin.
El estadstico anlogo es la varianza muestral S2.
Propiedades:
Sea a, b constantes y X, X1, , Xn variables.
V(a) = 0,
V(a X) = a2 V(X),
V(a X + b) = a2 V(X),
V( X i )
i=1
V(X )
i=1
Independencia
n V(X).
Igual Distribucin
se ubica
es poco
Resultados Importantes:
Normal:
X N(, 2) E(X) = ; V(X) = 2.
n
E(X ) = E(
X
i=1
) = 1 E( X ) = 1 E(X ) =
n
n
i
n
i=1
i =1
X es estimador insesgado de E(X) = .
1
n E(X i ) = E(X) = .
n
n
1
1 n
V(X) 2
1
=
V
(
X
)
=
V(X
)
=
V(X
)
=
.
i
i
i
n
n
n
n2
n 2 i=1
n2
i =1
la varianza deX decrece a medida que el tamao de muestra crece.
E(S2) = V(X) = 2 S2 es estimador insesgado de V(X) = 2.
Binomial:
X b(n, p) E(X) = n p;
V(X) = n p (1- p).
1
X
1
E( p ) = E( ) = E(X) = n p = p.
n
n
n
p es estimador insesgado de p.
X
p (1 p)
1
1
V( p ) = V ( ) = 2 V (X) = 2 n p (1 p) =
.
n
n
n
n
la varianza de p decrece a medida que el tamao de muestra crece.
V(X ) =
V(
i=1
)=
Teorema de Chebyshev:
Para muestras de cualquier tamao (en particular pequeas), se tiene que,
V( )
.
independiente de la distribucin original: P(| - | B) 1
B2
Algunas consecuencias y observaciones importantes son las siguientes:
V(X)
Distrib. normal u otra continua: P(|X | 2 n ) 1
=.
4 V(X)
2 V(X)
V(p )
Distrib. binomial: P(|p p| 2 p (1 p) n ) 1
=.
4 V(p )
2 V(p )
Error de Estimacin e Intervalo de Confianza:
El error de estimacin es la diferencia absoluta entre el valor real y el valor
estimado de un parmetro E = | - |.
En el caso normal, corresponde a E = | - |.
En el caso binomial, corresponde a E = | p - p|.
Se denota por B al error mximo permitido y por (1 ) al nivel de confianza en
la estimacin. Esto se resume en la siguiente expresin:
P(| - | B) = 1 .
Esta expresin tambin es anloga a decir que, con un nivel de confianza (1- )
se tiene que el verdadero valor pertenece al Intervalo de Confianza
[ - B, + B].
El nivel de confianza quiere decir que, si se construyeran un gran nmero de
intervalos, cada uno basado en una muestra extrada al azar, el verdadero
valor del parmetro estara contenido en el porcentaje dado por 1 de ellos.
Ejercicios:
1) Considere el conjunto dado a continuacin y correspondiente a los sueldos
de los 50 empleados de una reparticin.
a. Calcule los valores poblacionales = E(X) y = V(X) .
b. Realice el histograma de los datos.
c. Obtenga 20 muestras de tamao 5.
i. Para cada una calcule X, S y el intervalo de confianza para .
ii. Vea a cuntos intervalos pertenece el valor real de .
iii. Realice el histograma de valores de X.
iv. Comente.
d. Obtenga 20 muestras de tamao 30.
i. Para cada una calcule X, S y el intervalo de confianza para .
ii. Vea a cuntos intervalos pertenece el valor real de .
iii. Realice el histograma de valores de X.
iv. Comente.
2) Considere el conjunto dado a continuacin y correspondiente a la postura
de los 50 empleados de una reparticin respecto de las nuevas polticas de
la empresa.
a. Calcule el valor poblacional p.
b. Realice el histograma de los datos (codifique como 1: a favor y
0: en contra).
c. Obtenga 20 muestras de tamao 5.
i. Para cada una calcule p y el intervalo de confianza para p.
ii. Vea a cuntos intervalos pertenece el valor real de p.
iii. Realice el histograma de valores de p .
iv. Comente.
d. Obtenga 20 muestras de tamao 30.
i. Para cada una calcule p y el intervalo de confianza para p.
ii. Vea a cuntos intervalos pertenece el valor real de p.
iii. Realice el histograma de valores de p .
iv. Comente.
279.000
279.000
287.000
290.000
297.000
298.000
319.000
320.000
323.000
332.000
340.000
343.000
346.000
352.000
353.000
356.000
367.000
386.000
391.000
412.000
414.000
423.000
430.000
440.000
451.000
459.000
477.000
490.000
510.000
530.000
546.000
557.000
570.000
580.000
605.000
649.000
684.000
699.000
716.000
740.000
Para utilizar estos intervalos, se debe ubicar en una columna de Excell los
lmites superiores de los intervalos: 200.000, 250.000, 300.000, etc. Llame a
esa columna Clases (columna C).
C
Clases
200.000
250.000
300.000
Etc.
Haciendo clic sobre las barras se marcarn las columnas fuente del grfico,
la idea es ubicarse con el Mouse sobre la columna destacada en morado,
presionar botn izquierdo del Mouse, y mover el cuadr morado a la columna
de los Intervalos:
g) Ahora presione otra vez las barras del grfico y mueva la columna azul a
la de porcentajes. Finalmente reduzca con el Mouse el largo de las
columnas de fuente de los datos:
Porcentaje
14%
12%
10%
8%
6%
4%
2%
0%
151-200
201-250
251-300
301-350
351-400
401-450
451-500
501-550
551-600
601-650
651-700
701-750
Intervalos de Sueldos
A
B
Sueldos
Probabilidades
156.000
0,02
173.000
0,02
178.000
0,02
A
B
Sueldos Probabilidades
156.000
0,02
173.000
0,02
178.000
0,02
215.000
0,02
218.000
0,02
C
Muestra 1
477000
414000
716000
386000
546000
D
Muestra 2
352000
279000
451000
319000
740000
En contra
A favor
En contra
A favor
A favor
En contra
En contra
A favor
En contra
En contra
En contra
En contra
En contra
A favor
A favor
En contra
A favor
A favor
En contra
En contra
En contra
En contra
En contra
A favor
En contra
En contra
En contra
En contra
En contra
En contra
A favor
En contra
A favor
En contra
En contra
En contra
En contra
A favor
En contra
En contra
Los desarrollos en este caso son muy semejantes a los del problema 1, pero
presentan algunas diferencias, en primer lugar, que es factible definir la
distribucin de probabilidad poblacional a ojo o con la funcin Contar.si (vea el
ejemplo) y luego dividiendo por 50 para calcular la probabilidad:
1
2
3
4
5
6
7
A
Postura
En contra
En contra
En contra
En contra
En contra
A favor
B
Resultados
A favor
En contra
Codificacin
1
0
C
Frecuencia
=CONTAR.SI(A2:A51;"A Favor")
Probabilidad
=C1/50
Tcnicas de Muestreo
Clase 3: Elementos del Problema de Muestreo
Tamao de la Muestra:
Cada elemento de la poblacin contiene una cierta cantidad de informacin
relativa a ella, a las variables en juego, a sus distribuciones y a sus parmetros;
sin embargo cada unidad muestreada implica un costo, lo que motiva la
determinacin del mnimo tamao muestral que permita el logro de los
objetivos de la estimacin (precisin y confianza deseadas), dada la
variabilidad (desviacin estndar del estimador) existente y el tamao de la
Poblacin.
De estos cuatro factores, dos son propios del problema y no se pueden alterar
(variabilidad, tamao de la poblacin), mientras que los otros dos son definidos
por el investigador (precisin y confianza).
El ideal es que se pueda contar con que las mediciones hayan sido realizadas
en forma exacta. En caso contrario, se habla de error de medicin. Este tipo
de error debe minimizarse.
Definiciones importantes:
Elemento: Objeto al cual se le pueden tomar (y eventualmente se le toman) las
mediciones.
Poblacin: Coleccin de elementos acerca de los cuales se desea realizar
inferencias.
Unidades de muestreo: Colecciones no traslapadas de elementos que cubren
la poblacin completa.
Marco muestral: Lista de unidades de muestreo.
Muestra: Una coleccin de unidades seleccionadas de uno o de varios marcos
muestrales.
Diseo del Muestreo:
El objetivo del muestreo es la estimacin de parmetros de la poblacin.
La estimacin se basa en la informacin muestral. La precisin de esta
estimacin es determinada por el investigador como el error mximo de
estimacin B.
E = | | B.
La probabilidad 1 de que la estimacin tenga un error que no supere a esta
cota se denomina nivel de confianza.
P( E B) = P(| | B) = 1 .
Como se vio anteriormente, si consideramos B = 2( ) y: