Documente Academic
Documente Profesional
Documente Cultură
, t
,
t
. '; .
,-,",
~
- ~'~
Manuel Vivanco
Muestreo Estadstico
. Diseo y Aplicaciones
Re" M a ~ritte
G ak (Jnde, 1953 (Fragmen to)
O leo sobre li,nw, SI " IOOcm
Hou,ton [I"",s), "'h e Menil C ollecno n
ndice
Introduccin
13
C ...rlTUI.O I
1.5.
1.6.
15
15
16
16
17
17
19
19
20
20
20
21
C APtnJI.O 2
Conceptos bsicos
2. 1. Glosario de diseo de muestras
2.2. G losa rio de inferen cia estadtsttca
C APITULO
23
ZJ
25
27
C Af1ru L.O 4
31
JI
31
33
34
34
34
35
35
4.2.
35
CAPiTU LO 5
CAJ'l"llJl.O
38
40
41
42
42
45
45
46
47
48
48
48
49
50
50
51
52
9
Notaci n y frmul as
9.1. Notacin general
9 .2 . N otaci n de m ed ias. Poblacin
9.3. Notaci n de proporciones. Poblacin
9.4 . Notacin de m edias. M ues tra
9 .5. Notacin de pr oporciones. Muestra
C APIT ULO
37
37
37
37
8.6.
55
55
56
57
58
59
59
59
59
60
60
61
62
62
CW[T ULO
10
1I
Muestreo estratificado
11.1 . Precisin de la esti m ac i n
11.2. Tamao de los estratos
1 1.3. Nmero de estratos
11 .4 . Seleccin aleatoria de elementos
11.5. Afijecn
11.6 . Not acin
1 1.6 . \. Pob laci n
11 .6 .2. Muest ra
11.7. T ipos de afijac n
11.7.1 . A fijocn igual
11 .7.2 . Atijacin proporcio nal
1 1.7.3 . Afijacin pti m a
CAPITU l. O 12
Mu estreo estrati ficado de medias
12 .1. Est im acin de la m edia
12 .1.1 . Med ia aritmtica
12.1. 2. Med ia aritm tica po nderada
62
65
65
66
67
68
68
69
69
70
71
71
71
72
74
76
76
77
79
81
82
82
82
83
83
84
85
86
88
88
89
89
93
93
93
94
95
96
97
97
97
97
l OO
10Z
102
IOZ
103
106
108
108
108
109
11Z
errur.o
lJ
restreo estratificado de proporciones
I J .l . Esti macin de la proporcin
13.2. Varianza gen rfca del esti mador de la proporcin
13.3. Tamao de la m uestra gen rico
13.4 . Atiject n p roporcional
IJ .4 . 1. Estimacin de la proporcin
13A.Z. Error tpico
13.4.3. Tamao de la muestra
13.4.4. Intervalo de confianza
13.5. Afijaci n ptima de var ianza
13 .5. l . Estimacin de la p roporci n
13.5 .2 . Error tpico
13.5 .3. Tamao de la muestra
lJ .s.4. Intervalo de confianza
13 .6 . Afijac n ptima de costo
13 .6 .1 . Estimacin de la proporcin
13 .6.2. Error t pico
13 .6.3 . Ta m ao de la m uestr a
13 .6 .4 . Intervalo de co nfianza
115
CAPITULO 15
. .
_
:-'luestr CO po r con glome rados sin sobrnues trco . D lst mto tamano
15.1. Estim acin de !J. m edia
15 .1.1. Error tpico
15.\ .2. Tamao de la muest ra
15. 1.3 . Int ervalo de co nfianza
15.2. Estimacin de la p ropo rcin
15.2.1. Errortipico
15 .2 .2. Inte rvalo deo con fianza
139
139
140
140
14 1
142
142
144
1-15
145
149
149
150
I SO
151
154
154
155
115
116
116
117
117
l iS
118
1ZI
I ZZ
I ZZ
I Z3
I Z3
126
128
I Z8
128
128
13Z
1TULO 14
est rco por conglome rado s sin sub m uesrreo. Igual tamao
14. 1. Selecci n de las unidades de muestreo
14.2. Pre cisin de la estimacin
14.3 . Congl omerados de igual tam ao
14.4. Notaci n
14.4 . 1. Notacin poblacin
14.4.2. Notacin muestra
\4.5 . Esurnacn de la media
14 .5 .1. Error tpico
14.5 .2 . Tama o de la m uestra
14 .5.3 . Intervalo de confianza
14.6 . Est im acin de la p roporcin
14 .G.l . Error tip ico
14 .6 .Z. Inter valo de confianza
C.. . rn1JLO 16
Muest ro p or conglomerados co n submucs t rco
16 .1. Est imacin de la m edia
16 .1.1. Error tpico
16 .1.2 . Tam ao de la m uestra
16 .1 .3 . Int ervalo de confianza
16 .2 . Estimacin de la proporcin
16 .2 .1. Error t pico
16 .2.2. Inte rvalo de confianza
. . .
16 .3 . Seleccin de u nidad es de muestreo e n r;'u est reo pol ietpico
16 .3 .1. COIli!;lo me rado de tamao granee
16 .3 .2. Co nglome rado de t amao peque o
CArhu LO 17
Otros dise o s proh abi\stkos
17.1. Muest reo siste mtico
17.2. Mu estreo pol ifsico
17.3 . Muestr eo con r pli cas
17.4 . Mu estr eo po r re as
150
162
16 2
163
163
166
166
166
169
170
170
171
171
173
174
174
135
136
C APITULO 18
138
139
177
177
177
178
x
I
CAPITuLO 20
D iseos no probahilist i..:os
20 . 1. Mu estreo por cuotas
2\ ).2. Muestreo cuasiproblbilstico
20 .2 . 1. Muestreo aleat orio po r cuotas
20.2.2. Mu est reo de rutas aleatorias
20.3 . Otros dise os no probabilsticos
20.3 . 1. Mu estreo enatico
20.3.2. Muestrto op in tico
181
182
183
183
184
187
187
190
190
190
19 1
191
19 1
C',f'11UI.O 2 1
Funciones de cost o
193
C""!TIJLO 22
Tasa de no respuesta
195
Comno 23
Efecto de d ise o
201
CAPITU l.O 24
Error absoluto y error relativo :
203
CAI'ITULO 25
Pond eracin y elevacin
2~ . 1. C oe ficiente d e pon deracin
2:::1 .2. Coeficiente d e el evacin
205
206
207
B IMIJOCltAFlA
209
w. E. D eming
Sorne Theory of Sarnplmg. New York: Dover; 1950 .
Introduccin
El p resent e te xto tiene dos orgenes. A saber, las lecciones sob re teora de muestr as
que me ha correspondido impa rtir durante los ltimos anos e n el Dep art amento
de Sociologa de la Universidad de Chile y, por otra parte, la practi ca en diseno de
mu estras consec ue ncia de asesoras real izadas a instituciones pblicas y privadas.
H a sido escrito con el propsito de satisfacer los inte reses de dist intos lectores.
En efecto, estudiantes que aspiren a una formacin rigurosa e n el mbito de
diseno de m uestr as y, srnult neamente, p rofesionales de las C ie ncias Humanas
que realice n investigacio nes empric as mediante e-ncuesta por m uest reo.
Como text o de estud io res ulta adecu ado en una asignatura de p rcgrado de
carc te r anual. Sin e mb argo, el igiendo los captulos pe rtinentes p uede ut ilizarse
en un cu rso de duracin semest ral. El uso del libro supone co noc imi entos de
estadstica b sica .
La teoria de muestras se sustenta en el clculo de probabilidades. Desd e una
perspectiva estric tamente teri ca, co noci mie ntos de lgebra y clculo infinitesimal
resulta n necesarios para comprender los fundam entos de la inferencia estadstica.
Sin obv iar las e xigencias tericas inherentes a la infe re nc ia, se ha enfatizado el
aspecto instru me ntal y ap licado de la t co r ta de m uestr as.
Este libro no se hab ra escrito sin la estimulante for m acin otorg ada por el
profesor Rafael Pro Bermejo dd Instituto de Estadistica e Investigacin Operativa
de la Universidad Compluten se de Madrid . Tampoco h ubie ra sido posible sin
un sabe r acumulado durante dcadas plasmado en el texto inic i tico d e Yates
(194 9) 'j los lib ros que nos nutrieron como est udiante Kish ( 1972), Coc hran
(1980) y Azorn Poch (1 9 72) .
Las habilid ades de M nica Gerber han sido relevantes para generar esta obra .
Supo descifrar f rmu las imposibles y escribirlas en fo rmato d igit al, y resol v los
problemas que ilustran cad a u na de las aplicaciones
El propsito de esta s p ginas es t em atizar los problemas centrales y sus
solucio nes. Si bien no es un texto ex ha ustivo trata los aspectos fundamentales
del diseo d e m uest ras segu n el desarr ollo a la fecha .
No es un ma nual ni una acum ulaci n sistem tica de rec et as. Facilita los conocim ientos para resolver e n una situ acin concre ta la seleccin de u na mu estra
rep resent ativa de la poblaci n obj eto de estudio.
C~pitulo
1:
Plan de ,m lisis. Est able ce r los procedim ientos de procesam iento esta dstico
de la infor ma cin.
El momento del m uestreo se caracteriza por decision es tc nicas, e ntre las que
cabe destacar las siguientes:
prvu dimierlto de seleccWn de e/eme7ltos. Se t rat a de elegi r entre las opciones
de muestreos probabilsticos y no probabilsticos.
Tmn..l rlo de la muestra. Bsicamente se tra ta de aplicar la frm ula co rrespondie nte seg n el procedimiento de seleccin elegido.
Nivel de amfianza y pmbabilLld de error: Se t rata de tom ar decisiones respecto
a la precis in de- las estimaciones.
Probabilidad de seleccin (le las unrlllrles de muestreo. Establ ece r si toda s las
unidade s tendrn la mi sma pro babilidad de ser elegidas o probabilid3des
distint as de seleccin . A sabe r, decid ir si el diseno ser autopondcradc o no
autopomkrado
1.2.3. Decisiones posteriores al muestreo
El momen to po steri or al m uest reo co nte m pla materias del siguie nte o rde n.
Coliicoc wy digitacilI. Princip alm e nt e cerrar pr egun t as abiertas y generar
un a base de datos,
Variabilizar:
Establecer definiciones no mi nal es )o' operacionales de los conce
ptos.
Poblaci/m. Definir cuales son los elementos
..
la que se realizaran infer encias
qu e componen la pob lacin de
Recogida de i ntormaaon
{
.. , 1. as a1tcrnauvas a e t
personal , postal o telefnc El , '.
l' I s e respecto son e ntrevista
co m putador.
a. registro (e os da tos pu ede ser con lpi z o
Arlb'rramiento a encuestadores. Hsicamente f il ,
.
aplicacin del instrum t J > :xf d. e I ami lanz~r a los entre vistadores
Encuesta piloto. Se eva lan f~lco J"d' md'd ' I~ y a estrat egia de seleccin de casos.
a 1 a e instrum en to de m d' J J
d
'
e I ( J , a tasa e
no respuesta s, la var ianza J I " tabl
t
.
.
l
e
as
liana
es
marcado
ras
j' la organz "" d 1
fa b aj o ue ca mpo.
rzacton e
COti la
l fi
17
rrl"gUl1t~ deI
lnv~ti~~ci~ I
'---r----l
I
0""
"i~,""'"I
Ma rco mu estral
Cuestionario
Di$C'oo muestra]
tamao .N corresponde a la
ApliucOn de
la encuesta
I
I
Plan de an;ilisis
Digiucin
I
Depuracin base de datosl--
Tratamiento> estadisticcs 1_
I
Proc('Samiento
computacional
~~I'J(in y elevaoon
y-
Proccd;~nit'ntos d-... no
r"i~..!~
I
I
Sald os
complIt:ociona!t'S
inves tigacin
Pregun ta de
I
Informe
I
I
co mbinacin[~'.
."
Cabe des taca r que el ter mino e rror e n di seno de muestras no siempre es
sinni mo de falla o deficienci a. Por ejemplo, el e rro r de muestr eo es in her en te a
la inferencia y gene ra la inevitabl e imprecisi n e n la est imacin.
En el mb ito de e rro res sistemticos o ajenos al muestree cabe disti nguir
Jos fuentes de error. A sabe r, errore-s po r no observacin y errores de m ed icin .
En ambos casos la m uestra es con formada lesion an do la e xigencia de rep resen rat vldad.
La representat tvdad es una propiedad qu e debe carac te rizar a toda m uest ra. Se
trata de una cualid ad de las m uestras qu e permite reproducir a esca la los atributos de la poblacin y, en cons ecuencia. perm ite inferir a la poblacin ori gen
de la muestra .
No existe una definicin formal de q ue es 10 qu e se entiende por represt'n
tativdad y tampoco se pu ede establ ece r con exact itud cuando una muestra es
represen tat iva y en que mome nt o J eja de serlo.
La prctica e nse a qu e es m uy dificil q ue u na m uest ra reproduzca exactamente los atributos de la pobla cin . En gene ral, se asume que la m uestra es
Los orgenes de la encu est a po r muestreo se remontan a las inves tigacio nes
empricas reali zadas en el siglo XIX en el contexto de las m on ografas soc iales
medi ant e enc uesta realizada.. por precursores com o Charles Booth y Sidney
\ Vebb. Existen antecedentes remotos de es tudios mediante en cue- ra. sin embargo son ajenos al m odo en que est os se realizan e n la act ualidad . Ntese q ue
los trabajos ernpiricos realtzados e n Ingla t err a a fines del siglo XIX coincide n
temporalm ente co n los desa rrollos estadsticos im plem e ntados por Galton,
Pea rso n y Spearm an.
Cabe des tac ar q ue el Instituto Internacional de Estadistica e n la reunin de
Berln en 1903 m anifest su apoyo a los desarrollos incipientes de lo q ue llam
mtodo represe ntativo. Sin embargo, slo e n la re unin de Roma en 1926 se
elabo ra un inform e en que se reconocen las ventaj as de la infe rencia estadstica
como procedimiento para la estimacin de pa rmetros poblaconales.
El uso de encuestas por m uest reo se populari za e n las primer as dcadas del
siglo xx a part ir de los estudios de intenci n de voto real izados en Estados Unidos
por age ndas e..pccat zada s e n est udios de opinin . Ca be m e ncio nar a George
Ga llup, Elm o Roper y Archi vald Crosslcy
El inicio de los procedimientos modernos de selec cin de elementos y estim acin de par m etros es el art culo publicado po r .lcr zy N eyman ( 19~4) en la
revista de la n aya l Statstica Suci!'/}' de Londres con el titu lo O tt '/l O Different
Aspl'Cts 01 the Represer uatve A,fetllOds. En este articulo Neyman fu ndament a qu e
la seleccin aleat oria es la ha:..e para formular u na teo ra cie ntfica que permite la
inferencia de datos muestrales a valo res poblaconales En particu lar, demuestra
que es pos ible co noce r la precisin en la est imac in de valores poblacic nales a
part ir de datos de la m uestra.
20
21
Captu lo 2
24
25
~ilJel de con~nza [1-0). El ni vel de confianza expresa en trm inos de probabll,ldad q.ue e! inter valo de confi anz a incluir el parmetro poblacional.
} robdb7.lI~ad de error (n). Cor responde a la prob ab ilidad que el inte rvalo de
co nfian za no incluya el valor del parmetro poblacic na].
C::oefuiente de cQlljWnza. Valor en la abe isa de la curva norm a! estandarizad ...
asoc iado a un determinado nive] de confian1.a.
Captulo 3
1.3 disti ncin fun dame ntal en re laci n con los procedimientos u tilizados pa ra
selecciona r muestras dc e relaci n con la probabilidad de selecc ionar a los el, 'mentos q ue constituirn la muestra. As, se dist ingue entre muestr eo pr obabilstico,
no prob ebtltstco y cuasi prcbebtlsuco,
Los m uestreos probabils ticos son estrategias de selecc in de ele mentos q ue
se suste ntan e n el principio de selecci n aleatoria . En la prct ica esto signi fica qu~'
todos los elem en tos de la poblacin tienen un a probabilidad co nocida y distin ta
de O de pe rte nece r a la muestra. La aleato riedad no es a tribu to de un a muestra,
sino del proceso de se leccin utilizado.
Exist en diversos proced imi entos de m ues treo probabilistico. Las diferencias
tienen q ue ver con el mojo en q ue se seleccionan los e lementos y co n la precisin de las est im aciones. N tese qu e un d iseo muestral pu ede incluir mas de
un procedim ien to de seleccin de ele me ntos.
Los muestr eos probabilsti cos de uso co m n se rese an bre veme nte a continuacin.
MW'srreoA leatotio Simple (MAS) . Proced imien to de m uestreo bsico y fundame nt o de otras est rategias de seleccin de m uestra . Se carac teriza porq ue la
selecc in se rea liza de un list ado de la po blacin asign ndole igu al proba bilidad
a cada elemento, Adems cada muestra de tamao n tien e igual probabilidad de
ser seleccionada. Es el prototi po del muestreo equprobable y autopond erado
Se di st ingu e entre MAS sin reposicin y co n repo sici n. M uestr eo sin reposicin porque una vez seleccionado un elem ento no se puede selecc ion ar
. nuevam ente. Muestreo con reposici n porque un elem ento selecc ionado puede
ser selecc ionado posteriormente.
Normalm ente M' usa MAS sin reposici n Las frmul as so n rn s sencillas y
en la prctica los res ultados no difieren . En efecto, ambas alte rn ativas producen
resultados casi iguales cuando la muestra es un a fracc in pe q uea del ta ma o
de la poblacin.
En la b ibliogra fia se utiliza n distintas denominaciones: muestreo rrestnctamcnte aleato rio, muestr eo equtprobabilistico y, lt im ame nte, diseo muestra]
simple como opuesto a d iseo mcestral com plejo.
M uestreo Sistem tico (MS) . Se trata de una variante del ~IAS. El propsito es
facilitar la selecci n de element os cu ando la poblacin es un list ado de mo chos
casos y la seleccin se realiza mediante tabla de n m er os ale ato rios. En este
27
28
"
,.._.
Captu lo 4
Los esteds ncos m uestrales son valores q ue nos perm ite n esti m ar los par metros
pcbbcionales. Se tr ata de valores calculad os en la m uestra q ue operan corn o rcfe re:lcia em prica del valo r desco nocido co rrespond iente a la poblacin.
En virt ud de la fun ci n q ue cumpl en, los estadsticos maestrales son conocidos
como estimadores. En principio pueden obtenerse infinitos valores para est imar un
parmetro p obleco n al.As t, por ejem plo, para estima r la m echa de una poblacin se
pued en usar divers as combinacio nes d e valo res de una m uestra. Sin e mb argo, para
cada parmetro poblacicnal existir un estadstico rnuestral q ue es su mejor estimado r.
Ntese que un estim ador es un suceso aleatorio q ue asume diversos valores co n
proba bilidad~s distintas. En efec to, en C.I..:L muestra de tama o n ex tra ida de una
poblacin de tam ao N, d estim ado r asum id un valor di fe rente, En co nsecuencia,
un estim ad or vara en form a aleator ia en to rno al parmetro po blc co n al. As, por
e jemplo, la m edia mu estral de cada una de las m uestras se ap ro xima en d istinto
grado al valor pa rmetro poblacional.
31
E(')
="
E (P) = a
E (P) =
(4. 1)
=
(f"]
q.,;-
(4.4)
~ di",)
t,
=-'- E(i:XJ
TI
.~ I
=![ exJ]
TI
.~,
E
(4.2)
eaJ = Na
L ~=
(4.5 )
... 1
E (P ) : -l
eO
'
TI i ~1
(4 .6)
ti
32
33
qu e la media 'f la pro porcin muest ra] son est im ado res consi stentes de los respect fvcs p ar m eu 'J S poblaconales. Ambos esta dsticos so n consiste ntes en virtud
de 1.... ley de los gra nd es n me ros.
Se puede formalizar la propiedad de consiste ncia de la m edia (x) est im ado r
de un parmetr o (~) en los siguien tes trminos.
P (Ix-
~l
(4. 7)
La p robabilidad que la di fe renci a entre la m ed ia m uestra! y el parm etro pobl acio nal sea m ayor que un nm ero cualqucra j; tie nde a O c uando el tamao de
la muestra tiende al tamao de la poblacin .
fj (lb = var (e )
var (e )
(48)
Para verificar la eficien cia rela tiva se comparan las varianzas de dos est im adores.
As, po r eje m plo, los estimadores e J y el con varianzas 2 y 4, respect ivame nte,
permiten la siguiente conclusin a este respecto.
(4.9)
Se d.:=duce que para el mism o ta ma o de m ues tra la eficcnca relativa de
respecto a e l es <\(.,150%. Es dec ir, el es la m itad de efictentc.
el con
rita d uda r del valo r teri co. En la disyuntiva de dferenca ent re el valor terico
y el valor emprico se duda del valo r terico. Los valores te ricos se su pon en
ve rdaderos slo si son refre nd ados po r da tos empricos. El estimado r mximo
verosmil sera aq uel q ue hace m xima la probabi lidad de coincidencia entre el
p arm etro poblaciona! y el estadstico muest ra\.
El carcte r poco intuitivo del procedimiento mximo ve rosm il im pone
ilustrar su lgica me diante un ejem plo sencillo que el uda las operaci ones ma temticas.
Supngase qu e el propsito de la Invesrigactn es estima r el C I. promedio
e n la poblacin de est udiantes de una Facultad. Para estos efect os se obtiene una
muestra de 60 estudi antes calcul ndose u n valor muestra! promedio de 115.
Ntese qu e si la selecci n es aleatoria las muestras ms sim ilares a la distribu ci n de CI. e n la poblacin t ienen ma yor prob abilidad de ser elegid as. Enfrentado
a la disyuntiva de decidir si la media poblaccnal es 100 115 130 , el investigador puede argumen tar q ue lo m s verosmil es que el prom edio sea 115.
En efecto, el pcrruetro poblacional mas pro bable o ve rosm il es 115 si el azar
ha facilita do q ue e n la m uestr a se reproduzca la di stribucin de C l. e xiste nte
e n la poblacin.
.
Se demuestra qu e la media y la proporcin son estim adores m ximos verosm iles. El procedimiento de m xima ve rosimi litu d perm ite ob te ne r est ima dores
co nsistentes, eficient es y suficien tes. No necesariamente in sesgados.
Capitu lo 5
El concep to d e dist rib ucin d ice relacin co n los distintos valores que asume una
variable y la frec uencia o probabilidad que corresponde a cada valor.
Cabe distinguir distri bucin de una variab le e n la poblacin, d ist ribucin de
una variab le e n la muest ra y distribucin maestral de un est adstico.
5. L Distribucin de la med ia
5.1.1. DisrribucWlI e11 la poblaci n
La distribucin de una variable en la poblaci n se obtie ne m idie ndo cada elemento y estab leciendo para cada valor una frecuencia de ocurre ncia . Mediante
este procedimiento se puede establece r para la variable m edida una funcin
de distribucin . La funcin de distribucin se caracte rizar por los valores que
asume la variab le y la frecue ncia asociad a a cada uno de ellos.
En general las medi das realizadas en la poblacin se identifican con letras griegas
Si se tra ta de m edir la m edia dela poblacin la nom encla tu ra es la siguiente.
N ;::: Tam ao de la poblacin
J.l ;::: Media de la poblaci n
o ! = Varian za de la poblacin
Tama o de la mu estra
Medi a de la muestra
Va rianza de la m uest ra
37
Tabla l.
Media~
j.
VJlorde :r
Probabilidad de x
1,0
1
25
1,S
2
25
2,0
2S
2,5
Poblacin
3,0
5
25
3.5
4
25
I
muestra 1
[::J I
muestra 2
==:J
muestra h
C:"'",
2S
x,
X,
de medias
4,5
2
2S
5,0
1
25
4,0
X,
25
P(')~------------,
"
1,0
1,5
2.0 2,5
3,0
3,5
4,0
4.5
5,0
;*)
N(lt
p_
Total d~_~
~_ = ~ _
- N m ero de observaciones
N
(5. 1)
(5.2)
A = }:ai
(53)
La proporcin y la media m iden lo m ismo y tie nen la misma es truc tura algebraica.
En efect o, la pro porci n y la m edia son sum ato rios de los valores q ue asumen
las observaciones d iv.id idcs po r el total de observaciones.
0 + 0 +1 + 1 + 0
Variable dicotmica
con valores a,
40
41
....... '"
n
p
0.246
0,205
0,111
0/)44
0.010
o.en
0,00
0:0 1,0 2.0 J,O ~,O 5.0 6,0 1.0 8,0 9,0 10.0
Nmtro<J""",
El senti do co m n indica q ue si se lanza 100 veces la moneda al aire [a p robabilidad de obtener 50 ca ras ser u n valo r pr ximo a 0,5 . Na turalmen te q ue
si se re3\iza el experimento 1.000 veces la pr ob abtldad de 50 0 caras sera un
nU' mero an ms cercano a O,S.
. En ambos cases e l histograma de- la distribu ci n
de prob abilid"des te ndr la for ma de la curva de Ge uss.
No slo se evidencia empricamen te que las proporciones son una variable
aleatori3 qu e se distribuye s egn la ley 1\On n 31. Se d emuestra que como COIIsecuen cia de la co nvergencia de- ley bi no mial a la ley no rm al las pro po rciones
muestrah~s bajo ciertas condiciones se d istribuyen form ando una curva en forma
de camp ana.
La dist ribuci n muestra! de proporciones muestrales se define co nociendo el
valor del parme tro poblaciona l n y la des viaci n tpic a de la dist ribu cin rnuc stral
de pr oporcio nes - crro r estndar o error tpico- que asume el valo rV" (l - n).
n
N(Jt; y "i!-
(l n-
~ ).
Capitulo 6
El int ervalo de co nfianza ha rec ib ido varios nombres evidenciando la nom enclatura eq uivoc a aun presente en teora de m uestras. Las dist intas denomin ac io nes
ut ilizadas a este respecto com o e n rela cin a otros aspectos revela la relati va inmadu rez del saber acu m ulado e n di seo de muestras. Cuesti n qu e dice relacin
con un desarrollo intenso en un perodo breve.
El intervalo de confianza ha sido llamado error rnucstral o error de muestreo
cuando m ayoritariamente se denomina error m uestra! a la difer encia entre el
estimador y el pa r met ro. Confusin grave po rqu e el int er valo de confi anza es un
valor conocido y el er ror muestra ] es una magnitud que no se con oce. Tambi n
ha sido denominado como e rror de estim acin y error de precisi n. N"ltese que
esta ltima denominacin result a lgica en el sentido que el rango de amplitud
del intervalo esta relacionada con div erso s grados de precisin .
(6. 1)
e Ka,
45
.la am plitud del int ervalo y e l er ror tpico {l que mide la variabilidad de la dis.
tribucin muestra! del estad stico c .
~
."
Coeficiente de C(ltI6an13
1,64
'"
1,96
95,5%
99,7%
2,58
I
-3" -i"I
I
'H
95,S ~.
"1
3t
9~.1 ""
Probabilidad comprendida
~~in normal
en d intervalo
,lo
0,683
:1: 2 0
0,955
0,997
--1
"
1,0
95,5
99,7
10.000
0,1%
O,O~ %
0,045%
0,01%
0,003%
Coeficiente de confiao'lJ
1,64
1,96
2,58
El error m x im o admisible es una decisin del invest igador. Se puede leer de dos
modos distintos segun se estime la pro porcin o la m edia poblacional . Cuando
se estim a la proporcin el error mxi m o admisible asume valores entre Oy l . En
consecuencia, ste se puede leer en trminos de po rce nt aje de error asociado a la
estimacin. Sin emb argo, cu ando se estima la m edia poblaciona l el valor del error
mximo admisible de pe nde de la unidad de m edida de la variable en estudio
Asi, por ejemplo, si la variable a estimar es el peso de una poblacin este po d r
ser 5 kilos y si la variable es ingreso el e rro r m x imo admisible ser en decenas
de miles de unidades.
En principio resulta lgico elegi r el minimo de e rro r asoc iado a la estimacin.
Por q u no se hace siempre de este modo? Po rque el error m ximo ad m isible
est asociado al t am ao de la muestra.
La Figura p resent ada a continuacin perm ite cuanti ficar la relac in entre
error en la estimacin y el tamao de la muestra. Se asume que la estimacin se
realiza con 95,5% de confianza correspondiente a 2 o ,
Se verifica en la Tabla que errores grandes se asocian a muestras pequeas
y a errores pequeos le corresponden muestras grandes. Po r ejemplo, un error
de 5% requiere una m uest ra de 400 casos y un error l % exige 1.000 casos. En
consecuencia, para u n e rror cinco veces menor se requiere de 9 .60 0 casos ms
o una muestra 25 veces ms grande.
Los tamaos de er ror utilizados habitualmente son en torno a 3%. Ntese,
sin embargo, que un unidad porcentual de dife rencia en el error genera diferen cias im portantes en el tamao de la muestra . Por ejemplo, un error de 2% est
asociado a 2.500 casos y un error de 3% a l l l casos.
4R
49
2,0
2,5
], 0
4,0
22.500
95,5
2500
99,7
5.627
95,5
99,7
3.600
95,5
99,7
1.600
1.111
2500
95,5
625
99,7
1.406
(%J
0,1
1,000 (00
05
40,(0)
1,0
10.000
1,5
4A4 ~
2,0
2,500
Error tipico
25
1.600
de 11 media
J ,O
l.lll
J5
816
, ,O
625
5,0
400
En virtud del nexo entre tamao del error y tama o de la muestra la dec isin
respecto al e rror m ximo admisible est ar condicionada por la cantidad de recursos disp onibles.
Pcblacin inlinita
~
-
'
Poblacin tilUU
_y'!'-
N -n
n N _1
0. -
Pobbn
lini!,)
&ror upk c
En la literatura SI" usa indisti nta me nte error tpico y e rror estndar para de signar
la desviaci n t pica de la distribu cin m uest ra] del est adst ico El error tip ico es
una medida de disp ersin . Mide la variaci n de l es tadst ico muestra]. La variacin
de l estadstico rnucs tral se explica por las fluctu aciones del muestreo.
La m uest ra selecc io nada es slo una de las posibles muestras q ue se pueden
obtene r de la poblac in . En cada una de las muestras pos ibles se- po dra calcu lar
un estadstico para esti ma r el pa rmetro poblacio nal. En consecuencia, cada
m uestr a extraida darla lugar a un valo r pa ra la m edi a o la proporcin. En este
co ntexto el es tad stico es una va riable aleator ia q ue p uede asumir t antos valores
distintos como el n mero de m uestras pu eden extraerse de la poblacin .
Las m ed ias y proporciones m ucstrales - u ot ro est adstic o- p rese nt an una
dis persin que es descon ocida . En rigor, para conocer la disper sin del estadstico
se ria necesario e xtraer todas las m uestras po sibles de la pobl acin y calcula r la
varianz a de la distribu ci n de estad sticos.
6.5.3 . 1. ERROII. r usco
El valo r del error tpico no es posi ble de calcularse po rque ~unca se extraen
uest ras posibles y porque no se cono ce el valor del param etro a estimar.
~ 1a 'm
- entre error upr
." co teonco
. - y e rnpmco.
..
onte xto cabe d-st in guir
En este e
Tabla 7. Error tpico terico de distribucin de medias
m: LA
MEDIA
El er ror t p ico es !:J. raz cuad rada de la varianza de la d ist ribuci n muestrul de
m edias.
La varianza de las medias rnuestrales respecto al par metro poblaconel se
calcula promediando las k diferencias, medidas com o dferenctas de cuadrados,
e nt re las medras rnue st rales y el pa rmetro po blaconal.
de 1.1 meda
DE PROPORCIOSES
Poblacin finitl
nJN - n
Error tpico
N- l
de la proporcin
de 11 propo rcin
d~
proporciones
de el~ment()~ de la muestra
(6.2)
{X - l,96 ~ ;x+
~l
(63)
1,96 ..
Valor de p x q C%)
10/90
30/70
50/50
200
4,3
6,5
7,1
500
2,7
4,1
4,5
1.000
1,9
2,9
3,2
2.000
1,3
2,0
2,2
3.000
1,1
1,7
1,8
4.000
1,0
1,4
1,6
1000:1
0,6
1,0
1,0
cota inferior:
El valo r del in tervalo de confianza genrico es fund am en talm ente terico. Para
hacerlo operativo es necesari o asum ir info rm ac in complementaria. Asumiendo
distribucin normal de las medias maestrales despu s de operar algebraicamen te,
52
53
(6.1)
...-- '"
Capitulo 7
la inje rencia
de
La descom po sicin del e rror en sus compo nentes pe rm itir dar luz respecto a los
condicionantes de la precisin en la estimacin del pa r metro poblacional
PobIa.ci6n ob",,vo
l-:
,0
no muc; !,.1
I\>bl,.-in ~""'t.
f.rro< touI
D;"triboc in munu.l
--
cuad a operacionalizaci n de la poblacin obj etivo. No siempre es fcil definjos elementos q ue componen la poblacin objetivo. As, po r ejemplo, siendo la
poblaci n de cesantes el uni verso a estudia r ste puede ser entendido de distintOS modos. Se pueden co nsiderar cesa ntes a quienes no h an tra bajado el l timo
mes o tambin se incluy e :1 quienes t ienen trabajo informal o s610 se con sideran
cesante s a qui en es no tien en y no buscan trabajo.
Di fic ultades que in ciden am plian do el sesgo so n el c arcter din mico de la
poblacin objetivo donde suelen ingresa r y egresar nue vos elementos pe rmanentemente. Po r ejem plo, la poblacin de cesantes. Una tasa de no respuesta elevada
puede ser fuente de sesgo no muestra]. Ntese que si la no respuesta es aleatoria
no es una fuente de sesgo, sin embargo, no rmalmente se genera respecto a algunas
pregu ntas especficas e n un gru po identificable de la muestra .
Los error es q ue se p roducen en la manipulaci n de los instrumen tos de
medida son Fuente de sesgo que aument a proporcional mente al t amao de la
muestra . La codific aci n y dg ttacn de la in forma cin son proc esos mec nicos
que por acumulacin dan lugar ine vitablem ente a e rro r.
f-
lOrro,PO' u,"n
dc l. m u,. t..
Muo"""
El sesgo rnu cstr al es un com po nente de e rro r form ado por la d iferencia entre el
valor del estadstico y el valo r esperado del parmet ro pobl acio nal.
La esp eranza matemtica de la m edi a corresponde al valo r promedio de todas
las medias ex t radas en m ues tras de tama o 11 en una poblacin de tam a o N.
El valor de la esperanz a ma tem t ica de la media mue str a] es el valor de la media
poblaconal si la muestra no es sesgada .
Error po r S(:sgo rnuestr al
x::=
::= i
E()
Media de la m uest ra
lo: (x)
::=
Los componentes q ue part icipan en la generaci n del sesgo muestra! son sesgo
por seleccin y S5g 0 por estimacin .
El sesgo po r selecc in R' produce cuando no ex iste igu.il probabili dad de
seleccin para todos los elem entos de la poblacin. Para ev it ar la gene raci n de
sesgo se utilizan procedim ient os de ponderacin. Se han desarrollado di versos
modos de po nd erar, a fin de compen sar la scbrerr epre scntuc t n y sub re pre se ntac n de e le mentos ge ne rada po r la probabil id ad desigual de seleccin de
elementos de la poblac in .
El sesgo por esti m aci n se genera cuando se utiliza un estimador inapropiado
pa ra estimar el pa rmetro poblaconal . En particular, cuando el valor d o' la esperanza matem tica del estadstico es d isti nt o al valo r del pa r.imct ro poblacional.
56
57
::=
X.
::=
Capitu lo 8
Tamao de la m uestra
8. 1. 1. Recursos econmicos
Respecto a la incidencia de los recursos ame rita se alar que el costo de cada uni dad de m uestreo pu ede ser incl uido como infor m aci n en el clc ulo del tam ao
de la m uestra. En efect o, distin tas funcio nes de costo se h an desarrollado con el
propsito de considera r la variable econmica e n el t ama o de la muestra. Las
funciones de costo su ele n se r muy espec ficas en los gastos y ser poc o apl icables
en casos concret os 0 , por el co ntrario, inclu ir iternes de gastos muy generales
y aportar poca informacin para e l clculo del t am ao de la muestra en una
situ aci n con creta .
confianza co nst ante 95,5% y varianza co nsta nte, un a mu estra asocia da a un error
del 2% necesita 2.500 casos pa ra infe rir a la poblaci n. Bajo los mismos su puestos,
una m uestra con un error de 1% req uiere de 10.(X)() casos y una muestra asoc iada
a un erro r de 0 ,5 % necesita de 40 .00 0 observaciones. Se eviden cia q ue se nece sitan mu estra" sust antivamcnte ma yo res para un nivel de con fianz a co nstante
y el mismo procedimiento de seleccin de c asos. Para ilustrar est a cues tin se
presenta la cu rva q ue relaciona tama o de muestra y porce nt aje de er ro r.
El ta ma o de la muestra es p articul arm ente sensible a la het erogeneidad de la pobl acln . El sentido comn inJica que en pob laciones het ero gn eas se requi ere de
ma yor nmero de caso s para e st ima r el parmetro poblacion al que e n poblaciones
co n valores homogneos. La di sp ersin se mide co n la var ianza, lo que perm ite
concluir que poblaciones co n var ianzas grandes requ ieren muestr as mayores que
pobla cio nes con var ian zas peque as para inferen cias co n igual precisin.
Contr a lo q ue su giere el sent ido com n, el tamao de la m uestra no se ve susuntivam ente influenciado por el tamao de la poblacin or igen de la muestra.
No ex iste un aumento de la muestra proporcional al aum ento del tamao de la
poblacin. En poblaciones grandes - sup eriores a 100.000 casos- la influ encia
del tamao de la poblacin es nfima e n el clculo del ta mao de la muestra. Sin
embargo en poblacio nes de tamao medio la influencia es moderada y en poblacionrs pequeas -nfencres a 5.000- el t ama o de la muestra se ve influenciado
por el tamao de la poblacin . En poblaciones peque as es necesario m uest rear
a una parte importan te de la poblacin para obtener la pr ecisin dese ada. Normalrrwnte es preferible realizar un censo de la po b laci n.
A modo de ejem plo, pard po blaciones con 100.000 y 10.000 .000 de casos
una m uestra de 1.100 un idad es pe rm ite infer encias con precisin sat isfacto ria.
Se demuestra que la relacin de n co n N da lu gar a un a curva q ue p'lS..! por
el o rigen y tien e una asnto ta par alel a al eje de abscisas. La curva e vide ncia que
a part ir de cierto valor de n increme nto s de N no inciden e n e l tamao de n . El
Grfico 8 figura la re laci n de JI con N.
..
'--
-------------- - - --------
'.1 _
2uguW
l.O - . - 1.~
l oO
::
---4,----------- ,
t-------------~ -----------------------------__-
-- -
~~-+-4) .000
10 .00J
60
61
8.6, Decision es subjet ivas e n clc ulo del tam ao muest ra!
El calc u lo del tamao de la muestra involucra aspectos tcnicos y subje tivos.
Los aspectos t cnicos dicen rela cin con el procedimient o de sele cci n y, por
ex te nsi n , con la viabilidad de acceder a las unidade s de muestreo segun cos tos
y cro nograma. Los aspectos subjetivos tie nen q ue ver con o pciones decid idas
segun c rit er io del mucstrista .
En e l mbito de decisio nes del muest rista cabe dest acar el nivel de co nfianz a
asoc ad o a la estimacin y el e rror m ximo admi sible. Los valores qu e asuman
incid ir n e n el tam ao de la muestra.
Res p e cto al nivd de con fianza exi ste la pra ctica convencional de asumir co rno
valores a propiados 95 % y 99% de conhanva. En relacin con el error m xim o adnusible se utilizan valores en torno a 3% de error. El suste nt o es ms uso consuetndinario qu e razones sustantivas. De hecho, en ciertos contextos los valores sealados
pu eden resultar una imposici n exces iva y en ot ros ser claram ent e insuficientes.
La difi cultad de una decisi n aprop iada para cada caso dice relacin con la
falt a d e claridad respec to a las consecue ncias practicas de un nivel de co nfianza
de ter m in ado . En general es un a m ater ia abie rta a la subjet ividad de q uien calc ula
el tamao de la muestra
A fin de Ilustrar 13 influe ncia e n el ta ma o J~ la m uest ra de d ecisiones distinrespec to al nivel de confianza y el erro r mximo adm isihl~ se prese.ntan des
~j ell1p los. La. Tabla 12 ilustra el tam a o de mu estra 4ue: se obtiene co nside rando
lternativas d istinta s y razon ables.
taS
luestrista I
0)5
"'luestri<ta 2
O,"
0,0') ..... 15
O.02- t:2'llo
Nivd de coo~anlJ
95.5\0 - 20
99,7% - 3u
JOO
3 soo
Las dife rencias en el tamao muest ra] son significativas e im plicaran diferencias
de recursos y tiempo importan te. Los resu ltad os se ob tie nen a par tir de decisiones disp ares pe ro jusnficables en rel acin co n erro r m xi mo adrn ..blc y nivel
de confianza. En consecue ncia, la exactitud qu e distingue a las frmula s se ve
:)p.tcadd por la subj etividad inh er e nt e a decision es q ue so n de te rm inantes en el
tamao de muestra calculado.
El calcul o del tamao de la muest ra no t iene una solu cin ni ca 'j verdadera
El clculo del nme ro de elem en tos a muestrear tien e un a dim ensin tcnica
y otra im precisa q ue dice rel acin con la experien cia. capacidad e intuicin del
mucstrista.
Capitulo 9
La teora de m uestr as pe rmite realizar infe rencias a la po blacin uti lizando diversos estadsticos muestrales. Naturalmente las fr mulas son distintas, pero la
lgica es la misma.
El desarrollo de la teo ra d.... muestras ha d ado lu gar a variac iones en las
frmulas a aplicar para calc ular el ta mao de la mu est ra o es timar el par met ro
pobladon a\. En efect o, sencillas op er acio nes algebra icas pe rm iten prese ntar de
variadas maner as la misma frmu la. Un au tor pu ede ade cuar las frmulas segun
criterios de exha ustividad, cla ridad o aplicabilidad. A fin de homoge neizar la
produccin en castella no de t eo r a de m ues tra s se ha seguido la nomenclat ura
utilizada por A zor n ( 1976) o Azorn y Snc hez C respo ( 1986) .
N =X,
,.,
n=i:;.,
X,
) N'
[N
n = n!(N ~ n)!
65
Prob abilidad de seleccin de u na m uestra de ta mao n. Ext raccin sin renp lazo.
raccin de m uestren Probab ilidad que un ele mento de la poblacin sea sclec tonado para la m ues tra
Varianza en la po blacin
f= -~
e =-.1. =
0 =
1:!....
"
epf (varianza) =
=H 'l.-
~ ='}
x,
r.k dia de la pohlocin para los elementos de la variab le X
A
Proporci n de la poblaci n p ara los elem ento s de la variable d icot m ica
N
~a,
l'I = ~ = --
Varianza de la poblaci n
o; =)"[( I -l'I)
.; ( 1
(; 7
Captulo 10
Varianza de la muest ra
El muestreo aleatorio sim ple es un procedimiento de seleccin basado en la libre
actuacin del aza r, Es el p rocedimiento de muest reo m s elemental y es referencia
de los dem s tipos de d ise o. Muestreo elem ental porque como procedimiento
de seleccin es intuitivo y sus frmulas son sencillas. Es refere ncia para evalua r la
eficiencia de diseos que seleccio nan los elem en tos seg n una lgica qu e bu sca
ordenar el azar.
El muestreo aleat orio simple es u n procedi m iento monoe tipico q ue puede
realizarse co n o sin reposicin. Teri camente la difer encia dice relacin con la
independencia o dependen cia e n la probabilidad de selecci n. En virt ud qu e el
muestreo sin reposicin resu lta m s sencillo desde el punto de vista te rico y
prctico los desa rrollos siguie ntes se re alizan a partir del su pues to de no reposicin de los elementos seleccio nados.
Nt ese qu e ambos tienden a resu ltados sim ilares cuando la m uestr a es una
parte pequea de la po blaci n. Se verifica qu e cua ndo la poblaci n tiende a
infinito la probabi hdad de repet ici n en la se-lecci n tiend e a o.
"_(x,""
"-
x}2
-;-
n - 1
t (x.- xl'_
s = .!:.L.
El procedi mien to de seleccin de los ele me ntos se real iza en for m a independiente
y sucesiva para cada unidad segn un listado que pe rm ite la selecc in al aza r de
los elem ent os qu e componen la poblacin. Se tra ta de un mues treo probabilistico
donde todos los elem e nt os tien en la misma pr ob abilidad de ser parte de la m uestra
y cada un a de las muestras posibles t iene la mivrua probabdtdad de ser elegida. En
consecuencia es un procedimiento aleatorio eq uip rohable. Particula ridad que la
distingue d e los diseos p robabil sticos no equiprobables en los cu ales los e lerne-ntos tien en una probabilidad co nocida y distinto J e O de ser parte de la muestra.
Com nm ent e se confunde muestreo alea torio simple y muestreo cqcnp robol-le,
sin embargo, ste es slo uno de los modos del muestreo cq uprobable.
En virtud de la naturaleza equprobable del muestr eo aleatoro sim ple se le
califica de m uestreo autoponderudo. T rm ino ste q ue hace refe rencia a q ue el
peso de tod os [os individuos en la muestra es d m ism o.
Histricam ente la seleccin de unidad es de muest reo se ha realizado mediante
una tabla de nmeros aleatorios. Un ejemplo a este respecto es la tabla generada
s, = ,[ji""iti
68
69
por la Rand COl'J'(!Tu.t1un d(' 1.()(X).OCO de d gitos. Los programas com putacionales
facilita n la Urca dI' seleccin. En efecto, permiten asignar un n mero a cada uno
~le los elementos de la poblacin mar co, gene ran una serie de n meros aleatorios,
seleccionan el nm ero de eleme ntos previamente establecido e imprimen elli.~t a do
de elem entos q ue co mponen la muestra. La serie de numer as aleatorios podra ser
prcticament e infillita y el azar e n la serie de nmeros puede ser evaluada m ed.i allt~
pruebas de aleatoriedad. En pa rticular la distrihucin de frecuencias y la prueba serial
El muestreo aleatorio simple presenta do s inconv en ientes de aplicacin. A
saber, necesidad ele dispon er del lista do de la poblaci n m..reo y aumen to de
cos to po r dispersi n geog r fica de las uni dades de muestr eo selecc ionadas. Su
aplicaci n no es Frecuente en la p rct ica del diseo de muestras, sin em bargo, los
un procedim ie nto de selecci n habitua l en co mbinacin con dise os complejos
La principal ventaja es la sencillez de las frmulas pa ra calcula r el t ama o de la
muestra y la prec isin de la estimacin .
La senci llez de las fr mulas se explica por el ca rct er m on oer pico del
m uestreo y la cqu probabihdad de las unidad es de muest reo. Los elementos son
las unidades de m uestreo )' todos los ele mentos ti enen la misma probabilid ad
de ser seleccionados.
La estimacin de los par metros en m uestreo aleatorio simple se rea liza
seg n los cnones de la in fere ncia estad stica clsica. En particular, de la teora
de la estim aci n. En rigor, el m uest reo alea tori o simple es el nexo entre teora
de la estimacin y los diseos de muest ras probabilsticos qu e re gul an la scleccin alea tori a de e leme ntos. Las frmula s de estos diseos son variaciones del
muestr eo aleatorio simple.
epi =!:I~"
N
(10.1)
Elnombre se explica porq ue en poblacio nes injinitas asume el valo r consta nte 1
y su funcin como multiplicador de la varianza del estimado r pier de sen tido. En
[a prct ica se trabaja co n po bl acio nes finit as; en consecue ncia, el valor es dis tin to
de I }' se ju stifica su uso Sin embargo, en gene ral, el valor de la co rrecci n es
cercano a 1 po rque norma lm ente la poblacin es m ucho mayo r que la muestra.
En la pr ct ica se p ued e presci nd ir de la cpf cuan do su valo r es m ayor a 0,9 5,
dado q ue su efecto en la amp litud del intervalo sera irrel evante.
La cpfcu mple la func in de h acer m s precisas las estim aciones realizadas con
muestras relativam ent e gran des respecto al tam ao de la poblaci n y hace m i s
imprecisas 1.Js estima ciones efectuadas co n m uestras rela tivamen te peq ue as.
71
. ~
(102)
L=N-2' . "
N
rol1
Donde;
(x,- x)'
1"
(l 0.3J
[NN- n11
;.1
(IO.G)
[ NN -. nn l~ o ..i-n _ ~
N
(10.5)
72
despejado n
( 10.7)
Donde:
Todos los tr m inos de la ecuacin son conocidos ex ce pto la varianza de la poblacin. En la practica es te valo r es reempla zado po r un indicador de la variabil idad
en la mu estra . Este indicador normalmente es un a varianza calcula da al aplicar
una encues t a piloto para e valuar la validez del instrumento de med ida .
PIIOIlI. EMA 1
Una muncpaldad estudia hbi tos de estudio en estudiantes de- 10 bsico a 4"
medi o en liceos de la co m una. Se aplicar u na e ncuesta po r m uestreo. Co ndici n
es calcula r el t amao de m uestra . El tota l de estudia ntes qu e asiste n a los liceos
de est a comuna es de 2 1.524 . Se ut iliza la varianza de est udios an te rio res, 122.
El e rror m xim o adm isible se fija en 1 y el nivel d e co nfianz a en 99%.
73
SOLUClON
N = 21.524
s:
1, 96
,,t-n"
--
-'--
N- J
( 10.9)
122
= 1
Z " 2 = 2,58
Donde:
1,96 = Valor del coeficiente de co nfianza asociado al nivel de co nfianza de 95%
S1 = Varianza de la m uest ra
N = Tamao de la pobl acin
n
= Tamao de la m uestra
L-+_ "_
z~
N- l
Reemplazando:
122
_ " _ + __
1~__
2,58 1
2 1.524 - 1
n = 770
2
Calculado el tamao de la muestra se q uiere esti m ar el pro medio hor as do: estudio
al d a. Para infe rir los resultados a la po blaci n se crea un intervalo de co nfianza.
Segun probl em a anterior 2 1.524 estudiantes asisten a liceos de la co muna y se
encuest a n o. El promedio de horas calculado en la m ues tra es de 0,72, con
una varianza de 0,7. Se establece un in te rvalo asociado a 99% de confianza .
PRO RLEMA
C ONCLUSi N
So LUCION
(10 .8)
TI
:=
Sl
= 1,5
o:c
21.524
no
0,72
Z..n = 2,58
. ,,r-n"
x z..n
N - l ' -;;-
Reemplazando
0, 72
2,58
( 10.11)
(0,58; 0,86)
La frmula de la desviacin tpica del estimador o error tpico ~ la sigu ien te.
CONCLU::iON
Con 95% de co nfianz a, pode mos afirmar qu e el p romed io de horas q ue los estudi.mtes de los liceos de esta comun a estudian al d a est comprendido en el
inter valo 0, 58 a 0,86 ho ras.
II
I
=V- N- n . J -.i..
N- 1
(10 . 12)
(10.\3)
s:
L (a. - p)' a 2
.el_ ' _
=.~""-' ~N
"-
p'
(10 .10)
Cuando se utiliza la varianz a m xim a la amplit ud del intervalo puede ser m ayor
que el necesario en fu ncin de la varianza real de los datos. Considrese que la
imp reci sin por exceso de varianza es me nos perjudicial que inferir con un valo r
de varianza menor al realm ente existente.
(10. 14)
Ntese que
e z Y J:N:.l --n
. P~
1
( 10.15)
0/2
76
11
77
Zca/l = 2,58
para los calculas uti liza mos la sigu ie-nte frm ula:
(_1'-. ~) _(_"-.J'<l)=(VVJ'L
-1 . PE)_(J'L)
N- l
_ f'!L
N- l
~- l
~ pq
N~ l
"
---.!:i.- .P!L
N- l
L +_J:'!1_
ron
N- 1
Reem pla7.ando:
Despejando n
2 83 :? 30 o 25
58 4.23 0 - 1 '
(10 16)
"
_0,03] + -----'.9_
.2, 58 1
58 4 .230 - 1
n = 1.923
Co;-'CI.US IO ~
Donde:
= Tam ao d e la po b laci n
pq = Varian za de la muestra
el = Error m xim o ad misible
Z~ = Valor del coe ficie nte de co nfianza
Todos los trm inos de la frm ula son co noc idos. El tama o de la m uestra depe nde
de los valo res q ue asu ma n los trmino s que la co mponen.
P RO fll.EM A
Se ind aga e n una regin la proporcin de estudi antes q ue real izan actividades
de po rt ivas. Para este fin se ap licara una e ncuesta, por lo que se req uiere calcu lar
el ta m a o de muestra. El to tal de es tudiantes de liceos de la regi n es 58 4.230.
Se fij co mo error m ximo ad misible 3%, y nivel de con fianz a 99% . Se asume
un a varianza mxima de 0,2 5.
SOLU CION
N = 584.230
pq = 0,25
e = 0,03
P l ,oI1 up
( 10.17)
Don de:
, uV N_ I n
( 10 18)
Dnde:
p
N
n
pq
Capitulo 11
Muestreo estratificado
= Tamao de la muestra
= Varian za de la m uest ra
P ROBLEMA 4
Realizada la encu esta a los estudiantes se quiere est imar la proporcin de est os
que realizan act ividad deportiva. Segun problema anteri or, el to tal de estudiant es
es 584 .230 y se encuest a 1923 . La proporcin de estudiantes qu e afirm aro n
pract icar alguna actividad depo rt iva fue 0,35. A partir de esta informacin se
q uiere crear un intervalo con 95% de con fianza para inferir a todos los estu diantes
de la regin.
SOLUCIN
N = 584.230
= 1923
P = 0,35
q = 0,65
Zun = 1,96
11
p s: ' ,96V:'J - n . pq
N- J
Reemplazando:
0,3 5 1,96
584.230 - I
1.923
0,35 . 0,02
(0,33; 0,37)
C ONCLUSION
37%.
80
El muest reo estratificado se ca rac te riza por usar informacin auxiliar que
per mi te agrupar a los elementos que componen la muestra e n es tra tos diferenciaJos. Los estra tos estn conformados po r eleme nt os qu e tie nen p untuacin homog nea en la vari abl e e n estudio. Los elementos que componen
un estrato son pa recidos dentro de l estrato y los est ratos son agrupaciones
distinta$ entre si.
La vari able de estrati ficaci n es auxiliar y permit e const itui r grupos ho mogneos de elementos. Condici n par:! q ue est o ocurra es que la varia ble
de est rat ificacin est rel acio nad a co n la variable a medi r. ASI, po r ejemplo,
para estudiar satis faccin labo ral se puede es tablecer estra tos seg n nivel de
ingreso e n e l e ntend ido que el ingreso est relac ion ado co n la sat isfacc i n
labor al.
Se suele usar m s d e una variab le de est ratificaci n, a fin de asegurar m ayor
hom oge neid ad en los estratos. En ta l caso se aconseja que ambas vari ables
estn rel acion adas con la variable a m edir, pero no rela cionadas e nt re si. Si
existe rela cin entre ellas su uso no se just ifica porque no mejoran el resultado
de la estratificacin . Se aconseja usar aquella que este ma s rela cion ada co n la
variable en estudio. a fin de gene rar estratos ms homog neos.
La lgi ca que subyace al m uestr eo estratificado es que agrupando los
elementos en es t rat os homogn eos es posib le m ejo rar la precisi n y m inimizar el costo respect o a sele ccin mediante muestreo aleatorio simple.
Un a bue na estratificacin se prod uce cu ando se gen eran estratos altamente
homog neos. Estratos homog neos so n condici n ne cesa ria para una buena
est imacin . En el limite, si cada estra to est co mp uesto po r e le mentos co n
la misma puntuacin la seleccn de un elemento po r estrato se ria ad ecu ada
para in fer ir sin error.
Cabe destaca r que cada estr at o es una agrupacin independ iente de las
dem s, lo c ual per m it e infer ir los resulta dos a la pobla cin orige n de cada
estrat o en for ma au tnoma . Conside rados todos los estratos en fo rma con junt a
Se infie re a la po blac in or igen de la m ues tra .
A m enudo se preci sa de result ados p ara subd ivision es de la muestra. A
saber, regiones, nivel socoecon mtco, grupos et reos, et c. Si esta s subdivisiones
co nfo rman estratos se pu ede inferi r pa ra cad a s ubdivisi n po r se parado
81
4J
(11.1 )
o'
e)
Donde:
cr == Varianza de la muest ra
l. = N Ume ro de estr atos
11 = Tam ao de [a muestr a
.
N" de estratos
=s
b lc
(112)
Donde:
ti
= Tam ao de la muestra
e = Costo po r unidad
c = Cos to por est rato
11.5. Afijaci n
La asignaci n de los elementos de la m uestra a cada uno ~e los .t'st ratos q .ue
com ponen la muestra recibe el nomb re de afijaci n. I.a asrgna cto n sd rcall/.~
seg n crite rios q ue e mprica y tericame~te ~e ha n m O'itrado adecua os. l .os
principales cr iterios de asignacin son los siguientes:
11.6.1. Poblacin
Los estrat os se dist ribuyen del siguien te modo en la poblacin .
Primer estrato de tamao NI
Segundo est rato de tamao N 1
X II
Segundo estrato
x n xl] ...x l ;
xm
Estrato ultimo L
X LI X u
xl l
X H1
" , x/ i
x/N I
" ,X~l
", x Li
xtN t
.,
.,
( 11.3)
11 .6. Notacin
Para caracte rizar la est ruc tura del m uest reo estratificado cabe d istinguir estra tos
y elementos en la poblacin , y en la mu estra
84
85
(1 l.4 )
i= ,.,
LWi o
(1 1.7)
(1 1.5)
AA
x,;
i=~
( 11.8)
",
:"':1. muest ra es una replica e n tamao red ucido de la pobl aci n. Presen ta la mi sma
estruct ura q ue la pob laci n difer cnc t ndose en el tam ao de los est ratos.
El eleme nto gen{'rico x", corresp ond e a la puntuacin del ele mento i e n el
-strato h.
El siguien te esquema permite visualizar la es truc tura caracte rst ica del m uestreo
estr atficado.
(a m ao de la muestra
.,
Poblaci n
",
no = LX..
'"'
.I x",
X=!~
( 11.6)
"
oc
La afijacin pro po rcio nal h a sido co noc ida co mo afijaci n de Bowley. La caracterstica distintiva de la afiactcn propo rc io nal es q ue el t am ao de los est ratos
muestrales es proporc ional al ta ma o de los est ratos poblacion ales
L:1 af ij ac n proporcional da lug ar a un muestreo autoponderado. En efecto,
al mantene r la fraccin de m uestreo propor cional en todos los estratos asegura
que todos los elem entos de la pob lacin t ienen la m ism a probabilidad de pertenecer a la muestra.
La est ruc tura de la muest ra co n afijac n proporciona l es la sigu ien te.
w,
=t
n :: Tam ao de la muestr a
:fi.af:j~cin
Estadstico s
.,
r x"
X =.hl.., ",
I1I -
n w,
.,, "
x)='7t,
1
11, - 1I
w, I
r x
x=-"''-
.".
o.
LL I..
i =~
Media muestra
.,x-,
Pj=':t.,l.-
11'1 ,- 11 ' W ,
"
.,
I ",
p/ =':t-
~._,o-
,"
r" ....
P. = "n)~
LL -,
p= ..Mcl-
Proporcin muestra
"
Subdivi'lin en es tratos
Estildisticos
M..J ia muestra
Proporcin mUCl;tra
P= !WJJ.
"
88
La afijaci n ptima S~ realiza con el pro psito de mejo rar la precisi n de las
esti maciones respecto a la a fijaci n proporcio nal. Se distin gue afijaci n ptima
de varianza y afijaci n pti ma de cos to.
La ahjacin ptima de varianza co nocida com o afi jaci n de Ncymon tiene
el prop sito de minimizar la varianza del est im ado r p.lra un tama o de estratos
p redefinido. En particula r; los estratos de m eno r varianza sern m s peq ueos y los
de varianza m ayor sern m as grandes. La lugil";l que subyace a esta afijecin es q ue
en est ratos de ele mentos sim ilares no es necesa rio muestrear muchos element os
y slo cabe sacar muestras grandes en est ratos con valo res het e rog neos.
89
Media
T.m~o J~
los estratos
-; ,
K
11= " - -
, ,
i ,= W, x-,J
"
n = n "'1,
'
",...
.,
X, =
w, ,
xl =
.,
.,r, "',',
n =n "' '
W 1 Xl
I X;,= W. i:
,
X=L
. ,W.
M,-dia muestra!
r "'.s,
"
proporcin
x"
Propcrcjn muestral
Pro porci n
90
n-,K_
r "',J.
".-.re:
x1-wlx1 l l x~=u'.i~ 1
i =L
,-, w~ i~
Med ia
,
"7i:
n~=
--
Tamao de lo >estratos
! ......
7i:
n = n "'! ,
n1= n- -
I "',J
.,
~-
"','.
- ,
-:-:
-, .'l..
Capitulo 12
"
N. N
El peso relativo de cada estrato en la pobl acin y en la muestra cum ple con
la igualdad w,,=\V~.
"
"
,.
r I x.;
=A<ll. L....-...
"
93
(12.1)
hl
(12.3 )
Donde:
N
Sustit uyend o
(12.2)
(Ji,==
'-
LUr;; -----.L-h=/
~.l
!!. . - L
N ,
n ll
ende:
N ::: Tamao de la poblacin
N
}V, ==
== Peso del estrato h -simo
-ri-
01 == - 12
N
1.
:,N, (NI. hl
nJ .-nI.s''
(12.4)
Donde:
94
(J ;~:::
S~'='
95
Ntese que los pes os de los estratos se elevan al cuadrado, dado qu e rnulti,
plcan varianzas y no medias.
( 12.5)
X"
LLx,
hr_
"
Donde:
x"," Puntuacin en el est ado h -simo d el elemento i-si mc
11 = Tam a o de la muest ra
)
(~~'"I w11','~ w,'
N
= z?n
Dado que n~ ..
.'::L IL _ ..::A:.l
IIW
(12.7)
El error tpi co utilizado e n el inte rvalo de confianza se obtien e como raiz cu adrada de la varia n za.
(12.6)
( 12.8)
e = z.,n 0 """
..1
N -n- ,1"
.2
",::" Wh~-h
N n '~I
e- = Z..n - -
96
97
SOLUCI N
r)esr ejando n
"
~ w~si
,.,
( 129)
N = 560 .450
e = l
%<>12 =1 ,96
Para los clculos u tilizamos las sigu ientes frmulas:
z~ '" Coeficiente
de cada estrato
l V. "'" N
So:"
5
j e investiga nivel de intolerancia en mayores de 18 aos habitantes de una regin
.ivid id a en 5 com unas. Estud ios anteri ores se alan que la intoler ancia es distinta
-n cada una de estas co m unas (probableme nte debido a difere ncias en el nivel
-ocioccon mico ]. Se decde utilizar mu est reo estr atificado, y d ado que se quiere
presen ta r cada com una proporcionalme nte al t amao de su poblacin, se utiizar ahj aci n proporcional. Para pode r apl icar la encuest a es necesario definir
.arna o de la mu estra y efijac n para cada est rato. La regin en su conju nto
.ucnt a con 56 0 .450 habitantes ma yores de edad . El e rror mx imo ad misible fue
ljado en 1 y el nivel de con fianza en 9 5%. En la Tabla siguiente se observan los
.aruaos de cada estrato y sus respect ivas varianz as:
Para reem plazar los valores e n la frmula, debernos primero calcular los d atos
para llenar est a Tabla-
>ROBLD,fA
Comuna
N,
S'
128.230
59.78 1
142JtJ6
ISO.3ZO
49.753
560.450
144
49
81
100
3
4
5
Total
G4
",
w11.
0,23
14,72
Comuna 2
0,11
15,84
Comuna 3
0,25
12,25
Comuna 4
0,32
25,92
Comuna S
0,09
Comuna I
Tot.1
.230- = O 23
w = .128
_.. ~-I
560 .450
'
LWI = 1
Ir '
L wi. =77,73
.',
Donde:
w = 142 .366 = O 25
] 560.4 50
'
w = 49 .753 =
5
560.450
'
x
Z0/2
09
6
Luego de apli car la en cuesta sobre intolerancia se p rocede a inferir mediante
intervalo de confian za. Se mide intolerancia con esca la de rango I a 6. En es ta
regin viven 128.230 personas mayores de 18 aos, de las cua les fueron encuestad as 299 .'5e ob tuvo un a media m uestra] de 3,9. Se genera intervalo para estimar
con 95% de confi anza.
En la Tabla siguiente se observan los pesos de cada estra to, 'sus respectivas
var ianzas y el peso multiplicado por las varianzas (calc ulado en el ejercicio anterior) :
PROBLEM;\
11
= 299
= 299 0,23 = 69
n ]
= 299 0,11 = 33
TI]
= 299 0,32 = 96
"s = 299 0,09 = 27
Com una
Comuna
Comu na
Com una
Comuna
n4
CONCLUSION
Total
1
2
3
4
5
w,
0,23
0,11
0,25
0,32
64
144
49
0,09
100
,
2: wh =
W,S
14,72
15,84
12,25
25,92
9
81
,
L
ws
",, 77,73
l. '
~ 1
l
'~ J
SOLl/CION
N = 5604 50
11
(12.10)
=
0=
Z"-' 2
(12.11)
100
299
3,9
= 1,96
JO I
(12.13)
ceernplazando :
3,9 1,96
56Q,'ISO -?SL'L 77 73
560.450 299
'
3,9 1
(2,9; 4,9)
'~ON C LUS 1 0 N
:011
Para enc ontrar el mnimo de una fu ncin se ut iliza e! mtodo de mu lt iplicado res de Lagrange. En particula r se t rat a de e ncontrar el mnimo de la siguient e
expresin.
(12 14)
(12.12)
Jonde:
w~
El mnimo se obtiene deriva ndo la exp resin respecto a los O h estra tos e igualando
a ecad a una de las de rivadas. O perando algebrai camen tc se obtienen la fr m ula
del tamao de cada estrato nh que sat isface la restriccin preestablecida.
(12.16)
SOLUCi N
N = 1.430
despejando n
=o
zo/1
=o
2,58
( 12. 17)
Para los clculos utilizamos las siguientes frm ulas:
l~w~s~r
, ,
L W~s~
Do nde:
'.1
-el-+ - - z~
w.si
'1, =0'1
,r...w~s:
W = N~
( 12.15)
w =!:!.L
N
PROIl I.EM A 7
S(' mi de nivel de sex ism o en estudiantes. Sabido qu e estos pun tajes son m uy
dist intos segn sexo, se opt por estratificar a los est udiantes por esta variable ,
A su vez, a partir de informac in de otros estudios, se puede asumir que )IS
muj er es tie nde n a ser mas sim ilares en c uanto al sexismo que los hombres. Por
estas razones se decidi hace r un m uestr eo estrat ificado co n efija c n ptima de
varia nza . Para llevar a cabo el estudio es necesario calc ular el tamao de muestra
adec uado. El to tal de estudiant es de este colegio asciende a 1.430. Se fij como
error mx imo admisible 1, y 99 % de confian za.
En la sigu iente Tabl a se presenta el tamao de cada estrato y su varianza
respectiva :
Hom bres
Mujeres
Tlllal
N,
r.
705
225
100
725
1430
Para reem plazar los valo res en la frm ula, debemos p rime ro calcular los da tos
para llenar est a Tabla :
Hombres
Mujnn
-,
w.r.
0.'49
0,51
1I0,Z5
51
Tobl
,.,1:1t'. : I
,
.,~IU.~ : 161,Z5
w = _Z /)5 ;; O 49
, 1.430
'
w = 725_ = 05 1
1
104
1.430
'
105
"
11',1.
"
7~5
5,1
10
'l,W,i, = 12,45
,. -- "
zeemplazando :
"
12,45 '
~..l:.- +
2,582
llill
wA
'.
ws.
Hombres
0,49
15
7,35
4,3
O,5!
22S
100
110,25
Ml.ljeres
51
10
5,1
3,1
lA J a
.,
,
Lw,s=161,25
L w=1
Total
00'
n = 584
So LUCION
N = 1.430
11 = 584
ZoJ2 ;;; 2,58
=584 T6,1s=185
~ONC\.USION
'ara hacer una estimac in con un err or mximo adm isible de 1 y un nivel de
onfianza del 99%, se requiere una muestra de 584 estudiantes, 399 hom br es y
85 mujeres.
..,
i= L Wh X,
(12.18)
x z<l/2
(12.19 )
Reemplazando:
3,7 2,58
' f{O BLEM A
w.
3,7
(2,7; 4,7)
!1_L'ti':
lEil,25
584
1.430
,
Lw,=12,45
,.,
Con 99% de con fianza podemos afirm ar que el promedio de sexismo, en una
e-scala de J a 6, se encu e ntra e nt re 2,7 y 4,7 .
proporcio nal. Lgico si se cons idera que ~a afijac n ptim a de costo inclu ye
adems del costo simultneamente los atri butos de la ahjaci n p roporcion al y
la afijacin p tima de varianza. Eliminadas las diferencias en varianza y costo se
reduce a una afijs ci n p rop orcional.
El tamao de la m uest ra e n afijaci n ptima de costos se ob tiene aplicando el m todo de mu ltiplicadores de Lagrange. En particular se tra ta de encontrar los valores
C Q.\lCllISION
x '=
que hacen mnima la var ianz a del esti mador con la restri ccin
A saber, varianza mnima para un coste fijo.
L C. J1, .
h~ 1
min aL...-
t,
~ w. lo
(1 Z.ZO)
0 .0
Donde:
Do nde:
w. '=
n 10
= costo t otal
c.
'=
"..
'=
La varia nza de estimador de la media cua ndo se plantean costos variables en los
distin tos estratos se obtiene como variacin de la frmula gen rica del m uestreo
estratificado. La difer encia en tre ambas frmu las se explica po rque en mu est re-o en ahjaci n de costos se consideran simultneamente t amao, varianza y
costo.
hJ
s' +
(N. - '11.) _/0_
"lo
).
[ L' c."..- e
( 1z.zz)
Se deriva la expresin respect o a n I' ... ,"' y se igu ala a O. O pe rando algebraica mente en el result ado ob ten ido se ded uce las fr mul as de nh y n que cu m plen
con la restriccin establecida.
(12.23)
(1Z.ZI)
N tese q ue si la variacin e n los dife rentes e-stratos es la misma y los costos son
iguales en cada est rato, la frm ula anterior se reduce a la frmu la de la afijaci n
108
109
(Ji- es el e rror
tp ico.
Razone s de e xpo sicin aco nse jan gene r r la frm ula del tamao de la mu estra a
part ir de la ec uacin bsica. En particular; a pa rtir de la iguald ad del error m aximo
admisib le co n el coefictente de co nfianza y el error t p ico.
e = zu/2
0 ,-
i,
N,
Urb ano
Ru ral
(1 2.24)
To tal
758 .230
291.959
100
6'
10.0l10
14.; 00
1.050 .1R9
ti = .ni! o:...,
SOLUCI~
(12 .25)
Donde:
si
W = ~
N
9
Se invest iga racism o e n una regi n co n imp or tant e po blaci n indgena. D ado
qu e e n esta regi n e xiste n much as zo nas rurales y sabiendo q ue el costo para
realizar u na enc ues ta en reas ru rales es mucho mayor al de r eas urb anas, se
decidi llevar a cabo u n muest reo est rati ficado co n af ijacn pti ma de cost o.
Para lle var a cabo la e ncuest a se req uiere calcular el tam ao dIO' muestra necesario. En la regin vive n 1.050 . 189 pe rso nas. Se quier e hace r u na esti m acin
co n un err or m xim o ad m isible de 0,5 y un ni vel d e co nfian za del 95%. En la
siguie nte Tab la se p rese nta el t am ao de m ues tra de cada estrato, sus varianzas
y costos resp ectivos:
PRO RLEM A
=!:!l!
Para reemplazar los valores en la form ule. debernos primero calcular los datos
para llen ar est a Tabla:
l.
W'S I
W,
U'~r.
Urbano
0,72
72
10
100
720
0,072
Rur.l
0,28
17,92
12O
268,8
0,0 19
Total
,
r,.,. .l = 1
,
r,.,uS:: = 89,92
wsl K
Lws.JC;= 981:1,8
,.,
..
l. F.
,
el
~~= 0,09 1
l "f7!;
=-.l?V30
ur
1
1.050 .189
10
Aplicada la e ncuest a de racismo se q uiere calcular un intervalo de co nfianza
para est imar el p rom edio de racism o regional, se gn escala I a 6. De 1.050 .189
pe rsonas que habitan e n la re gin se enc ues ta ron 1.381 ,
En la siguient e Tahla se p resen ta el tamao de m uestr a de cada estrato, sus
varianzas)' costos respect ivos, el peso de cada estr ato (calculado en el ejercicio
anterior) y los promedios obtenidos e n la esca la de racismo.
PROBLEMA
= 0 72
'
w = 291.959 - O 28
1
1.050. 189 - ,
Reemplaza ndo ;
n-
.Q,52
1,96 2
U rb~no
+ ~~
758.230
291.959
Rural
1.050. I89
100
w.
<
'
0,12
0,2 8
10,000
3.,
3.9
101.400
..,
t,
I W,=1
1381
SOL UCIN
0,072
ni
r.
) ,050,189
l bt _1
'1 =
N = 1.0 50 .189
= 1.38 1
=
an 1,96
71
0,019
7.
:mJCI.USION
'ara hacer un a est im aci n con u n e rro r m ximo adm isible de 0,5 y un nivel de
on fianza del 9 5%, se req uier e un a m uestr a de 1.381 perso nas, 1.093 de zona
rbana y 288 de zona rural.
..,
i'= Iw~j,
xc
Z""
( 12.26)
(12.27)
112
113
.,
'.
'.
100
110
10
Urbano
Rural
Nlr.
N.s {E;
75.823000
18.685.3 76
753.2JO.COJ
230.280.640
,
Total
;':,N.r:94.508.376
..,
r N. S .c;;. 1.038.510540
N,s,
.fe:
zs.sn
Capitulo 13
19.403,93
~N,s.
6
..VC:",
c. 95.23 ,93
0-,
758.230
Wl
1.050.189 =0,72
Wz
= I .OSQl89- = 0,28
291.959
Reem plazando :
3,5:i: 1,96
3,5 :t 0,5
( 13.1)
(3; 4)
La ahjacl n igual y p tim a exigen gene rar un estadtstlco ponderado para est im ar
el parm etro poblaconal. En particular, se po nde ra la propo rcin de cada estrato
por el pe so de stos. Se asume que si las mu estras de ntro de cada est rato son independientes y la media de cada estrato es un esti mador insesgado del pa rmetro
del estrato, el estimador ponderado es un est im ado r apropi ado. Se dem uestra
que la frmula presenta da a continuacin es un es tim ado r de 11.
( 13.2)
D ond e:
Wk
..,
{~= ~wla~
( 133)
Donde:
l_ Nh - nh .__
phqh
a,._
N~
(IJ.4)
n~
w~ p,~
n= ' . . /
w,
f wh phqh
e: - ,
S ustituyendo:
0,;= l ul. N~ -
zk =---;N~-
n~ . ~q~
N~
....., .
(IJ .7)
n~
Donde:
Operando algebraicam ente:
0 2
,.
=_!.-. N i .
NJ h
"
N~.:...!!_~_
N~ - l
Z,v J
p"q"
(13.5)
" lo
=!'N!.!.
e = z,~ a ~
( 13.6)
(13.8)
11 6
117
N tese qu e todos los estratos de la muestr a tien en las mismas razones que su,>
correspon dientes estr ato s eu la poblaci n ~ _:::::
La fraccin de m uestree de
%_.
Donde:
t
z"n
N.
Wk ::::: -N-
N-=J1_
w
N .n
k.
PIlOB t. E ~ A 1I
k
p q
lo
lo
(13.9 )
El erro r t pico utilizado en el inte rvalo de confianza se obtiene como raiz cuadrad a de la varianza.
= 'Z"n 0,..
".
w, =-
Se m ide auto ritarismo en una regi n . Se sabe que existe n difer t"ncias significat ivas con resp ecto a esta variable seg n hab itant es de zonas rurales o urbanas. En
virtud ele lo cual se uti liza m uestr eo estratificado. A su vez, se qui ere represe ntar
proporcionalmente a cad a estrato, por lo q ue se opt por una afijac n proporcional. En la regin viven 8 79. 502 personas ma yores de 18 aos. Condiciones
p.lra la estim acin son e rror m ximo admi sible de 2% y n ivel de confianza del
95%. No se tie ne informaci n so bre la varianza en cad a est rato, se asumir la
varianza mayor, esto es, varianza igua l a 0,25 .
En la Tabla siguiente se observan los ta maos de cad a estra to y sus respectivas
varianzas:
N,
P,
q.
623.1 00
0.5
0.5
Rural
Z56.4OZ
0.5
0,5
Tolal
879.502
(13.10)
Urbano
SOWCION
N = 879 .502
e = 0,02
( 13.11)
%""1 =1 ,96
,
"--+
"'~'-..--z
N
""
}; wh ph qh
1110
0=
nw ~
iv = . -!.....
Para ree mplazar los valo res e n la frmula, d ebem os prim ero calcu lar los d atos
para lle nar es ta Ta bla:
El intervalo de confianza para estimar el p ar metro poblacional se obtiene ada ptan do la frm ula genrica de int ervalo de co n fianza El intervalo de estimacin
es el siguien te.
(13 .12)
Urbm,
w.
w. p. q.
0,71
0.1775
0,29
RUf'1
~1lI. "
.,
Donde:
0=
Estimador muestra]
:: Tamao de la poblacin
w~
P RO BLEM A
12
Reemplazando :
0,09
0,09
_0,_
03_
' + _ ""'''--_
1
1,96
879.502
11 :::: 86 5
N.
w.
p.
Urbano
623.100
0,7 1
0,3
0,7
Rural
25G,40l
0,29
0,311
0,62
0,71 :::: 6 14
1-n I ::::
( 13 13)
~~
= 623.1QO_ =0 71
879.502
'
11 ::::
w,
N n~":i
0,0725
,
Toul
- - "wp q
N- n
p Zun.
Tulal
879,502
,
1:w
, ."I
..
C O N CU JSI() N
SO LU CiN
Para ha cer un a estim acin con un e rror m xim o admisible del 3% y un nivel de
confianza del 95%, se req uiere una muestra de 865 person as, 614 reside ntes en
zonas urbanas y 25 I de zo nas rura les.
120
N = 879.502
n :::: 865
ZO/2 =: 1,96
121
. zun
(13 .15)
N
ree m plaz ar los valores en la frm ula, debemos primero calcular los datos
Vrb. nl
0,149
R'Jnl
0,. ...
TOlal
iplazan do :
min(~
11,32 1,96
32 0,03
( ,J ,29; 0,35)
~l.US10 N
(13 16)
El min imo se obtiene der ivando la expresin respect o a los n h estratos e igualando
a O cada una de las derivad as. Operando algebraicamcnte se obt ie ne la frmula
del tam ao de cada estra to fl h que satisface la rest ricc i n preestableci da
1. Estimacin de la proporci n
(13 .17)
..,
( = ,w, P,
l.
(13. 14)
Razones de exposici n aconsejan presentar la frm ula del tamao n de la muestra
a partir de la ec uaci n b sica. A sabe r, despejand o el e-rror m ximo ad m isible.
e=
zofl o~
(13 .16)
SoLUCIOS
N = 104 .335
e = 0,03
%0/1 = 1,96
Para los clculos u t ilizamos las siguie ntes frmulas:
despej ando n
( 13.19)
D onde :
= Error m ximo admisible
a nivel de confianza
Para reem plazar los valor es en la frmula, debe mos primero calcular los datos
N.
-.
IV
Se quiere m edir in tolera ncia religiosa en tre escol ares. D ado q ue se espe ran resultados distintos para est udiantes de colegios cat licos de aq uellos qu e asisten
a colegios laicos, se utiliz ar una m uestra est ratificada. A su vez, tomando en
c uenta q ue en estudios anterio res se ha observ ado una ma yor homogeneidad
e nt re est ud iantes de colegios cat licos q ue entre est udiantes de colegios laicos,
se decidi utiliza r u na afijacin ptima de varianza. Se fij co mo e rro r mximo
admisible 3% y nivel d e co nfianz a 95%.
En la Tabla sigui ente se observan los tamaos de cada est rato y sus respect ivas
varianzas {o btenidas st as de en cuesta piloto):
N.
CoI~'gim carhc os
CoI"giosIicos
Tat. 1
w"r;;
O.'"
0,16
0,34
CoI"gios Oltlicos
P ROBLEMA 13
"'P1q
0,66
CoI"gios l icos
,
V ", = /
,
..- . ..,
Tobl
= ~5. 2 1O = O 34
104 .335
'
q.
35.210
P.
0,35
0,65
69.125
0,45
0,55
104.335
124
0,16
125
..,
0,33
L III. ~ .. 0,49
-.
N.
0, 24
104.335
ColegIOS catlicos
35.ZIO
Colegiosla;cos
69.125
Tonl
IOU 35
0,55
0,66
0,39
0,61
,
~ ",. =I
.,
n = 101 5
'.
0,3 ~
P.
0,45
SOLUCi N
N = 104.335
n =1.01 5
Zon = 1,96
Para los clc ulo s utilizamos las siguientes formulas:
~ O .J C I.US I () :-l
A <I hacer
,.:
..,
P = r.wJ\
apeada al caso espec ifico de la esti macin de proporciones med iante a fijeci n
"o ti m a de var ianzas.
Reemp lazando en la frm ula se obti e ne para afijactn p tima de propo rciones
siguiente expresin.
p z..n 0_:=-
(13.20)
-.
( 13.21)
P :t: Zt]
O,H
14
"oltcada la encuest a sobre intoleran cia religiosa en colegios, se qui er e est ima r
a proporcin de est udiantes qu e opina n q ue no se puede con fiar e n una perna atea . Para esto se construye un int ervalo de confi anza qu e p ermita inferir
'a poblacin . En total son 104.33 5 los estudiantes de colegios de la regin,
le los cu ales 1.0 15 fueron enc ues tados . Se fij pa ra el inte rvalo un 9 5% de
nfianz a.
En la Tabla siguiente se observan los ta maos de cada est rato, los pesos (calui ados en el eje rcic io anteri or) y las prop orciones observadas:
OHl.EMA
126
w,""
Tohl
.
(0,3 8; 0,44)
0,66
s-r
..,
",. p,q.
w.vP.q.
0,08
0,17
0,16
L wP. q. = 0)4
..,
0,32
CoN CLUSION
Donde :
:=
n~
costo total
h-esmo
= tamao del est rato h- simo.
~ I clculo del estimador de la pro porcin po blacto nal se ob tien e co mo res ulta do
ponderar las p ro porc iones estrat alcs po r e l peso de los est ratos. La frm u la
c rrespoode al procedimiento de pon deracin en muest reo estrati ficado.
1("
p -=
..,
L WJ'~
(13.22)
n~ = n
w,r, a,
~~
(13 .25)
L~!k -'!~hl
"fC
d
P'"''
~, Nk,p;r"yc;
/IN]
-<.
-..!!.~,,!~qk
(:,..7;
Pkq~
Nk
N)
(13 .23)
[ 1327)
,
hacen m nim a la varianza del estimador co n la rest riccin e "" Lc~n~ .
,..
Donde:
e
='
N,
128
:=
"a
Ph (ji,
::
iV :: -N. N
15
. estudia homo foba en una regin. D ado que en la regin existen com unas
-n niveles econ micos muy variados y con costos di sm iles en la ap licacin
e las encuestas, se ha decidido utilizar un muestreo estratifi cado co n ahja cidn
,.tim a de costo. Antes de aplicar la encuesta es necesario definir el tamao
'total de pe rsonas mayores de 18 anos que habitan en la regin a estudiar
; 540.3 48 . Se fij co mo error mxi mo ad m isible 4% y nivel de confianza de
J%. Dado que no se conoce la varianza de estos est ratos, se asume la mxima
)sibk esto es 0, 25.
En la Tabla siguiente se observan los tam aos de cada est rato, sus respectivas
rrianzas (obte nidas de estudios anteriores) y cost os:
" OllLEMA
Para reemplazar los valores en la frmul a, debemos primero calcular para llen ar
esta Tabla:
w,
p.q.
sao
0,1
C1
0,36
0,42
0,12
0,25
0,25
0,25
0,25
e3
DE
-..1M" .c;
WJ!.'ll
0,\
11)()
0,025
0,5
0,5
0,5
90
90
95
O,1O5
0,09
"'J.q,
.c; -
0,00025
0,001
0,0012
vc:
Wl'';
5
16,2
1 ~,9
o,oom
l ~'
0,03
::
1
IV
J
_ 194 .5Z.L = O 36
540 .348
'
= ~P05'L
540 .348
:: O42
'
OLUClN
N :: 540 .348
e :: 0,04
Z'.J 2 :: 1,96
Reem plazand o:
45 8 O0055
J..;: _ . _ _
004 2
o' 2S
- '- - +
2
1,96
540.3 48
:: ~
n :: 604
Ahora distr ibu im os el t ot al de la m uestra en los estratos:
000025
0,00277
n :: 604 - '- -- :: 55
I
I1n
;~~
0,0005
0,002
0.00233
O,O::O J2
SJ
,
2) !J'lq.=O,25 i*?~ o ooJ77 w,r;q;.c;= 4S8 r5.~ 0005'
." c.
, "i:) . 'l '
' .-,.r,
, .,'
ro'" Lw.-"l
IV
w.v'P. ~.
-604 '
'1
1-
SOLUCION
0, OO L:::: 2 18
0,00277
N = 540.348
n = 604
znn = 1,96
0,00277
J -
= 604 . _O~}l = 70
0,00277
C ON CLUSION
Para hacer una estimacin con 95 % de confianza y error de 4%, se necesita una
muestra de 604 personas, SS ABe 1,2 18 C2 , 262 C 3 y 70 DE .
p=
...
~ w.
p.
Pan reem plazar los valores en la frmu la. debemos primero calc ular los da tos
para llen ar est a Tabla:
(13.28)
(13 .29)
ABCl
C2
O
DE
PRO BLEM A
P.<J,
v'Ni:
0,13
0,16
0,18
0,21
0,36
0,<
0,42
0,46
'.
'.
N.
P.
55.420
0,15
0,85
IO.CXXl
C2
194.577
0,2
0,8
8.1 00
C3
227.06-4
0,23
0,71
8.100
DE
6] 287
0,3
0,7
9.025
ABCI
Total
540.34 ~
132
'.;
N./f
~ K-
1.995.1 20
7000 72
85 81019,2
2.765.64 1,9
I N,..1flf. V'.:2QJ4gm,1
Total
16
100
00
00
ss
N,.,p;a;:
N.';;~
7~,6
\':19,51
864,79
1.059,63
306,44
t..'
31. 132)2
40871 ,52
13.290,27
Ree m plazando:
p = (0, 1 0,1 5) + (0,36' 0,2) + (0,42 ' 0,23) + (0,1 2 ' 0,3)
p = 0,22
20.348. 553 , 1 ' 2 430 37
022
1 9 '"
, ,
o -604 . 540 .34Sf .
, -
92.498, 7 1
540 .348l
0 ,22 0,03
(0, 19;0,25)
C ONCLUSION
Con 9 5% de confia nza pode rnos afirma r que el po rcentaje de pe rsonas mayo res
de 18 aos que esta de acue rdo con la prohibicin a homosexuales para cont raer
matrimonio se en cue ntra entre 19% y 25 %.
l:n
Capitu lo 14
El muestreo por conglomerados presenta dist incion es im port antes respecto a los
dise os aleatori o sim ple y est ratficado. Un a caracte rstic a distintiva dice relaci n
con la naturalez a de los conglomerados.
Un conglomerado es una unidad de mu estreo compues ta po r dos o mas
ele mentos de la pohlacin . En mu estreo por conglome rado s la inferencia 110
se realiza a partir tic la observa cin directa de los elementos q ue co m pone n
la poblacin. En efec to, la un idad de muestreo es el conglomerado y ste est.i
com puesto de d0S O ms elem entos.
Los ele mentos q ue componen los conglome rados so n heterog neos y los
c.:mglomerados son unidades de muestreo parec idas entre si
Para generar co nglome rados se requiere de una varia ble que agrupe los eleme ntos en grupos compuestos por ele m entos con p untu aciones di stintas. Por
ejem plo, para estu diar con sum o de sustancias stcoac t tvas en una un iversidad se
puede establecer qu e cada cu rso es un conglomer ado e n el e nt endido qu e en
cada uno de ello s h ay di stintos valo re-s en el indicador de co nsumo.
Nt ese q ue el r37.onam it"nto para la co nstitucin de co nglomer ados es inverso
al utilizado para generar est ratos. Los estratos est n co mpuestos po r eleme ntos
parecidos y los conglome rados por elem entos disti ntos en la variable medida. La
lgica que subya ce al m ue streo por co nglom erados se suste nta en el hecho que
todo s los cong lomerados son pareci do s y, en consecu enci a, resulta razonab le elegir
slo algun os de ellos para obtener los valores qu e permitan inferir a la poblacin .
En el limi te, si todos los conglome rados son igual es es suficie nte sef ..ccionar slo
uno para est im ar el parm etro poblad ona!.
Una ventaj a del m uestreo por conglome rados es q ue no se requiere de un
mar co muestra ! q ue incluya a todos los elementos de la pobl acin . En efecto, slo
es nece sario disponer de l Hstado de elementos qu e cornponeu cada co nglo merado
seleccio nado para conform ar la muestra.
En el mbito del mues treo po r co nglome rado s cabe diferenciar e nt re conglom erados sin submuestreo y co n subm ucstreo. Est a distincin es relev ante, dado
que la realizaci n de subrnuestreos en los conglo me rados da luga r al muest reo
po r et ap as. El conglomerado sin submuestreo se conoce como co nglomf"nldo
e n una e ta pa y se ca racteri za porqu e se seleccionan t odos los eleme ntos fluC
componen el conglomerado elegid o.
IVi
Seg n el nume ro de eleme ntos cabe distin guir e nt re co nglom e rados de igual
Isunto tamao. N orm alme nte los co nglomerados ser n de d istinto tamao.
r -je m plo, sern conglomerados de distin to tam ao las ciudades de un pas,
n -anz anas de un a ciudad o las vivien das de las manzanas. Los conglo m erados
igual nme ro de eleme n tos no son com unes, sin embargo, pe rmiten ilustrar
uso de las f rm ulas e introducir en la com plej idad del m uest re o po r co nglo erados de di stinto t am ao. U n eje mplo de co nglo merados co n m ism o n mero
ele mentos so n los cig arrillos en cajet illas.
Desde ot ra perspectiva se distingue e nt re co nglo merados na tu rales y de re as.
1 conglom era do na tural p uede ser la su cursal de u n banco en la q m~ se est udia
isfaccin laboral y co nglomerado por rea es un a zo na censal do nde se inda ga
pe cto a co nsumo de t e le visin .
El presen te captulo t ra tar del dise o po r conglome rad os sin submuestreo
co nglomerados de igu al ta ma o.
"
136
13 7
'0
10
(1 4.3 )
S; .
(14.2)
Ira ilustrar el com portamiento del coeficiente p se presentan dos poblaciones
- tres conglomerado s cada uno.
Poblacin 1
Conglom.:rado 1
150
Conglomerado 2
130
Co nglomerado 3
160
300
14.4. Notacin
Para caracterizar la es truct ura del muestreo por cong lome rados sin submuesrreo
es prec iso est ahlecer una nomenclatura de identificacin.
14 .4 . 1. N otaci n poblaci n
Poblacin 2
500
148
150
152
290
480
l37
140
143
310
510
153
155
158
XIII
xm . "
,vI I
,v12
X lli . "X I I
u X u . . ,xl. i
El calculo de la meda se obtiene como variacin de la media arirnetica utilizada en muestreo uleatoro simple. La medi a muestra] corresponde a un promedio
de medias. En particular, el promedio de las medias de los conglomerados
La expresin de la media de cada conglomerado y de Id med ia muestra] se
present a a continuacin.
,'vIlI
(14 .4)
,,,x L A1L
(1 4.5)
K= Nume ro de conglomerados
= Elemento genrico i del con glomerado genrico h
X l.i
}v1h
'"
__ ,MI.
M ::O~K-- = Tamao med io d e conglomerado
14.5.\. Errortipico
La est ructura de la frmu la es anloga a la frmula utilizada en mu estreo aleatorio
sim ple con corre cci n par:! poblaciones finitas. Las diferenci as son consecuenci a
de la nat uraleza distint a de las unidades de obse rvaci n. A saber, en mu estreo
aleato rio sim ple se miden elementos y en muestreo po r conglomerados se m iden elementos agrupados en conglomerados. Para evide nciar las similitudes y
diferencias se presen ta n ambas f rmulas.
Varianza del esti mador MAS
m=
Im
10 ,1
m I.
(14. 6)
= Tamao de la m u estra
tm,
= ~~_
,
_=Tamao
(14.7)
m edi o d e cong lo m e rados
Ntese que S2 mide dispe rsin de las pu ntuaciones respecto a la media y S2 c mide
la dispersin de las medi as de los cong lomerados respecto a la media muestra].
Las frm ulas siguientes lo ponen en evidencia.
14 .5 . Estimacin de la m edia
La media muestra! es el m ejor es timado r de la me dia p oblacic nal . Se dem uestr a que posee los atrib u t os de u n bu en estimador: Insesgado, con sistente y
eficiente.
140
h x,-x)'
i:I'---.__
n - 1
(14.8)
141
;;. .
P RORl B 4..... 1 7
(14.9)
"
( 14. 10)
Dep artamento 1
4,3
Dep artamento 2
4,\
Dep artament o S
3,9
[)"lwum<mto 4
4,5
Deparummto 5
Departamento 6
4.2
Departamen to 7
4, \
Dep artamen to 8
' ,7
'1
SOI.UClQN
n< po r
M.
K
~ .3.
Intervalo de confianza
= 65
=8
z"l2 = 1,96
11
-ervalo de confianza se est ablece segn el mi smo modo u t ilizado en los deproced imientos pro babil sticos. En co nsec ue ncia, la expresin del inter valo
~ comp uest a de tres t rm inos. A sabe r, d estadstico m ucst rai, el coe f icente
nfianza asociado al nivel de confianz a de finido y el error t ipico.
o
(14.1 1)
".I2 V K .
tl
'""
t . Yla S:corre!oponde n
(14.12)
si-
H(x. - x.)'
;'l l d
,-
-.
D.
Su -
0,03 57
4,2 1,96
y65-8
S'
65 .
0,035 7
s2,.= 0,0357
4,2 1,96
"
(1 4.14)
p =~
y65-8
( l"
4,20,12
V~-: ~~ . s';.
( 14. 15)
Donde:
(4,08; 4,32 )
(14 .16)
CmolCLUSION
(14.13)
( 14.17)
(14.1 8)
s;..
5:(P.- p,)'
,.,
(141 9)
. 1
n
PRO BI_F. MA 18
144
145
0,5 5
0,36
O,SS
D!opw,; umnto 5
0,'> 7
t Departamento 6
0,56
s~=
0,5]
lkparurTlffito 2
_
'\ / 32 - 6
0,) 6 1,96 -32 ' 6 . 0,(X)(}25
0,56
P.
Departamento 1
s:.c = 0,00025
0, 0 1
0 ,000 25
0,56
0,5 6 0,0 1
(0,56; 0,57 )
iOl.UClON
C O::'CLUSIO N
K = 32
11 = 6 .
ZuIl = 1,96
'ara los clculos utilizamos las siguie ntes frm ulas:
.\'.
D.
p< = ~-'
n
s;.
n(p. - pJ'
0,56
"
Captul o 15
Los conglome rados sean stos natu rales o po r reas norm almente tendr n distinto
nmero de ele me ntos. As, por ejem plo, co nglomerados natu rales como salas de
clase tiene n disti nto nm ero de alum nos, y conglo me rados de reas como zonas
censales tienen di stinto nmero de viviendas.
Co nglomerados de dist into tamao suponen variaciones respecto a las frmu las utilizadas a propsito de co nglo me rados de igual tamao. La d iferen cia que
no es concep tual dice relacin co n la mayor co m plejidad de clc ulos al incluirse
tam aos diferentes.
As, por ejemplo, e n el mbito de la infer enc ia las frmulas del estimador
de la med ia y el er ro r tpico del estimador son m as co m plejas al considerar para
cada conglomerado un tam ao distinto . En rel aci n co n el costo se generan
incert idumbres relativas al tam ao de la m uestra , da do q ue sta dep ender del
t am ao de los co nglo me rados que la com po nga n.
La nom enclatura se m antien e adquiriendo relevanci a el tamao de cada
conglo merado ffi h y el t am ao promedio de los co nglo me rados -m.
(15 .1)
( 15.2)
149
x,.,
x,..
r.\ i.
(1 5.3)
Donde:
=~~
.
LX,
Sl
( 15.4)
= i-1-
n_ 1
I m;
.l
(1 5.9)
IM~ f.
J:c ..
( 15.8)
( 15.5)
"-'- tA.f~
,.,
( 15.6]
Ree mplazand o:
"
K'
51
( 15 .7)
(1 5 .1 2)
Dond e:
K :::: Nmero de conglomerados
= N mero de cong lo me rados e n la m uest ra
TI
fM~
M == ..~
"1
PR.08lE~IA 19
N" de empleados
Puntua<i.;n SillisfKll
M,
i,
"
ubol'lll
(x
)'
K _ " ) ~t.,,-._--;m_,_
( KtlMl
11 - 1
m~
m ::o ~I--
"
Se calcul a:
Oficina
.\.1.i .
.',
167
4,79
1
. 2
95
5,9-1
39
4,33
21
108
21
91
:e. .....
mj
27.889
4 676
78'
"
2.025
5'0
67
H S9
918
OS
9.025
UZO
5,14
39
1.52]
351
81
3,79
108
11,(,(;4
2.268
441
91
8 281
2.184
576
40
1.600
300
81
39
1.521
J-l(l
100
)O
'O
1.600
3:!O
34
i:.M.~.
,., = 7Jl
i r. =69.615
,.,
i:>.m., 13.547
,.,
i:~ = 2.723
,.,
Z8
167
5,96
12
"
"
3,75
67
16
40
4,44
10
39
3,90
)O
'O
5,00
f Mo '" 151
.,
.,
x. =7J ]
SO LU C iN
K = 52
= 10
1f
153
2.723
".
196
256
1"':_."
. '
4,3 :t 1,96
2.30 1.72
10 - 1
4,8 0,59
(4.2 1; 5,39)
(15.17)
C;-~NCLUS I N
Co n ~5% de con fianza podemos afirmar que el pun taje de satisfac ci n labo ral,
una escala 1 a 10, se encuentra en tre 4,2 1 y 5,39 puntos.
e..
(15.1 8)
K -n
Kn,'\P
Fl orcced im iento utiliz ado a propsito de u na variable c uantit ativa funciona con
uu a variable dico t mic a que genera proporcion es. En rigo r, la gene ralizacin del
t'. am ie nto realizado con medias a proporcion es es inmediato. De hecho, la est- vctura de la meda muestra es anloga a la de 1.. pr oporci n mu estra! y la media
d~ cada co nglomerado se replica en la proporcin de cad a co nglomerado.
( , L:lSfrmulas para la ~ropo~~n muest ra! y la proporcin de los conglomer[ 'J S se presentan a conun uacion.
" p,
LM,
P = _'.'J_~
,., ~ M,
.,
( 15.13)
f(",P,-,".)'
,./
n -
( 15. 19)
tm~
m=-,.1n-
( 15.20)
Donde:
K = Nmero de co nglomerados
n = N mero de conglomerados en la m uestra
_ i>v,
0;
(1 5.14)
..
I ,:a, = Total
o.
~a ~,
= ~ l_
m.
20
En una empresa se encuesta p ara conocer la proporcin de empleados qu e cam biara de empleo. Se o pt po r muest reo po r co nglom e rados de di sti nt o tama o,
ya que la e mpresa cuenta con oficinas co n distin ta ca ntidad de funcio narios. Se
dese a crear un inte rvalo con 99% de co nfianza p ara poder estim ar la proporcin
a nivel poblacional. La empresa t ien e 3S oficinas, de las cuales se selecc io nan 8.
A continuac in se presenta una Tab la con info rm aci n acerca del tamao de cada
ofici na, y la proporcin de personas que conte st afirmativamente:
P RO BLE.\ l A
(15 .15)
,
1), 2. 1. Error tp ico
(
.c. cccpto es el mismo cid error tpi co del es tim ado r de la m edia . Se prese nta la
' un...a del es timador, El e rro r tpi co es su faz cuad rad a.
(15 .16)
~"Ik empleados
Oti<iJl~
S.tisf~L-cin
m.
,' 00 d ~mplo:o
Proporcin
P.
Se calculan :
\O
0,40
l'
0,43
r,
Ofi1\a
12
0,50
0,38
15
0,47
0,43
22
0,36
l'
a l;
",m.
16
'0
100
6,02
36
8'
1%
36
72
144
3,04
24
64
7,05
49
105
225
3,01
21
49
0,57
7,92
64
17.
48'
7,98
64
112
1%
0,43
\O
11
0,45
3,01
21
49
\O .
4,95
25
55
121
.,d,m.'" 710
ma1.628
.tlll."
o., 120
d. " 5)
",
",
"" 35
11
""
.,
"'
Reem plazand o:
10
(a, - p,,,,,m.) l = 31 7 .,
V :-w:-i2T '
35 -10
35
7,38
10- 1
0,44 0,05
(0,39; 0,49)
C ONCLUSION
156
157
Capitulo 16
En est e cap it ulo se presentan los muest reos polier pcos. C aracters tica de estos
procedtmtentos es real izar en form a sucesiva seleccin de elementos dentro de
cada u no de los conglo me rados q ue co m pone n la m uestra . En efecto, puede
gene rarse una segunda seleccin de ntro do:" cad a co nglo merado y una tercera
seleccin dentro de las unidades de m uestreo que componen la segunda seleccin y as sucesivam ente. En virt ud de lo anterior, se de no m inan muestreos co n
submuestro y seg n las etapas reciben (,1 nombre de bict pico, trie t pico, etc. El
submuestreo pu ede efectuarse den tro de cong lomerados naturales o dentro de
reas. En ambos casos la lgica es la mi sma .
La d ijer en cia entre el muestreo mon oet picc y po liet pico se pu ede ilustrar
grficam ente presentando las nni dudes pr ima rias y sec undarias de mu estreo.
::.mri"'....;i(.. l""fi ro 13
Muestreo po r con glomerado s 1 eta pa
ttEBIE
8IEEHE
18IE EHE
160
refer irse a las un idades de muestreo de cada e tapa se uti lizan los te rm inas uni dad
primaria de m uestreo (UPM), un idad secundaria de mu estreo (USf\I), unidad
terciaria de m ue str eo ( UT M) y scc estvame nr-,
La seleccin de la mu est ra polierjplca im plica disponer de un marco muestra!
apr opiado pa ra cada una de las unidades de mu estreo. El muestreo es jerrquico,
de modo que la unidad primaria de m uestr eo contiene a la un idad secundari a
de m uestreo y st a a la unidad tercia ra de mu estre o. Carta cter istica disti ntiva
del mu estr eo por e tapas es que el ma rco muestra] de un a etapa posterior se
limita solame nte a aquellas unidade s de m uest reo seleccionadas en la eta pa que
le ante ced e. Los marco s mu estrales de las sucesivas et apas son independien tes
entre si.
A modo de eje mp lo, considrese un est ud io de opinin de est udiantes u niversitarios. Las unida des primarias de mu estreo sern las uni versidades del pais.
Se seleccionan como un idad es sec undarias las facultades en cada un a de las
unive rsidades elegidas. Las unidades terciarias se rn los cursos de cada facultad
y, finalmente, las unidad es ltimas de muestreo so n los estudiantes de los c ursos
elegidos. En este ejem plo el proceso poliet pco h a est ado com puesto de cu atro
et ap as. Nt ese que se requerir de marco mu est ral pa ra seleccionar estudiantes
de los cursos elegidos en la ltima e ta pa y no se necesitara el list ado de tod os los
est udiantes del un iverso de uni versidades.
El diseo de u na m uestra polie t pica implica tornar cuatro de cisiones de
importancia. A, saber, qu p recisin se requie re, cu ntas unidades primari as amerita seleccionar, cu l es el t ama o ap ropiado de las unidades primarias y cuntas
unidad es sec undarias am eri ta seleccionar en cada un idad primaria. Respecto a
la seleccin de unidades primarias, sec unda rles, tercia rias, etc., ca be realizar las
siguie ntes ap reciacio nes.
El nmero de un idad es prim arias a seleccionar dice relacin con la precisin
requerida y con la varianza que se conjet ura corresponde al d ise o en ejec u cin .
Las unidades primarias de m uestreo sue len se-r un idad es natura les y en tal
caso d tamao est p reviame nte defin ido - u nve rstdades, com unas, sucursales
de un ban co. Cuand o se t rata de reas el criterio es definir un idades primarias de
tamao medio, dado que grandes reas generan dispersin en la seleccin posterior
pe rdindose la vent aja de costo qu e otorga la formacin de conglomerados.
El nme ro de unidades sec u nd ari as a seleccionar dep end e de la variacin
de ntro de los conglomerados . Si se verifican conglomerados homogn eos pocos
elementos sern suficien tes para una satisfact ori a infe re ncia y, po r el contrario,
heterogeneidad dent ro de los conglomerados imp lica m ayor nm ero de elementos a seleccionar. Para medir la homoge neidad de los conglomerados se utiliza
el coeficiente Rl . ste ind ica la p ropor cin de dispersin total ex plicada por la
d ispe rsin intraconglomerados. La frm ula del coeficien te es la siguiente.
Me D
"
(16.1)
" =1 - - -
1 ; 1
rio ndc:
( 164)
Se puede seal ar q ue el sub muesrreo prese nta como ven tajas la necesidad de
lfCOS muestrales acotados e n cada etapa y el meno r coste de seleccin de las
.inidadcs ltimas -que corresponden a las unidades de anllsis. Las desventajas
.ce n re lacin co n menor p recisi n po r acumulaci n de errores en las sucesivas
lpa s y la co mplejidad de calcular las fuentes de variaci n asociadas a oda
-tapa.
l~
-M-- l"
I M.X:~
- (K
n
:t, ::O
( 16.2)
~. ,
( 16 .3)
,c,
m. - 1
(16.5)
( 16 6)
Reem plazando:
K~
(-M O
"
l"
. -
LM~x~
1
Z0/1
(I<.K=!.j(-L),
11M2
+ _]~_ 2; MI
('!'.c"m,)(",,-)
M.
(! 67)
Se calculan:
PROIIU::MA 11
En una empresa se mide nivel de motivacin . Se apli c un a encuesta con mu estr eo po r conglomerados en do s e tapas. En la e m presa trabajan 4.200 person as,
repartidas en 15 oficinas. Se m uestrearon 7 oficin as. Para inferir a los empleados
se fij 95 % de con fianza .
En la siguien te Tabla se pu ede observar la cantidad de empleados por oficina, cuntos de estos fueron seleccionados, el promedio de cada oficin a, y su
respectiva varianza:
06ci na
~ de empleados
Promedio de
M.
en la mu estra '" .
100
220
20
42
Olicin~
S'
5,3
3S
7,5
130
"30
37
10
345
69
40
500
100
45
12
' 30
30
31
4,7
155
JI
30
6,'
i M.'" 1.720
.,
Mli l
(M'%I- ,"1,i.1l
4200
659.344
2120
7700
60.712,96
6600
5530
2190 24
6lXXl
])800
4458 .009,96
11 040
22500
30.913.600
24000
800(1
220.900
4700
4650
361.681,96
4278
I
__
'"'.1 [M__)[")
a " SS.738
~M.i. = 66400
..:.,.M
:..::.i-_ Jo
mi
"' ,
Reem plazando:
:t',j.
15
M o 4.200
o 15
n =7
zQ/7. = 1,96
33,88 1,96
1 J,6. 148.878,82 .
15 7 ,246,
(~)(
_
7 ' 15'1 246" >8.738
33 ,88 5,46
1i: i . Zon
- K
_
( ,\ 1 n ~'" M
(28,42; 39,34)
C ON CLU510:-:
Con 95% de confian za podem os afirmar que en la pobla cin la mo tivacin de los
empleado s, e n una escala de 1 a lOO, est compren dida entre 28,42 y 39,34 .
n
164
165
PROII I.EMA 12
I
( 16.8)
\
(
t
\
varianz a del est im ador de la proporcin incluye las varia nzas entre y den tro
. J~ co nglo me rados co mo comp on entes de la varianza total.
( n' =
pi>
lvllJe
s~
lIKi\{-
~~ I
MI.
mI. - 1
(16.9)
100
220
-,
P,
r.q.
20
10
0,50
0050
0.25
05 7
O/IJ
0.25
150
"
25
0,-1)
0,25
) 45
69
"
0,57
36
0,51
O,4>J
0,25
0,41
0,24
30
500
100
ss
0,59
150
so
20
0,40
0,60
0.24
155
31
18
O,51l
O,41
O.14
.,
( 15.10)
}:M. '" U 20
=;
4.200
K = 15
/1
:::; 7
z<J? = 1,96
I
(
) .10
zun,.
( 16.11)
[-M~-]i:.'\I,P,
/1
K ).
F - --
Lm p lazando en p :
( (la. =
Util izam os las siguientes fr mulas para h acer los clc ulos:
(16 .12)
(K-n]( I l ~'
- -K
.. 1
- -
nM
~~- + - l'~2'}; \f
"KM ~~I
(MM~-"J[p"
)
m.. - l
.:.:.:11.--.:.:..;'
_ A !JI .
(16.13)
se ca cu
Al' (...
-m'l['.,. )
Ofidn3
M,p.
M~(P.- P..j1
50
105,6
l2.5,4
43'
224.58
SS,S
22S
154,8
179,4
Z97,56
352,3 1
295
3600
'00
100
306,25
245
89,9
290,7
1S3,76
i M, r. ; 925,2:
...
A-f
101
,\-r;- '".- 1
r~
)(J:"1L
)'" 1.719,13
MI
,". -1
Reemplaz ando:
15
4.200 ' 7
' 92 5 2 ~ O.4 7
'
52 12,52 _ 86875
7- 1
'
= 245,7
0,47 . 1,96
(15
-))(_
1__
s
7 .245,7
. 1 7 19,13
, ) . 868,75 + 7 ' )5 1'245,72
0,47.0,07
(0,4; 0,54)
C O:-JCLU510N
N,'m"'m de
168
l(
Tamao de eoo~!orn('fm
-T,;lTLIo de poblxin
l(
Seg u la frmula prese ntada, cada ele mento tiene la m ism a probabhdad de
-ccin indepe ndie nte del tamao del conglomerado de pe rtenenci a.
\ Resulta evide nte consi derando q ue en la f nOl " .l el t am ao del conglornc .-lo figura simultneame nte en el numerador y denominador. En definitiva, la
;olm uld es una expresin de IJ. fracci n de m uest reo, es dec ir, el cocie nte en tre
~ amao de la m uestra y el t am ao de la poblaci n.
\ A modo de ejem plo, supngace que se des...a una mu estra eq upr ob abl.... en una
comun a q ue tiene 500 m anza nas y 50.000 vivie ndas Se decide selec cio nar 100
~ oz anas con probabilidad de seleccin proporcional al ta m a o y 10 viviendas
i cad a manzana elegida.
>'::...
Capitul o 17
0,4
10 (vivie ndas por ("onglorne rado) ' 40 [t amao del conglom erado) = 0,25
( " babilidad selecc in de unidad secundaria
;... verifica q ue en las ma nza nas de edificios y casas la prob abil idad de seleccin
El muestreo sistem tico es una variante del mu est reo aleator io sim ple q ue se
rem onta a mediado s de los aos -t0. Desa rrollad o por L.H . Madow y M. G.
Madow ( 1944) y WG. Coc hran ( 1946), tien e el m e rito de permitir un a senci lla
selecci n de los elem entos que componen la muestr a. Se simplifica la seleccin
po rque siendo est a aleatoria es t am b in sistemtica. El azar opera e n la selecci n
segn un modo predefinido.
El procedim iento de seleccin es siste mtico a pa rt ir de un element o elegido
al azar qu e o pera com o arra nque aleatorio para la selecc in autom t ica del conju nto de elem entos que co m po ne n la muestra. El primer elemento selecc io nado
condiciona los siguien tes, que son elegidos a pa rti r del arra nq ue aleatorio y seg n
un salto de amplitucl cons tan te . La seleccin sistemtica implica UII nm ero de
arranque y un in tervalo de muestreo. De fi nidos ambos la muestra queda au tomticam ent e establecida .
Desde el punto de vista operati vo se procede s..gn las sigu ie nt es etapa s.
G e ner ar un nmero de arra nque aleator io. El num ero de arranqu e sera un
valor i q ue est ad co ntenido en el intervalo con co ta inferior 1 y su pe rior igua l
al valor del coeficien te de elevacin (N/n). Este elemen to ser \., primero
q ue compo ndr la m uestra.
Seleccionar de modo sistem tic o los siguien tes elementos a k distancia del
punt o de arranque aleato rio. El valor k co rresponde N/n .
En consecuenc ia, se establece la siguiente sucesi n a part ir del primer eleme nt o i , i-ek, i+2k, i+3k, ... .i+( n-l }k. El procedimie nt o es sistem tico porque se
van selecc iona ndo elementos que estn a k lugares del i- simo de la lista
Por ejemplo, sea N= l ,000 Yn= 100 el valor de k co rresponde a 1.000/ 100== 10. El
p unto de ar ranq ue aleato rio se r un valor comprendido en t re 1 y 10, Su p ngase
q ue al azar se: selecciona el num ero yLos valores que com prende 1;1 mu estra sern
los siguie ntes: S, 15, 25, 35, 45, 55, 65, 75, 85, 9 5. N tese q ue se hall seleccionado
10 n m eros q ue correspo nde e xactamente al tamao de la muestra.
C abe destac ar q ue en c iertas circunsta ncias e l m uestreo sis te mtico puede
ser mas represen tativo qu e el m uestreo alea torio simple. En efecto, el muestreo
sistemtico asegu ra saltos sistemticos, de m odo q ue ningn in tervalo amplio
C abe destacar que el muestreo sistem tico se suele utilizar en el conte xto
diseos por etapas donde este es slo un a e tapa de la selecci n de la m ue stra.
;i, por eje mplo, siendo las unidades primarias ciudades se puede generar un a
cccin sistem tica de zo nas ce nsa les dentro de las ciudades y,pos te rio rme nte ,
ec ci n siste mtica de viviendas en las zon as ce nsales eleg idas.
En m uest reo sistem t ico e l es ti ma dor d e la m ed ia y la proporcin es un
.imadc r nsesgado del par ametro poblacional. Sin e m bargo, f'1clculo de la
-innza del estimad o r re sulta t ericamente probl emt ic a. En e fec t o. a dfcica de otros muestreos no es posible estima r tnsesgademente la va rianza
m ed ias y pro porc iones a part ir de una sola mue stra . 'Iukey )' Jones ( 19 56 )
mtean como so lucin seleccionar vari as muestras siste m at icas generadas
172
'"
de ntro de cad a arca seleccionada se selecci ona una submuestra de los elementos
que la compon<~n. Se suelen ut ilizar dos alternativas de submuestrcc dependiendo
de la info rm acin disponible. A saber, subm uest re ar el arca selecctoneda en rea s
ms peque as si la cartografa lo permite o enumerar todos los elementos del
rea seleccionada para elegir un subconjunto aleatc riarncnt e.
Los lm ites de las reas p ueden dehnirse a parti r de hitos na turales como
a,vcrudas o ros y segun divisiones politico-administrati\as como comunas o
zo nas censales. En los sectores ru rales sude ser eficaz el uso de h itos na turales
para establ ece r re as.
En encuestas urbanas las arcas pe rm iten seleccionar a bajo costo viviendas
Para estos e fectos se precisan m apas q ue co ntengan las m anzanas de la d uda d,
a fin de enumerar todas ellas. En umer adas las m anzan as se podran empadronar las m anzanas seleccionadas para elaborar un list ado de las viviendas que
las componen. Posteriorme nte selecc in ale ato ria de VI viendas y, por lt imo,
seleccin de pe rson as en cada vivien da. El proc edim ien to SC' puede simplificar
evita ndo el lista do de vivie ndas y realizando la seleccin segun salto sistemtico
o, sim plemente, se leccio nando al azar una de las c uatro calles de la m anzana
)" encuesta ndo todas las v...rendas qUt.' la componen. Se aconseja, sin embargo,
que el n me ro de viviendas seleccionadas e n cada m anzana sea propo rcio nal al
t ama o de la m anzana
La seleccin de viviendas puede presentar problemas inesperados que se
resuelven segn criterios p re viame nte establ ecidos. Entre estos cabe dest acar
un sitio donde se espera e xista un a vivienda, hayan efectivamente dos; o una
vivienda donde se su pone vive una familia, co nvivan dos, constituyendo dos
hogares independien tes.
En ge ne ral, el m uestreo por reas se asoci a a dise os po r conglomerados y
poliet pcos
Captulo 18
La seleccin COIl probabilidad proporcional al tama o es una adap t acin de la lgica del m uest reo estratificado co n af ijaci n proporcional a dise os m uest rales no
estratificad os. Se tr ata de una superaci n del muestreo aleato rio simple en la q ue
se incluye co mo in for macin au xiliar el tamao de las unidades de m uestreo.
El muest reo con probabilidades pro po rcio nales al ta mao puede rea lizarse en
di se os sin eta pa s y polietpicos. Subyace la lgica de diferenci ar en la m uestr a
unida des de muest reo peq ue as y grande s y, poster iorm e nte, asigna r a las un dudes probabilidad d e selecci n proporcional a su ta ma o. En particula r, m ayo r
probab ilidad de selecc in a las unid ades grandes y m enor a las un idades pequeas.
".
(x
P,
1- ~----'..
= --
N ' n
,.
( 18. 1)
D onde:
N = Tama o de la pob lacin
= Tama o de la muestra
x = N me ro de elementos en q ue apa rece el suceso
p', = Pro babilidad del intervalo asoc iado al suceso
11
0 (.
' (X,
i ; - N <;)
1
~ N 1n (n=I ) ~,
177
( 18.2)
(18.3)
-ernplaze ndo:
- --/ -"2:
" (_Xi - Nx )
f'PIl(n -l) ,. P,
[ /8.4)
PP'
13
indaga res pec to a la disponibilidad de tecnologa computac ion al en establenentos de educaci n m edi a, En la ciudad existen m uchos esta blecimientos
}tam ao pequeo, algunos medianos y poc os est ableci mientos grandes. Se
-oone que la infraestructura computacional y su utili zac in esta relacionada
.>11 el t ama o del estableci miento,
La seleccin de elem entos media nte m uestr eo aleatorio simple dada lugar a
' a proporci n ma yor de es tablecim ien tos peq ue os sesgando el result ado del
stud o. Sin emb argo, consi de rand o el tam ao del est ablec imie nto y selcc ctondo en forma proporcional al t ama o de sto s se obtien e una m uestra ms
.irescn ta rve que m edi ante la selecci n aleatoria sim ple. D e hecho, un diseo
'Iuip robahilistico podr a dejar fuera de la muestra a los pocos establecimientos
.J nLles exis te ntes.
Sup ngansc los siguientes valores num ricos para el ejemplo rese ad o.
OIl I EM A
/~
Probah,lidad
81100
9- 15
11100
16-2 1
61100
22<)0
wrcc
10
3 140
10/1 011
41-0
9/ 100
10
50- 59
10/100
13
6072
IJ Il UO
13
nss
13/ 100
10
'5
l((). IOO
15/ 100
Establec tmien to
Intervalo i<."'lmllloo
100
. u ntos co mputa dores en promedio es tn conec tados a In te rnet ?
P,
6
0,09
0, 1
0,13
SO l u a N
x _
"_( x, )
"" -N ' n ~ ~
Donde:
N = Nmero de establecimientos
:=: Tamao de la muest ra de establecimien tos
x, = Nmero de computador es conec tados a Internet por establecimiento
p, = Probabilidad del in ter valo asociado al es tablecimien to
'1
1 [6
7 9 9 10 ):=: 6,8
oT
" + O 13 + 01.3
, + 015
,
[_7__(10'6'8))', [ l _ (10'6,8)l',
0.1
0,13
'~- IO" S(5 -1 ) ( ~ __ (10 ' 6,8))', (Jo._(1O ' 6.8)1 '
0.13
~I
0,13
Captulo 19
=33
'
6,8 3,6
(3,2; 10,4]
:ONCl.USION
10.
Los m todos direc tos de est im aci n so n senci llos y si el aza r funcio na adec uadam e nte dan b ue nos resultados. Sin em bargo la eficacia de la est im acin PU1.'<il'
m ejorar si se u tiliza una variable auxiliar co rrelaci o nada co n la variable de estudio. La variab le au xiliar p uede ob te nerse de m e dic iones an te rio res resu ltado
de un es tudio d istinto, pero rela cionado co n el te m a in vest igado . Tam bin se
ut iliza co mo in formac in au xiliar el resultado obte nido al aplicar una enc uest a
piloto pa ra evaluar el inst rum e nto de m ed ida. La variabl e en estudio y la variable
au xiliar deben ser m edi das e n cada elemento de la mu estra.
Tres 'procedim ien tos de esti m aci n indir ectos so n de uso com n . A saber;
est imado r de ra zn . d e diferencias y de regresi n. El est imador de productos
ha sido ela borado, pe ro su ut ilizacin es poco h abi tua l.
En rigor, los est im adores ind irec tos son variaciones de una mism a lgica .
Dad a la ex ist en cia de rel aci n e ntre la variabl e en est ud io y la variable auxiliar
se asume qu e es ta rel acin es linea l. En virtud de lo cual los est imador es ind irectos supone n e l ajuste de un a rect a a los puntos obser vados. El estimador de
raz n asume q ue la recta pa sa por el o rige n d el plano cartesiano. El est im ado r
de regresin incluye el clculo del coeficie nte d e regresin p ara m ejorar la
calidad del est im ador. En e l est im ador d e dife rencias se asum e qu e el valo r J....J
coeficiente de regresin es l .
Los esti madores indirectos sern m s o menos preci sos segn el tipo de
re lacin ent re las vari ables.
Si los datos resp onden a una linea re cta q ue pasa po r el o rige n, d mejor
estimador es el est im ado r de ra zn.
Si la relacin entre los valores de la variable de estudio y la auxiliar es lineal,
pero la rect a no pasa por el or igen , cabe calc ula r la pe nd ie nte de un a recta
qu e es definida por el coe ficiente de regresin, y el es tim ado r correspon diente se r el esti mador d... regresi n.
Si los da tos se ajust an a tilla pendie nt e definida por u n coefi cc nte dI' rcgresin de valor ] el es t im ado r de di fer encias es el mus ap ropiado.
Los estim adores ind irect os p ueden ser usados en div e rsos oiseo:-. rnunst rales
co n el fin de re alizar est imacio nes de la rucd a o la p ro porci n po blcciona l. A
fin de ilu st rar la lgica de los est im adores indirectos se t rata r el es timador de
raz n en co ntexto de muest reo aleatorio sim ple.
18 1
d
El estadstico del esti m ador de razn esta co m
en tr e la variabh- X en estudo y la varia-ble auxif~re~o e ~os tderm inos: la raz~n
de la variable auxiliar y .
' en segu n o ugar, l media
.-fx,
, =- ,-
(19.1 )
Lv'
.,
(19.2)
o en t rminos de raz n.
'
.: ..
.
..
.
..
"
"
..
.. ..
.. . .
...... ...
'
'
"
( 19.3)
La varianza del estim ado r es una variacin de la frm ula util izada e n
t
. na I.
.
. m ues reo
est ratific ado ...con , fi,, e,
... o" P" iporcro
(J~ =_N- n . ~
'.
N .n
( 19.4)
Do nde :
i:(x,- ry,)'
n- 1
182
(195)
~y
= 5,5
Sumato rios cuad rados de las variables med ida y aux iliar
(19.6)
Reem plazando:
r oy,
V-
.t
on
N .- tI
(19 .7)
.L;Y.
N _n .j.,(x; - ryj1
N.n
D~ = 15.000
.,
; -:""";-'-.,..,-
~ . Y c.,
L X; " 29 .400
,.,
~
sf
}:x,
11 - 1
L x,Y. =. 21.000
-,
S O LUCiN
14
Se e-st udia identidad sindical en afiliados a un a fede racin campesina . Se supone que esta variable est rela cion ada con los aos de afiliacin . Conociendo la
relacin e ntre amb as variables se usa estimado r de razn que sera ms preciso
que la est imacin directa. Los valores pa ra ide nt idad sindica l se m iden aplica n.
do una escala tul hoc. Los valores de la variable aos de afiliacin se encuent ran
debidamente regist rados. Se ob t iene un a mu estr a aleatoria de 300 casos de una
po bl aci n de 5.000 afiliados. Los valores de amb as variables en la muestra seleccionada se presentan a continuacin. Los datos obteni dos pe rm ite n estimar
el parmetro poblacional de la variable X ide nt idad sindical seg n info rm acin
aportada por la variable Y aos de afiliacin.
PRO BLEMA
Estimador de razn de XI
~
LX
x = . .y = 4 200 . 5 5 = 7 7
".....
- )' 3 000
,.,Y,
Razn XIY
N " 50 .000
n=
600
Varian za estimado r x.
y =. aos de afiliaci n
>
0 -
"
N - n
= --- -
Nn
x,l - r ~ - 2r2:~; Y;
L X, " 4.200
;~l
;_/
1./
LY." 3.00 0
;~l
184
18 5
-Capitu lo 20
Jl ecmplazando:
); =
s~ =
-6 00 - 1
01
,4 21 .000
98
"
50.000 600
o
tervalo de confianza
Reemplazando
-; t'~t i mJ con 9 5,5% de co nfianza q ue el valor del parm etro poblacional est
co mp re ndido en e l inte rvalo 6,9 a 8,5.
Los m uestr eos no probabilst icos son procedimientos de seleccin q ue se caracteri zan por q ue los elementos de la po blacin no ti enen una probabi lidad co nocida de seleccin. El hec ho de no conocer la pro babilidad de selecci n anu la el
uso de las he-rramie ntas ela boradas r ara inferir de la muestra a la poblaci n. En
co nsecuenca, en el muestreo no probabilstico es im posible conocer la magni tud
del error asociado a la estimaci n del par me tro poblact onal.
Las dos ven tajas eviden tes del m uest reo no probabilstico son la facilidad del
diseno - no se precis a ma rco rnucstral- y la dismin ucin de costos.
Se disti nguen diversos proced imien tos de muestreo no probabilstico. La diferencia e ntre uno y ot ro d tcc relac in co n el modo de seleccin de los elementos.
Se presen tan a continuacin bre vemen te los procedimientos m s utilizados.
D esde la teor a de la estimaci n son diseos impropios po rq ue no pe rmi ten
in jerir probabilisticarn ente rt'speno al valor del parm etro po blacio nal. En efect o,
dad o qu e los ele me ntos de la po blaci n no tie ne n una probab ilidad conocid a de
perten ecer a la muestra , es im posible co nocer la di str ibucin de probabilidades
de la muest ra y estab lecer un inte rvalo de co nfianza para la injerencia
Ter icam ente la d iferencia p rincipa l ent re ambos dise os di ce relacin co n la
distribucin Cilla pob laci n de las variable s q ue se miden . Los dise os probubtlsricos no necesitan del supu esto de distribu cin norma l de las vartablcs somcttd as
a est ud io. La seleccin aleatoria de ele me ntos seg n el teo rema del lim ite cen tral
asegura la distribucin normal de las m edias m uest rales. Sin e mbargo, los diseos .
no probabilsticos dependen JeI supuesto de distrib ucin no rm al de las variable,
para rea lizar un a est imacin sat isfactoria.
Una paradoja que emerge de los precep tos funda ntes de la inferencia estadstica.
Se sude jus tificar e-l uso de m uestreo no prohabiltst ico porq ue e n la pr cti ca
no siempre resul ta posible la selecci n es tricta mente alea toria de todos los elem entos qu e compon en la muest ra. A menudo muestras diseadas probabilisficas
pie rden esa pro piedad d urante la fase de t rabajo de cam po
188
E.a.f
Hombres
Mujo:rn
r",,1
1524
2539
4054
1SO.OOO
ISO.OOO
105,000
130.(0)
]SO.OO)
330.(00
115.COO
220.000
55 Ymis
SO.OOO
90.000
170.000
Tot,!
51S-Cll'Xl
485.000
1000.000
280.00)
Hombres
M \lj,'rr~
150
2539
ISO
130
150
<0-,.
10;
55 ym~
80
11 5
90
Tob!
SI>
" 5
Total
2SO
3JO
220
170
1.000
l.a vida ense a qu e a cada en trevistador no se le debe asignar una cuo ta grande
de elem en tos. Si est e no ope ra aleatoria mente generar sesgo en la m ues t ra. Las
cuo ta s se form an proporcionales a la distribuci n de las variables en la muestra.
La Tabla 15 presenta los ele mentos quc co rresponde n a un entrevistador.
Tabla 15.- Cu otas asignadas a un e nt revistado r. n = 50
Sexo-Edad
H"mb r~
Mujrre-s
Total
1524
25)9
13
40.54
SSYmi..
Tut,l
11
5
5
11
"
26
9
50
En la pract ica de los estudios de o pinin e invest igacin de mer cado s se ha extend ido el uso de un diseo muestr a] q ue co mbin a procedi m ien tos probabilsticos
co n selecci n m edi ante cuo tas.
Cabe destaca r dos lim itacio nes pro pias del diseo de cuotas.A sabe r, tem a de
las no respuesta y c umplim iento falaz de las cuotas asignadas. En efec to, el diseo
de cuotas no considera el proble m a de la no respuesta . Las cuot as se co m plet an
sin conside rar a los elem entos q ue no respond en, po rq ue est e n b lgica del
procedimie nto qu e est os sea n rem pla zados por otros cualquiera q ue cum plan con
las co ndic ion es exigidas po r la cuota. En con secuen cia est n subreprese nt ados
los elem entos que no son fciles de co ntacta r o ret icen tes a contes tar.
189
P""r otra part e, el cu m plimie nto de las cuotas no asegu ra la represen taci n de
p....olaci n. A saber, se pueden completar cuotas for ma lm ent e co rrectas pero
~1 ente inadecuadas. Po r ejemplo, se establece para la var iab le edad u na Cuota
" -eut a aos y ms, y se entrevista slo a personas prximas a sesenta aos,
L('ti,m do subrepresentadas 13<; p... rsonas mayores de setenta. Desde el punto
.4 del pr oced imien to se ha cumplido; sin embargo, la cuota generada dara
~~ 1. sesgo.. e n la infe rencia.
e.abe destacar que el m uestreo po r cuotas puede ser el nico p rocedimiento
! ccc n cua ndo no se dispo ne de un m arco apropiado p ara ge nerar una se:q" n p robabili stica de elementos. Ntese que para su ap licacin no se precisa
m arco muesrral.
: m uestr eo por cuotas e~ u na especie de m uestreo estratificado no p robab hs( ' " los en tre vistadores se transfor man e n un dispositivo alea torio en la seleccin
I~ r-cota asignada result a un p rocedi miento pot encialmente represent ativo.
\
) tJ .
cada e ntrevistador seleccion a segn una co nvenci n las vivi.. ndas que componen
la muestra . El entre...istador es un disposi tivo aleato rio y 1J. seleccin de viviendas
es al aza r. Sin embargo no es probabtltsnco porque normalmente no to das las
viviendas tienen la misma probabilidad de se r parte de la muestra. En particular,
cuando no se efect a un empadr on am iento previo d... la rut a a reali zar.
En este contexto se suel e distinguir en el mb ito del muestreo po r etapas
entre muestreo serniprobabilistico superior e inferior. El m uestreo sem iprobabil stco superior se caracteriza por que s.". conoce la probabilidad de selecci n d e
un con glomerado de la poblacin pero no de un eleme nto de ntro del conglomerado, y e l muestreo scmprobabsnco inferior se produce cua ndo se conoce
la probabilidad de seleccin de un ele-mento dent ro de un co nglo merado pero
no la prob abilidad de selecc in de ste. Un muest reo probabilistico debe se r
s i muhan ~~mentt:' semiprobab tlistico superio r e infe rior.
ues treos cu asp robahls ttc os son procedim ien tos de seleccin qu e incluyen
,t' -ccin pr obabilsti ca y no pr obabilstic a en form a simult nea. En virt ud que
prcbabihd ad de seleccin de cada demento no ('S co nocida, resulta Inviable
c. culo de los errores de mues t reo y la infe ren cia a la po b lacin or igen de la
j~ ' ra. En su ve rsin m as so fistica da se le suele denomi nar mu estreo proba -uc o de cuotas o alguna varian te que incluya el t rmin o probabilstico. Se
~~J_ltan a co ntinuacin muestreos cuasprobabhstcos.
,<1.
\
l."
~ dimicnro de muestreo mixto frecu e nte e n los estu dio s de opinin y de-r- udo. Se caracteriza por la selecc in aleatoria de- las unidad es primeras de
",_.,(.feo y la selecc in por cuotas de las unida des ltimas q ue norm almen te
}' rd adanos o co nsum idores. Una c uota es un con jun to de e ntrev istados q ue
l h rm J.n grupos excluyente s segn sus valores en las variables de clasihcaci n.
i, tlOr eje m plo, se seleccio nan aleato riam ente distr itos ce nsales y e n cada ds.elccc io nado se elige n al azar m anzan as y, por ltimo, e n cada m anzan a se
e-v-tonan person as seg n una hoja de cuot as.
....11 rigor, no corresponde utili zar los procedi mient os de inferencia, sin eml ,d(' modo im propi o se su ele inferir a la pob laci n me diant e intervalo dI:'
lC ~n za .
La seleccin de los elementos SI:" realiza en fu ncin del juicio que respec t o a
la obtencin de un a muestra tiene q uien disea la muestra. El fundame nto de
selecc in es subje tivo y result a adec uado si quien define la selecci n dispo ne
de criterios que le pe rmitan reprod ucir la poblacin e n la muestra . C uando la
poblacin es pequea y los elementos se pued en ordenar segn un criterio o son
fcilme nte d istinguibles los result ados p ueden ser sat isfactorios.
Captulo 21
Funciones de costo
El diseo muestra] ti ene como prop sito maxi miza r la prec isin de la estimacin
minimizando el cos to asoc iado al muest reo. El te ma de la preci si n d ice relaci n
co n la co nst ruccin de int ervalos de co nfianza. El costo es una res triccin que se
trata mediant e el establec imie nto de funcion es de costo.
No ex iste una expresin m atemtica que sea funcin de costo ptimo a todo
evento. sta debera conside rar tod os los e rnes q ue inciden en maxim izar la
precisin y m in imi za r el costo para cada estrateg ia de diseo. Una solucin prac tica es esta blecer una expresin gene ral qu e conside re el facto r costo y permita
su uso en t odas las estrateg ias muestr ales pos ibles.
La fun cin el abo rada po r Kish ( 19 72) pa ra estos efec tos consider a qu e el
cos to total es fun cin de cu atro componentes. Cada diseo muestral se comporta
de m odo distinto en los componentes establecidos. Se trata en consecuencia de
asignar para cada co mponente los valor es que se estimen segu n el diseo utilizado.
La funcin para el costo total T se pr esenta a co ntinuaci n.
193
f ' mi funcin alternativa considera slo tr es fact ores . Perm it e en forma rpi da
c.eccr el pres up uesto aproxi m ado de un a e ncuesta por muestreo. Desde
erspecuva, la fu ncin para el costo to tal T esta definida en los siguientes
Capitulo 22
Tasa de no respuesta
\o.~
mo delo de cos tos es un a simplificaci n de la re alid ad que pe rmite estaer co mp araciones ent re d ise os y optar por el dise o ms apropi ado. Presenta
~ ventaja la sencillez y un iversalidad d e su ap licaci n, sin embargo, resu lta
na ap ro ximacin al costo rea l de la en cuesta .
:-.ra rr nar el terna cos to y pr ec isin se han elaborado procedi mientos espeos par J. d iseos estratificad os y de co nglomerados. En efec to, para optim izar
uilo de la muestr a dos alternati vas se prese nt an en rela cin con ('1 costo.
al.lecc mediante m ult iplicador es de Lagrange un cost o fijo y se calcula el
de n co n la condic in de que la varianza sea minirna o, p or el co nt rario, se
e ne la varianz a co nstante y se c alcula el valor de ti co n la restr icci n de
mnimo.
.' obtencin de un mini mo condicionado es una buena solucin mntern ti ca,
rbargo, pr esen ta la desventaja que rara vez se d ispo ne de in formacin pa ra
tir Sil uso rea l y prct ico.
'na funci n general per m ite un a ap ro xim ac i n til al t em a del costo, a fin
Ina r un a decisin m s informada respecto al d iseo apropiad o.
. . '1
x = W)( .. W....X~,
(22 . 1)
A sabe r, una co mbinacin lineal de los pesos por las respectiv as medias. Siendo
\V el peso o proporcin de cad a gru po y los sub ndices a la d istincin responden
y no respo nden.
El sesgo d e no respuesta se produce si ~l' ut iliza s lo la m ed ia de los rcspo ndentes pa ra estimar el parm et ro pobl acio nal. En el entendido qu e el ~w ( fi l de
grupo que no respon de es difere nte al de los q ue si respond e n. En con sec uencia,
el mod. , de re alizar u na buena estimacin de l parmetro es haciendo peque o el
peso de los que no responden . Es decir, dismi nuyen do la tasa de no respuesta.
Las no respuestas son los cu estionarios en blanco. Si hubiera que establecer
el or igen de las no respuestas cabria mencionar los siguientes asp ectos.
(AU) = Ausencia del sujeto seleccion ado, ya sea por cambio de di reccin , viaje u
ot ra razn que se p rolonga m s all del pe rodo de trabajo de campo.
( R) = Rech azo a resp onder por prejuicios respecto a las encuestas.
(1)
Im posibilidad pa ra co ntestar por an alfabe tismo o enfermedad inca pacita nte.
[N'C] = N o co ntacto p or vis itar al entrevistado fuera del horario de cs tac]a en
su domicilio.
La t asa de no respuesta corresponde al coci ente fo rm ado por nmero de cuestionarios no respon didos respecto a n m ero de elementos selecctonados para
for mar la m ues tra. Ut iliza ndo la no mencl atu ra del prrafo an te rior, el coc iente
se expresa en los siguie nte term ina s.
(AU + R+ 1 + N.5;L]
rNR =o 1 - (AV + R + 1 + NC + E)
(22.2)
/ alores de TNR cer canos a 1 indica Que el sesgo por no respuesta es peque~o.
-10 hay un valor convencional a partir del cual se conside re la no respuesta In -
dmsble.
Azorin (1 974) presenta U 1I cociente de no respuesta q~le relacio na as resruestas y no respuestas producidas por los elementos elegidos para componer
a muestra.
CNR
: oc h ran et al. ( 195 4) uti lizan este coeficiente para evaluar el tamao aproria~o
le la m uestra. El valor de CNR debe ser peq ueo, para asu mir q ue el t arnano
le la muestra es satis facto rio
Los diferentes com pone ntes que forman la t asa de no respuesta pe rmite.con:luir que no hay un factor pr~ponder:mte. Mas b ien confluyen de modo an~logo
hversos fact ores explicativos. Mosc r (1965) presenta un a Tab la q u:, COSC O? \Ias
uent es de no resp uesta e n dos encuestas realizadas e n G ran Bret aa. L3 1 a ila
-s la sigui ente:
Tabla 16 Fuente de no respuesta en dos encuestas probabiltsricas
E IKUM-U
de mncaJo
~
EnC\K'SU social
~
\,7
1,7
Rechazos
6,2
2,'
Fuera de casa
2,_
2,0
\,6
3,9
t.!iKel.ine<J
O,,
O,S
Total
12:,3
10,9
A\ll;~nt e en hora
de visita
:.os datos de la Tabla deben co nsiderarse slo com o una referencia. La .tas~ ~e
10 respuesta depende de modo importante de la nat urale za de ~a ,tnvt'stIgaClon
'\s por ejemplo un estudio di rigido a profesores co n el propostto de tndegor
, to a sus aspir
' . aciones
.
..
, en dra
que
-cspec
econonucas
ra meno
'-" r t asa
.' de no. respuesta
.
..
.ma encuesta enfocada a dueas de casa p ara conocer hbitos tele visivos.Tamb len
t: rnaci n Las encuestas
cond iciona la no respuesta el me d10 d e recogrid a dce mtor
.
196
postales y va co rreo electr nico present an una alta t asa de no respuesta . Sin
e mb argo, las en cuestas telefnicas tienen tasas de no resp uesta solo algo menores
qu e las realizadas cara a cara.
La experiencia p erm ite establecer el perfil de los mas reti centes a participar
en enc uestas, Es t il como expresin de te ndenci as po rqu e e xiste n dife rencias
segn tipo de encuesta. En partic ular, los siguientes rasgos caracterizan a los
generadores de no respuesta : soc loeco n mico alto, adulto mayor, nivel cultural
bajo, hombres, nivel de urbani zacin alto, hogares de pocos miembros.
Estudios realizado s en Gran Breta a po r D urbin y Stu art ( 195 1), co n el
pro psito de de tec t ar diferencias e n tasa de no respuesta segn experiencia del
entrevistador, per miti establecer importantes diferencias. En efecto, para un
m ismo estudio e ncuest ado res profesionales y circunstanciales obtienen rechazos
de 4 y 13 po r cie nto, respect ivam ente.
Una prc tica ha bitual para dism inuir la tas a de no respuesta son las visita s
sucesivas.Se asume como un est ndar qce es necesario realizar tres visitas antes de
asumir el caso com o no respuest a. Investigacio nes realizadas por Edwards ( 1963)
evide~cian un aume nto significa tivo de respuesta s cuando se realiza un a segu nda
visita y un c rec imien to cua ndo despu s de la segund a se realiza una tercera visita .
Sin e mbargo, visitas pos te riores -cua rta, quinta- generan un aumento m argina l
de respuestas, por lo qu e en la practica no se justifica su realizacin.
El primer paso e n el t ratamiento de las no respuestas es co nt arlas y clasficarlas en categoras excluyentes. Dimens ionar el t ama o de la no respuesta es
una primera aproximacin respecto a su eventual sesgo. La clasificaci n de la
no respuesta permite distingu ir los rechazos de las ausencia... de domicilio. Est ablecida la naturaleza de la no respuesta cabe plant earse proced im ientos que
sirvan p ara paliar el sesgo generado por no resp uesta . La gam a de alterna tivas
ut ilizadas es am plia.
Los sesgos de no respuesta han recibido un tratamiento porrnenor ixado, a
fin de conocer sus causas, controlar su incidencia }' red ucir su ocurrencia . Para
estos efectos se han p ropues to diversas o pcion es: mejo rar ru tinas, ejec uta~ sultm ues treos, efect uar sustituciones o realizar ree m plazos.
El procedimiento m s evidente es mejorar las ruti nas. No e xiste una receta
general, dada la naturaleza ni ca de cada encuesta. Sin embargo, se pueden
o pti mizar resu ltados asegurando el anonim ato del e ntrev ist ado, indic ando la
insti tucin respo nsable del estudio, acudiendo a los domicilios en las ho ras ade cua das, explicando cmo se seleccion el domicilio, se alando el propsito del
estudio o entrega ndo un regalo por cooperaci n.
La sustituciou del en trevista do es un a pr ctica com n que no controla el
sesgo po r \l O repuest a, Respecto a la no resp uesta la sustitucin es una opcin
simpl e e intil . Ntese que los seleccionados como sustitutos tien en un perfi l
ma s parecido a los qu e s han respondido qu e a aquellos qu e no lo han hec ho,
La sustitucin no impide el sesgo generado por no respuesta. Simplemente
elim ina las no respuestas. En consecuencia no evala p robable diferencia existente
entre aqu ellos que s responden y quien es no lo hacen .
19 7
(223)
~-=
1
ilazando:
1.111
(22.4)
unen to del tamao de la muestra es una soluci n de uso comn en el tr atade la no respuesta. Resulta de fcil aplicaci n. sin e mba rgo, es de dudosa
' ' 1 . La no respu esta es un problema ma yor qu e puede da r o rigen a im por: sesgo en la muest ra. En part icular, cuando las no respuest as responde n a
ron ide ntificable.
' l YN eficacia para el tratamie nt o de las no respues tas es el procedimi ento
no ut acio nes. Se im puta un valor c uando se realiza una predicci n razonada
.0( ausente. Para predecir e l valor omitido se utili za info rm acin secundaparticul ar se detectan variables co rrel acion adas co n la variable del valor
ido y se infiere el valor m s probable para el valor ausente.
nhicn es eficaz ponderar de dis tinto m odo las res puest as recogidas. En
se es tablecen los rasgos de los no respo nden tes y se asigna m s peso a
restas de sujetos de ca racte rstic as parecidas a los no respon dcm es. Ent re los
,--,i mk ntos de ponderac in de uso co m n cabe desta car los sustentados en
abtldad de respuesta y en la distribu c in de la poblacin .
" S correcciones qu e se sustentan en la probabilidad de las respuestas fueron
.olladas po r Hartl ey (19 56) y suge ridas por Polit z y Simmons ( 194 9) . Cocomo el mtodo Politz-Sim m ons, se utiliza para tr ata r el sesgo produ cido
'.~ no contactos. La probabilidad de resp uesta se mide seg n la disponibilidad
) e nt revistados a ser ent revistad os. La resp uesta y no respuest a se e nt iende es
) de la di sponibilidad a responder el cuestionario. Para eval uar la disponiI
.no
bldad ~e. ~st ab lece p ~ra cad~ e nt revista do el n mero de das de pe rtnancnc ., en
su domicilio e n los dios pre vios a la VISIt a realizada para aplica r el cuest ion ario
Para cada entre vistad o se calcu la un coeficie nte de dispon ibilidad. Este valor depende de cuantos das pr evios a la e ntrevista se e ncontraba el elem ento
~1~ciollaJo en su domicilio. El coeficiente permite ponderar las respuestas
en funci n de la disponibilidad de los sujetos. As, por ejemplo. los sujetos que
no pe rmanecan en su do micil io los d as previos a la visita se co nsideran poco
dispon ibles y reciben alt a po nd eracin y, por el co ntrario, los suje tos que pe rm anectan todos los dia s rec iben baja ponderacin. Se asu me q ue los sujetos poco
dispo nibles t ienen un pe rfil sim ilar a los no respon den tes
Capitulo 23
Efecto de diseo
Se calcula el efecto de di seo para evaluar la prec isin respec to a muestr eo aleatorio simple. Se utiliza co mo patrn de referencia el muestreo aleatorio simple
pOHlue es un m ues treo m o noe t pico y equi pro bable do nd e el azar o pera sin
rest ricciones.
En general en muestreo por conglome rado - mo noe tpico o poli et pico-la
varianz a de la estimacin es m ayor q ue la obtenida para el mismo numero de
casos en muest reo aleatorio simple. En m uestreo por conglomerado mon oet pico
se ge nera cierta homogeneidad dentro de cada conglomerado y en mu estr eos
complejos pol ietpicos cada etapa gene ra un sesgo agregado, dado q ue se seleccionan slo algunos elementos de la eta pa an teri or.
El efecto de dise o se obtiene comparando la varianza de la estim aci n del
d ise o en uso - est rau ficado o por cong lo merados- respe cto a la varianza de la
estimacin del m uestr eo alea torio simple,
l .a frmula del efec to de diseo co rrespo nde al coci en te entre la var ianza del
esti m ador del diseo a test ear respecto a la varianza del diseo aleato rio sim ple. El
efecto de di se o norm almente sera mayor que 1 en muestreo po r co nglo me rado
y menor q ue I e n muestreo estratificado.
El muestreo est rat ificado es un di seo rnonoet pico do nde el azar opera restr ingido, Normal mente la varian za del estimador sera me nor a la del muestreo
alea to rio simple.
Para ejem plificar la uti lizacin del efecto de diseo se acudir a un eje m plo
numr ico.
Tahla 17. Efecto de dise o
V~rianl~
El efecto de diseo asoci ado a estos valores corres po nde al siguien te guarismo :
36- = 1 5
d,fj =-24
.
(23. 1)
20 1
n
.\lAS
=~ == 1.600 o: I 067
deff
1,5
Capitulo 24
(23.2)
I
( .hfcrenca de 1.600 respec to a 1.06 7 se explica por la naturaleza de am bos
; " :00 5. El mu est reo aleatorio simpl e req uier e de menos e lem entos porque la
a rianz n del estim ador es m enor.
Ca lcular el efecto de dise-o no es siemp re po sible. Los valo res req uerid os
( 1 su calculo a m enudo no es tn dispon blcs . En la practica se util iza un rango
e- fluct uacin q ue dicta la e xpe riencia. Valores entre 1,5 Y3 result an apropiados
( .1 la ma yora de los casos. En part icular, el valor sera cerc ano a 1,5 cuando se
( (m e qu e los conglomerados est n co nstitu idos por ele me ntos heterog neos
[1 las variabl es principales de investigacin y, por el co ntrario, se asu m e un valo r
\ . xtmo a 3 cuando se conjetura que los conglome rados son homogneo s respecto
, ~' a riables en estudio. Es decir; se o pta por valores bajos cuando la varianza del
vr mador no es demasiado d ife ren te a la varianza obtenida medi ante mu estreo
~ " torio sim ple y se eligen valores altos cuando la varianza serta superio r a la
( co rrespo ndera co n seleccin aleatoria sim ple.
C abe se alar q ue ambos d iseos m uestra les ser ian igual de precisos si los
)"glomerados fueran ta n heter og neos co mo una seleccin aleatoria sim ple.
El coefic iente de correlacin rho (p) se util iza para medir la correlaci n e nt re
r- -lementos de los distintos co nglome rados. Si el valo r del coeficien te es igual a
Implica qu e no hay co rrelaci n entre los e le men tos de los co nglo me rados. En
, -ec uencia, un valor O significa q ue stos presen tan una dist ribucin anloga .1 la
, -rada medi ante selecci n aleatoria sim ple. Por tanto la varia nza del estim ado r
ra la m ism a y la precisi n de la es ti maci n igual en ambos diseos.
El erro r en la estimaci n pued e entende rse en t rm inos relativos. El error relat ivo
es ad imensional y puede ex presarse en trm inos de po rce ntaje de e l ro r, Resulta
de ms fcil inte rpretac i n y permite la com paraci n de errores en m uestr as
cuyas variables t iene n distint as unid ades de me d ida.
La ventaja de leer el error en t rmi nos de po rcentaje es evidente. Permi te
definir que erro res relativos de m uestr eo superio res a 10% son excesivos.Trtese
de medias o proporciones.
La frmul a del err or relat ivo anu la la uni dad de me dida al p resen ta r el err o r
mximo ad m isible ponderado po r la m edi a o proporcin respectiva . En general, (1
er ror relati vo se obtiene co mo Inform aci n ane xa al calc ulo de! error absoluto
Se presenta a continuac in e l e rro r relativo de m ed ias y p ro po rciones.
_.J'
Error re lat
anv o m eora
= - ~--
,, ~2S0
" ,,250
1I,,4.CXX)
Muesrral p
Error rd Jtivo
Error absoluto
Error relativo
0,1
0,0037
0,37 37%
O,CX.19
0,090 9"
0,001
0,15 15%
0,015
0,04 4%
0,9
0,4
0,6
Se verific a que una muest ra de 250 elem en tos presenta errores relativos de
restrco muy ele vados. En ambos casos superiores a 10%, Un a,mue-stra de 4JX)()
'mentas p ara los mismos est adst icos genera errores re lau,vos ?e muestreo
eriorcs al valor conven cio nal 10%. Co mo e ra de esp erar, esnmacroncs m uc ho
is precisas que las obtenidas c on una muestra 16 veces m enor.
C apitulo 2 5
l.
Coeficiente de ponderacin
,.
A(~.,
N pobbuoo~1
n muestt;1
\(~. Ch,C~
50.000
500
14.,....grande
4;0000
500
de ~t:\l.:: a r
.. pobbcirl
,,,,,
.,.
,,,,, I
muestf~
50%
" -:ntt' ,],1 despro porcin entre poblacin y muest ra no incid e en la calidad
i n ~' -ren ca. Nat uralm ente la infe rencia a Area chic a ser m s precisa que a
Coeficiente de ponderacin
Ar~~ chic~
10I50=O.Z
CO MPUT E PO ND ERA = 1.
lF (AREA EQ IjPONDERA = 0 .2.
IF (AREA EQ 2JI'ONDERA = L B.
W EIG HT BY PO ND ERA.
Acti vada la instr ucci n se oto rga a cada una de las reas de la muestra el peso que
le co rresponde segu n su ta m ao rela tivo en la po blacin orige n de la muestra. En
co nsec uencia, el clculo de la estimacin de l parmetro poblacional se rea liza.ra
a partir de un est adst ico que se ob tien e co nside rando los pesos dife rencales de
cada u na de las reas en la poblacin. Respec to a la tabul aci n conj unta de [a
informa cin, cabe dest acar que sta se efecta despu s de eje cutada la instrucci n de po nd eraci n.
N poblacional
N mu~ual
ResponJ..n Si
rea chica
50,000
5W
60%
Ar~~ grande
450.000
500.000
5W
1 1)) )
'"
Total
9IVSO= 1,8
el pu nto de vista prctico, la po nderacin de la m uestra se realiza computa[mente. En el programa SPSS/PC versin Windows se po ndera co n la instru c,'1'iKhr. La sint axis co rrespondiente a este ejem plo se presenta a continuacin .
BlBLlOGRAFIA
chica
Nm e ro de resp u~t as
Area chica
Coc ficie ll!e de elevacin = l/n/N = N/n :: 50.000/500 = 100
Area gra nd e
CllE:ficif:nte de elt:vacin = I/nIN = Nln = 450_0001500 = 900
CAURIN R. y BRION P., Manual J" Muestreo, I.~ Muralla, M..drid, 2()111.
CooJRAN
CocH~ \V., Rt'iariv A<X1<T<U)' ofS}<f<'r7Ulric .-.",1SfTan/fiI'J Rwuiom S","pk.- fur '1 ('.mai" C/as.. 01
PopI./mivns, Annals of Math e matic al Sraus acs . 17, 194 6
DVRBI" 1 y SllJ,Uf A_, Diffl'm.us i.. Rbpmts<-s Raus off & pnir>tcd ""J lnnpeoV>r.." lnfonvU-Wl'JT5.
Jcurnal of the Rop l Sta ti.stic~1 Society, 114. 195 1.
E Dw~R DS
F. , A spe'l:.fs 01R" ...lvm Sa...I'Plg IOT a CO"''''l'rrial Sllrtry Th.. ncorporated Stati,ticiaan.
4. 196 3
t 'ERNNOf Z
F. y
M AVO~ 1, M uestreo en Pobla cio nes Fillitas: Curro Bsico, EUB, Bar<:<:'!on a. I99S.
S~mpl e
1:I", Iffi.[Y H ., A RMew of Renf Sra fisriaJ fkwl<>r ......w in $ampliPlga ...1Stl",plml: SIItw)'$. Journa l
K ENDAl.L M. y B UC KJ.AM) W., Dic cion aro de htadi~ ti( ", Pirmide, M adrid , 19 7fi .
A rea chica
A rt!a grande
l.EGUn
S_, lntroduce i"'n ~ l lI.luelitfC'O en Poblacio nes Finitas, Nu...V3S Estructura~. ~ladrid .I999 _
lI f.DAV"'T A. y SII<ItA B. . Design and lnferen ce in Fintte Pop ul atio ns Samplin g. Wiky. 1'\.w Y('lrk,
199 1.
Il Er-o RY G ,
MADOWS W. y MAI'lOWS 1.., lI rlre nl/~ory QISy...em<ltin Sa",p/iPlg Ann al, of II.hthenlati c.1 St .l'
ti' til's. 15, 19 44
M IRAs
20S
J., Elem ...ntcs de Muestreo pa ra Po bla ciones Finitas, INE, M adrid , 1985.
NEYM.,,:'oI 1 , Oa rheTWll ViII........' A 5pt$ 01rhe RepresmrtJfil~ Merlro.b. Joumal of the Royal Sta n stical Society. 9 7, 193"
Mosu C. A _, Sur.. ey Methods in Soct ellnvesnganon, H einern ann , London, 1965.
OS~INA
1'~ ~ f.Z
209
S;''''ON~
\V., AJ1 A lu ,..,!'r ft> ';~r r},.. ~nol a / hame" J11O 1M Sam ple 1I, ;hQll r C..libwIu.
"1-
.. " Iing: MdhoJo:ogics: wit h apphc ations, Chal'man ti.. Hall, N_ York. 2{)(X)
J., Met ud os de Muestr eo, C !S. ~bdrid. 199 1.
( .>1'01., MuctTeO de PoblAciones Fmtas Aplicado al DiY-o de Encuo:-st:o.s" IN E. Mad rid,
Editorial
iria. 19 87.
"leona de Encue stas por Muest reo con Aplicaciones, Fondo C ultura Econmce,
~.
19 5(,_
. 'U IAr ME B. , SU~H Arr.lE S. y A SOK
-' ty
f' r".~,
lowa, 19 H4
Iccs treo par a IJ Invt"stilolalin e n Ciencia s de la Salud, D iH. de San tos, Mad rid , 19 9 3
_" pIid Sa m pling , Acaderuc
P r~'.I5,
y FIDn L L., U~ i n g :\l ultiv" riate Sta tistks, Harpl'r Co llins, Nt'w York. 1989.
...., T1,,,.,,ry of Samplc Su rveys, Londco, Chapma'l & Hall, l.andon, 19 9 7.
arnr ling M<'lhod s for Ce nsuses and Su rveys, Mc:\l i1lA n, Nc w York, ]9 ~1.
.
i-