Sunteți pe pagina 1din 164

CARLOS M.

MASCORT SUREZ
MANUEL ORTEGA GUTIRREZ
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
1

NDICE

Bloque 1. ESTADISTICA DESCRIPTIVA.

1. Generalidades. Anlisis de una variable.
1.1. Introduccin. 3
1.2. Conceptos bsicos. 5
1.3. Distribuciones de frecuencias. Tablas. Representaciones grficas. 6
1.4. Medidas de centralizacin. 9
1.5. Medidas de dispersin. 11
1.6. Medidas de posicin. 12
1.7. Coeficientes de variacin y de forma (asimetra, o sesgo, y apuntamiento, o
curtosis). 15
1.8. Ampliacin y/o aclaraciones. 17
Relacin de problemas del Tema 1. 21

2. Anlisis de dos variables.
2.1. Distribucin de dos variables. Diagramas de dispersin. 25
2.2. Parmetros estadsticos. Covarianza. 27
2.3. Correlacin. Coeficiente de correlacin lineal (de Pearson). 29
2.4. Regresin. Rectas de regresin. 31
Relacin de problemas del Tema 2. 34


Bloque 2. PROBABILIDAD.

3. Probabilidad.
3.1. Conceptos bsicos. 37
3.2. Probabilidad. Regla de Laplace. 40
3.3. Probabilidad condicionada. Teoremas de la probabilidad total y de Bayes. 42
3.4. Ampliacin. 47
Relacin de problemas del Tema 3. 48

4. Tcnicas para contar. Combinatoria.
4.1. Tcnicas bsicas de recuento: regla de la suma y regla del producto. 51
4.2. Factoriales y nmeros binomiales (o combinatorios). 53

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
2
4.3. Variaciones, permutaciones y combinaciones. 56
4.4. Potencia de un binomio: frmula de Newton. 63
4.5. Seleccin de una muestra. 63
4.6. La combinatoria y la probabilidad. 65
Relacin de problemas del Tema 4. 67

5. Variables aleatorias.
5.1. Variables aleatorias. 69
5.2. Modelos discretos. Distribucin binomial. 69
5.3. Modelos continuos. Distribucin normal. 73
Relacin de problemas del Tema 5. 84


Bloque 3. MUESTREO E INFERENCIA.

6. Muestreo y estimacin.
6.1. Introduccin a la Estadstica inferencial. 87
6.2. Teora del muestreo. 87
6.3. Distribuciones muestrales. 90
6.4. Estimacin de parmetros. 94
6.4.1. Estimacin puntual. 95
6.4.2. Estimacin por intervalos de confianza. 98
6.4.3. Error de estimacin y tamao de la muestra. 108
Relacin de problemas del Tema 6. 113

7. Contrastes de hiptesis.
7.1. Introduccin. 119
7.2. Hiptesis estadsticas. 122
7.3. Tipos de contrastes. 123
7.4. Estadstico de contraste. 123
7.5. Decisin estadstica. Contrastes bilaterales y unilaterales. 125
7.6. Contrastes paramtricos. 127
7.7. Tipos de errores y potencia de un contraste. 139
7.8. Contrastes no paramtricos. 146
Relacin de problemas del Tema 7. 157


BIBLIOGRAFA Y OTROS MEDIOS (INFORMTICOS) 163

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
3
Bloque 1. ESTADISTICA DESCRIPTIVA.

1. Generalidades. Anlisis de una variable.
1.1. Introduccin.

Qu es la Estadstica?

La Estadstica es la rama de las Matemticas que se ocupa de recoger, analizar y extraer
informacin relevante y til del conjunto de datos obtenidos; esta informacin aparece en forma
de nmeros, porcentajes o a travs de grficos.

Orgenes.
Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se
utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes
de cuevas para contar el nmero de personas, animales o cosas. Hacia el ao 3000 a.C. los
babilonios usaban pequeas tablillas de arcilla para recopilar datos sobre la produccin agrcola y
sobre los gneros vendidos o cambiados mediante trueque. En el siglo XXXI a.C., mucho antes de
construir las pirmides, los egipcios analizaban los datos de la poblacin y la renta del pas. Los
libros bblicos de Nmeros y Crnicas incluyen, en algunas partes, trabajos de estadstica. El
primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material
de las diversas tribus judas. En China existan registros numricos similares con anterioridad al
ao 2000 a.C. Los griegos clsicos realizaban censos cuya informacin se utilizaba hacia el
594 a.C. para cobrar impuestos.
El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la
poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media slo
se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y
Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758
y 762, respectivamente. Despus de la conquista normanda de Inglaterra en 1066, el rey
Guillermo I de Inglaterra encarg la realizacin de un censo. La informacin obtenida con este
censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y
defunciones comenz en Inglaterra a principios del siglo XVI, y en 1662 apareci el primer
estudio estadstico notable de poblacin, titulado Observations on the London Bills of Mortality
(Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la tasa de
mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrnomo
ingls Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la
generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales
y sociales, los investigadores aceptaron la necesidad de reducir la informacin a valores
numricos para evitar la ambigedad de las descripciones verbales.
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con
exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y
sirve como herramienta para relacionar y analizar dichos datos, as como para establecer

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
4
descripciones, predicciones, comparaciones y generalizaciones sobre una poblacin a partir de los
datos obtenidos de una muestra.
El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino
sobre todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la
probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de
datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones
probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La
probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el
tipo y la cantidad de datos necesarios en un determinado estudio estadstico.

Mtodos estadsticos.
La materia prima de la estadstica consiste en conjuntos de nmeros obtenidos al contar o
medir elementos. Al recopilar datos estadsticos se ha de tener especial cuidado para garantizar
que la informacin sea completa y correcta.
El primer problema para los estadsticos reside en determinar qu informacin y en qu
cantidad se ha de reunir. En realidad, la dificultad al compilar un censo est en obtener el nmero
de habitantes de forma completa y exacta; de la misma manera que un fsico que quiere contar el
nmero de colisiones por segundo entre las molculas de un gas debe empezar determinando con
precisin la naturaleza de los objetos a contar. Los estadsticos se enfrentan a un complejo
problema cuando, por ejemplo, toman una muestra para un sondeo de opinin o una encuesta
electoral. El seleccionar una muestra capaz de representar con exactitud las preferencias del
total de la poblacin no es tarea fcil.
Para establecer una ley fsica, biolgica o social, el estadstico debe comenzar con un
conjunto de datos y modificarlo basndose en la experiencia. Por ejemplo, en los primeros
estudios sobre crecimiento de la poblacin, los cambios en el nmero de habitantes se predecan
calculando la diferencia entre el nmero de nacimientos y el de fallecimientos en un determinado
lapso. Los expertos en estudios de poblacin comprobaron que la tasa de crecimiento depende
slo del nmero de nacimientos, sin que el nmero de defunciones tenga importancia. Por tanto, el
futuro crecimiento de la poblacin se empez a calcular basndose en el nmero anual de
nacimientos por cada 1.000 habitantes. Sin embargo, pronto se dieron cuenta que las predicciones
obtenidas utilizando este mtodo no daban resultados correctos. Los estadsticos comprobaron
que hay otros factores que limitan el crecimiento de la poblacin. Dado que el nmero de posibles
nacimientos depende del nmero de mujeres, y no del total de la poblacin, y dado que las
mujeres slo tienen hijos durante parte de su vida, el dato ms importante que se ha de utilizar
para predecir la poblacin es el nmero de nios nacidos vivos por cada 1.000 mujeres en edad de
procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje
de mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y fallecimientos slo es
til para indicar el crecimiento de poblacin en un determinado periodo de tiempo del pasado, el
nmero de nacimientos por cada 1.000 habitantes slo expresa la tasa de crecimiento en el mismo
periodo, y slo el nmero de nacimientos por cada 1.000 mujeres en edad de procrear sirve para
predecir el nmero de habitantes en el futuro.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
5
Estadstica descriptiva y estadstica inferencial.
La estadstica descriptiva analiza, estudia y describe a la totalidad de individuos de una
poblacin. Su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario
para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse
eficazmente para el fin que se desee. El proceso que sigue la estadstica descriptiva para el
estudio de una cierta poblacin consta de los siguientes pasos:
Seleccin de caracteres dignos de ser estudiados.
Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres
seleccionados.
Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos
dentro de cada carcter.
Representacin grfica de los resultados (elaboracin de grficas estadsticas).
Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms relevantes de
una distribucin estadstica.
La estadstica descriptiva trabaja con todos los individuos de la poblacin. La estadstica
inferencial (o inductiva), sin embargo, trabaja con muestras, subconjuntos formados por algunos
individuos de la poblacin. A partir del estudio de la muestra se pretende inferir aspectos
relevantes de toda la poblacin. Cmo se selecciona la muestra, cmo se realiza la inferencia, y
qu grado de confianza se puede tener en ella son aspectos fundamentales de la estadstica
inferencial, para lo cual se requiere un alto nivel en estadstica, probabilidad y matemticas.
1.2. Conceptos bsicos.
El primer campo de actuacin de la estadstica, como se ha visto, fue la demografa. De esta
ciencia ha tomado la nomenclatura (poblacin, individuo):
Poblacin: conjunto de todos los elementos que cumplen una determinada
caracterstica a estudiar.
Individuos: cada uno de los elementos de una poblacin.
Muestra: cualquier subconjunto de la poblacin.
Tamao de la muestra: nmero de individuos de la misma. Se representa por N (o n).
Carcter estadstico: propiedad que permite clasificar a los individuos de una
poblacin y que ser objeto de un estudio estadstico:

Cualitativos : no se pueden medir


Tipos de caracteres
Cuantitativos : se pueden medir

Variable estadstica: conjunto de valores x
i
que toma un carcter estadstico.

Discretas (toma valores aislados)


Continuas (toma todos los valores de un intervalo)
Cualitativas
Tipos de variables
Cuantitativas

Frecuencia absoluta de un valor x
i
: nmero de veces que se repite ese valor. Se
representa por f
i
. Siempre tendremos que N f
i
=

.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
6
Frecuencia relativa de un valor x
i
: cociente entre la frecuencia absoluta y el nmero
total de datos, N . Se representa por h
i
.
i
i
f
h
N
= . Puede expresarse en porcentaje.
Siempre tendremos que 1 =
i
h .
Distribucin estadstica: Conjunto de la variable estadstica y sus frecuencias.
Frecuencia absoluta acumulada de un valor x
i
: suma de las frecuencias absolutas de x
i

y todos los valores anteriores.

=
= + + + =
i
k
k i i
f f f f F
1
2 1
... .
Frecuencia relativa acumulada de un valor x
i
: suma de las frecuencias relativas de x
i

y todos los valores anteriores.

=
= + + + =
i
k
k i i
h h h h H
1
2 1
... . Tambin
i
i
F
H
N
= .
1.3. Distribuciones de frecuencias. Tablas. Representaciones
grficas.
Tablas estadsticas.
Una vez recogida la muestra a estudiar se proceder de la forma siguiente:
1.- Ordenacin de los datos, de forma creciente o decreciente segn convenga. La forma
creciente es la ms comn y es la que utilizaremos.
2.- Recuento de las frecuencias absolutas.
3.- Agrupacin de datos: Si el nmero de datos es grande o la variable estadstica es continua,
se agrupan los datos en intervalos o clases. Aproximadamente el n de clases debe ser N y, si
es posible, deben tener la misma amplitud. A los puntos medios de cada clase se les denomina
marca de la clase y se nombran (como si de la variable se tratase)
i
x .
4.- Construccin de la tabla estadstica: Deben figurar los valores de la variable estadstica (si
est agrupada en clases, tambin su marca) y las frecuencias.
5.- Hemos aadido en negrita una columna y una fila ms (con sumas de ciertas columnas) que
no pertenecen a la tabla de frecuencias, pero que nos sern muy tiles ms adelante.

Ejemplo 1 ( variable estadstica discreta):

Edad
i
x (aos)
i
f
i
F
i
h
i
H
i i
f x
16
17
18
3
6
3
3
9
12
025
050
025
025
075
1
48
102
54

(sumas)
12 ---- 1 ------ 204

Ejemplo 2 (variable estadstica continua):

Estatura
2 Bach. (m)
i
x
i
f
i
F
i
h
i
H
i i
f x
[150,160)
[160,170)
[170,180)
[180,190)
155
165
175
185
3
6
2
1
3
9
11
12
025
050
017
008
025
075
092
1
465
99
35
185

(sumas)
------ 12 ---- 1 ------ 199
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
7

Ejemplo 3 (variable estadstica cualitativa):
Queremos estudiar la matriculacin de los alumnos
en un instituto. Recabados los datos, hay matriculados
145 alumnos de 1 en E.S.O., 130 en 2 de E.S.O., 100
en 3 de E.S.O., 85 en 4 de E.S.O., 105 en 1 de
Bahillerato, 70 en 2 de Bachillerato. Y 220 en Ciclos
formativos.
Se trata de una variable estadstica cualitativa
cuyos valores son: 1 en E.S.O., 2 de E.S.O., 3 de
E.S.O., 4 de E.S.O., 1 de Bahillerato, 2 de
Bachillerato y Ciclos formativos, respectivamente,
obtenindose la tabla de la derecha.

Grficos estadsticos.
Las distribuciones estadsticas son representadas grficamente segn el diagrama que ms
se adecue a la distribucin. Estos diagramas pueden ser los siguientes:
Diagrama de barras: Se representa en los ejes coordenados positivos, en cuyo eje
horizontal estn representados los valores de la variable y en el eje vertical las
frecuencias (absolutas o relativas, simples o acumuladas) de cada valor. Desde cada
valor parte una barra cuya altura coincide con la frecuencia del valor correspondiente.
Utilizado para variables cualitativas o cuantitativas discretas.

Histograma: Se representa en los ejes coordenados positivos, en cuyo eje horizontal
estn representados los intervalos o clases de la variable. Sobre cada clase (y
tomando ese intervalo como base) se dibuja un rectngulo cuya rea es proporcional a
la frecuencia de la clase. Si todas las clases son de la misma amplitud, la altura de
cada rectngulo representa la frecuencia (absoluta o relativa, simple o acumulada) de
esa clase. Por eso se procura que todas las clases tengan la misma amplitud. Utilizado
para variables cuantitativas continuas.
Polgono de frecuencias: Se forma uniendo mediante segmentos los puntos medios de
la parte superior de las barras (de un diagrama de barras) o los puntos medios de los
lados superiores de los rectngulos (de un histograma). No tiene que aparecer junto al
diagrama de barras o histograma, sino que es un grfico independiente.
x
i
f
i
F
i
h
i
H
i
1 E.S.O. 145 145 0,170 0,170
2 E.S.O. 130 275 0,152 0,322
3 E.S.O. 100 375 0,117 0,439
4 E.S.O. 85 460 0,099 0,538
1 Bach. 105 565 0,123 0,661
2 Bach. 70 635 0,082 0,743
Ciclos form. 220 855 0,257 1,000
855 1
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
8


Diagrama de sectores: crculo dividido en sectores de amplitud proporcional a la
frecuencia de cada valor de la variable. Utilizado principalmente para variables
cualitativas (o, tambin, en algunos casos, para variables cualitativas discretas).
Pictograma: formados por dibujos alusivos a la distribucin que se pretende estudiar
y que mediante su forma y tamao nos ofrecen una descripcin lo ms expresiva
posible de la distribucin.
Cartograma: grficos que se realizan sobre mapas sealando sobre las distintas zonas
con colores o rayados lo que se quiere poner de manifiesto.




Climogramas: especialmente indicados para representar distintos tipos de climas. En
ellos se recogen los regmenes pluviales y las temperaturas a lo largo de un ao.
Pirmides de poblacin: Se utilizan para estudiar conjuntamente la edad y el sexo de
los habitantes de un pas a lo largo de los aos. Segn su forma se pueden sacar
conclusiones sobre la edad de la poblacin.
Diagramas en espiral: Se utilizan para observar evoluciones en el tiempo de manera
cclica.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
9


1.4. Medidas de centralizacin.
Nos dan un valor representativo de toda la distribucin en el caso de las variables aleatorias
cuantitativas.
Media (aritmtica).
Suma de todos los valores dividida por el nmero total de ellos. La media de una variable x se
denota por x . Utilizando las frecuencias absolutas, simblicamente, se expresara as:

i i
x f
x
N
=


Ejemplos:
En el ejemplo 1 de la pgina 5, 17
12
204
= = x aos.
En el ejemplo 2 de la pgina 5, se procede como si las marcas de clase fuesen los
valores de la variable. La media es 66 , 1
12
9 , 19
= = x metros.
En el ejemplo 3 de la pgina 6 no tiene sentido el clculo de la media.
Moda.
Valor de la variable que ms se repite. Por tanto para variables discretas o cualitativas es el
valor de mayor frecuencia absoluta. La moda no tiene por qu ser nica. Si la distribucin tiene
dos modas se dice bimodal; si tiene tres, trimodal; etc. Esta es la nica medida de centralizacin
que tiene sentido para variables cualitativas.
Para variables continuas, se determina la clase modal (intervalo con mayor frecuencia
absoluta) y la moda es el valor del intervalo que se obtiene mediante la expresin:
( ) ( )
1
1 1
i i
o i i
i i i i
f f
M L c
f f f f

= +
+
, siendo:
L
i
es el lmite inferior del intervalo modal.
f
i
es la frecuencia absoluta del intervalo modal.
f
i-1
es la frecuencia absoluta del intervalo anterior al intervalo modal.
f
i+1
es la frecuencia absoluta del intervalo posterior al intervalo modal.
c
i
es la amplitud del intervalo modal.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
10
Ejemplos:
En la distribucin del ejemplo 1, Mo = 17 aos; en el ejemplo 2,
43 , 160
) 2 6 ( ) 3 6 (
3 6
160 =
+

+ =
o
M metros; y en el ejemplo 3, Mo =Ciclos formativos.
Mediana.
Valor de la variable tal que el nmero de observaciones menores que l es igual al nmero de
observaciones mayores que l.
Para las variables discretas se ordenan los datos de menor a mayor y la mediana ser el valor
central (N impar) o la media aritmtica de los dos valores centrales (N par). Tambin se puede
calcular de la siguiente forma: Encontramos el primer valor de
i
F mayor o igual que 2 / N . Si
ocurre que 2 / N F
i
= , entonces la mediana es la media entre
i
x y
1 + i
x . Si ocurre que
2 / N F
i
> , entonces la mediana es
i
x .
Para las variables continuas, una vez localizado el intervalo mediano (el que contiene el valor
que deja a su izquierda el mismo nmero de datos que a su derecha) la mediana es el valor del
intervalo que se obtiene mediante la expresin:
1
2
i
e i i
i
N
F
M L c
f

= + , siendo:
L
i
es el lmite inferior del intervalo mediana.
f
i
es la frecuencia absoluta del intervalo mediana.
F
i-1
es la frecuencia absoluta del intervalo anterior al intervalo mediana.
N es el nmero total de datos.
c
i
es la amplitud del intervalo mediana.
Ejemplos:
En la distribucin del ejemplo 1, 5 , 17
2
18 17
=
+
=
e
M aos; en el ejemplo 2,
65 , 1 05 , 0 60 , 1 10 , 0
6
3
2
12
60 , 1 = + =

+ =
e
M metros; y en el ejemplo 3 no tiene sentido la
mediana al ser una variable cualitativa.
Observacin: En el siguiente ejemplo da igual elegir la clase mediana [ ) 10 , 5 que [ ) 15 , 10 ya
que la mediana va a ser 10 =
e
M
i
x
i
f
i
F
[ ) 5 , 0 3 3
[ ) 10 , 5 3 6
[ ) 15 , 10 6 12
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
11
1.5. Medidas de dispersin.
Las medidas de centralizacin son insuficientes por s mismas para describir exactamente una
distribucin. En consecuencia, una medida de centralizacin debe ir acompaada de una medida de
la dispersin de los valores agrupados en torno a ella.
Rango o recorrido.
Diferencia entre el mayor valor y el menor de la variable. Se denota r.
Desviacin media.
Media aritmtica de las desviaciones de los valores de la variable respecto de la media. Viene
dada por
i i
m
x x f
d
N

=

.
Varianza (
2
o
2
S ).
Media aritmtica de los cuadrados de las desviaciones de los valores de la variable respecto
de la media. Viene dada por
( )
N
f x x
S
i i

= =
2
2 2
.
Haciendo transformaciones aritmticas en esta expresin, podemos obtener la varianza
mediante
2
2
2 2
x
N
f x
S
i i
= =

.
Desviacin tpica ( o S ).
Raz cuadrada de la varianza:
( )
N
f x x
S
i i

= =
2
o bien
2
2
x
N
f x
S
i i
= =

.

NOTA: Ms adelante veremos, en el bloque de Estadstica Inferencial, que con S nos
referiremos a la desviacin tpica de una muestra, mientras que con nos referiremos a la
desviacin tpica de una poblacin.

Ejemplos:
En el ejemplo 1 de la pgina 5, el rango es r = 2 aos. Para hallar la media y las dems
medidas de dispersin hay que utilizar la columna y la fila (en negrita) que aadamos a la
tabla de frecuencias y algunas columnas ms para la desviacin media y la desviacin tpica:
i
x
(aos)
i
f
i i
f x
x x
i


i i
f x x
i i
f x
2

16
17
18
3
6
3
48
102
54
1
0
1
3
0
3
768
1734
972


12 204 -------- 6 3474
La media sera 17
12
204
= = x aos. La desviacin media 5 , 0
12
6
= =
m
d aos.
La varianza 5 , 0 17
12
3474
2 2
= = S . La desviacin tpica 71 , 0 5 . 0 = = S aos.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
12
En el ejemplo 2 de la pgina 5, procedemos como en el anterior, pero con las marcas de
clase:
Estatura
2 Bach. (m)
Marca clase
(
i
x )
i
f
i i
f x
x x
i

i i
f x x
i i
f x
2

[150,160)
[160,170)
[170,180)
[180,190)
155
165
175
185
3
6
2
1
465
99
35
185
011
001
009
019
033
006
018
019
72075
16335
6125
34225


------------- 12 199 --------- 076 3309
La media sera 66 , 1
12
9 , 19
= = x metros.
La desviacin media 06 , 0
12
76 , 0
= =
m
d metros.
La varianza 0019 , 0 66 , 1
12
09 , 33
2 2
= = S .
La desviacin tpica 04 , 0 0019 , 0 = = S metros.
En las distribuciones de variables cualitativas no tienen sentido las medidas de dispersin
(ni la media ni la mediana), por tanto obviamos el ejemplo 3 de la pgina 6.

1.6. Medidas de posicin.
Adems de los valores de tendencia central y de dispersin de una distribucin, es
interesante localizar la posicin de los valores y cmo estn repartidos.
Cuartiles.
Son tres valores que dividen la distribucin en cuatro partes con el mismo nmero de datos.
As, el cuartil de orden k es el primer valor de la variable que excede a las k cuartas partes de los
valores.
El segundo cuartil, por tanto, coincide con la mediana,
e
M Q =
2
.
Si la variable es discreta encontramos el primer valor de
i
F mayor o igual que
4
K N
,
entonces
i k
x Q = . Si ocurre que =
i
F
4
K N
, entonces
2
1 +
+
=
i i
k
x x
Q
Si la variable es continua, el cuartil de orden k viene dado por la expresin
1
4
i
k i i
i
N
k F
Q L c
f

= + , donde las indeterminadas que aparecen tienen el significado expresado


en apartados anteriores.
En el Ejemplo 1

i
x
(aos)
i
f
i
F
16
17
18
3
6
3
3
9
12
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
13
Calculamos 3
4
=
N
. Entonces 5 , 16
2
17 16
1
=
+
= Q aos.
Calculamos 6
2
=
N
. Entonces 17
2
= Q aos.
Calculamos 9
4
3
=
N
. Entonces 5 , 17
2
18 17
3
=
+
= Q aos.
En el Ejemplo 2
Estatura
2 Bach. (m)
Marca
i
x
i
f
i
F
[150,160)
[160,170)
[170,180)
[180,190)
155
165
175
185
3
6
2
1
3
9
11
12
Calculamos 3
4
=
N
. Entonces 60 ' 1 1 ' 0
6
3
4
12
60 ' 1
1
=

+ = Q metros.
Calculamos 6
2
=
N
. Entonces 65 ' 1 1 ' 0
6
3
2
12
60 ' 1
2
=

+ = Q metros.
Calculamos 9
4
3
=
N
. Entonces 70 ' 1 1 ' 0
2
9 3
4
12
70 ' 1
3
=

+ = Q metros.

Rango intercuartlico,
1 3
Q Q Q
IC
= y rango semiintercuartlico,
2
1 3
Q Q
Q
SIC

= .
Verdaderamente se trata de medidas de dispersin.

Deciles.
Son nueve valores que dividen la distribucin en diez partes con el mismo nmero de datos.
As, el decil de orden k es el primer valor de la variable que excede a las k dcimas partes de los
valores. El quinto decil coincide con la mediana,
e
M D =
5
.
Si la distribucin es discreta actuamos igual que en los cuartiles.
Si la distribucin es continua,
1
10
i
k i i
i
N
k F
D L c
f

= + .
En el Ejemplo 1

i
x
(aos)
i
f
i
F
16
17
18
3
6
3
3
9
12

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
14
Calculamos 2 , 1
10
=
N
. Entonces 16
1
= D aos. As sucesivamente se calculan los dems.

En el Ejemplo 2
Estatura
2 Bach. (m)
Marca
i
x
i
f
i
F
[150,160)
[160,170)
[170,180)
[180,190)
155
165
175
185
3
6
2
1
3
9
11
12
Para calcular
7
D , calculamos 4 ' 8
10
7
=
N
. Entonces 69 ' 1 1 ' 0
6
3
10
7 12
60 ' 1
7
=

+ = D m.
Percentiles.
Son noventa y nueve valores que dividen la distribucin en cien partes con el mismo nmero
de datos. As, el percentil de orden k es el primer valor de la variable que excede a las k
centsimas partes de los valores. El percentil 50 coincide con la mediana,
e
M P =
50
.
Si la distribucin es discreta actuamos igual que en los cuartiles.
Si la distribucin es continua,
1
100
i
k i i
i
N
k F
P L c
f

= + .
En el Ejemplo 1

i
x
(aos)
i
f
i
F
16
17
18
3
6
3
3
9
12
Para calcular, por ejemplo, el
81
P , calculamos 72 , 9
100
81
=
N
. Entonces 18
81
= P aos.
En el Ejemplo 2
Estatura
2 Bach. (m)
Marca
i
x
i
f
i
F
[150,160)
[160,170)
[170,180)
[180,190)
155
165
175
185
3
6
2
1
3
9
11
12
Para calcular, por ejemplo,
43
P , calculamos 16 ' 5
100
43
=
N
.
Entonces 636 ' 1 1 ' 0
6
3
100
43 12
60 ' 1
43
=

+ = P metros.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
15

1.7. Coeficientes de variacin y de forma (asimetra, o sesgo, y
apuntamiento, o curtosis).

Coeficiente de variacin.
Estudia la dispersin en relacin a los valores de la variable. Viene dado por
x
S
CV = . El
coeficiente de variacin puede venir dado en tanto por ciento.
Si y x = y
y x
S S < entonces x es ms representativa que y .
Si y x y
y x
CV CV < entonces x es ms representativa que y .

Coeficiente de asimetra o sesgo.
Mide el sesgo o asimetra de la distribucin. Se define como
( )
3
3
3
S N
f x x
a
i i

=

.
Si
3
0 a > est sesgada a la derecha, y si
3
0 a < la distribucin est sesgada a la
izquierda. Si 0
3
= a , la distribucin no tiene sesgo, es simtrica (como la distribucin normal que
estudiaremos en el bloque 2).


Coeficiente de apuntamiento o curtosis.
Mide el aplastamiento o apuntamiento. Se define como
( )
3
4
4
4

=

S N
f x x
a
i i
.
Si
4
0 a > la distribucin est apuntada, y si
4
0 a < la distribucin est aplastada.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
16

Una distribucin que presenta un apuntamiento alto ( ) 0
4
> a se llama leptocrtica, mientras
que la que es ms achatada ( ) 0
4
< a se denomina platicrtica. La que no es ni muy apuntada ni
achatada ( ) 0
4
= a , como la distribucin normal que estudiaremos en el bloque 2, se llama
mesocrtica.

En los ejemplos que venimos estudiando hay que aadir a la tabla de frecuencias otras tres
columnas:

Ejemplo 1 : Ya sabemos que 17 = x y que 71 , 0 = S
i
x (aos)
i
f x x
i

( )
i i
f x x
3
( )
i i
f x x
4

16
17
18
3
6
3
-1
0
1
-3
0
3
3
0
3
SUMAS 12 -------- 0 6
El coeficiente de variacin: 04 , 0
17
71 , 0
= = CV = 4%.
El coeficiente de sesgo o asimetra es: 0
294932 , 4
0
71 , 0 12
0
3
3
= =

= a , con lo que la
distribucin es totalmente simtrica.
El coeficiente de curtosis o apuntamiento es:
0324 , 1 3
04940172 , 3
6
3
71 , 0 12
6
4
4
= =

= a , por lo que es un poco aplastada.



Ejemplo 2 : Ya sabemos que 66 , 1 = x y que 04 , 0 = S
Estatura
2 Bach. (m)
Marca de
clase,
i
x
i
f x x
i

( )
i i
f x x
3
( )
i i
f x x
4

[150,160)
[160,170)
[170,180)
[180,190)
1,55
1,65
1,75
1,85
3
6
2
1
-0,11
-0,01
0,09
0,19
-0,003993
-0,000006
0,001458
0,006895
0,00043923
0,00000006
0,00013122
0,00130321
SUMAS ------------- 12 --------- 0,004318 0,00187372
El coeficiente de variacin: 4 , 2 024 , 0
66 , 1
04 , 0
= = = CV %.
El coeficiente de asimetra: 6224 , 5
04 , 0 12
004318 , 0
3
3
=

= a . Es sesgada a la derecha.
El coeficiente de apuntamiento: 9935 , 57
00003072 , 0
00187372 , 0
3
04 , 0 12
00187372 , 0
4
4
= =

= a , por lo que
es bastante apuntada (leptocrtica).
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
17
1.8. Ampliacin y/o aclaraciones:

Cmo repartir los datos en intervalos.

Vemoslo con un ejemplo:

Ejemplo 4:
Se ha aplicado una prueba de inteligencia general a una muestra de 40 individuos. Los
resultados obtenidos han sido los siguientes:

43, 44, 50, 55, 56, 53, 52, 51, 40, 42,
60, 59, 56, 58, 49, 46, 47, 45, 43, 51,
59, 55, 52, 52, 50, 47, 45, 48, 43, 42,
52, 48, 50, 58, 51, 53, 55, 57, 49, 50

a) Realiza la tabulacin correspondiente.
Puesto que en este caso la variable puede considerarse cuantitativa continua, no es
rentable situar en la primera columna de la tabla de frecuencias uno por uno todos los
valores de la variable, ya que eso nos obligara a elaborar una columna excesivamente
larga. En esta muestra el valor mnimo obtenido es de 40 y el mximo de 60. Si
dispusiramos todos los valores obtendramos una columna de 21 elementos (40 y 60
incluidos).
Lo que interesa en el proceso de tabulacin es conseguir una idea lo ms global y
sinttica de la distribucin. Para ello, hemos de condensar los datos al mximo siempre
que la prdida de informacin sea aceptable. Es decir, hemos de agrupar los datos en
intervalos (o clases).
No hay ninguna regla fija que determine el nmero de intervalos en los que hay que
dividir una distribucin. Lo que s hay que procurar, si es posible, es llevar a cabo la
tabulacin en intervalos de forma que los extremos de los intervalos (o, mejor, las marcas
de clase) coincidan con datos realmente observados, pues esto disminuye el error de
agrupamiento. Unos autores normalmente suelen dividir la distribucin entre 9 y 15
intervalos, dependiendo del nmero de individuos de la muestra. Otros indican que debe
dividirse entre 5 y 20, dependiendo de los datos. Algunos dicen que el nmero de
intervalos debe ser el nmero natural ms prximo a N 2 (en vez de N , como ya
hemos expresado anteriormente), siendo N el tamao de la muestra.

En fin, otros autores emplean la
siguiente relacin: Siendo
m
2 el
tamao de la muestra, el nmero
mnimo de intervalos debe ser 1 + m .
Esta frmula nos llevara a la tabla que
se ofrece a continuacin. Dicha tabla
es de un valor meramente indicativo, ya
que nos permite calcular el nmero
mnimo de intervalos en que es
aconsejable dividir la distribucin,
aunque esta cantidad puede ser
superada.


Tamao de la
muestra
N mnimo de
intervalos
8 4
16 5
32 6
64 7
128 8
256 9
512 10
1024 11
2048 12
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
18
En nuestro caso, puesto que el nmero de individuos de la muestra es 40, el nmero de
intervalos mnimo oscila entre 6 y 7. Elegimos 7 intervalos, con lo que la prdida de
informacin es menor.
El valor mnimo de la distribucin es de 40 puntos, y el mximo de 60. En total, la
amplitud de la distribucin consta de 21 puntos (considerando los extremos), luego, si
dividimos estos 21 puntos entre los 7 intervalos elegidos, corresponden 3 puntos por
intervalo.
La tabulacin, entonces, y sin tener en cuenta las frecuencias relativas, podra quedar
as:
x
i
x
i
f
i
F
i i
f x
2
i
x
i i
f x
2

[ ) 5 ' 42 , 5 ' 39 41 3
[ ) 5 ' 45 , 5 ' 42 44 6
[ ) 5 ' 48 , 5 ' 45 47 5
[ ) 5 ' 51 , 5 ' 48 50 9
[ ) 5 ' 54 , 5 ' 51 53 6
[ ) 5 ' 57 , 5 ' 54 56 6
[ ] 5 ' 60 , 5 ' 57 59 5

= ------ 40 ------ ------------------


Es muy corriente tambin obligar a que el primer, e inferior, intervalo (o clase) sea
cerrado por la izquierda, y que el ltimo, y superior, lo sea por la derecha, como podemos
ver en la tabla anterior. Con esto siempre evitaramos perder esos valores extremos en
caso de que aparecieran en la distribucin original (lo que no ocurre, de todas formas, en
nuestro ejemplo, al ser los extremos nmeros decimales).
b) Calcular la media, la moda y la mediana.
c) Calcular la varianza y la desviacin tpica.
d) Hallar los cuartiles y los percentiles 25, 35, 60 y 83.
e) Calcular los coeficientes de variacin, de asimetra (sesgo) y de apuntamiento (curtosis).
Necesitaramos alguna(s) otra(s) columna(s) en la tabulacin original para llevar a cabo
estos clculos?

Rango o recorrido.
El rango o recorrido de una distribucin de valores de una variable continua es la diferencia
entre el lmite (o extremo) superior del ltimo intervalo y el lmite (o extremo) inferior del
primer intervalo, si los valores de la variable estn agrupados en intervalos.
Si los valores no estn agrupados (variable discreta), se calcula la diferencia entre el valor
mayor y el menor, aunque algunos autores definen dicho rango como esta diferencia ms uno
(sobre todo, cuando se trata de agrupar en intervalos valores de una variable que, en el fondo, no
es continua aunque se pueda considerar as-, como ocurre en este caso): en el ejemplo 1 del
texto, sera entonces 3 1 16 18 = + = r aos, cosa que tiene su lgica, pues, al fin y al cabo, son
tres las edades que estamos considerando. En este ejemplo 4 tendremos el mismo resultado para
el rango si hacemos 21 1 40 60 5 , 39 5 , 60 = + = = r .

Error de agrupamiento (correccin Shepard).
Se llama as al error cometido en el clculo de la desviacin tpica como consecuencia del
agrupamiento de los datos en clases. Para ajustarnos a la realidad se puede utilizar la llamada
correccin Shepard para la varianza, que vale 12
2
c , donde c es la amplitud de los intervalos,
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
19
siempre que todos tengan la misma amplitud. Llamando
c
a la desviacin tpica corregida,

12
2
2 2
c
c
=
12
2
2
c
c
=
Esta correccin se emplea, fundamentalmente, en distribuciones continuas donde las colas
van gradualmente a cero en ambas direcciones.
Los distintos autores difieren en lo que se refiere a cuando y si debe aplicarse la correccin
Shepard, sobre todo sin haber hecho un examen completo de la situacin. En este texto dicha
correccin no va a ser utilizada.


Aproximacin de medio punto.
En los dos ejemplos siguientes, por tratarse de variables discretas tomadas como continuas y
no tener expresadas las clases como verdaderos intervalos, habra que realizar una especie de
aproximacin de medio punto: es decir, en el ejemplo 5 donde dice, por ejemplo, 40-44 libros,
en la tabla y a efectos de todos los clculos habra que entender el intervalo [ ] 5 ' 44 , 5 ' 39 ; y en
el ejemplo 6, 64-69 errores habra que considerarlo como el intervalo [ ] 5 ' 69 , 5 ' 63 .

Ejemplo 5:
La directora de la biblioteca de un centro universitario est interesada en conocer el nmero
de libros que por trmino medio sacaron en prstamo los cien alumnos de una determinada
promocin a lo largo de sus aos en el centro. Cul ser la media de libros por alumno, si los
datos correspondientes al grupo son los recogidos en la siguiente tabla? Construye previamente la
tabla de frecuencias. Cul ser la moda? Y la mediana? Qu porcentaje de alumnos sac menos
de 61 libros? Y ms de 83?

N
libros
40-
44
45-
49
50-
54
55-
59
60-
64
65-
69
70-
74
75-
79
80-
84
85-
89
90-
94
95-
99
100-
104
N
alum-
nos

2

2

8

4

8

16

16

20

12

4

6

0

2


Ejemplo 6:
A partir de la siguiente distribucin para datos agrupados por intervalos, correspondientes al
nmero de errores ortogrficos cometidos en un ejercicio de dictado por los 104 alumnos de 3
de Primaria de un centro, calcula la media, la mediana, la moda, la desviacin tpica, el coeficiente
de variacin, el sesgo y la curtosis.

N errores 16-21 22-27 28-33 34-39 40-45 46-51 52-57 58-63 64-69
N alumnos 8 12 18 17 17 12 8 9 3

Variables cualitativas.
Queda claro (tal y como hemos podido ir viendo a lo largo del tema) que, para una variable
estadstica cualitativa, la moda es la nica medida que podemos calcular.



Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
20
Otras medias.

Adems de la media aritmtica (o, simplemente, media), para variables cuantitativas pueden
calcularse otras medias, de las cuales las ms interesantes son:

Media geomtrica de N nmeros es la raz N-sima del producto de dichos N nmeros:

N
N
x x x x G ...
3 2 1
=
Si los valores
i
x se repiten
i
f veces, se puede elevar cada valor a su frecuencia, pero
quedando siempre en el radicando un total de N factores (repetidos o no), ya que

= N f
i
.

Media armnica de N nmeros es el nmero inverso de la media aritmtica de los inversos
de los N nmeros:

=
N
k k
x N
H
1
1 1
1

Si los valores
i
x se repiten
i
f veces, se puede multiplicar cada valor inverso por su
frecuencia, pero quedando siempre en el denominador un total de N sumandos (repetidos o no),
ya que

= N f
i
.
No utilizaremos ninguna de estas dos medias, pero siempre cumplen que x G H .

Algunas propiedades de la media (aritmtica) y de la desviacin tpica.
Se trata de algunas propiedades bsicas, cuyas demostraciones se dejan como ejercicios:
1) Si a todos los valores de una distribucin estadstica cuantitativa se les
suma una misma cantidad, la media queda tambin sumada en esa misma
cantidad, pero la desviacin tpica no vara.
2) Si todos los valores de una distribucin estadstica cuantitativa se
multiplican por una misma cantidad, la media y la desviacin tpica tambin
quedan multiplicadas por dicha cantidad.

Variable normalizada. Puntuaciones tpicas.

Para poder comparar dos datos correspondientes a dos distribuciones distintas, hay que
tipificar (o normalizar) dichos valores, es decir, calcular los valores

x x
z

= y, despus,
comparar los resultados de ambas puntuaciones tpicas.

Las puntuaciones tpicas no tienen dimensiones y, aplicando las propiedades del apartado
anterior, podemos comprobar que 0 = z y 1 =
z
.

Estudio conjunto de x y S .

En una distribucin estadstica de comportamiento normal ( 0
3
= a , 0
4
= a y
e
M M x = =
0
)
se cumple: 1) En ( ) S x S x + , se encuentra el 68,27% del total de individuos.
2) En ( ) S x S x 2 , 2 + se encuentra el 95,45% del total de individuos.
3) En ( ) S x S x 3 , 3 + se encuentra el 99,73% del total de individuos.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
21
Relacin de problemas del Tema 1.
1. En un estudio sobre determinadas caractersticas del alumnado de la Universidad de Sevilla,
aplicando un cuestionario, entre otras, se plantea la siguiente pregunta: Dnde resides durante
el curso? De una muestra de 400 alumnos elegidos al azar, se obtuvieron los siguientes
resultados:
Domicilio familiar (con los padres) 150
Domicilio de otros familiares 40
Residencia de estudiantes 50
Vivienda propia (comprada o alquiler) 40
Vivienda alquilada con compaeros 120
a) Indica cual es la poblacin de referencia.
b) Cul es la variable y de qu tipo.
c) Expresa los resultados en una tabla y haz las representaciones grficas oportunas.
2. Para un grupo de alumnos de Educacin Primaria hemos medido la variable X = "nmero de errores
cometidos en una prueba de clculo". Las puntuaciones obtenidas son las siguientes:
1 1 0 1 5 4 0 1 5 9 2 5 1 7 0 5 4 1 7 6
7 6 2 2 3 1 1 2 8 3 0 6 1 3 6 0 7 1 4 3
a) Determina las frecuencias simples absolutas y relativas de cada valor, as como sus
correspondientes valores acumulados.
b) Representa ambos polgonos de frecuencia.
c) Calcula las medidas de centralizacin.
d) Halla el rango, la desviacin media y la desviacin tpica.
3. Un grupo de 50 sujetos ha obtenido las siguientes puntuaciones, sobre un mximo de 20, en una
prueba sobre sus conocimientos de cierta asignatura:
20 14 17 3 5 6 16 4 8 7
3 19 7 5 5 7 6 9 8 6
12 7 5 8 6 14 4 19 5 14
7 12 9 6 6 9 12 20 10 15
8 11 13 7 14 8 10 9 6 8
a) Ordena en una tabla de distribucin agrupando los datos en intervalos de longitud 4.
b) Representa grficamente la distribucin usando los tipos de grficos ms adecuados.
4. Sean los datos reflejados a continuacin el resultado de la medicin, en metros, de la estatura de
una muestra de 50 jvenes de 15 a 18 aos de una determinada zona de la provincia de Sevilla:
1'69 1'37 1'70 1'46 1'74 1'81 1'67 1'47 1'40 1'73
1'75 1'58 1'39 1'77 1'85 1'68 1'50 1'64 1'88 1'43
1'38 1'59 1'55 1'34 1'76 1'33 1'60 1'56 1'45 1'65
1'98 1'47 1'54 1'64 1'44 1'54 1'48 1'53 1'89 1'61
1'65 1'56 1'78 1'51 1'92 1'62 1'57 1'49 1'25 1'53
a) Realiza una tabulacin y las representaciones grficas oportunas.
b) Cuntos sujetos miden ms de 1'60 m y cuntos menos que 1'50 m.
c) Halla las medidas de centralizacin.
d) Calcula la desviacin media, la desviacin tpica y el coeficiente de variacin.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
22
e) Calcula los percentiles 40 y 50.
f) Hasta qu altura pueden tener el 75% de los sujetos medidos?
g) En otro estudio realizado sobre otra muestra obtenemos = x 1645 m y = S 624 cm. En
qu caso es ms representativa la media?
5. Las puntuaciones obtenidas por un grupo de 38 alumnos en una prueba valorada
de 0 a 100, las cuales se suponen medidas en escala de intervalos, son las que
se presentan en la tabla.
a) Calcula la media aritmtica, la mediana y la moda.
b) Qu puntuacin deja por debajo de s el 75% de los casos? Y el 25%?
Cmo se denominan dichas puntuaciones?
c) Calcula el percentil 90 y el decil 2.
d) En este caso, es mayor la mediana que el decil 5?
e) Si hubisemos tomado intervalos de amplitud 5, seran ms o menos
exactas, las medidas calculadas?
6. Las puntuaciones obtenidas por 60 alumnos en una prueba de lectura son las que se recogen en la
tabla de la derecha.
a) Calcula P
25
, P
50
, P
75
, P
90
, moda y mediana.
b) Qu percentil corresponde a una alumna que ha obtenido 40 puntos?
Y a un alumno con 34?
c) Determina qu puntuaciones limitan el 40% central de los sujetos que
componen la muestra.
7. Cierto profesor a la hora de la calificacin final puntuaba a los alumnos con
el siguiente criterio: suspensos 40%, aprobados 30%, notables 15%,
sobresalientes 10% y matrculas 5%. Si las notas obtenidas por los alumnos
vienen dadas en la tabla inferior izquierda, calcular las notas mximas y mnimas para conseguir
suspenso, aprobado, notable, sobresaliente y matrcula.

8. En la tabla anterior derecha se presenta la distribucin de las puntuaciones obtenidas por dos
muestras de sujetos de escuelas diferentes en un test instructivo:
a) A partir de qu puntuacin se encontrar el 50% de los estudiantes que han obtenido notas
superiores en la escuela B?
b) Qu sujeto se sita en una posicin ms elevada respecto a su grupo, el que ha obtenido en
la escuela A 36 puntos o el que ha obtenido 30 puntos en la escuela B?
Puntuacin Esc. A, f
i
Esc. B, f
i
[0,5) 0 1
[5,10) 0 5
[10,15) 3 7
[15,20) 5 10
[20,25) 10 14
[25,30) 15 18
[30,35) 12 12
[35,40) 11 7
[40,45) 7 5
[45,50] 3 1
Notas n alumnos
[0,1) 36
[1,2) 74
[2,3) 56
[3,4) 81
[4,5) 94
[5,6) 70
[6,7) 41
[7,8) 28
[8,9) 16
[9,10] 4
Intervalos f
i
[0,10) 1
[10,20) 1
[20,30) 5
[30,40) 4
[40,50) 9
[50,60) 7
[60,70) 6
[70,80) 3
[80,90) 0
[90,100] 2
Intervalos f
i
F
i
[2,8) 1 1
[8,14) 4 5
[14,20) 5 10
[20,26) 10 20
[26,32) 11 31
[32,38) 5 36
[38,44) 13 49
[44,50) 11 60
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
23

9. Tras aplicar una prueba de comprensin lectora a 50 alumnos
de Educacin Primaria, pretendemos describir el conjunto de
puntuaciones obtenidas. Teniendo en cuenta que las
puntuaciones logradas son las que mostramos a continuacin,
calcula el rango semiintercuartlico, la asimetra y el
apuntamiento.

10. Se ha presentado una serie de 21 operaciones aritmticas a un grupo de 36
alumnos a fin de determinar su destreza matemtica. El nmero de
operaciones correctamente realizadas aparece recogido en la distribucin de
frecuencias de la derecha. Calcula la varianza y los coeficientes de variacin,
de asimetra y apuntamiento.

11. La tabla siguiente representa los aos de servicio de 52 personas de una empresa textil:
Aos de servicio 0 - 3 4 - 7 8 - 11 12 - 15 16 - 19 20 - 25
frecuencia 8 10 15 9 6 4
a) Construye un polgono de frecuencias para dicha poblacin.
b) Determina sesgo y curtosis de la poblacin.
c) Encuentra el nmero de personas que pertenecen al intervalo ( ) S x S x 2 , 2 + .

12. La siguiente tabla indica las edades de un grupo de personas.
Edad (aos) 0 a 10 10 a 20 20 a 30 30 a 40 40 a 50 50 a 60 60 a 70 70 a 80
N de personas 23 34 47 53 45 15 18 4
a) Determina la media, moda, mediana y cuartiles.
b) Determina las medidas de dispersin.
c) Analiza sesgo y curtosis.
d) Determina el porcentaje de personas que pertenecen al intervalo ( ) S x S x + , .

13. Una empresa inmobiliaria ofrece apartamentos de alquiler cuyos precios, en euros, y nmero de
ellos aparece en la tabla de la derecha.
a) Halla el alquiler medio por apartamento, el precio ms frecuente y el precio que se sita en la
mitad de la oferta.
b) Si una persona quiere gastar en alquiler entre 1250 y 1350 euros al mes, a qu porcentaje
del total de apartamentos tiene opcin?
c) Calcula los coeficientes de asimetra y apuntamiento.
N Operac. f
i
[2,4) 5
[4,6) 3
[6,8) 4
[8,10) 6
[10,12) 7
[12,14) 3
[14,16) 3
[16,18) 2
[18,20) 2
[20,22] 1
Clases f
i
[0,3) 15
[3,6) 20
[6,9) 10
[9,12] 5
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
24

14. Se tiene el siguiente conjunto de datos:
10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9,
9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
Construye la tabla de frecuencias necesaria para calcular su media, su moda, su mediana, sus
cuartiles y su desviacin tpica y calcula todas estas medidas.
Representa grficamente esta distribucin mediante un diagrama de barras y un polgono de
frecuencias.
15. Un pediatra obtuvo la primera tabla
de la derecha sobre los meses de edad
de 50 nios de su consulta en el
momento de andar por primera vez:
a) Dibuja el polgono de frecuencias.
b) Calcula la moda, la mediana, la
media y la varianza.





16. Otro pediatra obtuvo la tabla de arriba a la derecha sobre las edades (de 0 a 10 aos) de los
nios que iban a su consulta.
a) Calcula la media aritmtica y la desviacin tpica.
b) Representa el polgono de frecuencias.
c) Halla sus coeficientes de variacin, de sesgo y de curtosis.
d) Entre qu valores se encuentran las diez edades centrales?
17. Completa los nmeros y letras que faltan en la tabla estadstica de abajo a la izquierda, y
calcula la media, la moda, la mediana, la desviacin tpica y el coeficiente de variacin.


18. El histograma de la distribucin del peso (en kg) de 100 alumnos de Bachillerato es el que
aparece arriba a la derecha (donde los nmeros que aparecen dentro de cada rectngulo nos
indican las frecuencias absolutas correspondientes).
a) Forma la tabla de la distribucin.
b) Calcula el peso medio, la moda, la mediana, la desviacin tpica y los coeficientes de
variacin, de sesgo y de apuntamiento.
c) A partir de qu peso se encuentra el 25% del alumnado con ms peso?
d) Cuntos alumnos tienen un peso comprendido entre 65 y 70 kg?
19. Una persona A mide 1,75 m y reside en un pas donde la estatura media es de 1,60 m y la
desviacin tpica es de 20 cm. Otra persona B mide 1,80 m y vive en otro pas donde la
estatura media es de 1,70 m y la desviacin tpica es de 15 cm. Cul de las dos personas es
ms alta respecto a sus compatriotas?

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
25
2. Anlisis de dos variables.

2.1. Distribucin de dos variables. Diagramas de dispersin.

Hasta ahora se ha estudiado un solo carcter de la poblacin mediante una variable
unidimensional. En este apartado se estudiarn variables bidimensionales, es decir, que miden dos
caracteres de la poblacin conjuntamente. Por tanto las variables bidimensionales vendrn dadas
por parejas de valores resultantes de la observacin de dos caracteres.

Para expresar estas variables se utilizan tablas simples o tablas de doble entrada.
En una tabla simple la primera columna contiene los datos de la variable x, la segunda columna
corresponde a la variable y, la tercera contiene los valores de la variable bidimensional, que son
parejas de valores, y en la cuarta columna se recogen las frecuencias de cada valor de la variable
bidimensional (cada par de valores).
En la tabla de doble entrada, en cada cruce de columna y fila aparece la frecuencia del par
correspondiente. La columna de abajo y la de la derecha recogen las llamadas frecuencias
marginales, que son las correspondientes a cada una de las variables, y son, a su vez, sumas de las
frecuencias que aparecen en las distintas filas o columnas.


j
y
i
x
1
y
2
y
j
y
n
y

1
x
11
f
12
f
j
f
1

n
f
1

1
1
x
m
i
in
f f =

=

2
x
21
f
22
f
j
f
2

n
f
2

2
1
x
m
i
in
f f =

=


i
x
1 i
f
2 i
f
ij
f
in
f
i
x
m
i
in
f f =

=1


m
x
1 m
f
2 m
f
mj
f
mn
f
m
x
m
i
in
f f =

=1


1
1
1 y
m
i
i
f f =

=

2
1
2 y
m
i
i
f f =

=


j
y
m
i
ij
f f =

=1


n
y
m
i
in
f f =

=1

= =
=
m
i
n
j
ij
N f
1 1

TABLA DE DOBLE ENTRADA

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
26
Ejemplo 1:
Se clasifican 50 familias con arreglo al nmero de hijos e hijas obtenindose los siguientes
resultados. La
i
x se refiere al nmero de hijos y la
j
y representa el nmero de hijas.
i
x
j
y ( )
j i
y x ,
ij
f
0 0 (0, 0) 2
0 1 (0, 1) 3
0 3 (0, 3) 1
1 2 (1, 2) 6
1 3 (1, 3) 4
2 0 (2, 0) 4
2 1 (2, 1) 9
2 4 (2, 4) 2
3 0 (3, 0) 3
3 2 (3, 2) 6
3 5 (3, 5) 1
4 0 (4, 0) 1
4 3 (4, 3) 2
4 4 (4, 4) 1
5 1 (5, 1) 3
5 3 (5, 3) 1
6 2 (6, 2) 1
------- -------- ------------------ 50
TABLA SIMPLE


j
y
i
x
0 1 2 3 4 5


0 2 3 0 1 0 0 6
1 0 0 6 4 0 0 10
2 4 9 0 0 2 0 15
3 3 0 6 0 0 1 10
4 1 0 0 2 1 0 4
5 0 3 0 1 0 0 4
6 0 0 1 0 0 0 1


10 15 13 8 3 1 50
TABLA DE DOBLE ENTRADA

La tabla de la izquierda es una tabla simple, mientras que la
de arriba es una tabla de doble entrada, en la que pueden
observarse resultados como, por ejemplo, que hay 13 familias con
2 hijas (frecuencia marginal resultante de la suma de la columna
0+6+0+6+0+0+1=13), 10 familias con 3 hijos (frecuencia
marginal resultante de la suma de la fila 3+0+6+0+0+1=10), etc.
El total de la suma de las frecuencias marginales de la ltima fila
da, por supuesto, 50 = N , lo mismo que la suma de las
frecuencias marginales de la ltima columna.

A veces los datos relacionados aparecen en tablas simples donde no aparece la frecuencia.
En ese caso son parejas de datos nicas, es decir como si las frecuencias fuesen todas 1.
Ejemplo 2:
En la siguiente tabla aparecen los datos referidos a la esperanza de vida al nacer (en aos) y
el P.N.B. per cpita (en dlares) de 11 pases de frica.


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
27
Diagramas de dispersin.
En un sistema de ejes representamos en cada eje cada una de las variables. Alrededor del
punto del plano correspondiente a cada pareja de valores dibujamos tantos puntos como indique la
frecuencia absoluta del par.
Ejemplo 1:

Tenemos as una nube de puntos que nos da idea de cmo se relacionan los datos, si es que
se relacionan.

2.2. Parmetros estadsticos. Covarianza.
El estudio de una variable bidimensional parte del estudio de cada una de las variables
simples, por tanto es necesario hallar las medias y las desviaciones tpicas de cada una de ellas.
Para esto nos son muy tiles las dos distribuciones de frecuencias marginales (distribuciones
marginales) de la tabla de doble entrada. Vemoslo con el ejemplo 1:
i
x
i
x
f
i
x i
f x
i
x i
f x
2

0 6 0 0
1 10 10 10
2 15 30 60
3 10 30 90
4 4 16 64
5 4 20 100
6 1 6 36


50 112 360

j
y
j
y
f
j
y j
f y
j
y j
f y
2

0 10 0 0
1 15 15 15
2 13 26 52
3 8 24 72
4 3 12 48
5 1 5 25


50 82 212

Entonces,

24 , 2
50
112
= = x hijos.
= =
2 2
24 , 2
50
360
x
S 2,18.

64 , 1
50
82
= = y hijas.
= =
2 2
64 , 1
50
212
y
S 1,55

Pero, adems, hay que medir un parmetro nuevo (conjunto) que pone en relacin ambas
variables: la covarianza.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
28

Covarianza.
Se define como
( )( )
N
f y y x x
S
ij j i
xy


= .

Haciendo transformaciones se llega a esta otra expresin:
y x
N
f y x
S
ij j i
xy
=

.

Es decir, que, ya que podemos decir que la varianza es igual a la media de los cuadrados
(de una variable) menos el cuadrado de la media, tambin podemos decir que la covarianza
es igual a la media de los productos (de dos variables) menos el producto de las medias.

Ejemplo 1:
Para efectuar el clculo de la covarianza en este ejemplo se pueden tomar los datos
indistintamente de la tabla simple o de la de doble entrada de la pgina 26. En ambos casos
obtendremos (usando la segunda de las dos frmulas anteriores):
146 , 0 64 , 1 24 , 2
50
1 2 6 1 3 5 3 1 5 1 4 4 ... 9 1 2 4 3 1 6 2 1
=
+ + + + + + +
=
xy
S


Ejemplo 2:
Llamando x a la esperanza de vida (en aos) e y al P.N.B. per cpita (en dlares), vamos a
calcular primero ambas medias y ambas varianzas:
55 , 54
11
70 45 70 ... 68 42 52
=
+ + + + + +
= =

N
x
x
i
aos.
6 , 140 55 , 54
11
70 45 70 ... 68 42 52
2
2 2 2 2 2 2
2
2
2
=
+ + + + + +
= =

x
N
x
S
i
x

18 , 748
11
1600 140 1800 ... 1250 260 550
=
+ + + + + +
= =

N
y
y
i
$
380780 18 , 748
11
1600 140 ... 1250 260 550
2
2 2 2 2 2
2
2
2
=
+ + + + +
= =

y
N
y
S
i
y


Han resultado muy cmodos de hacer estos clculos, gracias a ser todas las frecuencias
absolutas iguales a 1. Tambin resulta muy cmodo el clculo de la covarianza:
7070 18 , 748 55 , 54
11
1600 70 140 45 ... 260 42 550 52
=
+ + + +
= =

y x
N
y x
S
i i
xy

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
29
2.3. Correlacin. Coeficiente de correlacin lineal (de Pearson).
Correlacin.
Dadas dos variables estadsticas, la correlacin estudia la existencia o no de una relacin
entre sus valores.
Pueden darse dos tipos de correlacin: la correlacin lineal y la correlacin curvilnea, segn
que los puntos se aproximen a una lnea recta o curva.
Si hay correlacin, al representar la nube de puntos, stos aparecern ajustados alrededor
de una lnea recta o de una lnea curva.
Si los puntos no se ajustan a una lnea, se dice que no hay correlacin o que es nula.

Nos ocuparemos en este curso de la correlacin lineal, luego, de ahora en adelante, cuando
hablemos de correlacin, nos estaremos refiriendo a la correlacin lineal.

Podemos encontrar varios grados de correlacin.


Ejemplo 1: A la vista de la nube de puntos de nuestro ejemplo (pgina 27), no hay
correlacin.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
30

Coeficiente de correlacin lineal (de Pearson).
Mide el grado y el tipo de correlacin. Se define como
y x
xy
S S
S
r

= .
El signo de coeficiente de correlacin lineal define el tipo de correlacin, si es positiva o
negativa.
El coeficiente de correlacin es un nmero comprendido entre -1 y 1.
Si 1 = r la correlacin es funcional y negativa.
Si 0 1 < < r , hay correlacin estadstica lineal negativa, tanto ms fuerte cuanto ms
prximo est de -1 y tanto ms dbil cuanto ms prximo est de 0.
Si 0 = r no existe correlacin lineal.
Si 0 < r < 1, hay correlacin estadstica lineal positiva, tanto ms fuerte cuanto ms
prximo est de 1 y tanto ms dbil cuanto ms prximo est de 0.
Si 1 = r la correlacin es funcional y positiva.
En nuestro ejemplo 1, 0794 , 0
55 , 1 18 , 2
146 , 0
=

= r . Luego la correlacin es positiva y dbil


(ver nube de puntos).
En nuestro ejemplo 2, 9663 , 0
380780 6 , 140
7070
=

= r . La correlacin es positiva y muy


fuerte, como parece lgico pensar (que la esperanza de vida y el P.N.B. per cpita estn tan
estrechamente relacionados).
Ejemplo 3:
La evolucin del IPC (ndice de precios de consumo) y de la tasa de inflacin en el primer
semestre de 1987 fue:

Llamamos X = IPC; Y=TASA DE INFLACIN.
55 , 1
6
3 , 9
6
9 , 1 9 , 1 2 7 , 1 1 , 1 7 , 0
= =
+ + + + +
= =

N
x
x
i
4822 , 0 55 , 1
6
9 , 1 9 , 1 2 7 , 1 1 , 1 7 , 0
2
2 2 2 2 2 2
2
2
=
+ + + + +
= =

x
N
x
S
i
x

87 , 5
6
2 , 35
6
9 , 4 8 , 5 2 , 6 3 , 6 6 6
= =
+ + + + +
= =

N
y
y
i

4607 , 0 87 , 5
6
9 , 4 8 , 5 2 , 6 3 , 6 6 6
2
2 2 2 2 2 2
2
2
=
+ + + + +
= =

y
N
y
S
i
y

=
+ + + + +
= =

87 , 5 55 , 1
6
9 , 4 9 , 1 8 , 5 9 , 1 2 , 6 2 3 , 6 7 , 1 6 1 , 1 6 7 , 0
y x
N
y x
S
i i
xy
=

= =
4607 , 0 4822 , 0
0585 , 0
0585 , 0
y x
xy
S S
S
r -0,2633

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
31
Se trata de una correlacin lineal negativa dbil, prcticamente no hay correlacin lineal,
lo que no quiere decir que no haya otro tipo de correlacin.

2.4. Regresin. Rectas de regresin.

Una vez establecida la dependencia entre dos variables estadsticas nos proponemos hallar
una recta que se ajuste lo mejor posible a la nube de puntos.

Para ello utilizamos el mtodo que se conoce como de los mnimos cuadrados, que consiste en
elegir aquella recta tal que la suma de los cuadrados de las desviaciones de la ordenada de cada
punto respecto de la recta sea la mnima posible.
Se demuestra con la premisa anterior que la recta
buscada tiene la siguiente ecuacin:
( ) x x
S
S
y y
x
xy
=
2

Esta recta se llama recta de regresin de Y sobre
X.
Planteando que sea mnima la suma de los cuadrados
de las desviaciones de las abscisas de los puntos respecto
de la recta, se obtiene la recta de regresin de X sobre
Y, que viene dada por ( ) y y
S
S
x x
y
xy
=
2
.

Obsrvese que ambas rectas pasan por el punto de coordenadas ( ) , x y .

Si la correlacin es fuerte estas rectas sirven para, dado un valor de una de las variables,
calcular el de la otra, es decir, para efectuar una estimacin. Dicha estimacin ser tanto ms
fiable cuanto ms prximo a 1 est el valor absoluto del coeficiente de correlacin ( ) r .

Adems, cuanto ms prximo a 1 est r , ms parecidas sern ambas rectas.

Tambin hace ms fiable la estimacin el hecho de que el valor que nos den est comprendido
dentro del rango de valores que tenemos de la variable en cuestin, no pudindose asegurar tan
contundentemente la fiabilidad cuando se trate de un valor alejado del rango en cuestin. En
nuestro ejemplo 2 las estimaciones sern bastante fiables ( ) 9663 , 0 = r , sobre todo si damos,
por ejemplo, a x valores comprendidos entre 42 aos y 70 aos (que son los valores extremos de
esa distribucin) o a y los comprendidos entre 100 dlares y 1800 dlares (por la misma razn
anterior).


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
32


En nuestro ejemplo 2 las rectas de regresin son:

Recta de regresin de y sobre x: ( ) 55 , 54
6 , 140
7070
18 , 748 = x y . Esta recta permitira
estimar, por ejemplo, que un pas de frica cuya esperanza de vida fuera 60 aos, tendra un
P.N.B. per cpita de 1022 18 , 748 ) 55 , 54 60 (
6 , 140
7070
) 60 ( = + =
est
y dlares.

Recta de regresin de x sobre y: ( ) 18 , 748
380780
7070
55 , 54 = y x , lo que nos permitira
estimar que, para una P.N.B. per cpita de (por ejemplo) 1000 dlares, la esperanza de vida sera
( ) 60 55 , 54 18 , 748 1000
380780
7070
) 1000 ( = + =
est
x aos.


Veamos un par de ejemplos ms sobre el clculo y/o uso de una de estas rectas de regresin
(en concreto, de la de y sobre x):

Ejemplo 4:

Una empresa dispone de los siguientes datos: con tres vendedores, recibe 90 pedidos; con
cuatro, 110 pedidos; con cinco, 140; con ocho, 190; y con diez, 235. Cmo es la correlacin
lineal entre ambas variables, dbil, moderada o fuerte, positiva o negativa? Estima el nmero
de pedidos que se obtendran con nueve vendedores.

Llamando x a la variable nmero de vendedores e y al nmero de pedidos:

x 3 4 5 8 10
y 90 110 140 190 235

6
5
10 8 5 4 3
=
+ + + +
= =

N
x
x
i
vendedores.

153
5
235 190 140 110 90
=
+ + + +
= =

N
y
y
i
pedidos.

61 , 2
2
2
= =

x
N
x
S
i
x
vendedores.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
33
1 , 53
2
2
= =

y
N
y
S
i
y
pedidos.
138 = =

y x
N
y x
S
i i
xy
.

=

=
1 , 53 61 , 2
138
y x
xy
S S
S
r 0,9957 Correlacin lineal positiva fuerte. Por eso
es muy fiable la estimacin que vamos a realizar:
Recta de regresin: ( ) ). 6 (
81 , 6
138
153
2
= = x y x x
S
S
y y
x
xy

Entonces, si x = 9 vendedores, + = ) 6 9 (
81 , 6
138
153 ) 9 (
est
y 214 pedidos.

Ejemplo 5:
Estas son las calificaciones de diez alumnos en dos asignaturas:

MATEMT. 3 4 4 5 6 6 7 7 8 10
ECCONOMA
3 2 4 4 4 5 5 6 7 9

Calcula el coeficiente de correlacin lineal y la ecuacin de la recta de regresin que nos d la
calificacin de ECONOMA en funcin de la de MATEMTICAS. Es fiable la utilizacin de
esta funcin?
Vamos a llamar x a la calificacin en Matemticas e y a la calificacin en Economa.
6
10
60
= = =

N
x
x
i

2 6
10
400
2 2
2
= = =

x
N
x
S
i
x
;

9 , 4
10
49
= = =

N
y
y
i

92 , 1 9 , 4
10
277
2 2
2
= = =

y
N
y
S
i
y
;

= =

=

6 , 3 9 , 4 6
10
330
y x
N
y x
S
i i
xy
r = =

=
92 , 1 2
6 , 3
y x
xy
S S
S
0,9375.

( ) ) 6 (
2
6 , 3
9 , 4
2 2
= = x y x x
S
S
y y
x
xy
, que es un resultado bastante fiable dado el
alto valor del coeficiente de correlacin.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
34
Relacin de problemas del Tema 2.
1. Dada la siguiente tabla de correlacin, determina:
a) Las distribuciones marginales. Media, Moda y Mediana.
b) Nube de puntos.
c) Coeficiente de correlacin lineal. Interpreta el resultado.
d) Rectas de Regresin.
2. En una empresa se estudia la relacin que existe entre
los gastos en publicidad, en miles de euros, (variable X)
y los beneficios, tambin en miles de euros, (variable Y).
De ambas variables disponemos de los datos recogidos
en la tabla.
a) Se puede considerar que ambas variables guardan algn tipo de relacin? Cul sera la
variable dependiente y cul la independiente?
b) Con un grfico adecuado. Se puede suponer que la relacin que las liga es de tipo lineal?
c) Construye las dos rectas de regresin mnimo cuadrtica asociada con las variables.
d) Si la empresa para el prximo ao realizara un esfuerzo para poder invertir 115.000 en
publicidad. Cules resultaran ser sus beneficios? Es fiable la prediccin?
3. Se determina la prdida de actividad que experimenta un medicamento desde el momento de su
fabricacin a lo largo del tiempo, obtenindose los resultados de la tabla. Se desea calcular:
Tiempo en aos 1 2 3 4 5
Actividad restante % 96 84 70 58 52

a) Qu tipo de correlacin se da?
b) La recta de regresin entre actividad y tiempo transcurrido.
c) El tiempo en meses que corresponde al 80% de actividad.
d) Cundo ser nula la actividad?
4. Se ha realizado un estudio comparativo de las
puntuaciones obtenidas por los alumnos en un test de
ingreso en la universidad (X) y el nmero de asignaturas
aprobadas en el primer curso (Y). Los resultados
obtenidos se expresan en la tabla adjunta. Calcula:
a) Recta de regresin de X sobre Y.
b) Coeficiente de correlacin e interpretacin del mismo.
c) Si la universidad en cuestin slo contara con alumnos que al menos logren aprobar dos
asignaturas, qu nmero de preguntas respondidas correctamente exigir en el test?
5. Un holding formado por cinco empresas pblicas decide realizar, en vista de una prxima
privatizacin, un anlisis conjunto de sus actividades. La valoracin del conjunto de todas las
empresas es de 2000 millones de euros, donde las empresas A y B representan cada una de ellas
el 30% de la valoracin total. La empresa C supone un 10% de dicha valoracin repartindose a
partes iguales el resto las otras dos empresas. El beneficio neto que obtuvieron las empresas en
el periodo anterior fue en miles de euros: el de la empresa A, 224; el de la empresa B, 233; el de
la empresa C, 107; el de la empresa D, 155 y el de la empresa E, 130. Se pide:
Ao 1993 1994 1995 1996 1997
x 70 75 80 90 104
y 33 45 50 65 67
X \ Y 1 2 3
[0,4) 3 6 1
[4,8) 4 7 3
[8,12) 5 3 0
X \ Y
0 1 2 3 4
[0, 10)
2 2 1 0 0
[10, 20)
1 1 2 2 0
[20, 30)
0 1 3 4 1
[30, 40)
0 0 2 2 6
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
35
a) Construye una tabla donde se reflejen de manera clara los valores anteriores de las variables
X=valor de las empresas e Y=beneficio.
b) Halla el valor medio de las empresas del holding y estudia si ste es representativo.
c) Es equitativo el reparto de los beneficios entre las empresas?
d) Construye un modelo lineal que explique los beneficios en funcin del valor de la empresa. Es
aceptable el modelo construido?
6. Una compaa discogrfica ha recopilado la siguiente informacin sobre el nmero de conciertos
(X) dados por 15 grupos musicales y las ventas de discos (Y) de estos grupos (expresados en
miles), obteniendo los datos siguientes:

a) Halla el nmero medio de discos vendidos
por estos grupos.
b) Calcula las rectas de regresin entre estas
dos variables. Son fiables las estimaciones
que hagamos con ellas?
c) Si un grupo musical ha vendido 18.000 discos, qu nmero de conciertos es previsible que d?
7. Se consideran dos variables aleatorias X e Y tales que:
La recta de regresin de Y sobre X viene dada por la ecuacin: y x 2 = 0.
La recta de regresin de X sobre Y viene dada por la ecuacin: y 4x + 22 = 0.
a) Valores de e x y .
b) Coeficiente de correlacin lineal.
8. La siguiente tabla recoge las calificaciones de 40 alumnos en Matemticas y Fsica.
Matemticas (X ) 3 4 5 6 6 7 7 8 10
Fsica (Y ) 2 5 5 6 7 6 7 9 10
N de alumnos 4 6 12 4 5 4 2 1 2
a) Escribe las distribuciones marginales de X e Y. Halla las respectivas medias y
desviaciones tpicas.
b) Calcula el coeficiente de correlacin lineal.
c) Qu nota de Matemticas se puede esperar que obtenga un alumno que ha obtenido
7,5 en Fsica? Es fiable este resultado?
9. En un centro diettico se est probando una nueva dieta de adelgazamiento en una muestra de 12
individuos. Para cada uno de ellos se ha medido el nmero de das que lleva con la dieta y el
nmero de kilos perdidos desde entonces, obtenindose los siguientes resultados:
(33,39), (51,59), (30,32), (55,60), (38,49), (62,62), (35,45), (60,61), (44,56), (69,62), (47,58), (40,53)
a) Dibuja el diagrama de dispersin. Segn la nube de puntos, qu tipo de modelo explicara
mejor la relacin entre los das de dieta y los kilos perdidos?
b) Calcula la recta de regresin de los kilos perdidos con respecto a los das de dieta.
c) Utiliza la recta anterior para predecir el nmero de kilos perdidos tras 40 das de dieta y
tras 100 das. Son fiables estas predicciones?
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
36
10. Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan, respectivamente, 14, 20, 32, 42 y 44
kilogramos.
a) Halla la ecuacin de la recta de regresin de la edad sobre el peso.
b) Cul sera el peso aproximado de un nio de seis aos?
11. Los directivos de una cadena de centros comerciales saben que, en funcin de la distancia (en
km) a la que se siten de un ncleo de poblacin, acuden los clientes (en cientos) que figuran
en la siguiente tabla:

a) Calcula el coeficiente de correlacin lineal.
b) Si un centro comercial de esta cadena se sita a 2 km de un ncleo de poblacin,
cuntos clientes puede esperar?
c) Si desea recibir a 500 clientes, a qu distancia debe situarse?
12. Las estaturas (en cm) y pesos (en kg) de 10 jugadores de un equipo de baloncesto son:

a) Halla la recta de regresin de Y sobre X.
b) Calcula el coeficiente de correlacin.
c) Estima el peso de un jugador que mide 208 cm.
13. A partir de los siguientes datos referentes a horas trabajadas en un taller (X) y a unidades
producidas (Y), determina ambas rectas de regresin y el coeficiente de correlacin lineal.

14. Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero de horas diarias que
dedican a dormir y a ver la televisin. La clasificacin de las respuestas estn en esta tabla:

a) Calcula el coeficiente de correlacin lineal.
b) Determina ambas rectas de regresin.
c) Si una persona duerme ocho horas y media, estima cunta televisin ve.
15. Esta tabla nos da las notas del test de aptitud (X) y las ventas (en cientos de euros) del
primer mes de prueba de seis dependientes:

a) Halla el coeficiente de correlacin lineal e interpreta el resultado.
b) Calcula la recta de regresin de Y sobre X y estima las ventas de un vendedor que
haya obtenido 47 puntos en el test.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
37

Bloque 2. PROBABILIDAD.

3. Probabilidad.

3.1. Conceptos bsicos.
En este tema se estudian los hechos que no dependen de ninguna ley preestablecida, sino slo
del azar. Tratamos de establecer la mayor o menor facilidad de que determinada cosa ocurra,
esto es, cuantificar el azar.

Experimentos aleatorios.
Son aquellos en los que no podemos predecir su resultado de antemano.
Ejemplos:
Ejemplo 1: Lanzar una moneda al aire.
Ejemplo 2: Lanzar un dado.
Ejemplo 3: Lanzar dos dados y anotar su suma.
Ejemplo 4: De una urna donde hay 3 bolas rojas y 5 verdes extraer dos bolas con
reemplazamiento.
Ejemplo 5: De una urna donde hay 3 bolas rojas y 5 verdes extraer dos bolas sin
reemplazamiento.
En contraposicin a ellos estn los experimentos deterministas, que son aquellos cuyo
resultado podemos predecir puesto que estn ligados a cierta ley.
Ejemplos:
Arrojar una piedra al vaco y medir su aceleracin.
Medir la longitud de una circunferencia de radio 5 cm.

Espacio muestral.
Es el conjunto de resultados que pueden darse en un experimento aleatorio.
Ejemplo 1: E={C,X}
Ejemplo 2: E={1,2,3,4,5,6}
Ejemplo 3: E={2,3,4,5,6,7,8,9,10,11,12}.
Ejemplo 4: E={RR,RV,VR,VV}
Ejemplo 5: E={RR,RV,VR,VV}

Sucesos aleatorios.
Un suceso aleatorio es cada uno de los subconjuntos del espacio muestral.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
38
Se da un suceso (o se realiza, o se cumple, o tiene lugar, o sucede, u ocurre) cuando al
efectuar el experimento sale como resultado uno cualquiera de los elementos que componen el
suceso.
Ejemplo 1: A=Que salga cara={C}.
Ejemplo 2: A=Sacar par= {2,4,6}, B=Sacar ms de 4={5,6}.
Ejemplo 3: A=Sacar menos de 7 puntos={2,3,4,5,6}.
Ejemplo 4: A=Extraer bolas del mismo color= {RR,VV}.
Ejemplo 5: A=Extraer al menos una bola verde={RV,VR,VV}.

Operaciones con sucesos.

Unin de sucesos: Dados dos sucesos A y B, la unin de los sucesos es otro suceso que
expresa que se da A B. Se denota por A B y es el suceso formados por todos
los elementos de A y de B. Es decir, A B se verifica (ocurre, tiene lugar, se da)
cuando ocurre uno de los dos, A o B, o ambos. A B se lee A o B.
En el ejemplo 2, si A = sacar par = { } 6 , 4 , 2 y B = sacar mltiplo de 3 = { } 6 , 3 , la
unin es { } 6 , 4 , 3 , 2 = B A , tal y como podemos ver en el siguiente diagrama (todo lo
que aparece sombreado en verde):

Interseccin de sucesos: Dados dos sucesos A y B, la interseccin de los sucesos es
otro suceso que expresa que se da A y B a la vez. Se denota por A B y es el
suceso formado por todos los elemento que son, a la vez, de A y de B. Es decir, el
suceso A B se verifica cuando ocurren simultneamente A y B. A B se lee
A y B.
En el ejemplo 2, si A = sacar par = { } 6 , 4 , 2 y B = sacar mltiplo de 3 = { } 6 , 3 , la
interseccin es { } 6 A B = , tal y como podemos ver en el siguiente diagrama (lo que
aparece sombreado en verde).

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
39
Diferencia de sucesos: La diferencia de sucesos, B A , es el suceso formado por
todos los elementos de A que no pertenecen a B. Es decir, la diferencia de los sucesos
A y B se verifica cuando lo hace A y no B. B A se lee A menos B. Se cumple:
( ) B A A B A B A = =
En el ejemplo 2, si A = sacar par = { } 6 , 4 , 2 y B = sacar mltiplo de 3 = { } 6 , 3 , la
{ } 4 , 2 = B A , tal y como podemos ver en el siguiente diagrama (lo que aparece
sombreado en verde).


Tipos de sucesos.
Sucesos elementales: Son los formados por un solo elemento del espacio muestral. En
el ejemplo 1, son sucesos elementales cada una de las dos posibilidades, { } C { } X .
Suceso imposible: Suceso que no puede darse. Se denota por , que representa
cualquier conjunto vaco. En el ejemplo 3, Obtener una suma 15 = .
Suceso seguro: suceso que se da siempre, sea cual sea el resultado del experimento.
Este suceso es el propio espacio muestral E. En el ejemplo 1, Sacar cara o cruz = E.
Suceso contrario: el contrario de A expresa que no se da A. Se denota por A . En el
ejemplo 2, { } 5 , 3 , 1 = A , lo que era de esperar, puesto que lo contrario de extraer par
es extraer impar.
Sucesos compatibles: Son aquellos que pueden darse (tener lugar) a la vez, es decir,
que B A . Es decir: dos sucesos, A y B, son compatibles cuando tienen algn
suceso elemental comn. En el ejemplo 2, los sucesos A=Sacar par= {2,4,6} y
B=Sacar ms de 4={5,6} son compatibles porque tienen un suceso elemental comn,
{ } 6 = B A .
Sucesos incompatibles: Son aquellos que no pueden darse a la vez, es decir, que
A B = . Es decir: dos sucesos, A y B, son incompatibles cuando no tienen ningn
suceso elemental comn. En el ejemplo 2, los sucesos A=Sacar par= {2,4,6} y
B=Sacar mltiplo de 5={5} son incompatibles porque no tienen ningn suceso
elemental comn, = B A .
Sucesos independientes: Dos sucesos son independientes cuando el hecho de que uno
de ellos ocurra o no (su probabilidad) no se ve afectado porque haya o no sucedido el
otro. Por ejemplo, si tiramos dos dados, lo que salga en uno de ellos no tiene nada que
ver con lo que salga en el otro.
Sucesos dependientes: Dos sucesos son dependientes cuando el hecho de que uno de
ellos ocurra o no (su probabilidad) s se ve afectado porque haya o no sucedido el otro.
Por ejemplo, si extraemos dos cartas de una baraja, una despus de otra, sin devolver
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
40
la primera carta a la baraja (sin reemplazamiento), s influye lo que haya salido en la
primera en lo que obtengamos en la segunda (porque, para empezar, ya hay una carta
posible menos que extraer).

Espacio de sucesos.
Se llama espacio de sucesos, y se representa por S, al conjunto de todos los sucesos
aleatorios subconjuntos de un espacio muestral determinado. En el ejemplo 1, E={C,X} y
.
Se observa siempre que el primer elemento del espacio de sucesos es el suceso imposible y el
ltimo el suceso seguro.
Si E (espacio muestral) tiene un nmero finito de elementos, n, el nmero de elementos de S
es
n
2 .
Por ejemplo: UNA MONEDA: 2 = n y
n
2 = 4, como ya hemos visto.
DOS MONEDAS: 4 = n y
n
2 = 16. ( ) ( ) ( ) ( ) { } X X C X X C C C E , ; , ; , ; , = .
UN DADO (ejemplo 2): 6 = n y
n
2 = 64. E={1,2,3,4,5,6}.


3.2. Probabilidad. Regla de Laplace.
Nos proponemos ahora asignar a cada suceso un nmero que indique la mayor o menor
facilidad de que, al realizar el experimento, se d (se realice, tenga lugar) ese suceso. Dicho
nmero ser la probabilidad del suceso en cuestin.

Ley de los grandes nmeros. Idea intuitiva de probabilidad.
Si realizamos el experimento de lanzar una moneda al aire 10, 20, , 200 veces y vamos
obteniendo los siguientes resultados para el nmero de caras:
N de lanzam. 20 40 60 80 100 120 140 160 180 200
Frec. Absoluta 11 23 35 43 58 65 74 85 96 105
Frec. relativa 0,5500 0,5750 0,5833 0,5375 0,5800 0,5417 0,5286 0,5313 0,5333 0,5250

Si siguisemos este proceso indefinidamente iramos obteniendo frecuencias absolutas que
cada vez se aproximan ms a 05.
Dicho de otro modo, para un nmero cada vez ms alto de tiradas, aproximadamente el 50%
son caras y el 50% son cruces.
Desde un punto de vista terico, es razonable pensar que la proporcin de caras y cruces
para un nmero cada vez ms alto de tiradas debe repartirse as (50% y 50%, respectivamente),
ya que no tenemos razones para pensar que sea ms fcil que se den las caras que las cruces.
Este proceso, que en matemticas se llama de paso al lmite, es lo que se conoce en
estadstica como Ley de los grandes nmeros, es decir, las frecuencias relativas resultantes de
la realizacin de un experimento se estabilizan alrededor de cierto valor conforme aumentamos
el nmero de experiencias.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
41
Probabilidad. Regla de Laplace.
Dado un suceso A, buscamos, segn dijimos ms arriba, asignar a A un nmero que indique la
mayor o menor facilidad de que A se d al realizar el experimento. Ese nmero lo llamaremos
probabilidad del suceso A y la denotaremos por P(A).
La ley de los grandes nmeros, que se basa en la frecuencia relativa, es decir, en la
proporcin, va a ser la forma de asignar probabilidades a un suceso.
No obstante, basndonos tambin en la proporcin, pero no de manera experimental, sino
terica, si los sucesos elementales son equiprobables (tienen la misma probabilidad), la
probabilidad de un suceso la podemos determinar por la Regla de Laplace que dice:
( ) P A =
N de casos favorables al suceso A
N de casos posibles
,
entendiendo por casos favorables, los sucesos elementales que forman el suceso A y por casos
posibles el total de sucesos elementales posibles.

Ejemplos:
En el Ejemplo 1:
1
( ) ( )
2
P C P X = = = 05;
En el Ejemplo 2:
1
(1) (2) (3) (4) (5) (6)
6
P P P P P P = = = = = = ;
3
( ) 0' 5
6
P A = = ;
2
( ) 0' 3
6
P B = =
)
.
En el Ejemplo 3:
2
(3)
36
P = ;
6 1
(7)
36 6
P = = ;
15 5
( )
36 12
P A = = .
En el Ejemplo 4: %. 125 ' 53 53125 ' 0
32
17
64
34
64
25
64
9
) ( ) ( ) ( = = = = + = + = VV P RR P A P
En el Ejemplo 5:
15 15 20 50
( ) 0' 89286
56 56 56 56
P A = + + = =

Propiedades de la probabilidad.
1. 1 ) ( 0 A P .
2. ( ) 1 P E = .
3. Si A y B son incompatibles, es decir, A B = , entonces
( ) ( ) ( ) P A B P A P B = + .
De stas se deducen estas otras:
4. ( ) 1 ( ) P A P A = .
5. ( ) 0 P = .
6. ( ) ( ) ( ) ( ) P A B P A P B P A B = + , si los sucesos A y B son compatibles.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
42

( ) ( ) ( ) ( ) P A B P A P B P A B = +
PROBABILIDAD DE LA UNIN DE
DOS SUCESOS ( Hay que r est ar l a
pr obabi l i dad de l a i nt er secci n
par a no t ener en cuent a dos veces
l os el ement os de l a mi sma)
Ejemplos:
En el ejemplo 2 podemos comprobar esta ltima propiedad, ya que:
{ } ( )
4
( ) 2, 4, 5, 6
36
P A B P = = y
{ } ( ) { } ( ) { } ( )
4
( ) ( ) ( ) 2, 4, 6 5, 6 6
36
P A P B P A B P P P + = + = .
En el ejemplo 5 podemos tener en cuenta que A es el suceso contrario de {RR}, por tanto
podemos aplicar la propiedad 4 y obtendremos { } ( )
56
50
56
6
1 1 ) ( = = = RR P A P .

Probabilidad de la diferencia de sucesos.
) ( ) ( ) ( ) ( B A P A P B A P B A P = =

Distribucin probabilstica.
LLamada tambin distribucin de probabilidad, es el conjunto formado por el espacio
muestral y las probabilidades asignadas a los sucesos elementales.

3.3. Probabilidad condicionada. Teoremas de la probabilidad total y
de Bayes.

Experimentos compuestos.

Son aquellos que se componen de la realizacin de dos o ms experimentos simples.

Ejemplos:
Ejemplo 6: Lanzar dos monedas al aire. E={CC,CX,XC,XX}
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
43
Ejemplo 7: Lanzar dos dados sin mirar la suma, sino slo cul es el nmero que sale en cada
uno de ellos. E={11,12,13,...,16,21,22,...26,...,61,62,...,66}
Ejemplo 8: Extraer 3 temas de entre 20 para una oposicin.
Ejemplo 4: De una urna donde hay 3 bolas rojas y 5 verdes extraer dos bolas con
reemplazamiento. E={RR,RV,VR,VV}
Ejemplo 5: De una urna donde hay 3 bolas rojas y 5 verdes extraer dos bolas sin
reemplazamiento. E={RR,RV,VR,VV}

Probabilidad condicionada.
Analizando los experimentos de los ejemplos 4 y 5 vemos que en el primer caso la extraccin
de la segunda bola no est influida por lo que se haya extrado en la primera, mientras que en el
ejemplo 5 s se da esa influencia.
Para asignar probabilidades a los sucesos en los experimentos compuestos es necesario tener
en cuenta esto, de manera que, utilizando la regla de Laplace adecuadamente y los diagramas en
rbol, resulta:
Ejemplo 4: P(RR)=
9
64
, P(RV)=
15
64
, P(VR)=
15
64
, P(VV)=
25
64
.
Ejemplo 5: P(RR)=
6
56
, P(RV)=
15
56
, P(VR)=
15
56
, P(VV)=
20
56
.
Analizando estos casos ms detenidamente, observamos que en el ejemplo 4 se cumple que
( ) ( ) ( ) P AB P A P B = , mientras que en el ejemplo 5, esta relacin no se da, sino que en lugar de
P(B) hay otra probabilidad, que es la probabilidad de que salga B tendiendo en cuenta que en la
primera extraccin se ha dado A, hecho que influye en lo que salga en la segunda extraccin,
puesto que las condiciones iniciales no son las mismas. Esta probabilidad es la probabilidad de B
condicionada a A, que se denota P(B/A).
Con esta notacin, en el ejemplo 5 se tendra ( ) ( ) ( / ) P AB P A P B A = .
Hasta ahora hemos usado la notacin P(AB) para la probabilidad de sacar A y B en sucesivos
experimentos simples que constituyen el experimento compuesto, es decir A y B no son sucesos
del mismo espacio muestral, no obstante se suele utilizar la notacin ) ( B A P .
Todo esto nos lleva a la definicin de probabilidad condicionada:
( )
( / )
( )
P AB
P B A
P A
= .

Sucesos dependientes e independientes.

Dos sucesos A y B son independientes si ( ) ( ) ( ) P A B P A P B = .
Sern dependientes si esto no ocurre.
Tenamos que, por la definicin de probabilidad condicionada,
( )
( / )
( )
P A B
P B A
P A

= .
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
44
Si A y B son independientes,
( ) ( ) ( )
( / ) ( )
( ) ( )
P A B P A P B
P B A P B
P A P A

= = = , es decir
( / ) ( ) P B A P B = .
Como era de esperar, si A y B son independientes la probabilidad de B no est condicionada
a A.
Hay casos en los que es til utilizar los diagramas en rbol para describir los experimentos
compuestos (condicionados o no). Vemoslos:

Diagramas en rbol

Para la construccin de un diagrama en rbol (o de rbol), se partir poniendo una rama
para cada una de las posibilidades, acompaada de su probabilidad. En el final de cada rama
parcial se constituye, a su vez, un nudo del cual parten nuevas ramas, segn las posibilidades del
siguiente paso, salvo si el nudo representa un posible final del experimento (nudo final). Hay que
tener en cuenta que la suma de probabilidades de las ramas de cada nudo ha de dar 1. La
probabilidad de cada camino se calcula multiplicando las de cada rama de ese camino (y, si es
necesario, sumando los productos de otros caminos que lleven al mismo resultado final).

Ejemplo 9: Una clase consta de 6 nias y 10 nios. Si se escoge un grupo de tres de ellos al
azar, halla la probabilidad de:
a) Seleccionar tres nios.
P ( 3 ni os) = 214 , 0
14
8
15
9
16
10
=

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
45
b) Seleccionar dos nios y una nia.
P ( 2 ni os y 1 ni a) = 482 , 0
14
9
15
10
16
6
14
9
15
6
16
10
14
6
15
9
16
10
= + +
c) Seleccionar dos nias y un nio.
P ( 2 ni as y 1 ni o) = 268 , 0
14
10
15
5
16
6
14
5
15
10
16
6
14
5
15
6
16
10
= + +
d) Seleccionar tres nias.
P ( 3 ni as) = 036 , 0
14
4
15
5
16
6
=
Aunque este l ti mo apartado tambi n se pod a haber cal cul ado
restndol e a 1 l a suma de l os resul tados de l os otros tres.

Ejempl o 10: Si l anzamos al ai re tres monedas, hal l a l a probabi l i dad de:
a) Obtener tres caras: P ( CCC) =
8
1
2
1
2
1
2
1
=

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
46
b) Obtener dos caras y una cruz:
P ( dos caras y una cruz) =
8
3
) ( = XCC CXC CCX P

Probabilidad total.

Llamaremos sistema completo de sucesos a un conjunto
1 2
, ,...,
n
A A A tales que
1 2
...
n
E A A A = con
i j
A A = para cualesquiera i, j distintos.

Si tenemos un sistema completo de sucesos:
1 1 2 2
( ) ( ) ( / ) ( ) ( / ) ... ( ) ( / )
n n
P B P A P B A P A P B A P A P B A = + + + .
Esta igualdad se conoce como probabilidad total.

Ejemplo 11: Cul es la probabilidad de que la segunda bola extrada en el ejemplo 5 sea
verde?
Teniendo en cuenta que la segunda bola puede ser verde en los casos en que en la primera
extraccin salga blanca o verde
56
35
7
4
8
5
7
5
8
3
) / ( ) ( ) / ( ) ( ) (
1 2 1 1 2 1 2
= + = + = V V P V P R V P R P V P .

Teorema de Bayes.

Si tenemos un sistema completo de sucesos, segn la definicin de probabilidad condicionada,
1 1 2 2
( ) ( ) ( / )
( / )
( ) ( ) ( / ) ( ) ( / ) ... ( ) ( / )
i i i
i
n n
P A B P A P B A
P A B
P B P A P B A P A P B A P A P B A

= =
+ + +
,
luego
1 1 2 2
( ) ( / )
( / )
( ) ( / ) ( ) ( / ) ... ( ) ( / )
i i
i
n n
P A P B A
P A B
P A P B A P A P B A P A P B A

=
+ + +
, que se conoce con el
nombre de teorema de Bayes.
El teorema de Bayes sirve para, dado el resultado final en la realizacin de un experimento,
hallar la probabilidad de lo que se obtuvo en el primer subexperimento.

Ejemplo: La segunda bola extrada en el experimento del ejemplo 5 ha sido roja, Cul es la
probabilidad de que la primera bola extrada haya sido verde?
7
5
21
15
56
21
56
15
7
3
8
5
7
2
8
3
7
3
8
5
) / ( ) ( ) / ( ) (
) / ( ) (
) / ( = = =
+

=
+

=
V R P V P R R P R P
V R P V P
R V P
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
47
3.4. Ampliacin.

Propiedades de la UNIN ( ) U y de la INTERSECCIN ( ) I .
CONMUTATIVA A B B A U U = A B B A I I =
ASOCIATIVA ( ) ( ) C B A C B A U U U U = ( ) ( ) C B A C B A I I I I =
IDEMPOTENTE A A A = U A A A = I
SIMPLIFICACIN ( ) A B A A = I U ( ) A B A A = U I
DISTRIBUTIVA ( ) ( ) ( ) C A B A C B A I U I I U = ( ) ( ) ( ) C A B A C B A U I U U I =
ELEMENTO NEUTRO U A A = I A =
ABSORCIN E E A = U A E A = I
Leyes de De Morgan
( ) B A B A I U = ( ) B A B A U I =

Tablas de contingencia.

Un mtodo til para clasificar los datos obtenidos en un recuento es mediante las tablas de
contingencia.
Se trata de tablas en cuyas celdas figuran probabilidades (o frecuencias, como en las de
doble entrada), y con las cuales podemos determinar unas probabilidades conociendo otras de la
tabla.

Ejemplo 12: Se sortea un viaje a Roma entre los 120 mejores clientes de una agencia de
automviles. De ellos, 65 son mujeres, 80 estn casados y 45 son mujeres casadas. Se pide:
a) Cul es la probabilidad de que le toque el viaje a un hombre soltero?
b) Si del afortunado se sabe que es casado, qu probabilidad hay de que sea una
mujer?
Se construye la siguiente tabla, en la que los datos estn en negrita y el resto lo
deducimos del total de dichos datos:
Hombres Mujeres Totales
Casados 35 45 80
Solteros 20 20 40
Totales 55 65 120

Entonces:
a) P (hombre soltero)
6
1
120
20
= =
b) P (mujer / casado)
16
9
80
45
= =
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
48
Relacin de problemas del Tema 3.
1. Sean A y B dos sucesos aleatorios con 2 1 ) ( = A P , 3 1 ) ( = B P y 4 1 ) ( = B A P . Calcula:
a) ) / ( B A P b) ) / ( A B P c) ) ( B A P d) ) / ( B A P e) ) ( A B P
2. Sean A y B dos sucesos aleatorios con 3 1 ) ( = A P , 4 1 ) ( = B P y 5 1 ) ( = B A P . Calcula:
a) ) / ( B A P b) ) / ( A B P c) ) ( B A P d) ) / ( B A P e) ) / ( A B P
3. Se consideran dos sucesos, A y B, asociados a un experimento aleatorio con 7 ' 0 ) ( = A P ,
6 ' 0 ) ( = B P y ( ) 58 ' 0 = B A P . Son independientes A y B?
4. Se considera el sexo de los hijos de las familias de tres hijos. Sea A el suceso el hijo mayor es
hembra, y B el suceso los dos hijos pequeos son varones. Cules son los elementos de A y B?
5. Tenemos una urna con nueve bolas numeradas del 1 al 9. Realizamos el experimento, que consiste
en sacar una bola de la urna. Consideramos los siguientes sucesos: A="salir un nmero primo" y
B="salir un nmero cuadrado". Responde a las cuestiones siguientes:
a) Calcula los sucesos A B y A B .
b) Los sucesos A y B, son compatibles o incompatibles?
c) Encuentra los sucesos contrarios de A y B.
6. Tenemos un dado con tres "1", dos "2" y un "3". Lo tiramos dos veces consecutivas y anotamos la
suma de los resultados.
a) Cul es el Espacio Muestral?
b) Cul es la probabilidad de que la suma sea 4?
c) Cul es la suma ms probable? Cunto vale su probabilidad?
7. Se lanzan dos dados equilibrados con seis caras marcadas con los nmeros del 1 al 6. Se pide:
a) Halla la probabilidad de que la suma de los valores que aparecen en la cara superior sea
mltiplo de tres.
b) Cul es la probabilidad de que los valores obtenidos difieran en una cantidad mayor de dos?
8. En una baraja hemos suprimido varias cartas. Entre las que quedan, se dan las siguientes
probabilidades de ser extradas:
P(REY)=015 P(BASTOS)=03 P("carta que no sea REY ni BASTOS")=06.
a) Est entre ellas el REY de BASTOS? En caso afirmativo, da su probabilidad.
b) Cuntas cartas hay?
9. Si escogemos al azar dos nmeros de telfono y observamos la ltima cifra de cada uno,
determina las probabilidades siguientes:
a) Que las dos cifras sean iguales.
b) Que su suma sea 11.
c) Que su suma sea mayor que 7 y menor que 13.
10. Se lanzan dos dados:
a) Cul es la probabilidad de obtener una suma de puntos igual a 7?
b) Si la suma de puntos ha sido 7, cul es la probabilidad de que en alguno de los dados haya
salido un tres?
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
49
11. Se tiran tres dados al mismo tiempo. Encuentra la probabilidad de que:
a) Los nmeros sean iguales.
b) La suma de los nmeros aparecidos sea menor que 8.
c) La suma de los nmeros sea mayor que 4 y menor que 8.
12. Los alumnos de Primero de Biologa tienen que realizar dos pruebas, una terica y otra prctica.
La probabilidad de que un estudiante apruebe la parte terica es de 06, la probabilidad de que
apruebe la parte prctica es de 08 y la probabilidad de que apruebe ambas pruebas es 05.
a) Son independientes los sucesos aprobar la parte terica y la parte prctica?
b) Cul es la probabilidad de que un alumno no apruebe ninguno de los dos exmenes?
c) Cul es la probabilidad de que un alumno apruebe solamente uno de los dos exmenes?
d) Se sabe que un alumno aprob la teora. Cul es la probabilidad de que apruebe tambin la
prctica?
13. El 35% de los crditos de un banco es para vivienda, el 50% para industrias y el 15% para
consumo diverso. Resultan fallidos el 20% de los crditos para vivienda, el 15% de los crditos
para industrias y el 70% de los crditos para consumo. Calcula la probabilidad de que se pague un
crdito elegido al azar.
14. Con los jugadores de un club de ftbol se forman dos equipos para jugar un partido de
entrenamiento; entre los dos equipos se renen 6 defensas, 8 medios, 6 delanteros y 2 porteros.
El entrenador sabe que en estos partidos, la probabilidad de que se lesione un jugador es 022 si
es delantero, 011 si es medio, 0055 si es defensa y 0 si es portero.
a) Calcular la probabilidad de que se lesione uno cualquiera de los jugadores en este partido.
b) Si se sabe que un jugador se ha lesionado, determina la probabilidad de que haya sido un
defensa.
15. Tras un estudio estadstico en una ciudad se observa que el 70% de los motoristas son varones y,
de estos, el 60% llevan habitualmente casco. El porcentaje de mujeres que conducen
habitualmente con casco es del 40%. Se pide:
a) Calcular la probabilidad de que un motorista elegido al azar lleve casco.
b) Se elige un motorista al azar y se observa que lleva casco. Cul es la probabilidad de que sea
varn?
16. Un taller sabe que por trmino medio acuden: por la maana 3 automviles con problemas
elctricos, 8 con problemas mecnicos y 3 con problemas de chapa, y por la tarde 2 con
problemas elctricos, 3 con problemas mecnicos y 1 con problemas de chapa.
a) Calcula la probabilidad de que un coche de los que est en el taller haya acudido por la tarde.
b) Calcula la probabilidad de que un coche acuda por problemas mecnicos.
c) Calcula la probabilidad de que un automvil con problemas elctricos acuda por la maana.
17. En un centro escolar los alumnos y alumnas pueden optar por cursar como lengua extranjera
ingls o francs. En un determinado curso, el 90% estudia ingls y el resto francs. El 30% de los
que estudian ingls son chicos, y de los que estudian francs son chicos el 40%. Elegido un alumno
al azar, cul es la probabilidad de que sea chica?
18. Una caja tiene tres monedas. Una moneda es corriente, otra tiene dos caras y la otra est
cargada de modo que la probabilidad de obtener cara es de 1/3. Se selecciona una moneda al
azar y se lanza al aire. Halla la probabilidad de que salga cara.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
50
19. Una compaa de seguros hace una investigacin sobre la cantidad de partes de siniestro
fraudulentos presentados por los asegurados. Clasificando los seguros en tres clases, incendio,
automvil y "otros", se obtiene la siguiente relacin de datos:
El 6% son partes por incendio fraudulentos; el 1% son partes de automviles fraudulentos; el 3%
son "otros" partes fraudulentos; el 14% son partes por incendio no fraudulentos; el 29% son
partes por automvil no fraudulentos y el 47% son "otros" partes no fraudulentos.
a) Haz una tabla ordenando los datos anteriores y hallando el porcentaje total de partes
fraudulentos y no fraudulentos.
b) Calcula qu porcentaje total de partes corresponde a la rama de incendios, cul a la de
automviles y cul a "otros". Aade estos datos a la tabla.
c) Calcula la probabilidad de que un parte escogido al azar sea fraudulento. Cul ser, en
cambio, la probabilidad de que sea fraudulento si se sabe que es de la rama de incendios?
20. Tenemos tres urnas: A con 3 bolas blancas y 5 verdes, B con 2 bolas blancas y 1 verde y C con 2
bolas blancas y 3 verdes. Escogemos una urna al azar y extraemos una bola. Si la bola ha sido
blanca, cul es la probabilidad de haber sido extrada de la urna A?
21. Una compaa dedicada al transporte pblico explota tres lneas de una ciudad, de forma que el
60% de los autobuses cubre el servicio de la primero lnea, el 30% cubre la segunda y el 10%
cubre el servicio de la tercera lnea. Se sabe que la probabilidad de que, diariamente, un autobs
se avere es del 2%, 4% y 1%, respectivamente, para cada lnea. Determina la probabilidad de que,
en un da, un autobs sufra una avera.
22. Una empresa del ramo de la alimentacin elabora sus productos en cuatro factoras: F1, F2, F3 y
F4. El porcentaje de produccin total que se fabrica en cada factora es del 40%, 30%, 20% y
10%, respectivamente, y adems el porcentaje de envasado incorrecto en cada factora es del 1%,
2%, 7% y 4%. Tomamos un producto de la empresa al azar. Cul es la probabilidad de que se
encuentre defectuosamente envasado?
23. Se tiene una urna vaca y se lanza una moneda al aire. Si sale cara, se introduce en la urna una
bola blanca y si sale cruz, se introduce una bola verde. El experimento se repite tres veces y, a
continuacin, se introduce la mano en la urna, retirando una bola. Cul es la probabilidad de que
en la urna queden una bola blanca y otra verde?
24. Se lanzan dos monedas al aire. Si salen dos caras, se extrae una bola de una urna I, que contiene
2 bolas blancas y 3 verdes. Si sale cara y cruz, se extrae una bola de una urna II, que contiene 4
bolas blancas y 1 verde. Si salen dos cruces, se extrae una bola de una urna III, que contiene 3
bolas blancas y 2 verdes. Cul es la probabilidad de extraer bola blanca despus de lanzar las
monedas y sacar la bola?
25. Tres mquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las piezas
producidas en una fbrica. Los porcentajes de produccin defectuosa de estas mquinas son del
3%, 4% y 5%.
a) Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.
b) Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido
producida por la mquina B.
c) Qu mquina tiene la mayor probabilidad de haber producido la citada pieza defectuosa?
26. Se toman dos barajas espaolas de 40 cartas. Se extrae al azar una carta de la primera baraja y
se introduce en la segunda baraja. Se mezclan las cartas de esta segunda baraja y se extrae una
carta, que resulta ser el dos de oros. Cul es la probabilidad de que la primera carta extrada
fuese una espada?
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
51

4. Tcnicas para contar. Combinatoria.

4.1. Tcnicas bsicas de recuento. Regla de la suma y regla del
producto.


En el estudio de situaciones de enumeracin o recuento habr que responder a preguntas
como las siguientes: Cmo podemos realizar una tarea que nos proponemos? De cuntas formas
diferentes puede realizarse la tarea que nos proponemos?
En los casos en los que los objetos (o muestras) a manejar sean pocos, podemos intentar
formarlos todos y, a la vez, contarlos. Cuando el nmero de objetos (o muestras) es grande, la
formacin de todos los casos y el posterior recuento ser problemtico y pocas veces podremos
hacerlo directamente.
Para las situaciones en las que no es posible contar directamente, habr que acudir a los
diversos procedimientos que describe la Combinatoria, la cual nos ayuda a contar de forma
planificada y ordenada.
La Combinatoria es un conjunto de procedimientos y resultados que estudian las diferentes
formas en que puede llevarse a cabo una tarea de ordenacin o agrupamiento de ciertos objetos,
siguiendo unas reglas prefijadas.

Contar o enumerar objetos es una de las actividades que efectuamos en los primeros cursos
escolares. Aprendimos a contar enumerando objetos uno a uno. Este procedimiento es efectivo si
el nmero de objetos no es muy grande.
En las situaciones en las cuales el nmero de objetos sobrepasa ciertos lmites o las
condiciones de la situacin son muy complejas, debemos utilizar otros procedimientos que no sean
el contar los objetos o las situaciones (o los sucesos elementales) uno a uno.
Describimos algunos procedimientos o tcnicas bsicas que son de gran ayuda en las
situaciones de recuento, principalmente dos: la regla de la suma y la regla del producto. Se
trata de un par de tcnicas de recuento que nos ayudan a establecer el nmero de elementos de
conjuntos discretos y finitos muy grandes, sin enumerar todos sus elementos. Algunas de estas
tcnicas sern de posterior aplicacin en las frmulas de clculo de los conceptos combinatorios
elementales (variaciones, permutaciones y combinaciones).


Regla de la suma (o principio de adicin).

Esta regla es tan sencilla que ha sido utilizada en la prctica desde el comienzo de la
civilizacin. Slo en tiempos recientes, y en el contexto de un desarrollo matemtico estricto del
tema, ha recibido un tratamiento formal. Este principio nos dice:

Para dos (o ms) conjuntos que no tengan elementos comunes (dos a dos), el nmero de
elementos que existen en todos los conjuntos (en su unin) es la suma de los elementos que tiene
cada uno de ellos por separado.

Este principio ya fue empleado en una de las propiedades de la probabilidad, la que nos dice
que, si A y B son incompatibles, es decir, A B = , entonces ( ) ( ) ( ) P A B P A P B = + .
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
52

Ahora, si llamamos ( ) A n y ( ) B n al nmero de elementos (cardinal) de cada uno de los
conjuntos A y B , si ambos conjuntos no tienen elementos comunes ( A B = ),
( ) ( ) ( ) B n A n B A n + = .

Ocurre lo mismo si se trata de ms de dos conjuntos. Vemoslo para tres:
Si = B A , = C A y = C B , ( ) ( ) ( ) ( ) C n B n A n C B A n + + = .

La regla de la suma, o principio de adicin, puede tambin enunciarse as: "Si se puede
realizar una primera tarea de m maneras, mientras que una segunda se puede efectuar de n
maneras, y no se pueden realizar las dos tareas simultneamente, entonces realizar cualquiera de
ellas se puede lograr de n m+ maneras". Por supuesto, esto se puede ampliar a ms de dos
tareas (siempre que no haya dos de ellas que se puedan efectuar simultneamente), cada una con
sus maneras de llevarlas a cabo, maneras que -en todos los casos- se consideran diferentes, a
menos que se indique lo contrario.

Ejemplo 1: Si lanzamos al aire dos dados y observamos el resultado de la suma de las caras
superiores, de cuntas formas se puede obtener un siete o un ocho?
Asociando a cada lanzamiento una pareja de nmeros que se correspondan con la puntuacin
obtenida en el primero y en el segundo dado, y llamando A y B a los conjuntos de resultados que
dan como suma siete y ocho, respectivamente, tenemos:
( ) ( ) ( ) ( ) ( ) ( ) { } ( ) 6 1 , 6 ; 2 , 5 ; 3 , 4 ; 4 , 3 ; 5 , 2 ; 6 , 1 = = A n A
( ) ( ) ( ) ( ) ( ) { } ( ) 5 2 , 6 ; 3 , 5 ; 4 , 4 ; 5 , 3 ; 6 , 2 = = B n B
Entonces, las formas de obtener como suma un siete o un ocho son:
( ) ( ) ( ) B n A n B A n + = = 6 + 5 = 11.



Regla del producto (o principio de multiplicacin). Diagramas en rbol.

Si un procedimiento se puede separar en r etapas o pruebas, tales que el resultado de una
de ellas no influya en el resultado de las otras, y estas etapas o pruebas tienen
r
n n n ,..., ,
2 1

resultados, respectivamente, entonces el procedimiento global conduce a
r
n n n ...
2 1

resultados posibles.


Ejemplo 2: Una casa de comidas tiene para el almuerzo un men que ofrece: tres primeros
platos (fabada, cocido o arroz), dos segundos platos (pollo o pescada) y dos postres (flan o
yogur). Cuntas comidas distintas pueden confeccionarse? Cules son esas posibilidades?
Cada primer plato puede "combinarse" con cada uno de los dos segundos platos, obteniendo
6 2 3 = formas distintas de "combinar" los primeros y segundos platos. Cada una de estas
situaciones puede, a su vez, "combinarse" con cada uno de los dos postres. Las posibles comidas
distintas que pueden confeccionarse son = 2 2 3 12 mens distintos.

Todo esto puede verse de una manera ms clara e intuitiva mediante el siguiente diagrama
en rbol (o de rbol):


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
53
FLAN (
er
1 men)
POLLO
YOGUR (2 men)
FABADA
FLAN (
er
3 men)
PESCADA
YOGUR (4 men)

FLAN (5 men)
POLLO
YOGUR (6 men)
COCIDO
FLAN (7 men)
PESCADA
YOGUR (8 men)

FLAN (9 men)
POLLO
YOGUR (10 men)
ARROZ
FLAN (11 men)
PESCADA
YOGUR (12 men)
Podemos ver que cada camino o itinerario en el diagrama en rbol constituye un men, una
de las 12 distintas comidas que pueden confeccionarse: el octavo men posible, por ejemplo, es el
formado por COCIDO, PESCADA y YOGUR.

Ejemplo 3: Entre los diez miembros de una sociedad, se quiere elegir un presidente, un
tesorero y un secretario, de forma que cada cargo recaiga en una persona distinta. De cuntas
maneras se podr llevar a cabo la eleccin?
Teniendo en cuenta que el presidente podr ser elegido de 10 maneras diferentes; que el
tesorero, de 9 (ya no se tiene en cuenta a la persona que haya salido elegida presidente); y el
secretario, de 8 (por una razn similar); se podr efectuar la eleccin del equipo directivo de
= 8 9 10 720 maneras distintas.


4.2. Factoriales y nmeros combinatorios (o binomiales).

Factorial de un nmero natural.

Se llama factorial de un nmero natural, n, y se representa por ! n (se lee factorial de n),
al producto de los n primeros nmeros naturales consecutivos, excepto el cero. Es decir,

n n n i n
n
i
= =

=
) 1 ( ) 2 ( ... 3 2 1 !
1
para n N y 1 n .

Por convenio, se toma 0! =1 (convenio que tiene similitud con el de 1
0
= x , si 0 x , pues
en ambos casos- hay una ausencia de factores que deja como nico elemento que aparece en la
expresin el neutro del producto, esto es, el 1).

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
54

Veamos algunos ejemplos de clculo de factoriales:

1!=1; 2!= ; 2 2 1 = ; 6 3 2 1 ! 3 = = ; 24 4 3 2 1 ! 4 = =
; 120 5 4 3 2 1 ! 5 = = ; 720 6 5 4 3 2 1 ! 6 = = ... ... ...
; 479001600 12 11 10 9 8 7 6 5 4 3 2 1 ! 12 = = ... ... ...



Propiedades de los factoriales.

1) )! 1 ( ) 1 ( ! + = + n n n
Es decir, el factorial de un nmero natural es igual a dicho nmero multiplicado por el
factorial del nmero anterior.
Esta propiedad, que es muy importante y se deduce de la propia definicin, podra
servirnos, entre otras cosas, para razonar que 0!=1 (ya que ! 1 1 ! 0 = ).

2) Esta segunda propiedad es consecuencia de la anterior y, por consiguiente, de la
propia definicin, y dice as:
! ) 1 ( ) 2 ( ... ) 2 ( ) 1 ( ! m m m m n n n = + + para n m > .



Nmeros binomiales o combinatorios.

Las siguientes expresiones numricas que estudiamos son los llamados nmeros (o
coeficientes) combinatorios por estar muy relacionados con las combinaciones- o coeficientes (o
nmeros) binomiales (por aparecer en el desarrollo de la potencia de un binomio y tener, tambin,
mucho que ver con la distribucin binomial de probabilidad).

Sean n y r dos nmeros naturales ( r n, N) tales que r n 0 . Llamamos nmero
combinatorio o binomial (se lee n sobre r ), y se representa por
|
|

\
|
r
n
, a la siguiente expresin:

)! ( !
!
r n r
n
r
n

=
|
|

\
|

donde n recibe el nombre de base o numerador del nmero combinatorio, y r el de orden del
nmero combinatorio.

Veamos algunos ejemplos de clculo de nmeros combinatorios:

21 3 7
2
6 7
1 2 3 4 5 1 2
1 2 3 4 5 6 7
! 5 ! 2
! 7
2
7
= =

=


=

=
|
|

\
|

56 7 8
1 2 3
6 7 8
1 2 3 1 2 3 4 5
1 2 3 4 5 6 7 8
! 3 ! 5
! 8
5
8
= =


=


=

=
|
|

\
|

10
2
4 5
1 2 1 2 3
1 2 3 4 5
! 2 ! 3
! 5
3
5
=

=


=

=
|
|

\
|



Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
55
Algunas propiedades fundamentales de los nmeros combinatorios.

1) 1
0
=
|
|

\
|
=
|
|

\
|
n
n n


2) Los nmeros combinatorios de igual numerador y rdenes complementarios son iguales
(decimos que dos rdenes son complementarios cuando, sumados, dan el numerador):
|
|

\
|

=
|
|

\
|
r n
n
r
n


3) La suma de dos nmeros combinatorios del mismo numerador y rdenes consecutivos
es otro nmero combinatorio de numerador una unidad superior a los anteriores, y de
orden el mayor de los anteriores:
|
|

\
|
+
+
=
|
|

\
|
+
+
|
|

\
|
1
1
1 r
n
r
n
r
n


Tringulo de Pascal.

La relacin recursiva anterior es la base para el tringulo de Pascal que aparece en la
siguiente figura, el cual es muy popular aunque su utilidad se limite a valores muy pequeos de n.
Este Tringulo Aritmtico se conoce como tringulo de Pascal en recuerdo de Blaise Pascal
(1623-1662), a pesar de que era conocido mucho antes. En algunos textos se le denomina, en
cambio, tringulo de Tartaglia, por haber ste trabajado tambin con l.

|
|

\
|
0
0


|
|

\
|
0
1

|
|

\
|
1
1


|
|

\
|
0
2

|
|

\
|
1
2

|
|

\
|
2
2


|
|

\
|
0
3

|
|

\
|
1
3

|
|

\
|
2
3

|
|

\
|
3
3


|
|

\
|
0
4

|
|

\
|
1
4

|
|

\
|
2
4

|
|

\
|
3
4

|
|

\
|
4
4


|
|

\
|
0
5

|
|

\
|
1
5

|
|

\
|
2
5

|
|

\
|
3
5

|
|

\
|
4
5

|
|

\
|
5
5

|
|

\
|
0
6

|
|

\
|
1
6

|
|

\
|
2
6

|
|

\
|
3
6

|
|

\
|
4
6

|
|

\
|
5
6

|
|

\
|
6
6

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

Los nmeros de la fila 1 + n son los nmeros binomiales
|
|

\
|
r
n
para . ,..., 2 , 1 , 0 n r = La primera
propiedad implica que los bordes estn enteramente constituidos por unos, y la segunda nos dice
que cada nmero es la suma de los dos nmeros que tiene inmediatamente por encima.


1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
... ... ... ... ... ... ... ... ... ... ..
... ... ... ... ... ... ... ... ... ... ..
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
56

4.3. Variaciones, permutaciones y combinaciones.

Variaciones (ordinarias o sin repeticin).

Sean A un conjunto finito con n elementos ( ) 0 > n y r un nmero natural n r . Una
variacin sin repeticin (sin reemplazamiento), o variacin ordinaria, o simplemente variacin,
de orden r de n elementos de A es una lista ordenada ( )
r
a a a a ,..., , ,
3 2 1
de r elementos de A
distintos. Diremos que dos variaciones son diferentes si algn elemento de una de las dos listas
no se encuentra en la otra, o bien si las dos listas contienen los mismos elementos en distinto
orden.



Nmero de variaciones ordinarias.

El nmero de posibles variaciones de orden r de n elementos se puede simbolizar por:
V(n, r) = V
r
n
= V
r n,


Veamos cmo podemos calcular dicho nmero: 1) como primer elemento podemos elegir un
elemento cualquiera de , es decir, hay n posibilidades; 2) como segundo elemento habr 1 n
posibilidades de eleccin, ya que el primero no puede volver a ser elegido (sin repeticin); 3) como
tercer elemento se podr elegir uno de los 2 n restantes; 4) el cuarto elemento lo elegiremos
de entre los 3 n que quedan; 5) y as sucesivamente, hasta llegar al lugar de orden r (ltimo
elemento), que se puede elegir entre los elementos de distintos de los elegidos en los lugares
1, 2, ..., r-1.

En definitiva, habr n maneras distintas de elegir el primer elemento, 1 n formas de
elegir el segundo, 2 n para el tercero, y as sucesivamente, hasta llegar a
( ) [ ] ( ) 1 1 + = r n r n formas de elegir el ltimo. Aplicando la regla del producto, obtenemos
que: V ) 1 ( ... ) 2 ( ) 1 ( + = r n n n n
r
n

donde el producto tiene exactamente r factores, uno por cada elemento elegido.

Si en la expresin de ms arriba multiplicamos y dividimos por (n-r)!, obtenemos esta otra
expresin:
V
)! (
!
)! (
)! ( ) 1 ( ... ) 2 ( ) 1 (
r n
n
r n
r n r n n n n
r
n

+
= ,
en la que hemos tenido en cuenta una propiedad de los factoriales, y que es otra expresin, a
veces ms manejable, del nmero de variaciones de n elementos tomados de r en r.

Ejemplo 3 (pgina 53): V 720 8 9 10
3
10
= = V 720
! 7
! 10
)! 3 10 (
! 10
3
10
= =

=

Ejemplo 4: Cuntos nmeros de tres cifras distintas se pueden formar con las cifras
impares { } 9 , 7 , 5 , 3 , 1 ?
La respuesta es V = = 3 4 5
3
5
60 nmeros posibles de tres cifras impares distintas.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
57

Ejemplo 5: Y si queremos lo mismo que en el ejemplo anterior, pero con las cifras pares
{ } 8 , 6 , 4 , 2 , 0 ?
Est claro que aparece una pequea dificultad, pues las variaciones que empiecen por 0
(como, por ejemplo, 026) no son verdaderamente nmeros de tres cifras; luego al clculo del
ejemplo anterior hay que restarle todas las variaciones que empiecen por 0, que son
V 12 3 4
2
4
= = . En total habr 60-12 = 48 nmeros.

Ejemplo 6: De cuntas maneras pueden sortearse (o repartirse) cuatro premios (o regalos)
distintos entre un grupo de nueve personas, sin que pueda tocarle ms de un premio (o regalo) a
ninguna de ellas?
Al tratarse de premios distintos, la cuestin ser seleccionar por orden cuatro personas
diferentes (nadie puede recibir ms de un premio) de entre las nueve que tenemos; esto es,
V = = =

= 6 7 8 9
! 5
! 9
)! 4 9 (
! 9
4
9
3024 maneras.


Variaciones con repeticin.


Si quitamos la restriccin de que los elementos que forman cada una de las agrupaciones
anteriores (variaciones) sean todos distintos, se obtienen colecciones anlogas, pero que se
denominan con repeticin (con reemplazamiento).

Sean A un conjunto finito con n elementos ( ) 0 > n y r un nmero natural. Una variacin con
repeticin de orden r de A es una lista ordenada ) ,..., , (
2 1 r
a a a de elementos de A, en donde
los elementos ( )
i
a pueden (o no) ser iguales. Diremos que dos variaciones con repeticin son
diferentes si algn elemento de una de las dos listas no se encuentra en la otra, o bien si las dos
listas contienen los mismos elementos en distinto orden.


Nmero de variaciones con repeticin.

Para calcular el nmero de posibles variaciones con repeticin en una situacin determinada,
nmero que representamos por VR =
r
n
VR =
r n,
VR(n,r)=V
r n,
, podemos realizar un razonamiento
anlogo al de las variaciones ordinarias para efectuar su clculo, pero pudiendo ahora elegir las r
veces cualquiera de los n elementos de que disponemos: para elegir el primer elemento habr n
formas; para el segundo, otras n formas, ya que pueden repetirse; para el tercero, otras n; y as
sucesivamente, hasta llegar al de lugar r, que tambin podr elegirse de n maneras distintas. En
definitiva, y tras aplicar la regla del producto, obtenemos:
VR(n,r)=VR r n n
r
n
...( = veces)
r
n n = ...

Est claro que ahora los nmeros r y n no tienen por qu cumplir forzosamente ninguna de
las tres relaciones , n r n r o n r = , sino que pueden verificar cualquiera de las tres.
Tambin est claro que, al decir variaciones con repeticin, queremos decir que los elementos
de cada variacin pueden repetirse, no que tengan que repetirse. Podremos entonces decir que
las variaciones (sin repeticin, ordinarias o simplemente- variaciones) constituyen un
subconjunto de las variaciones con repeticin con posible repeticin debera, quizs, decirse-.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
58
Ejemplo 7: Como en el ejemplo 4 (pgina 56) , pero pudiendo repetirse las cifras.
Sera VR 125 5
3 3
5
= = nmeros distintos de tres cifras impares.

Ejemplo 8: Como en el ejemplo 5 (pgina 57) , pero pudiendo repetirse las cifras.
Sera VR
3
5
VR 100 25 125
2
5
= = nmeros de tres cifras pares.

Ejemplo 9: Cuntas apuestas habra que confeccionar en la quiniela espaola de ftbol para
acertar con toda seguridad un pleno al 15?
Como se trata de elegir 15 smbolos (uno para cada partido) de entre 3 (1, X y 2, que
representan, respectivamente, que gane el equipo que juega en casa, que empaten, o que gane el
equipo visitante), tenemos puesto que importa el orden (no es lo mismo un partido que otro) y los
smbolos pueden (en este caso deben) repetirse- que se trata de variaciones con repeticin de 3
elementos (n=3) tomados de 15 en 15 (r=15):
VR 14348907 3
15 15
3
= = apuestas.

Ejemplo 10: Como en el ejemplo 6 (pgina 57), pero pudiendo corresponder ahora ms de un
premio (hasta incluso los cuatro) a la misma persona.
Seran entonces VR 6561 9
4 4
9
= = maneras de realizar el sorteo (o reparto).



Permutaciones ordinarias (o sin repeticin).

Llamamos permutaciones (sin repeticin, ordinarias o, simplemente, permutaciones) de n
elementos (de un conjunto A, que tiene, precisamente, n elementos) a las distintas formas de
ordenar todos los elementos de A. Dos permutaciones de sern diferentes si es distinta la
colocacin de los elementos, por eso decimos que, en las permutaciones, slo influye el orden.

Las variaciones de orden r formadas con n objetos, es decir, las diversas ordenaciones
de todos estos n elementos, se llaman permutaciones. Dos cualesquiera contienen, pues, los
mismos objetos, y difieren solamente en el orden de colocacin de stos.


Nmero de permutaciones ordinarias.

En cuanto al nmero de permutaciones ordinarias (que representamos por P
n
), parece
lgico calcularlo teniendo en cuenta su consideracin como caso particular de las variaciones,
obtenindose que P =
n
V
n
n
= ( ) [ ] 1 2 3 ... ) 2 ( ) 1 ( 1 ... ) 2 ( ) 1 ( = n n n n n n n n
Es decir, P ! n
n
=

Ejemplo 11: De cuntas formas se pueden colocar juntos siete libros diferentes en un
estante?
La respuesta es de P 5040 1 2 3 4 5 6 7 ! 7
7
= = = formas distintas.

Ejemplo 12: Cinco amigas han comprado entradas numeradas para una funcin de teatro.
Cuando van a sentarse en las cinco butacas que les corresponden por sus entradas, de cuntas
maneras distintas podrn hacerlo?
Lo podrn hacer de P 120 1 2 3 4 5 ! 5
5
= = = maneras distintas.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
59

Permutaciones con repeticin.

Consideremos un conjunto de n elementos (objetos) entre los cuales hay un cierto
nmero
1
n de elementos iguales entre s, otro nmero
2
n de elementos tambin iguales entre s
pero diferentes de los anteriores, etc. Las permutaciones con repeticin de estos n elementos
(objetos) son cada una de las diversas maneras de ordenarlos. Por tanto, dos permutaciones con
repeticin cualesquiera se distinguirn por el lugar que ocupan dos elementos (objetos) distintos.

En definitiva, llamamos permutaciones con repeticin de n elementos entre los que hay
1
n iguales entre s, otros
2
n iguales entre s, ..., y
k
n tambin iguales entre s y
distintos a todos los anteriores, siendo n n n n
k
= + + + ...
2 1
, a las distintas agrupaciones
ordenadas que se pueden formar con los n objetos, entre los que aparecen repetidos
k
n n n ,..., ,
2 1
elementos (es decir, slo hay k elementos distintos). Entonces, aunque todas las
permutaciones con repeticin, con las condiciones indicadas, tienen los mismos elementos
repetidos el mismo nmero de veces, consideramos distintas dos permutaciones cuando difieren
en el orden de colocacin.

Obsrvese que en las variaciones con repeticin un elemento puede repetirse un nmero
variable de veces, que llega hasta el orden de dicha variacin (incluso puede no aparecer siquiera
ese determinado elemento). En las permutaciones con repeticin, sin embargo, esto no ocurre as,
ya que el nmero de veces que aparece repetido cada elemento es siempre el mismo.
Esto significa que, aunque las permutaciones (ordinarias) pueden entenderse como el caso
lmite de las variaciones (ordinarias), las permutaciones con repeticin nada tienen que ver con las
variaciones con repeticin.



Nmero de permutaciones con repeticin.

En cuanto al nmero de permutaciones con repeticin, que podemos representar por
PR
k
n n n
n
,..., ,
2 1
, podemos justificar que es precisamente:
PR
! ... ! !
!
2 1
,..., ,
2 1
k
n n n
n
n n n
n
k

=
Esto es justamente as, porque al intercambiar entre s el orden de los
1
n elementos que
son iguales, seguimos obteniendo la misma permutacin con repeticin, luego hay que dividir el
total de permutaciones cuando los elementos fueran todos distintos ( ) ! n P
n
= entre !
1
1
n P
n
= .
Lo mismo ocurre con los otros
2
n elementos que se repiten, los
3
n , etc., y as sucesivamente.
Dividir por todos esos factoriales es dividir por el producto de todos ellos.

Ejemplo 13: Cuntas palabras (agrupaciones de letras aunque no signifiquen nada ni, tan
siquiera, puedan pronunciarse) de 11 letras pueden formarse con las letras de la palabra
ABRACADABRA?
La palabra tiene 11 letras, pero 5 de ellas son una A, dos son una B, dos son una R, una es una
C y otra es una D.
As que habr PR 83160 4 5 6 7 9 11
! 1 ! 1 ! 2 ! 2 ! 5
! 11
1 , 1 , 2 , 2 , 5
11
= =

= palabras.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
60
Ejemplo 14: De cuntas formas pueden repartirse 15 discos distintos entre tres amigas, si
queremos llevar a cabo el reparto de la manera ms equitativa posible (es decir, entregando 5
discos a cada una de ellas)?
Razonando de manera similar al ejemplo anterior, obtenemos:
PR =
5 , 5 , 5
15
756756
! 5 ! 5 ! 5
! 15
=

formas de efectuar el reparto, ya que el orden en que se le den los
cinco libros a cada amiga no tiene influencia ninguna (aunque sean libros distintos).

Ejemplo 15: Y si son doce libros distintos a repartir entre dos amigos, cinco libros para el
primero de ellos y los restantes para el otro?
Seran entonces PR
7 , 5
12
792
! 7 ! 5
! 12
=

= formas, por la misma razn que en el ejemplo anterior.






Combinaciones sin repeticin (ordinarias).

Dado un conjunto { }
n
a a a ,..., ,
2 1
= , de n elementos, se llama combinacin (ordinaria, sin
repeticin o, simplemente, combinacin) de orden r de dichos elementos a todo subconjunto de
r elementos de ( ) n r . Sabemos que dos subconjuntos son iguales si tienen los mismos
elementos sin importar su orden de colocacin; as, pues, dos combinaciones sern diferentes slo
si difieren al menos en un elemento.

Puede darse entonces esta otra definicin: Combinaciones ordinarias o sin repeticin de n
elementos tomados r a r , o de r en r , ( ) n r son las distintas muestras (o agrupaciones)
que se pueden formar con los n elementos, de manera que:
- En cada muestra (o agrupacin) entren r elementos distintos.
- Dos muestras (o agrupaciones) son distintas si se diferencian en algn elemento, pero
no en el orden de colocacin.

Algunos autores llaman tambin a las combinaciones ordinarias selecciones no ordenadas sin
repeticin.

En el recuento de estos subconjuntos est incluidos tambin el subconjunto vaco () y el
propio conjunto .




Nmero de combinaciones ordinarias.

En cuanto al nmero de combinaciones ordinarias (sin repeticin), que representamos por
C
r n,
= C
r
n
= C( ) r n, , debemos tener en cuenta que las combinaciones (sin repeticin) son casi como
variaciones (sin repeticin) pero sin tener en cuenta el orden, es decir, que, en una variacin
ordinaria, si intercambiamos el orden de los r elementos que la forman (los permutamos),
seguimos obteniendo cada vez la misma combinacin ordinaria.
Luego, para calcular el nmero de combinaciones (sin repeticin), debemos dividir el nmero
de variaciones (sin repeticin) entre el nmero de permutaciones de r ( ) ! r P
r
= :
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
61
C =
r
n

r
r
n
P
V
=
!
)! (
!
!
) 1 )...( 2 )( 1 (
r
r n
n
r
r n n n n
=
+
=
|
|

\
|
=
r
n
r n r
n
)! ( !
!
.
donde ahora se entiende por qu los nmeros de la forma
|
|

\
|
r
n
reciben el nombre de nmeros
combinatorios.

Ahora puede razonarse de otra manera la primera propiedad que vimos de los nmeros
combinatorios, dada la equivalencia que existe entre ellos y el nmero de combinaciones sin
repeticin. Dicha propiedad dice que
|
|

\
|

=
|
|

\
|
r n
n
r
n
, o (lo que sera lo mismo) que
r n
n
r
n
C C

= .
Esto aparece ahora como evidente, pues seleccionar r elementos distintos (sin importar
el orden) de los n elementos que tenemos es lo mismo que no seleccionar los n-r
restantes. En definitiva, para realizar una particin de un conjunto (de n elementos) en dos
subconjuntos (de r y r n elementos, respectivamente), da igual seleccionar los r
elementos de una parte que los r n de la otra.

Ejemplo 16: Consideremos el ejemplo 3 (pgina 53), ahora en el caso de querer elegir un
comit de tres personas para representar a la mencionada sociedad en alguna negociacin, pero
sin tener distintos cargos representativos ninguno de los miembros del comit (lo que podramos
llamar un comit paritario).
De todas las 720 formas posibles de eleccin anteriores, tenemos en cuenta aquellas en que
aparecen siempre las tres mismas personas, A, B y C, ocupando los distintos cargos en el orden
anteriormente mencionado: presidente, tesorero y secretario. Las posibilidades son: (A,B,C),
(A,C,B), (B,C,A), (B,A,C), (C,A,B) y (C,B,A).
Sean quienes sean las tres personas A, B y C, siempre tendremos estas seis posibilidades,
distintas como equipos directivos (variaciones sin repeticin), pero idnticas como comits
paritarios (combinaciones sin repeticin). Podemos decir que cada 6 equipos directivos
diferentes (los formados por las mismas personas, pero con distintos cargos) corresponden a un
solo posible comit (tres personas distintas, simplemente). Entonces, el nmero de posibles
comits distintos ser

6
720
= 120 comits diferentes.
O, lo que es lo mismo, =


=


=

=
1 2 3
8 9 10
! 7 1 2 3
! 7 8 9 10
! 7 ! 3
! 10
3
10
C
6
720
= 120 comits diferentes.

Ejemplo 17: Cuntas diagonales tiene un polgono convexo de n lados?
Desde cada uno de los n vrtices del polgono pueden trazarse 3 n diagonales, puesto
que ni al propio vrtice (es lgico) ni a los consecutivos (daran lados del polgono) pueden
trazarse diagonales: en principio habra, pues, ) 3 ( n n diagonales; pero hay que tener en
cuenta que cada diagonal se ha contado dos veces, una desde cada extremo . Luego el nmero
resultante de diagonales ser: N DE DIAGONALES =
2
) 3 ( n n
.
O, lo que es lo mismo,
N DE DIAGONALES = C
2
) 3 (
2
3
2
2
2
) 1 (
2 2
2

=

=

=

=
n n n n n n n
n
n n
n
n
,
donde restamos n porque son los lados del polgono.


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
62

Ejemplo 18: Cuntas apuestas diferentes hay que confeccionar para acertar con toda
seguridad los 6 nmeros (de los 49 posibles) de una lotera primitiva?
Sern C =
|
|

\
|
=
6
49
6
49
13983816
1 2 3 4 5 6
44 45 46 47 48 49
! 43 ! 6
! 49
=


=

apuestas distintas.


Ejemplo 19: El mismo reparto de regalos (o premios) del ejemplo 6 (pgina 57) y el ejemplo
10 (pgina 58), pero tratndose de cuatro premios (o regalos) iguales y sin poder corresponderle
ms de un premio (o regalo) a ninguna de las nueve personal.
Sern entonces C =

=
|
|

\
|
=
! 5 ! 4
! 9
4
9
4
9
126 maneras de efectuar el reparto (o 126 posibles
resultados del sorteo).


Ejemplo 20: Otra forma de resolver el ejemplo 15 (pgina 60): De cuntas maneras se
pueden repartir doce libros distintos entre dos amigos, de manera que le correspondan cinco
libros al primero de ellos y los restantes al otro?
La respuesta es: C =
5
12
C 792
! 7 ! 5
! 12
7
12
5
12
7
12
=

=
|
|

\
|
=
|
|

\
|
= maneras distintas.

Ejemplo 21: Otra forma de resolver el ejemplo 14 (pgina 60): De cuntas formas pueden
repartirse 15 discos de msica distintos entre tres amigas, si queremos llevar a cabo el reparto
de la manera ms equitativa posible (es decir, entregando 5 discos a cada una de ellas)?
El clculo puede hacerse por pasos, hallando primero de cuntas formas le pueden
corresponder cinco discos (de los quince en total que tenemos) a una de las amigas; despus lo
mismo, con los diez discos que quedan, para elegir los cinco que le correspondan a la segunda
amiga; y as sucesivamente, hasta acabar con todos los discos.
Entonces, por la regla del producto, la respuesta seran:
756756
! 5 ! 5 ! 5
! 15
1
! 5 ! 5
! 10
! 10 ! 5
! 15
5
5
5
10
5
15
=

=

=
|
|

\
|

|
|

\
|

|
|

\
|
formas de realizar el reparto.


Ejemplo 22: De cuntas maneras pueden formarse tres comits disjuntos de un grupo de
veinte personas, si los comits deben tener 3, 5 y 7 personas, respectivamente?
Razonando de manera anloga al ejemplo anterior, obtendramos:
C
3
20
C
5
17
C
7
12
=

=

=
|
|

\
|

|
|

\
|

|
|

\
|
=
! 5 ! 7 ! 5 ! 3
! 20
! 5 ! 7
! 12
! 12 ! 5
! 17
! 17 ! 3
! 20
7
12
5
17
3
20

= 5587021440 formas de constituir los tres comits.



Combinaciones con repeticin.

Las combinaciones con repeticin no las estudiamos en este curso, debido a su complejidad y
a su escasa aplicacin en los contenidos de Estadstica de este nivel.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
63
4.4. Potencia de un binomio: frmula de Newton.

En lgebra elemental aprendemos las frmulas ( )
2 2 2
2 b ab a b a + + = + ,
( )
2 2 2
2 b ab a b a + = , ( )
3 2 2 3 3
3 3 b ab b a a b a + + + = + , etc., y se da el caso de tener que
desarrollar la frmula para ( )
4
b a + y potencias superiores de ( ) b a + .

El resultado general que proporciona una frmula para ( )
n
b a + se conoce como el teorema
del binomio, o frmula de Newton de la potencia de un binomio, o (ms sencillamente) el
binomio de Newton. Esta ltima denominacin de Newton, aun siendo muy utilizada, lo es de
manera impropia, pues, en realidad, era ya conocida anteriormente por Tartaglia.

Sea n un entero positivo (un nmero natural). El coeficiente del trmino
r r n
b a

en el
desarrollo de ( )
n
b a + es el nmero o coeficiente- binomial (o combinatorio)
|
|

\
|
r
n
.

En concreto, tenemos que:
( ) = +
n
b a
n n n n n r r n
n
r
b
n
n
ab
n
n
b a
n
b a
n
a
n
b a
r
n
|
|

\
|
+
|
|

\
|

+ +
|
|

\
|
+
|
|

\
|
+
|
|

\
|
=
|
|

\
|

=

1 2 2 1
0
1
...
2 1 0
.

EJEMPLOS:
1) ( ) =
|
|

\
|
+
|
|

\
|
+
|
|

\
|
+
|
|

\
|
+
|
|

\
|
+
|
|

\
|
+
|
|

\
|
= +
6 5 4 2 3 3 2 4 5 6 6
6
6
5
6
4
6
3
6
2
6
1
6
0
6
b ab b a b a b a b a a b a
6 5 4 2 3 3 2 4 5 6
6 15 20 15 6 b ab b a b a b a b a a + + + + + + = ,
expresin cuyos coeficientes son los de la fila sptima (6+1) del tringulo de Pascal.

NOTA: Como a y b pueden ser cualquier nmero o expresin, podemos encontrar otros
desarrollos sin ms que sustituirlas por las expresiones que queramos.

2) ( )
7 6 5 4 3 2 7
7 21 35 35 21 7 1 1 x x x x x x x x + + + + + + + = + .
3) ( )
6 5 4 3 2 6
6 15 20 15 6 1 1 x x x x x x x + + + = .
4) ( )
5 4 3 2 5
5 10 10 5 1 1 x x x x x x + + = .



4.5. Seleccin de una muestra.

El primer tipo de problemas que dio origen a las nociones combinatorias ms primitivas es el
de seleccin de una muestra de objetos de un conjunto dado, que tiene gran importancia en
Estadstica.

En los problemas de recuento suelen aparecer dos operaciones que definen el procedimiento
utilizado: elegir, o no, una parte del conjunto y ordenar, o no, los elementos seleccionados.

Cuando estamos eligiendo una parte del conjunto, estamos definiendo una muestra. Si
tomamos todos los elementos del conjunto, decimos que es una muestra completa.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
64
La muestra se dice que est ordenada, o no ordenada, si tenemos, o no, en cuenta el orden
de los elementos. Una muestra ordenada se obtiene eligiendo los elementos uno tras otro y
anotndolos en ese orden. Una muestra en la cual todos los elementos se toman a la vez no est
ordenada.

Tambin se puede reemplazar, o no, un elemento ya tomado antes de la siguiente extraccin.
Tenemos as las muestras con o sin reemplazamiento (con o sin repeticin).

Combinando el orden y la repeticin, las muestras pueden obtenerse de las diferentes formas
que aparecen en el siguiente diagrama:

SIN REEMPLAZAMIENTO
(Variaciones ordinarias)
ORDENADA
CON REEMPLAZAMIENTO
(Variaciones con repeticin)
SELECCIN
(muestra) SIN REEMPLAZAMIENTO
(Combinaciones ordinarias)
NO ORDENADA
CON REEMPLAZAMIENTO
(Combinaciones con repeticin)


Si, adems, tenemos en cuenta la posibilidad de que las muestras sean completas o no, tenemos:


VARIACIONES
No ORDINARIAS
Puede haber
repeticin? S
No VARIACIONES
CON REPETICIN
En cada muestra
intervienen todos
S los elementos?
PERMUTACIONES
S No ORDINARIAS
Influye Puede haber
el orden? repeticin?
S PERMUTACIONES
CON REPETICIN

No

No COMBINACIONES
ORDINARIAS
En cada muestra No Puede haber
intervienen todos repeticin?
los elementos? S COMBINACIONES
CON REPETICIN

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
65

Para nuestros fines y nuestro nivel, tal vez podramos tener suficiente con el siguiente
esquema:
TIPOS DE MUESTRAS

VR
r
n
V
r
n
P
n
PR
k
n n n
n
,..., ,
2 1
C
r
n

Influye el orden en la formacin de la
muestra?
S S S S No
Se pueden repetir los elementos en la
muestra?
S No No S No
Intervienen todos los elementos en la
muestra?
No No S S No



4.6. La combinatoria y la probabilidad.

Como veamos en el tema anterior al estudiar la Probabilidad, en los casos en que puede
aplicarse la ley (o regla) de Laplace (es decir, cuando los sucesos son equiprobables), tenemos
que hacer el recuento de los casos favorables y el de los casos posibles, ya que, segn la regla (o
ley) de Laplace,
( ) P A =
N de casos favorables al suceso A
N de casos posibles


Pues bien, para estos dos recuentos, en muchos casos, incluso en experimentos compuestos,
podemos utilizar los conceptos combinatorios estudiados, obviando en bastantes ocasiones incluso
los conceptos de sucesos dependientes y de probabilidad condicionada.

Vemoslo con algunos ejemplos, ya vistos en el tema anterior:

Ejemplo 23: Como en el ejemplo 4 del tema 3 (pgina 43): De una urna donde hay 3 bolas
rojas y 5 verdes extraer dos bolas con reemplazamiento (con repeticin).
P(RR)= = =
2
2
2
8
2
3
8
3
VR
VR 9
64
P(VV)= = =
2
2
2
8
2
5
8
5
VR
VR 25
64


P(una de cada color)
32
15
64
30
8
2 3 5
2 2
8
1 , 1
2
1
3
1
5
= =

=

=
VR
PR VR VR


En el tema anterior habramos hecho:
P(una de cada color)= ( ) = + = ) ( ) ( RV P VR P RV VR P = + ) ( ) ( ) ( ) ( V P R P R P V P
32
15
64
30
8
5
8
3
8
3
8
5
= = + =

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
66
Ejemplo 24: Como en el ejemplo 5 del tema 3 (pgina 43): De una urna donde hay 3 bolas
rojas y 5 verdes extraer dos bolas sin reemplazamiento (sin repeticin).
P(RR)= =

=
7 8
2 3
2
8
2
3
V
V 6
56 28
3
= , si tenemos en cuenta el orden.
o, mejor, P(RR)=
2
8
2
3
C
C
28
3
= , si no tenemos en cuenta el orden.

P(una de cada color)
28
15
28
3 5
2
8
1
3
1
5
=

=
C
C C


En el tema anterior habramos hecho:
P(una de cada color)= ( ) = + = ) ( ) ( RV P VR P RV VR P
= + = ) / ( ) ( ) / ( ) ( R V P R P V R P V P
28
15
56
30
7
5
8
3
7
3
8
5
= = +

Ejemplo 25: Como en el ejemplo 9 del tema 3 (pgina 44): Una clase consta de 6 nias y 10
nios. Si se escoge un grupo de tres de ellos al azar, halla la probabilidad de:
a) Seleccionar tres nios.
P ( 3 ni os) = =


=
14 15 16
8 9 10
3
16
3
10
V
V
214 , 0
o, mej or, P ( 3 ni os) = =




=
1 2 3
14 15 16
1 2 3
8 9 10
3
16
3
10
C
C
214 , 0 .
b) Seleccionar dos nios y una nia.
P (2 nios y 1 nia) 482 , 0
14 15 16
3 6 9 10
3
16
1 , 2
3
1
6
2
10
=


=

=
V
PR V V

o, mejor, P (2 nios y 1 nia) = =

1 2 3
14 15 16
6
1 2
9 10
3
16
1
6
2
10
C
C C
482 , 0 .
c) Seleccionar tres nias.
P ( 3 ni as) =




= =
1 2 3
14 15 16
1 2 3
4 5 6
3
16
3
6
C
C
036 , 0 .
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
67
Relacin de problemas del Tema 4.

1. De cuntas formas diferentes se pueden cubrir los puestos de presidente, vicepresidente y
tesorero de un club de baloncesto sabiendo que hay doce posibles candidatos?

2. Con las letras de la palabra libro, cuntas ordenaciones distintas se pueden hacer que
empiecen por vocal?

3. Cuntos nmeros de cinco cifras distintas se pueden formar con las cifras impares?
Cuntos de ellos son mayores de 70.000?

4. De cuntos partidos consta una liguilla formada por cuatro equipos?

5. A una reunin asisten 10 personas y se intercambian saludos entre todos. Cuntos saludos
se han intercambiado?

6. Con las cifras 1, 2 y 3, cuntos nmeros de cinco cifras pueden formarse? Cuntos son
pares?

7. De cuntas formas pueden colocarse los 11 jugadores de un equipo de ftbol teniendo en
cuenta que el portero no puede ocupar otra posicin distinta de la portera?

8. Una mesa presidencial est formada por ocho personas, de cuntas formas distintas se
pueden sentar, si el presidente y el secretario siempre van juntos?

9. Cuntas diagonales tiene un octgono? Cuntos tringulos se pueden formar con sus
vrtices?

10. Un grupo, compuesto por cinco hombres y siete mujeres, forma un comit de 2 hombres y 3
mujeres. De cuntas formas puede formarse, si:
d) Puede pertenecer a l cualquier hombre y cualquier mujer.
e) Una mujer determinada debe pertenecer al comit.
f) Dos hombres determinados no pueden estar en el comit.

11. Cuntos nmeros capicas hay de ocho cifras? Y de nueve?

12. Cuatro libros distintos de matemticas, seis diferentes de fsica y dos diferentes de qumica
se colocan en un estante. Halla de cuntas formas es posible ordenarlos si:
a) Los libros de cada asignatura deben estar todos juntos.
b) Solamente los libros de matemticas deben estar juntos.

13. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules. Si las bolas de igual
color no se distinguen entre s, de cuntas formas posibles pueden ordenarse?

14. Metemos en una caja las diez bolas del ejercicio anterior, las removemos y extraemos tres
de ellas al azar. Calcula la probabilidad de que:
a) las tres bolas sean rojas;
b) las tres sean de distinto color;
c) de las tres, dos sean azules y una blanca.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
68

15. Extraemos cuatro cartas distintas de una baraja espaola de 40 cartas. Cul es la
probabilidad de que las cuatro cartas sean figuras (es decir, sotas, caballos o reyes)? Y de
que entre las cuatro haya al menos una figura?

16. Ests jugando al pker con unos amigos y amigas con una baraja de 40 cartas. Sabiendo que
en el pker se reparten 5 cartas distintas a cada jugador, cul es la probabilidad de que
dicha jugada sea la que, en el lenguaje del pker, se denomina COLOR (las cinco cartas del
mismo palo)?

17. En una caja hay seis bolas verdes, ocho azules y cinco amarillas, todas del mismo tamao e
iguales al tacto. Con la caja cerrada mezclamos bien las bolas y, sin mirar, extraemos tres de
ellas aleatoriamente. Calcula la probabilidad de que:
a) sean las tres amarillas;
b) no sea ninguna amarilla.

18. Un jurado de seleccin entrevista a siete candidatos para un puesto de trabajo. El jurado
entrega al final una lista con las personas que propone. Cuntas listas distintas puede
entregar en cada uno de los siguientes casos?
a) La lista entregada contiene a los siete candidatos ordenados.
b) El jurado selecciona un primer candidato, un segundo y un tercero (slo tres en la
lista).
c) El jurado indica un grupo de tres candidatos aceptables.

19. Una comisin de un centro de enseanza la forman 8 alumnos y 5 profesores. Se quiere elegir
un grupo de seis personas. Halla de cuntas formas puede hacerse si:
a) El grupo ha de contener solamente dos profesores.
b) El grupo ha de contener al menos dos profesores.

20. Se quieren repartir cuatro premios entre un grupo de veinte personas. Halla de cuntas
maneras puede hacerse si:
a) Los premios son distintos y no puede obtener ms de un premio ninguna persona.
b) Los premios son iguales y no puede obtener ms de un premio ninguna persona.
c) Los premios son distintos, pero puede corresponderle ms de un premio a cada
persona.

21. Con las letras de la palabra MATEMATICAS, cuntas agrupaciones distintas de letras se
pueden formar?

22. Se disponen ocho monedas en fila. Hay tres de un euro, dos de cincuenta cntimos, dos de
veinte cntimos y una de diez cntimos. De cuntas formas distintas pueden ordenarse?

23. Calcula, ordenando el polinomio resultante, ( )
5
2
3 2 x x .

24. De cuntas maneras puede elegirse una tripulacin de 4 personas para un vuelo espacial si
se dispone de 12 astronautas entrenados? Y si uno de ellos es el comandante y debe ir
obligatoriamente en el vuelo?


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
69
5. Variables aleatorias.
5.1. Variables aleatorias.
Dado el espacio muestral E asociado a un experimento aleatorio, una variable aleatoria X
asociada a dicho experimento aleatorio es toda aplicacin del espacio muestral en el conjunto de
los nmeros reales.
R E X a :
El concepto de variable aleatoria surge ante la necesidad de cuantificar los resultados de un
experimento aleatorio para poder realizar un estudio matemtico del mismo.
Para estudiar una variable estadstica es precisa una recogida de datos, una tabulacin, unos
grficos y el clculo de ciertos parmetros. En una variable aleatoria haremos lo mismo pero
partiendo de un modelo terico, de tal manera que stas son idealizaciones de aquellas. La bondad
de tal idealizacin viene garantizada por la ley de los grandes nmeros.
Igual que las variables estadsticas cuantitativas, las variables aleatorias pueden ser
discretas o continuas, segn tomen una cantidad finita de valores o un intervalo de valores.
Definimos el suceso { } [ ] : ( ) X a s E X s a = .
De forma anloga se definen [ ] X a = , [ ] X a < , [ ] a X b y otros semejantes.
Ejemplos:
El nmero de caras al lanzar cinco monedas o el nmero de bolas verdes que se extrae de una
urna son variables discretas. La duracin de una bombilla es una variable continua.
En la distribucin que contaba el nmero de caras al lanzar cinco monedas:
[ 3] X > = {CCCCX, CCCXC, CCXCC, CXCCC, XCCCC, CCCCC}
[ 1] X = = {XXXXC, XXXCX, XXCXX, XCXXX, CXXXX }

5.2. Modelos discretos. Distribucin binomial.
5.2.1. Variables aleatorias discretas.
Son aquellas que toman una cantidad finita de valores.
Son idealizaciones de variables estadsticas discretas.
Ejemplo:
Al lanzar dos dados y anotar la suma, experimentalmente, obtenemos la siguiente
distribucin estadstica:
Suma f
i
h
i
2 3 0,03
3 6 0,06
4 7 0,07
5 12 0,12
6 14 0,14
7 17 0,17
8 13 0,13
9 10 0,10
10 9 0,09
11 7 0,07
12 2 0,02
0,00
0,04
0,08
0,12
0,16
0,20
2 3 4 5 6 7 8 9 10 11 12

Si hacemos una asignacin terica, obtendremos la probabilidad:
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
70
Suma f
i
p
i
2 1 0,03
3 2 0,06
4 3 0,08
5 4 0,11
6 5 0,14
7 6 0,17
8 5 0,14
9 4 0,11
10 3 0,08
11 2 0,06
12 1 0,03
0,00
0,04
0,08
0,12
0,16
0,20
2 3 4 5 6 7 8 9 10 11 12

Como se observa, se obtienen resultados muy parecidos, sin embargo el modelo terico nos
permite hacer un estudio matemtico del problema. Tenemos as una distribucin probabilstica.
La probabilidad de que se d cierto valor es la altura correspondiente a dicho valor en el
diagrama de barras.
Funcin de distribucin.
La funcin de distribucin de una variable aleatoria discreta, ( ) k F , se define como la
probabilidad de que la variable aleatoria, X , tome un valor inferior o igual a k , es decir,
( ) [ ] k X P k F = .
Ejemplo: Si lanzamos tres monedas, y llamamos = X nmero de caras obtenidas, tenemos:
( ) [ ] [ ] 8 1 0 0 0 = = = = X P X P F
( ) [ ] [ ] [ ] 2 1 8 4 8 3 8 1 1 0 1 1 = = + = = + = = = X P X P X P F
( ) [ ] [ ] [ ] [ ] 8 7 8 3 8 3 8 1 2 1 0 2 2 = + + = = + = + = = = X P X P X P X P F
( ) [ ] [ ] [ ] [ ] [ ] 1 8 8 8 1 8 3 8 3 8 1 3 2 1 0 3 3 = = + + + = = + = + = + = = = X P X P X P X P X P F

Esperanza.
En una variable estadstica la media era
i i
i
i i i
x f
f
x x x h
N N
= = =


.
El valor equivalente a la media en las distribuciones aleatorias es la esperanza (o media), que
se denota por . Trasladando el resultado obtenido a una variable aleatoria, donde la frecuencia
relativa equivale a la probabilidad, llegaremos a que:
i i
x p =


Desviacin tpica.
Para la variable estadstica la varianza es
2
2 2 2 2 i i
i
i
x f
f
s x x x
N N
= =


2 2
x h x
i i
=

.
Para la distribucin probabilstica la varianza se denota por
2
y, establecidos los
paralelismos anteriores, se tendr:
2 2 2
i i
x p =

y
2 2
i i
x p =


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
71
Ejemplo:
En el lanzamiento de dos dados y anotar la suma de las caras superiores:

[3 6] [ 3] [ 4] [ 5]
2 3 4 9
0' 25
36 36 36 36
P X P X P X P X < = = + = + = =
= + + = =


7 =
83 ' 5 7 83 ' 54
2 2
= =
41 ' 2 83 ' 5 = =

5.2.2. Modelos discretos:
1. Distribucin uniforme discreta.
Una variable aleatoria discreta sigue una distribucin uniforme si presenta n resultados
distintos, todos ellos equiprobables y tal que la probabilidad de cada resultado es 1/n.
Si ( ) X U n a entonces
1
[ ] , 1,..., P X k k n
n
= = = y

=
+
=
12
1
2
1
2
2
n
n


Ejemplo: El lanzamiento de un dado da lugar a una (6) U .

2. Distribucin de Bernouilli.
Una variable aleatoria discreta sigue una distribucin de Bernouilli cuando toma slo dos
valores, 1 si se da el suceso A (xito), con probabilidad p; y 0, si se da el suceso A (fracaso),
con probabilidad p q =1 .
Si ( ) X Ber p a entonces [ 1] P X p = = , [ 0] P X q = = y
2
p
pq


Este tipo de experiencias donde slo se dan dos resultados se llaman dicotmicas.
Ejemplo: Si el 2% de las piezas que se fabrican son defectuosas, la variable que vale 1 si se
obtiene una pieza defectuosa y 0 si la pieza es vlida sigue una (0' 02) Ber .

3. Distribucin binomial.
Cuando un experimento dicotmico de Bernouilli se realiza un nmero n de veces, y
constituyen pruebas independientes (es decir, el resultado de un experimento no depende de lo
que haya ocurrido en los anteriores), se dice que es un experimento que sigue una distribucin
binomial de parmetros n y p, que denotaremos por B (n, p).
Dada una distribucin binomial B (n, p), el suceso obtener k xitos lo denotaremos por
[X = k], y la probabilidad de este suceso [ ] k X P = vendr dada por:
Suma p
i
x
i
p
i
x
i
2
p
i
2 0,03 0,06 0,11
3 0,06 0,17 0,50
4 0,08 0,33 1,33
5 0,11 0,56 2,78
6 0,14 0,83 5,00
7 0,17 1,17 8,17
8 0,14 1,11 8,89
9 0,11 1,00 9,00
10 0,08 0,83 8,33
11 0,06 0,61 6,72
12 0,03 0,33 4,00
7,00 54,83
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
72
Si ( , ) X B n p a entonces [ ]
k n k
q p
k
n
k X P

|
|

\
|
= = y
np
npq



k n k
q p
k
n

|
|

\
|
es uno de los trminos del binomio de Newton, de ah el nombre de la distribucin.
Ejemplo: Al extraer 8 veces una carta de una baraja espaola de 40 cartas, observamos el
nmero de figuras extradas. Las extracciones deben ser con reemplazamiento, si no, no sera la
misma experiencia repetida 8 veces.
Sabemos que 7 ' 0 3 ' 0 1 1 3 ' 0
40
12
= = = = = p q p
Tenemos una binomial con media y desviacin tpica

= = =
= = =
30 ' 1 7 ' 0 3 ' 0 8
4 ' 2 3 ' 0 8
npq
np


Las distribuciones binomiales son las que ms estudiaremos (casi las nicas) en este
curso dentro de las variables aleatorias discretas.

4. Distribucin de Poisson.
La distribucin de Poisson se aplica en situaciones en que se tiene una distribucin binomial
con p muy pequeo y n grande y el producto np se mantiene constante igual a .
Si ( ) X P a entonces [ ] , 0,1, 2, 3,...
!
k
e
p X k k
k

= = = y
2


=


Si 30 n y 0'1 p la binomial B (n, p) se puede aproximar por una P(np).
Ejemplo: Nmero de radiaciones radiactivas.

5. Distribucin geomtrica.
Consideramos un experimento dicotmico y la variable aleatoria X= "nmero de fracasos
ocurridos antes del primer xito"; dicha variable sigue una distribucin geomtrica.
Llamaremos p a la probabilidad de xito y q a la probabilidad de fracaso:
Si ( ) X Geo p a entonces [ ] , 0,1, 2, 3,...
k
P X k q p k = = = y
2
2
q
p
q
p


6. Distribucin binomial negativa.
Dado un experimento dicotmico, consideremos la variable aleatoria X = "nmero de fracasos
antes de producirse el xito n-simo"; dicha variable sigue una distribucin binomial negativa.
Si ( , ) X Bn n p a entonces

1
[ ] ,
0,1, 2, 3,...
n k
n k
P X k p q
k
k
+ | |
= =
|
\
=
y
2
2
nq
p
nq
p


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
73

5.3. Modelos continuos. Distribucin normal.

5.3.1. Variable aleatoria continua.
Es una idealizacin de una variable estadstica continua y, por tanto, toma valores en todo un
intervalo, que puede ser todo el conjunto de nmeros reales.
Ejemplo:
Un autobs es un tanto impuntual. Debe pasar a las ocho, pero puede retrasarse hasta 20
minutos. Haciendo un estudio estadstico se tienen los siguientes resultados:
Retraso f
i
hi hi/c
i
[0,5) 18 0,56 0,113
[5,10) 8 0,25 0,05
[10,15) 5 0,16 0,031
[15,20] 1 0,03 0,006
32 1
0
0,02
0,04
0,06
0,08
0,1
0,12

En este grfico la frecuencia relativa es el rea de cada rectngulo, siendo la altura, por
tanto, el cociente entre la frecuencia relativa y la longitud del intervalo. Por tanto el rea total
del grfico es la suma de las frecuencias relativas, es decir, 1. La frecuencia relativa para un
retraso entre 8 y 12 minutos es el rea del histograma relativa al intervalo [8,12].

Podemos abstraer el problema y buscar un modelo matemtico mediante una grfica en la que
el rea encerrada por ella y el eje de abscisas en el intervalo [0,20] sea 1 y que la probabilidad de
un retraso entre 8 y 12 minutos, sea el rea relativa al intervalo [8,12]. Debemos buscar una
funcin de forma parecida al histograma y de acuerdo con la experiencia.
R e t r a s o y
i
0 0 , 1
5 0 , 0 7 5
1 0 0 , 0 5
1 5 0 , 0 2 5
2 0 0
0
0 , 0 2
0 , 0 4
0 , 0 6
0 , 0 8
0 , 1
0 , 1 2
0 5 1 0 1 5 2 0

Obsrvese que en las distribuciones continuas, a diferencia de las distribuciones discretas,
[ ] 0 P X a = = , [ ] [ ] P X a P X a = < y dems casos semejantes, ya que el rea de un segmento
es 0.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
74
Funcin de probabilidad o funcin de densidad.
Es una funcin R R D f : ( D es el dominio de definicin de f) que cumple:
f es positiva.
El rea encerrada por su grfica y el eje de abscisas es 1.
[ ] P a X b viene dada por el rea comprendida entre la grfica de la funcin y el
eje de abscisas en el intervalo [a,b] , lo que en matemticas, utilizando la integral,
sera [ ] ( )
b
a
P a X b f x dx =

.
Esperanza.
Para las variables continuas la media es el rea encerrada por la grfica de la funcin
) (x f x y = y el eje de abscisas, es decir, ( )
D
xf x dx =

, siendo D el dominio de de f.
Desviacin tpica.
Anlogamente, para las variables continuas la varianza es el rea encerrada por la grfica de
la funcin ) (
2
x f x y = y el eje de abscisas, menos el cuadrado de la esperanza. Es decir:
2 2 2
( )
D
x f x dx =

, siendo D el dominio de definicin de f.


Y, consecuentemente,
2 2
( )
D
x f x dx =

.
Ejemplo:
En el ejemplo del retraso del autobs:
La funcin de densidad es ( ) 0' 005 0'1 f x x = + .
(8) (12) 0' 06 0' 04
[8 12] (12 8) 4 0' 2
2 2
f f
P X
+ +
= = = .
( )
20
2
0
20
0' 005 0'1 6' 67
3
x x dx = + = =

.
( )
2 20
2 3 2
0
20 200
0' 005 0'1 22' 22
3 9
x x dx
| |
= + = =
|
\

.
200
4' 71
9
= = .

5.3.2. Modelos continuos.
1. Distribucin uniforme continua.
Se dice que una variable aleatoria continua sigue una distribucin uniforme si la funcin de
densidad es constante en el intervalo en el que se encuentran todos los valores de la variable.
Si ( , ) X U a b a entonces
1
( ) si f x a x b
b a
=

y
( )
2
2
2
12
a b
b a

+
=


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
75
2. Distribucin exponencial.
Se utiliza como modelo para representar tiempo de funcionamiento o de espera, siendo el
parmetro de la distribucin con 0 >
Si ( ) X Exp a entonces ( ) 0


= >
x
f x e x y
2
2
1
1


Ejemplos: tiempo de espera en la parada del autobs o tiempo transcurrido entre dos
llamadas telefnicas.

3. Distribucin normal.

Es la que siguen la mayor parte de las variables aleatorias continuas y la que ms vamos a
trabajar en este curso. Multitud de fenmenos responden a dicha distribucin.
La distribucin normal se caracteriza por su media y su desviacin tpica : ( ) , N .
Si ( , ) X N a entonces
2
1
2
1
( )
2
x
f x e


| |

|
\
=
Por tanto, para calcular una probabilidad utilizamos:
2
1
2
1
[ ]
2
x b
a
P a X b dx e


| |

|
\
=

u otra integral similar.



Propiedades de la funcin de densidad en una distribucin normal:
Est definida en todo R .
Su representacin grfica se conoce como campana de Gauss y es simtrica respecto
de la vertical que pasa por .

El rea encerrada entre la grfica de la funcin y el eje de abscisas, aunque es
ilimitada, vale 1.
El rea encerrada entre la grfica y el eje de abscisas en el intervalo [ , ] +
es 06826, es decir, [ ] 0'6826 P X + = % 26 ' 68 = .
Segn los valores de y adoptar una forma ms o menos apuntada, pero
manteniendo las propiedades anteriores.
La importancia de esta distribucin estriba en que aparece en numerosas y variadas
situaciones.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
76

Z 0 1 2 3 4 5 6 7 8 9
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Centsimas

TABLA DE LA DISTRIBUCIN NORMAL TIPIFICADA, N (0,1)

Tipificacin y uso de la tabla de la distribucin normal.
De entre todas las distribuciones normales, la ms importante es N (0, 1), ya que de ella se
pueden obtener todas las dems.
A la variable aleatoria correspondiente a la N (0, 1) se le llama Z.
El proceso por el que pasamos de cualquier distribucin normal a la N (0, 1) se llama
tipificacin, que consiste en hacer el cambio de variable
X
Z

= (ver Ampliacin del Tema 1,


pgina 20) y calcular las probabilidades a partir de los valores de la N (0, 1).
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
77
Los valores de la N (0, 1) estn recogidos en una tabla que nos da para cada k entre 0 y 399,
con una precisin hasta la diezmilsima, el rea comprendida entre la grfica y el eje desde
hasta k, o sea, [ ] P Z k :


Para los k que no estn recogidos en la tabla el valor de la probabilidad hay que calcularlo
usando la simetra de la funcin y pueden darse los siguientes casos:

[ ] P Z k con k >0. Se calcula directamente en la tabla





Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
78


Aproximacin de una distribucin binomial por una normal.

Para valores grandes del nmero de repeticiones en la distribucin binomial el clculo de una
probabilidad se complica porque los nmeros combinatorios adquieren valores muy grandes y
porque las potencias de p y de q son muy pequeas para exponentes muy grandes.
Sin embargo, cuanto mayor es el nmero de repeticiones, una binomial se parece cada vez
ms a una normal. As se observa en el siguiente grfico:
-0,05
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 5 10 15 20 25
B(5,0'2) B(15,0'2) B(25,0'2) B(50,0'2)


Por tanto, bajo ciertas condiciones podemos aproximar una distribucin binomial B (n, p) por
una normal ( , ) N np npq . Concretamente, si los valores de np y de nq son superiores a 3, la
aproximacin es bastante buena y, si superan a 5, la aproximacin es casi perfecta.
Pero veamos como hacemos esa aproximacin, porque mientras la binomial es una
distribucin discreta y en ella tienen sentido probabilidades como [ ] P X k = , para la normal,
que es continua, esa probabilidad es 0 (no tiene ningn sentido).
Pues bien, si X es B (n, p) la aproximacin, que llamaremos X , es ( , ) N np npq y:
[ ] [ 0' 5 ' 0' 5] P X k P k X k = = + .
[ ] [ ' 0' 5] P X k P X k = + .
[ ] [ ' 0' 5] P X k P X k < = , etc.
Es decir, aumentamos o disminuimos media unidad segn el caso (ver Ampliacin del Tema 1,
pgina 19, Aproximacin de medio punto).

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
79

Ejemplo: En una distribucin B (200, 03), np=60, nq=140, 200 0' 3 60 = = y
200 0' 3 0' 7 6' 48 = = . Luego podemos aproximar por una N (60, 648).
69' 5 60
[ 70] [ ' 70 0' 5] [ ' 69' 5]
6' 48
[ 1' 47] 1 [ 1' 47] 1 0' 9292 0' 0708
P X P X P X P Z
P Z P Z
(
= = = =
(

= = < = =



4. Distribucin
2
de Pearson.

Dadas Z
1
, Z
2
,,Z
n
, n variables N (0, 1) independientes entre s, definimos la distribucin
chi-cuadrado con n grados de libertad como la generada por la variable X:
2
1
n
i
i
X Z
=
=

. Se denota
2
n
y
2
2
n
n




Propiedades de la funcin de densidad de la distribucin
2
de Pearson.

Est definida en [0, ) + .
El rea encerrada entre la grfica de la funcin y el eje de abscisas, aunque es
ilimitada, vale 1.
Segn los valores de n adoptar una forma u otra, no siempre semejante.

Conforme el grado de libertad aumenta, se aproxima cada vez ms a una normal.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
80
0,001 0,005 0,010 0,025 0,050 0,100 0,150 0,200 0,250 0,300 0,350 0,400 0,450 0,500
1 0,000 0,000 0,000 0,001 0,004 0,016 0,036 0,064 0,102 0,148 0,206 0,275 0,357 0,455
2 0,002 0,010 0,020 0,051 0,103 0,211 0,325 0,446 0,575 0,713 0,862 1,022 1,196 1,386
3 0,024 0,072 0,115 0,216 0,352 0,584 0,798 1,005 1,213 1,424 1,642 1,869 2,109 2,366
4 0,091 0,207 0,297 0,484 0,711 1,064 1,366 1,649 1,923 2,195 2,470 2,753 3,047 3,357
5 0,210 0,412 0,554 0,831 1,145 1,610 1,994 2,343 2,675 3,000 3,325 3,656 3,996 4,351
6 0,381 0,676 0,872 1,237 1,635 2,204 2,661 3,070 3,455 3,828 4,197 4,570 4,952 5,348
7 0,599 0,989 1,239 1,690 2,167 2,833 3,358 3,822 4,255 4,671 5,082 5,493 5,913 6,346
8 0,857 1,344 1,647 2,180 2,733 3,490 4,078 4,594 5,071 5,527 5,975 6,423 6,877 7,344
9 1,152 1,735 2,088 2,700 3,325 4,168 4,817 5,380 5,899 6,393 6,876 7,357 7,843 8,343
10 1,479 2,156 2,558 3,247 3,940 4,865 5,570 6,179 6,737 7,267 7,783 8,295 8,812 9,342
11 1,834 2,603 3,053 3,816 4,575 5,578 6,336 6,989 7,584 8,148 8,695 9,237 9,783 10,341
12 2,214 3,074 3,571 4,404 5,226 6,304 7,114 7,807 8,438 9,034 9,612 10,182 10,755 11,340
13 2,617 3,565 4,107 5,009 5,892 7,041 7,901 8,634 9,299 9,926 10,532 11,129 11,729 12,340
14 3,041 4,075 4,660 5,629 6,571 7,790 8,696 9,467 10,165 10,821 11,455 12,078 12,703 13,339
15 3,483 4,601 5,229 6,262 7,261 8,547 9,499 10,307 11,037 11,721 12,381 13,030 13,679 14,339
16 3,942 5,142 5,812 6,908 7,962 9,312 10,309 11,152 11,912 12,624 13,310 13,983 14,656 15,338
17 4,416 5,697 6,408 7,564 8,672 10,085 11,125 12,002 12,792 13,531 14,241 14,937 15,633 16,338
18 4,905 6,265 7,015 8,231 9,390 10,865 11,946 12,857 13,675 14,440 15,174 15,893 16,611 17,338
19 5,407 6,844 7,633 8,907 10,117 11,651 12,773 13,716 14,562 15,352 16,109 16,850 17,589 18,338
20 5,921 7,434 8,260 9,591 10,851 12,443 13,604 14,578 15,452 16,266 17,046 17,809 18,569 19,337
21 6,447 8,034 8,897 10,283 11,591 13,240 14,439 15,445 16,344 17,182 17,984 18,768 19,548 20,337
22 6,983 8,643 9,542 10,982 12,338 14,041 15,279 16,314 17,240 18,101 18,924 19,729 20,529 21,337
23 7,529 9,260 10,196 11,689 13,091 14,848 16,122 17,187 18,137 19,021 19,866 20,690 21,510 22,337
24 8,085 9,886 10,856 12,401 13,848 15,659 16,969 18,062 19,037 19,943 20,808 21,652 22,491 23,337
25 8,649 10,520 11,524 13,120 14,611 16,473 17,818 18,940 19,939 20,867 21,752 22,616 23,472 24,337
26 9,222 11,160 12,198 13,844 15,379 17,292 18,671 19,820 20,843 21,792 22,697 23,579 24,454 25,336
27 9,803 11,808 12,878 14,573 16,151 18,114 19,527 20,703 21,749 22,719 23,644 24,544 25,437 26,336
28 10,391 12,461 13,565 15,308 16,928 18,939 20,386 21,588 22,657 23,647 24,591 25,509 26,419 27,336
29 10,986 13,121 14,256 16,047 17,708 19,768 21,247 22,475 23,567 24,577 25,539 26,475 27,402 28,336
30 11,588 13,787 14,953 16,791 18,493 20,599 22,110 23,364 24,478 25,508 26,488 27,442 28,386 29,336
40 17,917 20,707 22,164 24,433 26,509 29,051 30,856 32,345 33,660 34,872 36,021 37,134 38,233 39,335
60 31,738 35,534 37,485 40,482 43,188 46,459 48,759 50,641 52,294 53,809 55,239 56,620 57,978 59,335
0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,980 0,985 0,990 0,995
1 0,571 0,708 0,873 1,074 1,323 1,642 2,072 2,706 3,841 5,024 5,412 5,916 6,635 7,879
2 1,597 1,833 2,100 2,408 2,773 3,219 3,794 4,605 5,991 7,378 7,824 8,399 9,210 10,597
3 2,643 2,946 3,283 3,665 4,108 4,642 5,317 6,251 7,815 9,348 9,837 10,465 11,345 12,838
4 3,687 4,045 4,438 4,878 5,385 5,989 6,745 7,779 9,488 11,143 11,668 12,339 13,277 14,860
5 4,728 5,132 5,573 6,064 6,626 7,289 8,115 9,236 11,070 12,832 13,388 14,098 15,086 16,750
6 5,765 6,211 6,695 7,231 7,841 8,558 9,446 10,645 12,592 14,449 15,033 15,777 16,812 18,548
7 6,800 7,283 7,806 8,383 9,037 9,803 10,748 12,017 14,067 16,013 16,622 17,398 18,475 20,278
8 7,833 8,351 8,909 9,524 10,219 11,030 12,027 13,362 15,507 17,535 18,168 18,974 20,090 21,955
9 8,863 9,414 10,006 10,656 11,389 12,242 13,288 14,684 16,919 19,023 19,679 20,512 21,666 23,589
10 9,892 10,473 11,097 11,781 12,549 13,442 14,534 15,987 18,307 20,483 21,161 22,021 23,209 25,188
11 10,920 11,530 12,184 12,899 13,701 14,631 15,767 17,275 19,675 21,920 22,618 23,503 24,725 26,757
12 11,946 12,584 13,266 14,011 14,845 15,812 16,989 18,549 21,026 23,337 24,054 24,963 26,217 28,300
13 12,972 13,636 14,345 15,119 15,984 16,985 18,202 19,812 22,362 24,736 25,471 26,403 27,688 29,819
14 13,996 14,685 15,421 16,222 17,117 18,151 19,406 21,064 23,685 26,119 26,873 27,827 29,141 31,319
15 15,020 15,733 16,494 17,322 18,245 19,311 20,603 22,307 24,996 27,488 28,259 29,235 30,578 32,801
16 16,042 16,780 17,565 18,418 19,369 20,465 21,793 23,542 26,296 28,845 29,633 30,629 32,000 34,267
17 17,065 17,824 18,633 19,511 20,489 21,615 22,977 24,769 27,587 30,191 30,995 32,011 33,409 35,718
18 18,086 18,868 19,699 20,601 21,605 22,760 24,155 25,989 28,869 31,526 32,346 33,382 34,805 37,156
19 19,107 19,910 20,764 21,689 22,718 23,900 25,329 27,204 30,144 32,852 33,687 34,742 36,191 38,582
20 20,127 20,951 21,826 22,775 23,828 25,038 26,498 28,412 31,410 34,170 35,020 36,093 37,566 39,997
21 21,147 21,992 22,888 23,858 24,935 26,171 27,662 29,615 32,671 35,479 36,343 37,434 38,932 41,401
22 22,166 23,031 23,947 24,939 26,039 27,301 28,822 30,813 33,924 36,781 37,659 38,768 40,289 42,796
23 23,185 24,069 25,006 26,018 27,141 28,429 29,979 32,007 35,172 38,076 38,968 40,094 41,638 44,181
24 24,204 25,106 26,063 27,096 28,241 29,553 31,132 33,196 36,415 39,364 40,270 41,413 42,980 45,558
25 25,222 26,143 27,118 28,172 29,339 30,675 32,282 34,382 37,652 40,646 41,566 42,725 44,314 46,928
26 26,240 27,179 28,173 29,246 30,435 31,795 33,429 35,563 38,885 41,923 42,856 44,031 45,642 48,290
27 27,257 28,214 29,227 30,319 31,528 32,912 34,574 36,741 40,113 43,195 44,140 45,331 46,963 49,645
28 28,274 29,249 30,279 31,391 32,620 34,027 35,715 37,916 41,337 44,461 45,419 46,626 48,278 50,994
29 29,291 30,283 31,331 32,461 33,711 35,139 36,854 39,087 42,557 45,722 46,693 47,915 49,588 52,335
30 30,307 31,316 32,382 33,530 34,800 36,250 37,990 40,256 43,773 46,979 47,962 49,199 50,892 53,672
40 40,459 41,622 42,848 44,165 45,616 47,269 49,244 51,805 55,758 59,342 60,436 61,812 63,691 66,766
60 60,713 62,135 63,628 65,226 66,981 68,972 71,341 74,397 79,082 83,298 84,580 86,188 88,379 91,952

TABLA DE LA DISTRIBUCIN
2
,

n
DE PEARSON
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
81
Uso de la tabla de la distribucin
2 22 2
.
Los valores de la
2
,

n
estn recogidos en una tabla que nos da, para cada grado de libertad n
y cada valor de la probabilidad , el punto tal que el rea encerrada a su izquierda por la grfica
de la funcin de densidad y el eje sea igual a esa probabilidad. Es decir, se procede igual que en la
normal, pero a la inversa: para cada grado de libertad se busca en medio de la tabla un valor que
deja a su izquierda un rea ( ) igual a lo expresado en la primera celda de su columna.


Ejemplos:

Si X sigue una
2
10
, [ 15] P X es un valor entre 0850 y 0900. Para averiguarlo podemos
interpolar:
15' 987 14' 534 15 14' 534
0' 8660
0' 900 0' 850 0'850


= =

% 60 ' 86 = .

Si X sigue una
2
18
, realizando la interpolacin correspondiente, obtenemos
[ 28' 5] 1 [ 28' 5] 1 0' 9436 0' 0544 P X P X = = = .

En cambio, si queremos hallar para qu valor k una variable X sigue una
2
12
cumple
[8 ] 0' 75 P X k = , tendremos que plantear [ ] [ 8] 0' 75 P X k P X = (con las
adecuadas interpolaciones) [ ] = 75 ' 0 2149 ' 0 k X P
[ ] 4045 ' 22 9649 ' 0 2149 ' 0 75 ' 0 = = + = k k X P .

5. Distribucin t de Student
Dadas Z
0
, Z
1
,,Z
n
, 1 + n variables N (0, 1), independientes entre s, definimos la
distribucin t de Student con n grados de libertad como la generada por la variable X:

0
2
1
n
i
i
Z
X
Z
n
=
=



Se denota
n
t y cumple que 0 = y que
2
disminuye al aumentar el nmero de grados de libertad.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
82
0,525 0,550 0,575 0,600 0,625 0,650 0,675 0,700 0,725 0,750 0,775
1 0,0787 0,1584 0,2401 0,3249 0,4142 0,5095 0,6128 0,7265 0,8541 1,0000 1,1708
2 0,0708 0,1421 0,2146 0,2887 0,3651 0,4447 0,5284 0,6172 0,7126 0,8165 0,9313
3 0,0681 0,1366 0,2060 0,2767 0,3492 0,4242 0,5023 0,5844 0,6715 0,7649 0,8664
4 0,0667 0,1338 0,2017 0,2707 0,3414 0,4142 0,4897 0,5686 0,6519 0,7407 0,8364
5 0,0659 0,1322 0,1991 0,2672 0,3367 0,4082 0,4822 0,5594 0,6406 0,7267 0,8191
6 0,0654 0,1311 0,1974 0,2648 0,3336 0,4043 0,4774 0,5534 0,6331 0,7176 0,8079
7 0,0650 0,1303 0,1962 0,2632 0,3315 0,4015 0,4739 0,5491 0,6279 0,7111 0,8000
8 0,0647 0,1297 0,1953 0,2619 0,3298 0,3995 0,4713 0,5459 0,6240 0,7064 0,7942
9 0,0645 0,1293 0,1946 0,2610 0,3286 0,3979 0,4693 0,5435 0,6210 0,7027 0,7897
10 0,0643 0,1289 0,1941 0,2602 0,3276 0,3966 0,4677 0,5415 0,6186 0,6998 0,7862
11 0,0642 0,1286 0,1936 0,2596 0,3267 0,3956 0,4664 0,5399 0,6167 0,6974 0,7833
12 0,0640 0,1283 0,1932 0,2590 0,3261 0,3947 0,4654 0,5386 0,6151 0,6955 0,7809
13 0,0639 0,1281 0,1929 0,2586 0,3255 0,3940 0,4645 0,5375 0,6137 0,6938 0,7789
14 0,0638 0,1280 0,1926 0,2582 0,3250 0,3933 0,4637 0,5366 0,6125 0,6924 0,7772
15 0,0638 0,1278 0,1924 0,2579 0,3246 0,3928 0,4630 0,5357 0,6115 0,6912 0,7757
16 0,0637 0,1277 0,1922 0,2576 0,3242 0,3923 0,4624 0,5350 0,6107 0,6901 0,7744
17 0,0636 0,1276 0,1920 0,2573 0,3239 0,3919 0,4619 0,5344 0,6099 0,6892 0,7732
18 0,0636 0,1274 0,1919 0,2571 0,3236 0,3915 0,4615 0,5338 0,6092 0,6884 0,7722
19 0,0635 0,1274 0,1917 0,2569 0,3233 0,3912 0,4610 0,5333 0,6086 0,6876 0,7713
20 0,0635 0,1273 0,1916 0,2567 0,3231 0,3909 0,4607 0,5329 0,6080 0,6870 0,7705
21 0,0635 0,1272 0,1915 0,2566 0,3229 0,3906 0,4603 0,5325 0,6076 0,6864 0,7698
22 0,0634 0,1271 0,1914 0,2564 0,3227 0,3904 0,4600 0,5321 0,6071 0,6858 0,7691
23 0,0634 0,1271 0,1913 0,2563 0,3225 0,3902 0,4598 0,5317 0,6067 0,6853 0,7685
24 0,0634 0,1270 0,1912 0,2562 0,3223 0,3900 0,4595 0,5314 0,6063 0,6848 0,7680
25 0,0633 0,1269 0,1911 0,2561 0,3222 0,3898 0,4593 0,5312 0,6060 0,6844 0,7675
26 0,0633 0,1269 0,1910 0,2560 0,3220 0,3896 0,4591 0,5309 0,6056 0,6840 0,7670
27 0,0633 0,1268 0,1909 0,2559 0,3219 0,3894 0,4589 0,5306 0,6054 0,6837 0,7665
28 0,0633 0,1268 0,1909 0,2558 0,3218 0,3893 0,4587 0,5304 0,6051 0,6834 0,7661
29 0,0633 0,1268 0,1908 0,2557 0,3217 0,3892 0,4585 0,5302 0,6048 0,6830 0,7658
30 0,0632 0,1267 0,1908 0,2556 0,3216 0,3890 0,4584 0,5300 0,6046 0,6828 0,7654
40 0,0631 0,1265 0,1903 0,2550 0,3208 0,3881 0,4572 0,5286 0,6029 0,6807 0,7629
60 0,0630 0,1262 0,1899 0,2545 0,3201 0,3872 0,4561 0,5272 0,6012 0,6786 0,7604
120 0,0628 0,1259 0,1895 0,2539 0,3194 0,3862 0,4549 0,5258 0,5995 0,6765 0,7579
0,800 0,825 0,850 0,875 0,900 0,925 0,950 0,975 0,990 0,995 0,999
1 1,3764 1,6319 1,9626 2,4142 3,0777 4,1653 6,3137 12,7062 31,8210 63,6559 318,2888
2 1,0607 1,2096 1,3862 1,6036 1,8856 2,2819 2,9200 4,3027 6,9645 9,9250 22,3285
3 0,9785 1,1045 1,2498 1,4226 1,6377 1,9243 2,3534 3,1824 4,5407 5,8408 10,2143
4 0,9410 1,0573 1,1896 1,3444 1,5332 1,7782 2,1318 2,7765 3,7469 4,6041 7,1729
5 0,9195 1,0305 1,1558 1,3009 1,4759 1,6994 2,0150 2,5706 3,3649 4,0321 5,8935
6 0,9057 1,0133 1,1342 1,2733 1,4398 1,6502 1,9432 2,4469 3,1427 3,7074 5,2075
7 0,8960 1,0014 1,1192 1,2543 1,4149 1,6166 1,8946 2,3646 2,9979 3,4995 4,7853
8 0,8889 0,9925 1,1081 1,2403 1,3968 1,5922 1,8595 2,3060 2,8965 3,3554 4,5008
9 0,8834 0,9858 1,0997 1,2297 1,3830 1,5737 1,8331 2,2622 2,8214 3,2498 4,2969
10 0,8791 0,9804 1,0931 1,2213 1,3722 1,5592 1,8125 2,2281 2,7638 3,1693 4,1437
11 0,8755 0,9761 1,0877 1,2145 1,3634 1,5476 1,7959 2,2010 2,7181 3,1058 4,0248
12 0,8726 0,9725 1,0832 1,2089 1,3562 1,5380 1,7823 2,1788 2,6810 3,0545 3,9296
13 0,8702 0,9695 1,0795 1,2041 1,3502 1,5299 1,7709 2,1604 2,6503 3,0123 3,8520
14 0,8681 0,9669 1,0763 1,2001 1,3450 1,5231 1,7613 2,1448 2,6245 2,9768 3,7874
15 0,8662 0,9647 1,0735 1,1967 1,3406 1,5172 1,7531 2,1315 2,6025 2,9467 3,7329
16 0,8647 0,9627 1,0711 1,1937 1,3368 1,5121 1,7459 2,1199 2,5835 2,9208 3,6861
17 0,8633 0,9610 1,0690 1,1910 1,3334 1,5077 1,7396 2,1098 2,5669 2,8982 3,6458
18 0,8620 0,9595 1,0672 1,1887 1,3304 1,5037 1,7341 2,1009 2,5524 2,8784 3,6105
19 0,8610 0,9582 1,0655 1,1866 1,3277 1,5002 1,7291 2,0930 2,5395 2,8609 3,5793
20 0,8600 0,9570 1,0640 1,1848 1,3253 1,4970 1,7247 2,0860 2,5280 2,8453 3,5518
21 0,8591 0,9559 1,0627 1,1831 1,3232 1,4942 1,7207 2,0796 2,5176 2,8314 3,5271
22 0,8583 0,9549 1,0614 1,1815 1,3212 1,4916 1,7171 2,0739 2,5083 2,8188 3,5050
23 0,8575 0,9540 1,0603 1,1802 1,3195 1,4893 1,7139 2,0687 2,4999 2,8073 3,4850
24 0,8569 0,9532 1,0593 1,1789 1,3178 1,4871 1,7109 2,0639 2,4922 2,7970 3,4668
25 0,8562 0,9524 1,0584 1,1777 1,3163 1,4852 1,7081 2,0595 2,4851 2,7874 3,4502
26 0,8557 0,9517 1,0575 1,1766 1,3150 1,4834 1,7056 2,0555 2,4786 2,7787 3,4350
27 0,8551 0,9511 1,0567 1,1756 1,3137 1,4817 1,7033 2,0518 2,4727 2,7707 3,4210
28 0,8546 0,9505 1,0560 1,1747 1,3125 1,4801 1,7011 2,0484 2,4671 2,7633 3,4082
29 0,8542 0,9499 1,0553 1,1739 1,3114 1,4787 1,6991 2,0452 2,4620 2,7564 3,3963
30 0,8538 0,9494 1,0547 1,1731 1,3104 1,4774 1,6973 2,0423 2,4573 2,7500 3,3852
40 0,8507 0,9457 1,0500 1,1673 1,3031 1,4677 1,6839 2,0211 2,4233 2,7045 3,3069
60 0,8477 0,9419 1,0455 1,1616 1,2958 1,4582 1,6706 2,0003 2,3901 2,6603 3,2317
120 0,8446 0,9383 1,0409 1,1559 1,2886 1,4488 1,6576 1,9799 2,3578 2,6174 3,1595

TABLA DE LA DISTRIBUCIN
, n
t DE STUDENT
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
83
Propiedades de la funcin de densidad de la distribucin t de Student.
Est definida en todo R .
El rea encerrada entre la grfica de la funcin y el eje de abscisas, aunque es
ilimitada, vale 1.
Segn los valores de n adoptar una forma ms o menos apuntada, pero manteniendo
las propiedades anteriores.
Es simtrica respecto del eje de ordenadas.
Es muy parecida a la normal N (0, 1).


Uso de la tabla de la distribucin t
n
.
Los valores de la
, n
t estn recogidos en una tabla que nos da, para cada grado de libertad n
y cada valor de la probabilidad , el punto tal que el rea encerrada a su izquierda por la grfica
de la funcin de densidad y el eje sea igual a esa probabilidad. Es decir, se procede igual que en
la chi-cuadrado: para cada grado de libertad se busca en medio de la tabla un valor que deja a su
izquierda un rea ( ) igual a lo expresado en la primera celda de su columna.

Ejemplos:
Si X sigue una t
5
, [ 2] P X es un valor entre 0925 y 0950. Para averiguarlo podemos
interpolar:
2' 0150 1' 6994 2 1' 6994
0' 9488
0' 950 0' 925 0' 925


= =

% 88 ' 94 = .

Si X sigue una t
12
, realizando la oportuna interpolacin, obtenemos
[ 0' 35] 1 [ 0' 35] 1 0' 6337 0' 3663 P X P X = = = % 63 ' 36 = .

Si X sigue una t
20
y queremos hallar para qu valor k [ ] 0' 45 P k X k = , tendremos que
plantear 2 [ ] 1 0' 45 [ ] 0' 725 0' 6080 P X k P X k k = = = .
________________________________________________________________________
NOTA: Tanto esta distribucin
n
t (de Student) como la distribucin
2
n
(de Pearson) no sern
utilizadas hasta los temas siguientes (Muestreo y estimacin y Contrastes de hiptesis).
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
84
Relacin de problemas del Tema 5.
1. Sea X una variable aleatoria discreta cuya ley de probabilidad es:
a) [ 7' 5] P X < .
b) [ >8] P X .
c) [4 6' 5] P X .
d) [5 6] P X < < .
e) Calcula la esperanza y la desviacin tpica.
2. Se realiza un experimento aleatorio consistente en inyectar un virus a tres tipos de ratas y
observar si sobreviven o no. Se comprueba que las probabilidades asociadas a los elementos del
espacio muestral, donde V es vivir y M es morir, son las recogidas en la tabla adjunta. Se pide:
a) Construye la variable aleatoria que mida el nmero de ratas vivas y su
funcin de probabilidad.
b) Calcula la funcin de distribucin.
c) Calcula [ 1] P x , [ 2] P x , [ 1' 5] P x = .
d) Calcula la media y la desviacin tpica.
3. Construye la distribucin de probabilidad de la variable que a cada lanzamiento de 5 dados asigna
el nmero de cuatros obtenidos y halla la probabilidad de que el 4 aparezca:
a) Ninguna vez. b) Una vez. c) 2 veces. d) 3 veces. e) 4 veces. f) 5 veces.
4. La probabilidad de curacin de un paciente al ser sometido a un determinado tratamiento es 085.
En un grupo de 6 enfermos sometidos a tratamiento:
a) Calcula la probabilidad de que se curen la mitad.
b) Calcula la probabilidad de que se curen al menos 4.
c) Qu nmero de enfermos debemos esperar que se cure?
5. La probabilidad de que un arquero acierte en el blanco es 02. Si lo intenta 5 veces, calcula la
probabilidad de que acierte:
a) Ninguna vez. b) Alguna vez. c) 2 veces. d) 3 4 veces.
6. Si el 20% de los cerrojos producidos por una mquina son defectuosos, determina la probabilidad
de que de 4 cerrojos elegidos al azar:
a) Slo uno sea defectuoso. b) No haya ninguno defectuoso. c) A lo ms 2 sean defectuosos.
7. Las edades de los obreros de una fbrica se distribuyen segn la funcin de probabilidad de la
derecha. Halla la probabilidad de que un obrero tenga:
a) Menos de 45 aos.
b) 45 aos o ms.
c) Entre 30 y 40 aos.
d) Entre 55 y 60 aos.
8. Halla el rea bajo la curva normal en cada uno de los siguientes casos:
a) Entre z = 0 y z = 12 c) Entre z = -046 y z = 221 d) Entre z = 081 y z = 194
b) Entre z = -068 y z = 0 e) A la izquierda de z = -06 f) A la derecha de z = -128
g) A la derecha de z = 205 a la izquierda de z = -144.
x
i
p
i
4 0'15
5 0'35
6 0'10
7 0'25
8 0'15
x
i
p
i
VVV 0'1
VVM 0'1
VMV 0'1
MVV 0'15
VMM 0'15
MVM 0'1
MMV 0'1
MMM 0'2
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
85
9. Determinar el valor de k en cada uno de los siguientes casos:
a) [0 ] 0' 3770 P Z k = b) [ ] 0' 8621 P Z k = c) [ 1' 5 ] 0' 0217 P Z k =
10. La media de los pesos de 500 estudiantes de un cierto colegio es 61 kg y la desviacin tpica 10
kg. Suponiendo que los pesos se distribuyen normalmente, halla cuntos estudiantes pesan:
a) Entre 48 y 62 kg. b) Ms de 74 kg. c) Menos de 51 kg.
11. La media de los dimetros interiores de un cierto tipo de arandelas producidas por una mquina
es 0502 pulgadas y la desviacin tpica 0005 pulgadas. El propsito para el que se destinan estas
arandelas permite una tolerancia mxima en el dimetro de 0496 a 0508 pulgadas, de otro modo,
las arandelas se consideran defectuosas. Determina el porcentaje de arandelas defectuosas
producidas por la mquina, suponiendo que los dimetros se distribuyen normalmente.
12. Calcula las probabilidades de las siguientes distribuciones binomiales mediante aproximacin a la
normal correspondiente.
a) [ 10], [ 2' 5], [4 12] P X P X P X = < < , siendo X una B (100, 01).
b) [ 32], [ 24], [14 20] P X P X P X > < < , siendo X una B (1000, 002).
c) [ ] [ ] [ ] 48 42 , 40 , 43 < = > X P X P X P , siendo X una B (50, 09).
13. Un dado se lanza 120 veces. Halla la probabilidad de que la cara 4 salga:
a) 18 veces o menos. b) 14 veces. c) Ms de 20 veces. d) Entre 15 y 25 veces.
14. La probabilidad de que un tirador acierte en el blanco es 08. Suponiendo que el arquero haga
1000 intentos y que su capacidad de acierto se mantuviese:
a) Cuntos aciertos debemos esperar?
b) Cul sera la probabilidad de que acertara ms de 240 veces?
15. Si la probabilidad de que un cerrojo sea defectuoso es 01, halla la media y la desviacin tpica
para la distribucin de cerrojos defectuosos de un total de 400.
16. Si la probabilidad de que un individuo sufra una reaccin por una inyeccin de un determinado
suero es 0001, determina la probabilidad de que de un total de 2.000 individuos
a) Exactamente tres individuos tengan reaccin b) Ms de 2 individuos tengan reaccin.
17. En una cierta ciudad el 15 % de la poblacin es de raza negra.
a) Cul es la probabilidad de que, eligiendo 25 personas al azar, haya al menos una de color?
b) Y si elegimos cien personas, qu probabilidad hay de que haya ms de veinte personas de raza
negra?
18. Un tipo de pilas elctricas tiene una duracin media de 50 horas, con desviacin tpica de 5 horas.
Suponiendo que la duracin sigue una distribucin normal:
a) halla la probabilidad de que, al elegir una de estas pilas al azar, dure entre 40 y 55 horas.
b) En una caja de 500 pilas, cuntas cabra esperar que duren ms de 58 horas?
19. En unas elecciones primarias se sabe que el 45 % de los votantes ha votado al candidato A.
a) Si elegimos seis votantes al azar, cul es la probabilidad de que al menos uno de ellos haya
votado por el candidato A?
b) Y si se eligen cien votantes al azar, qu probabilidad hay de que hayan votado a A un mnimo
de 40 y un mximo de 55 personas?
20. Una moneda se lanza 400 veces. Calcula la probabilidad de obtener ms de 210 caras, pero menos
de 225.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
86
21. El peso de los toros de una determinada ganadera se distribuye normalmente con una media de
500 kg y una desviacin tpica de 40 kg.
a) Cunto vale la probabilidad de que un toro de esa ganadera, elegido al azar, pese entre 480
y 540 kg?
b) Si la ganadera tiene dos mil toros, cuntos cabra esperar que pesaran ms de 560 kg?
22. En Andaluca aprueban las Matemticas de 1 de Bachillerato 14 de cada 25 alumnos/as. Si
elegimos 10 alumnos/as de dicho curso al azar, cul es la probabilidad de que alguno/a haya
aprobado las Matemticas?
23. Si lanzamos un dado 1200 veces, cunto vale la probabilidad de que el nmero de cincos
obtenidos sea menor que 180?
24. Un examen tipo test consta de 90 preguntas con 3 posibles respuestas cada una de ellas, de las
cuales slo una es correcta. Calcula la probabilidad de acertar por lo menos la mitad de las
preguntas, si se responden al azar.
25. En una cierta poblacin se sabe que el 20 % de las personas adultas habla correctamente espaol.
Se eligen al azar diez adultos. Halla la probabilidad de que alguno hable correctamente espaol.
26. Una mquina produce tornillos. Por trmino medio, el 2 % de ellos son defectuosos. Se
empaquetan en cajas de 100. Calcula las probabilidades de que en una caja:
a) haya exactamente tres tornillos defectuosos;
b) haya algn tornillo defectuoso.
27. Extraemos una carta de una baraja espaola de 40 cartas, la miramos y la devolvemos al mazo.
Barajamos y volvemos a extraer. Repetimos 10 veces la experiencia.
a) Cunto vale la probabilidad de haber obtenido una FIGURA al menos dos veces en estas diez
extracciones?
b) Cul es el nmero de FIGURAS que se espera obtener al repetir diez veces la extraccin
descrita (con reemplazamiento)?
28. La nota media de un examen en las Pruebas de Acceso a la Universidad (Selectividad) es de 5,6,
con una desviacin tpica de 1,9.
a) Cul es la probabilidad de que un/a alumno/a elegido/a al azar tenga notable
) 9 7 ( < NOTA en dicho examen?
b) Si dicho examen lo realizaron 2000 alumnos/as, cuntos/as cabe esperar que lo hayan
suspendido ( ) 5 < NOTA ?
29. La distribucin de la duracin del embarazo en mujeres es aproximadamente normal, con media
266 das y desviacin tpica 16 das. Calcula la proporcin de embarazos con una duracin mxima
de 244 das.
30. Se sabe que un determinado medicamento produce mejora de cierta enfermedad en dos de cada
tres pacientes. Se le administra a siete enfermos.
a) Calcula la probabilidad de que mejoren cinco personas.
b) Calcula la probabilidad de que mejoren al menos cinco personas.
31. Se sabe que las tallas de una muestra de mil personas de una determinada poblacin siguen una
distribucin normal. El 15,87 % de dicha muestra mide ms de 180 cm, y el 15,87 % menos de 160
cm. Cuntas personas podemos esperar que midan entre 170 y 190 cm?
32. Una compaa de autobuses sabe que el retraso en la llegada sigue una ley normal de media 5
minutos y desviacin tpica 3 minutos. Qu porcentaje de autobuses llega con un retraso
comprendido entre los 3 y los 9 minutos?
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
87

Bloque 3. MUESTREO E INFERENCIA.

6. Muestreo y estimacin.

6.1. Introduccin a la Estadstica Inferencial.

La tarea fundamental de la Estadstica Inferencial, es extraer conclusiones acerca de
determinado carcter de la poblacin expresado a travs de una variable aleatoria.
Para llevar a cabo este propsito nos basamos en los siguientes apartados:
Muestreo: definicin de las diferentes tcnicas para elegir una muestra que nos sirva
para estudiar a la poblacin entera.
Estimacin de parmetros: caracterizacin y mtodos de obtencin de los parmetros
poblacionales a partir de los muestrales.
Tests de Hiptesis: resolucin de problemas de decisin.

Ejemplo: Si queremos conocer la media de los coeficientes intelectuales en la poblacin de
universitarios de Sevilla de ambos sexos. Tenemos que escoger una muestra de manera adecuada
y, conocida la media de la muestra, estimar la de la poblacin. Despus podramos plantearnos si
las diferencias encontradas entre chicos y chicas responden a una realidad o son fruto del azar al
elegir las muestras de estudio.

6.2. Teora del muestreo.

El estudio estadstico de las variables se realiza generalmente en las muestras, bien por
razones de rendimiento, de comodidad o porque resulta imposible hacerlo en la poblacin. A
veces, porque el estudio es destructivo y ms vale destruir una muestra que toda la poblacin; si
queremos estudiar la duracin media de una poblacin, por ejemplo, de lmparas de algn tipo, hay
que esperar a que dichos elementos dejen de funcionar y, si lo hiciramos con toda la poblacin,
nos quedaramos sin producto que comercializar

La teora del muestreo es la parte de la Estadstica Inferencial que estudia las relaciones
entre poblaciones y muestras.
Una vez efectuado el estudio descriptivo en la muestra trataremos de inferir, de estimar las
caractersticas del fenmeno considerado en la poblacin, utilizando para ello ciertas tcnicas
estadsticas.
Entendemos por muestreo el proceso mediante el cual se extraen muestras de una
determinada poblacin.
La representatividad de la muestra exige que su composicin sea la misma que la de la
poblacin de donde procede, de tal forma que sea un buen reflejo de ella.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
88

Tipos de muestreo:
Muestreo probabilstico.
Muestreo no probabilstico.

Muestreo probabilstico.

Se caracteriza porque existe aleatoriedad en la seleccin de las muestras, y as todos los
individuos de la poblacin tienen, aproximadamente, la misma probabilidad de ser elegidos.

En este caso, la representatividad est basada en la ley de los grandes nmeros y en el
clculo de probabilidades.

Los tipos de muestreo probabilstico ms comunes son:

1. Muestreo aleatorio simple.
Los individuos de la poblacin son elegidos completamente al azar. Esto se consigue asignando
un nmero a cada uno de los individuos de la poblacin estudiada y sortendolos posteriormente.
Ejemplo: En una localidad de se van a designar 10 personas de entre 2530 votantes para
componer una mesa electoral. Se dispone del censo, donde los vecinos estn numerados del 1 al
2530, y se eligen al azar dichos integrantes por sorteo puro.

2. Muestreo sistemtico.
Si se dispone de un listado de la poblacin se elige al azar el primer elemento de la muestra
por sorteo y se continan extrayendo elementos igualmente espaciados en la lista.
Ejemplo: En el mismo caso anterior, elegimos por sorteo el primero, supongamos que sale el
528. Cada 253 (2530 dividido entre 10) elegimos los siguientes. Seran: 528, 781, 1034, 1287,
1540, 1793, 2046, 2299, 22 y 275.

3. Muestreo estratificado.
Se divide la poblacin en varios estratos segn un determinado criterio. Despus se
seleccionan al azar un nmero determinado de individuos de cada uno de estos estratos.
Ejemplo: En un centro de enseanza, donde se imparten cuatro niveles distintos de un
determinado tipo de estudios, hay 1.100 alumnos, de los que 350 alumnos cursan 1, 300 cursan
2, 250 estn en 3, y 200 en 4. Queremos estudiar el nmero de alumnos que aprueban todas
las asignaturas y necesitamos una muestra de 80 alumnos. Pensamos que puede haber diferencias
entre los distintos niveles educativos, por lo que nos interesa que en la muestra estn
representados todos los cursos. Para que todos estn representados, elegimos de cada curso o
nivel
80
20
4
= alumnos.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
89
4. Muestreo estratificado controlado.
Se divide la poblacin en varias partes o estratos y se selecciona de cada uno de estos
estratos y al azar un nmero de individuos proporcional al nmero que de este estrato se
encuentra en la poblacin (en definitiva, un reparto proporcional directo).
Ejemplo: En el caso anterior elegiramos:
350
80 25
1100
= de 1,
300
80 22
1100
= de 2,
250
80 18
1100
= de 3, y
200
80 15
1100
= de 4.

5. Muestreo por conglomerados.
Se divide la poblacin total en un nmero determinado de subdivisiones relativamente
pequeas y se seleccionan al azar algunas de estas subdivisiones o conglomerados. Dentro de ellos
elegimos una muestra aleatoria simple para incluirlos en la muestra total.
No se obtienen valores tan exactos pero es mucho ms barato.
Ejemplo: Una compaa de servicio de televisin por cable est plantendose abrir una
sucursal en una ciudad grande; la compaa planea realizar un estudio para determinar el
porcentaje de familias que utilizaran sus servicios; como no es prctico preguntar en cada casa,
la empresa decide seleccionar varias partes de la ciudad al azar, por ejemplo 100 calles, cada una
de las cuales es un conglomerado. Esas 100 calles se eligen para representar, tan fielmente como
sea posible, a toda la poblacin; entonces se usa una muestra aleatoria simple de conglomerados.

Muestreo no probabilstico.

Se caracteriza por la utilizacin de un procedimiento no aleatorio en la seleccin de las
muestras. Cada individuo no tiene la misma probabilidad de ser elegido.

1. Muestreo por cuotas.
Consiste en elaborar un modelo de la poblacin a estudiar, dividindola en categoras y
tomando para dicho modelo el mismo porcentaje de individuos que en cada categora se
encuentran en la poblacin.
Se requiere un buen conocimiento de los estratos de poblacin y los individuos ms adecuados
o representativos para la misma.
En este caso, el investigador puede elegir la persona que desee, con tal que rena las
"caractersticas" necesarias.
Este mtodo tiene la ventaja de resultar sencillo, econmico y rpido. Como contrapartida, al
no haberse seleccionado la muestra aleatoriamente no es posible aplicar la teora de
probabilidades y por tanto conocer el error cometido. Con todo, es un mtodo muy utilizado en
tcnicas de encuestas por los institutos de opinin.
Ejemplo: Supongamos que deseamos hacer una encuesta sobre toda la poblacin espaola para
una muestra de 2000 personas. Dividimos la poblacin espaola en las siguientes categoras:
Edad: 26% Menores de 25 aos. 74% Mayores de 25 aos.
Sexo: 51% Sexo femenino. 49% Sexo masculino.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
90
Obtenemos 4 grupos y de cada uno de ellos debemos seleccionar:
Cuota 1: Menores de 25 aos femenino: 026 x 051 x 2000 = 265 individuos.
Cuota 2: Mayores de 25 aos femenino: 074 x 051 x 2000 =755 individuos.
Cuota 3: Menores de 25 aos masculino: 026 x 049 x 2000 = 255 individuos.
Cuota 4: Mayores de 25 aos masculino: 074 x 049 x 2000 =725 individuos.
Nos desplazamos a una ciudad y entrevistamos a las primeras 265 mujeres menores de 25
aos que encontremos, y as sucesivamente.

2. Muestreo Casual o Incidental.
Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los
individuos de la poblacin. El caso ms frecuente de este procedimiento es utilizar como muestra
los individuos a los que se tiene fcil acceso.
Ejemplo: Si un profesor quiere investigar el consumo de tabaco en los jvenes, emplea como
muestra sus propios alumnos.


6.3. Distribuciones muestrales.

El estudio de determinada caracterstica de una poblacin se realiza a travs de diversas
muestras, en cada una de las cuales calculamos un determinado estadstico e (media, proporcin,
desviacin tpica). El conjunto de todos los valores as obtenidos (tantos como muestras)
constituyen la distribucin del estadstico e que nos va a permitir conocer el correspondiente
parmetro de la poblacin.

Consideremos todas las posibles muestras de tamao n que pueden extraerse de una
poblacin dada (con o sin reemplazamiento). Para cada muestra se puede calcular un estadstico,
tal como la media aritmtica, la desviacin tpica, etc., que variar de una muestra a otra. De esta
forma se obtiene una distribucin del estadstico que se conoce como distribucin muestral o
distribucin en el muestreo.

La distribucin muestral de un estadstico adopta una forma determinada y puede coincidir
con una distribucin binomial, de Poisson, t de Student, o como ocurre generalmente, puede seguir
una ley Normal. Por otra parte, como cualquier distribucin de frecuencias, se puede caracterizar
por sus medidas de tendencia central y sus medidas de dispersin.

Si, por ejemplo, el estadstico de que se trata es la media muestral, la distribucin se conoce
como distribucin muestral de medias o distribucin muestral (o en el muestreo) de la media.
Anlogamente se obtendran distribuciones muestrales de las desviaciones tpicas, de las
varianzas, de las medianas, de las proporciones, etc.

Para cada distribucin muestral se puede calcular, a su vez, la media y la desviacin tpica.
As, pues, se puede hablar de la media y desviacin tpica de la distribucin muestral de que se
trate.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
91

A partir de ahora consideraremos que la poblacin es prcticamente infinita cuando el tamao
de la(s) muestra(s) no supera el 5% del tamao de la poblacin ( ) N n % 5 , y finita en
caso contrario ( ) N n > % 5 .



6.3.1. Distribucin muestral de medias


Supongamos que son extradas de una poblacin de tamao N (finita o prcticamente
infinita) todas las posible muestras de tamao n (con o sin reemplazamiento). Evidentemente,
N n < . Si se denota la media y la desviacin tpica de la distribucin muestral de medias por
x

y
x
, y la media y la desviacin tpica de la poblacin por y , respectivamente, tenemos:


Muestra:
Poblacin:
Con
reemplazamiento
Sin
reemplazamiento

Infinita
( ) N n % 5
=
x


n
x

=
=
x


n
x

=

Finita
=
x


n
x

=
=
x


1

=
N
n N
n
x


TABLA I: DISTRIBUCIN MUESTRAL DE MEDIAS


Para valores grandes de n ( ) 30 > n , la distribucin muestral de medias se aproxima a
una distribucin normal con media
x
y desviacin tpica
x
, independientemente de la
distribucin que tenga la poblacin de que se trate (siempre que la media y la desviacin tpica
sean finitas y el tamao N de la poblacin sea al menos dos veces el tamao n de las muestras).
Si la poblacin sigue una distribucin normal, la distribucin muestral de medias se
distribuye tambin normalmente, incluso para pequeos valores de n ( 30 n ).




6.3.2. Distribucin muestral de proporciones


Supongamos una poblacin de tamao N (finita o prcticamente infinita) y que la
probabilidad de ocurrencia de un suceso (lo que se denomina su xito) es p , mientras que la
probabilidad de no ocurrencia del suceso es p q =1 . Consideramos todas las posible muestras
de tamao n (con o sin reemplazamiento) extradas de esta poblacin y para cada muestra se
determina la proporcin p de xito. Entonces se obtiene una distribucin muestral de
proporciones cuya media
p
y desviacin tpica
p
vienen dadas por:

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
92

Muestra:
Poblacin:
Con
reemplazamiento
Sin
reemplazamiento

Infinita
( ) N n % 5

p
p
=

n
pq
p
=
p
p
=

n
pq
p
=

Finita
p
p
=

n
pq
p
=
p
p
=

1

=
N
n N
n
pq
p

TABLA II: DISTRIBUCIN MUESTRAL DE PROPORCIONES


Estas igualdades pueden obtenerse de las anteriores (las de la distribucin muestral de
medias) sin ms que hacer p = y pq = , aunque tambin pueden obtenerse salvo en el
caso de poblacin finita sin reemplazamiento- si se dividen por n la media y la desviacin tpica
(np y npq ) de la distribucin binomial.


Para grandes valores de n ( ) 30 > n la distribucin muestral de proporciones se aproxima
mucho a una distribucin normal, aunque est claro que la poblacin se distribuye
binomialmente.



6.3.3. Distribucin muestral de la diferencia de medias


Sean A y B dos poblaciones de tamaos respectivos
A
N y
B
N (finitos o prcticamente
infinitos), con medias respectivas
A
y
B
, y desviaciones tpicas
A
y
B
,
respectivamente. Para cada posible muestra de tamao
A
n (con o sin reemplazamiento) de la
poblacin A obtenemos un determinado estadstico
A
e , lo que proporciona una distribucin
muestral del estadstico cuya media y desviacin tpica vienen dadas por
A
e
y
A
e
,
respectivamente. Anlogamente, para cada posible muestra de tamao
B
n , extrada de la
poblacin B, se calcula un estadstico
B
e , lo que proporciona una distribucin muestral del
estadstico con media
B
e
y desviacin tpica
B
e
.

De todas las posibles combinaciones de estas muestras de las dos poblaciones se puede
obtener una distribucin de las diferencias,
B A
e e , que se conoce como distribucin muestral
de la diferencia de estadsticos. La media y la varianza de esta distribucin muestral se denotan,
respectivamente, por
B A
e e
y
2
B A
e e
, y vienen dadas por:

B A B A
e e e e
=



Y, si las poblaciones son independientes (es decir, sin correlacin entre ellas),

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
93

2 2 2
B A B A
e e e e
+ =


2 2
B A B A
e e e e
+ =




Si
A
e y
B
e son las medias muestrales de las dos poblaciones, tenemos:


Muestras:
Poblaciones:
Con
reemplazamiento
Sin
Reemplazamiento

Infinitas
( ) N n % 5

B A x x
B A
=



B
B
A
A
x x
n n
B A
2 2

+ =



B A x x
B A
=



B
B
A
A
x x
n n
B A
2 2

+ =



Finitas

B A x x
B A
=



B
B
A
A
x x
n n
B A
2 2

+ =



B A x x
B A
=



1 1
2 2

B
B B
B
B
A
A A
A
A
x x
N
n N
n N
n N
n
B A


TABLA III: DISTRIBUCIN MUESTRAL DE LA DIFERENCIA DE MEDIAS


Si las muestras son grandes ( ) 30 ; 30 > >
B A
n n , la distribucin muestral de diferencia
de medias sigue una ley normal, y si son pequeas siguen una distribucin t de Student
(tal y como veremos ms adelante).



6.3.4. Distribucin muestral de la diferencia de proporciones


Si los estadsticos a que nos referamos en el apartado anterior son, en este caso, las
proporciones muestrales, es decir,
A
e
A
p = y
B
e
B
p = , la distribucin muestral de la diferencia
de proporciones viene caracterizada por:


Muestras:

Poblaciones:
Con
reemplazamiento
Sin
Reemplazamiento

Infinitas
( ) N n % 5
B A p p
p p
B A
=


B
B B
A
A A
p p
n
q p
n
q p
B A


B A p p
p p
B A
=


B
B B
A
A A
p p
n
q p
n
q p
B A



Finitas
B A p p
p p
B A
=


B
B B
A
A A
p p
n
q p
n
q p
B A


B A p p
p p
B A
=


1 1

B
B B
B
B B
A
A A
A
A A
p p
N
n N
n
q p
N
n N
n
q p
B A


TABLA IV: DISTRIBUCIN MUESTRAL DE LA DIFERENCIA DE PROPORCIONES


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
94

6.4. Estimacin de parmetros.


Un importante problema de la Inferencia Estadstica es la estimacin de parmetros de la
poblacin o, simplemente, parmetros (tales como la media, la varianza o la desviacin tpica- de
la poblacin, etc.) a partir de los correspondientes estadsticos muestrales o, simplemente,
estadsticos (media muestral, varianza muestral, etc.).

En una poblacin cuya distribucin es conocida pero desconocemos algn parmetro, podemos
estimar dicho parmetro a partir de una muestra representativa.

Un estimador de un parmetro poblacional desconocido es una variable aleatoria que a cada
muestra asigna un valor prximo al del parmetro poblacional desconocido.

Una estimacin es el valor numrico que toma el estimador para una muestra dada.
Las estimaciones de los parmetros poblacionales dadas por un nmero (el valor de un
determinado estadstico muestral, que es considerado como valor del correspondiente parmetro
poblacional) se llaman estimaciones puntuales o por puntos. Las estimaciones de los parmetros
poblacionales dadas por dos nmeros entre los cuales se considera que se encuentra el valor del
correspondiente parmetro poblacional, se denominan estimaciones por intervalos de confianza.

Error tpico (o standard) de una estimacin.
Es la desviacin tpica de la distribucin muestral correspondiente.
Indica la desviacin promedio que podemos esperar entre el estimador y el valor del
parmetro.


A la hora de estimar el valor del parmetro poblacional desconocido se exige al estadstico
una serie de propiedades con el fin de obtener una estimacin aceptable:

- Centrado o insesgado: si, por ejemplo, la media de la distribucin muestral de un
estadstico es igual al correspondiente parmetro poblacional, el estadstico se llama
estimador insesgado del parmetro; si no es igual, se dice estimador sesgado del
mismo. Los valores correspondientes de tales estadsticos se conocen,
respectivamente, como estimaciones insesgadas o sesgadas.

- Consistente: al aumentar el tamao n de la muestra, el valor medio de la distribucin
muestral debe tender al parmetro estimado.

- Eficiente: si las distribuciones muestrales de dos estadsticos tienen la misma media
(o esperanza), el estadstico que tenga menor varianza (y, por tanto, menor desviacin
tpica, es decir, menor error tpico) se llama estimador eficiente de la media,

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
95
mientras que el otro estadstico se llama estimador no eficiente. Los valores
correspondientes de los estadsticos se llaman estimaciones eficientes o no
eficientes, respectivamente. Si se consideran todos los posibles estadsticos, cuyas
distribuciones muestrales tienen la misma media, al que tiene menor varianza se le
denomina el ms eficiente o mejor estimador de esta media. En la prctica, sin
embargo, se utilizan frecuentemente estimaciones no eficientes, por la relativa
facilidad con que pueden obtenerse algunas de ellas.

- Suficiente: que facilite toda la informacin sobre el parmetro que poseen los datos
de la muestra.



6.4.1. Estimacin puntual.

Una estimacin es puntual cuando se obtiene un solo valor para el parmetro.
Los estimadores ms probables en este caso son los estadsticos obtenidos en la muestra,
aunque es necesario cuantificar el riesgo que se asume al considerarlos.
La distribucin muestral indica la distribucin de los valores que tomar el estimador al
seleccionar distintas muestras de la poblacin.

Las dos medidas fundamentales de esta distribucin son la media, que indica el valor
promedio del estimador, y la desviacin tpica.

Hay que reiterar que, si el tamao de la muestra, n , es bastante grande, las distribuciones
muestrales estudiadas son normales o casi normales. Por eso, los mtodos correspondientes se
conocen como mtodos para grandes muestras. Cuando 30 n , las muestras se llaman pequeas
y su estudio se conoce como teora de pequeas muestras, o teora de muestreo exacto.

Cuando los parmetros de la poblacin, tales como ,
2
o p, se desconocen, pueden
estimarse mediante sus respectivos estadsticos muestrales, x ,
2
S (o, mejor,
2 2
1
S
n
n
s

= ,
denominada cuasivarianza) y p , si las muestras son suficientemente grandes.

Dada una muestra aleatoria de una poblacin,
k
x x x ,..., ,
2 1
(con frecuencias absolutas
respectivas
k
f f f ,..., ,
2 1
, donde n f f f
k
= + + + ...
2 1
) los mejores estimadores puntuales (y los
ms utilizados) son:
- De la media poblacional, , la media muestral:
n
f x
x
k
i
i i
=

=
1
.

- De la proporcin poblacional, p , la proporcin muestral, es decir, la probabilidad de
xito dentro de la muestra:
n
n
p
E
= , con =
E
n n veces que ocurre el suceso considerado xito,
y = n tamao de la muestra.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
96

- De la varianza poblacional,
2
, la cuasivarianza muestral:

( )
|
|
|
|

\
|

=

= = 2 1
2
1
2
2 2
1 1 1
x
n
f x
n
n
n
f x x
S
n
n
s
k
i
i i i
k
i
i
.


NOTA: Vemos que, mientras el valor medio ( ) x de una muestra de n elementos es una
estimacin sin tendencia (insesgada) del valor medio ( ) de la poblacin correspondiente, la
varianza tiene tendencia (sesgo), en el sentido de que subestima el valor relativo de la poblacin.
Es una tendencia que se nota sobre todo en las muestras pequeas. Se puede demostrar que la
mejor estimacin (la estimacin insesgada) de la varianza de la poblacin, que se obtiene a
partir de la varianza de una muestra de n elementos, es
2 2
1
S
n
n
s

= , por lo que hay que


distinguir entre los siguientes tres conceptos: varianza de la poblacin ( )
2
, varianza de la
muestra ( )
2
S y cuasivarianza de la muestra ( )
2
s . El factor |

\
|
n
n 1
se conoce como correccin
de Bessel y, tal y como podemos observar, a medida que n aumenta, se va aproximando a la
unidad, por lo que su aplicacin es cada vez menos importante.


En la misma lnea, se puede demostrar que, si (en lugar de una nica muestra) tenemos varias
muestras independientes de una misma poblacin con
k
n n n ,..., ,
2 1
elementos, respectivamente,
y varianzas muestrales
2 2
2
2
1
,..., ,
k
S S S , entonces la mejor estimacin de la varianza de la
poblacin, que puede llevarse a cabo reuniendo toda la informacin muestral, es (siendo k el
nmero de muestras),
( ) ( ) ( )
=
+ + +
+ + +
=
1 ... 1 1
...
2 1
2 2
2 2
2
1 1 2
k
k k
n n n
S n S n S n
s
k n n n
S n S n S n
k
k k
+ + +
+ + +
...
...
2 1
2 2
2 2
2
1 1
.

El divisor de esta expresin representa, en este caso, el nmero de grados de libertad.

No obstante, prcticamente todas las estimaciones que llevemos a cabo (a nuestro nivel) en
este tema y el siguiente se efectuarn a partir de una nica muestra, por lo que el nmero de
grados de libertad ser 1 n .


Ejemplo 1:

Cuatro muestras de la misma poblacin originaria resultaron con el siguiente nmero de
elementos y con las varianzas muestrales que se indican: 7
1
= n ; 24
2
1
= S ; 10
2
= n ; 37
2
2
= S ;
13
3
= n ; 27
2
3
= S ; 22
4
= n ; 32
2
4
= S . Calcula la mejor estimacin (la estimacin insesgada) de
la varianza de la poblacin.

La respuesta ser: = =
+ + +
+ + +
=
48
1593
4 22 13 10 7
32 22 27 13 37 10 24 7
2
s 332.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
97



Para la estimacin puntual en los dos primeros casos, medias y proporciones (e, incluso,
para las diferencias de ambos parmetros), no hay ms que aplicar lo visto en el apartado
anterior sobre distribuciones muestrales (TABLAS I, II, III y IV).

Para el tercer caso (estimacin puntual de la varianza poblacional), tendremos que tener en
cuenta lo que sigue:

1) Si X es una variable aleatoria de una poblacin que sigue una distribucin normal de
media , conocida, y desviacin tpica , desconocida, se tiene que, para cualquier
muestra de tamao n (con media x y cuasivarianza
2
s ):
n
s
x
sigue una distribucin t de Student con 1 n grados de libertad.
En el caso de que el tamao muestral sea mayor de 30 ( ) 30 > n , la distribucin t
de Student se aproxima por una distribucin normal N(0, 1).

2) Si X es una variable aleatoria de una poblacin que sigue una distribucin normal de
media , desconocida, y desviacin tpica , conocida, se tiene que, para cualquier
muestra de tamao n (con media x y cuasivarianza
2
s ):

2
2
2
2
) 1 (

nS s n
=

sigue una distribucin chi-cuadrado con 1 n grados de libertad.






Ejemplo 2:
Las estaturas de 3000 estudiantes estn normalmente distribuidas con media 172 cm y
desviacin tpica 1762 cm. Si se toman muestras de 25 estudiantes cada una, como conocemos los
parmetros poblacionales y el tamao de la poblacin es muy grande comparado con el tamao de
las muestras, stas seguirn una normal de parmetros 172 =
x
cm y 524 ' 3
25
62 ' 17
= =
x
cm.
Adems, [ ] [ ] [ ] = = =
(

= 85 ' 0 1 85 ' 0
524 ' 3
172 175
524 ' 3
172
175 Z P Z P
x
P x P
1977 ' 0 8023 ' 0 1 = = . Es decir, el 1977% de las muestras aleatorias deberan tener medias
de ms de 175 cm.

Ejemplo 3:
500 bolas de cojinete tienen un peso medio de 502 g y una desviacin tpica de 030 g.
Suponemos que los pesos estn distribuidos normalmente. Si cogemos al azar una muestra de 100
bolas, como el tamao de la muestra es ms del 5% del de la poblacin, la distribucin de medias
sigue una normal de parmetros 02 ' 5 =
x
g y 027 ' 0
1 500
100 500
100
30 ' 0
=

=
x
g.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
98
Ejemplo 4:
En unas elecciones un candidato obtuvo el 46% de los votos. Las muestras de tamao 200
siguen una normal de parmetros % 46 46 ' 0 = =
p
y % 52 ' 3 0352 ' 0
200
54 ' 0 46 ' 0
= =

=
p
.
Ejemplo 5:
Una determinada poblacin A tiene de media 200 y de desviacin tpica 15. Una segunda
poblacin B tiene de media 100 y de desviacin tpica 10. Extraemos muestras de tamaos
100 =
A
n y 121 =
B
n , respectivamente. Suponiendo las poblaciones infinitas, la diferencia de
medias sigue una normal de parmetros
B A x x
B A
=

100 100 200 = = y



B
B
A
A
x x
n n
B A
2 2

+ =

75 ' 1
121
10
100
15
2 2
= + = .


6.4.2. Estimacin por intervalos de confianza

La estimacin puntual se utiliza poco, puesto que carecemos de datos que nos indiquen el
grado de fiabilidad del dato muestral que hemos tomado. Es ms til utilizar la estimacin por
intervalos de confianza, que como ya hemos dicho- consiste en calcular dos valores que definen
el intervalo en el cual estimamos que se encontrar el parmetro poblacional con un cierto nivel o
grado de confianza predeterminado.

En la estimacin por intervalos se tiene que, cuanto ms amplio sea el intervalo determinado,
mayor ser el nivel de confianza de que dicho intervalo incluya el valor estimado del parmetro.
Es decir, si deseamos tener ms seguridad de que el parmetro poblacional estimado se
encuentra en el intervalo de confianza, habr que proponer un intervalo ms amplio para reducir
el riesgo.

Se trata de encontrar un intervalo ( )
2 1
, x x de manera que el parmetro poblacional
desconocido se encuentre en dicho intervalo con una determinada precisin o nivel de confianza.
Para hallar dicho intervalo se utilizan los datos de una muestra, que evidentemente cambiarn de
una muestra a otra, por lo que los valores de los dos extremos del intervalo tambin cambiarn.

El trmino grado (o nivel) de confianza ( ) 1 , por ejemplo, 95 % = 095, se refiere a que,
si consideramos un nmero elevado de muestras, y para cada una de ellas construimos dicho
intervalo de confianza para un parmetro " "h desconocido de la poblacin, tendremos que el
parmetro poblacional desconocido " "h se encuentra en, al menos, y en este ejemplo, el 95 % de
los intervalos construidos. El nivel de riesgo o significacin es , y en este ejemplo
= = 05 ' 0 5 %.

Para hallar los intervalos de confianza de un parmetro poblacional " "h se partir de un
estimador de dicho parmetro, llammosle " "a (generalmente insesgado); en la mayora de los
casos, a partir del estimador " "a (y centrado, precisamente, en dicho valor " "a , salvo cuando
haya que utilizar la distribucin
2
, que no es simtrica) se construir el intervalo con una
determinada amplitud, b 2 , de manera que el intervalo ser ( ) b a b a + , , b a , con
la condicin de que la probabilidad de que el parmetro poblacional desconocido " "h se encuentre
en dicho intervalo (es decir, el nivel de confianza) sea 1 :



( ) = + < < 1 b a h b a P

El trmino b es el margen de error, o precisin, de la estimacin del parmetro poblacional
desconocido; recibe el nombre de error tpico de estimacin o error estndar y es el producto de
dos cantidades: , que es un valor (punto crtico) de una distribucin conocida ( Z t ,
generalmente), y b (dependiente de la desviacin tpica del estimador y del tamao n de la
muestra).

Veamos la notacin que emplearemos:
(NOTA: Donde la mayora de los autores hablan de

Z ,

t y
2

, nosotros hablaremos de
1
Z ,
1
t y
2
1


, por parecernos ms conveniente, al ser precisamente los valores de 1
los que aparecen directamente en las tablas de Z , t y
2
de que disponemos).









6.4.2.1. Intervalos de confianza para una nica poblacin (prcticamente infinita, o
finita y muestreo con reemplazamiento):


POBLACIN
INTERVALO DE
CONFIANZA PARA:

INTERVALO

N ( ) , ,
CONOCIDA
LA MEDIA
POBLACIONAL,

+

n
Z x
n
Z x


2
1
2
1
,
N ( ) , ,
DESCONOCIDA,
30 n
LA MEDIA
POBLACIONAL,

+

n
s
t x
n
s
t x
n n
2
1 , 1
2
1 , 1
,


N ( ) , ,
DESCONOCIDA,
30 > n
LA MEDIA
POBLACIONAL,

+

n
s
Z x
n
s
Z x
2
1
2
1
,



N ( ) ,
LA VARIANZA
POBLACIONAL,
2

( ) ( )



2
2
, 1
2
2
2
1 , 1
2
1
,
1


n n
s n s n
( ) *
B ( ) p N, ,
30 > n
LA PROPORCIN
POBLACIONAL,
p



n
q p
Z p
n
q p
Z p
2
1
2
1
,


TABLA V ( ) * *


Por supuesto, se cumplen, como siempre, las siguientes equivalencias:
( )
2 2
1 s n S n = o, lo que es lo mismo,
n
s
n
S
=
1



Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
101
NOTAS (*), (**) Y (***) A LA TABLA V:

(*): Para muestras grandes (con tamao 30 > n ), los valores de
2
no suelen aparecer
en las tablas. En estos casos, podemos aproximarnos a travs de la distribucin
normal tipificada, N(0, 1), conociendo la siguiente equivalencia:
( )
2
2
,
2
2
1
n Z
n
+ =



(**): En el caso de que el muestreo sea sin reemplazamiento y sobre una poblacin
finita, se debe multiplicar el error estndar o error tpico de estimacin por el
factor ya conocido-
1

N
n N
, aunque esto slo ser posible en los casos en que se
utilice la distribucin normal tipificada Z o la t de Student (que son las dos nicas
distribuciones que, al ser simtricas, dan lugar a intervalos de confianza centrados).

(***): La utilizacin de
2

en lugar de en todos estos clculos y en los que siguen se


debe a que, empleemos la distribucin que empleemos (Z, t
2
), el hecho de calcular,
por ejemplo, un intervalo de confianza al 90 % ( 10 , 0 = ) significa al estar
habitualmente dicho intervalo centrado en el estimador de que se trate- calcular la
diferencia entre percentiles
5 95
P P , donde
|

\
|
= =
2
1 100 95
1

k y
2
100 5
2

= = k
Podemos verlo en la siguiente grfica de
2
:



Ejemplo 6:
Para una muestra de 81 habitantes de cierta poblacin se obtuvo una estatura media de 167
cm. Se sabe que la desviacin tpica de la altura de la poblacin es de 8 cm.
Un estimador puntual de la media sera 167 =
x
cm, y el error tpico de la estimacin
9
8
81
8
= =
x
cm, pero no tenemos la probabilidad de la certeza de la estimacin.
Para hallar el intervalo de confianza para la estatura media de la poblacin al 95% tenemos
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
102

en cuenta que 30 > n y, por tanto, el intervalo de confianza es de la forma:
|
|

\
|
+

n
Z x
n
Z x


2
1
2
1
, = |

\
|
+ =
9
8
167 ,
9
8
167
975 ' 0 975 ' 0
Z Z
( ) 74 ' 1 167 , 74 ' 1 167
9
8 96 ' 1
167 ,
9
8 96 ' 1
167 + = |

\
|
+

= . Es decir, (16526 cm, 16874 cm).



Ejemplo 7:
En una poblacin que sigue una ley normal se obtiene una muestra de tamao 10 cuya media es
41 y su varianza 609. Como 30 n , utilizaremos la t de Student y el intervalo de confianza de
la media poblacional al 90% ser de la forma:
|
|

\
|
+

n
s
t x
n
s
t x
n n
2
1 , 1
2
1 , 1
,

=
|
|

\
|

=

1
,
1
2
1 , 1
2
1 , 1
n
S
t x
n
S
t x
n n


=
|
|

\
|
+ =
|
|

\
|
+ =
9
09 ' 6
8331 ' 1 1 ' 4 ,
9
09 ' 6
8331 ' 1 1 ' 4
9
09 ' 6
1 ' 4 ,
9
09 ' 6
1 ' 4
95 ' 0 , 9 95 ' 0 , 9
t t
( ) = + = 508 ' 1 1 ' 4 , 508 ' 1 1 ' 4 (2592, 5608).

Ejemplo 8:
La probabilidad de que un espaol estudie en la universidad es 02. La distribucin muestral
de proporciones para muestras de tamao 100 sigue una normal porque el tamao de la muestra
es suficientemente grande, con 2 ' 0 = = p
p
y 04 ' 0
100
8 ' 0 2 ' 0
=

= =
n
pq
p
. El intervalo de
confianza para la proporcin de espaoles que estudia en la universidad con un nivel de confianza
del 85% es, entonces,
|
|

\
|

+



n
q p
Z p
n
q p
Z p
2
1
2
1
,

( ) = + = 04 ' 0 2 ' 0 , 04 ' 0 2 ' 0
925 ' 0 925 ' 0
Z Z
( ) = + = 04 ' 0 44 ' 1 2 ' 0 , 04 ' 0 44 ' 1 2 ' 0 (01424, 02576), es decir, entre el 1424% y el 2576%.

Ejemplo 9:
En el ejemplo en el que tenamos una muestra de tamao 10 con media 41 y varianza 609 de
una poblacin que segua una ley normal, como desconocemos la media muestral, el intervalo de
confianza para la varianza al 80% es:
=
|
|
|

\
|


2
2
, 1
2
2
2
1 , 1
2
) 1 (
,
) 1 (


n n
s n s n
=
|
|

\
|
2
1 ' 0 , 9
2
2
9 ' 0 , 9
2
9
,
9

s s
= |

\
|
=
|
|

\
|
168 ' 4
09 ' 6 10
,
684 ' 14
09 ' 6 10 10
,
10
2
1 ' 0 , 9
2
2
9 ' 0 , 9
2

S S

= (4147, 14611).

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
103

Ejemplo 10:
Un ingeniero de control de la calidad midi el espesor de la pared de 25 botellas de vidrio de
2 litros. La media muestral result 405 mm y la cuasivarianza 00064. El intervalo de confianza al
90% para la variabilidad del espesor de la pared de las botellas es:
=
|
|
|

\
|


2
2
, 1
2
2
2
1 , 1
2
) 1 (
,
) 1 (


n n
s n s n
= |

\
|
=
|
|

\
|
886 ' 9
0064 ' 0 24
,
415 ' 36
0064 ' 0 24 24
,
24
2
05 ' 0 , 24
2
2
95 ' 0 , 24
2

s s
(00042, 00155).

Ejemplo 11:
En un estudio sobre la edad de los alumnos que dejan de asistir a la escuela en zonas
marginales, hemos tomado una muestra aleatoria de 73 alumnos, para los que la media de edad
asciende a 123 aos, con una desviacin tpica 114 aos. Queremos saber entre qu valores se
encuentra la desviacin tpica de la poblacin con una confianza de 095.
Como los valores de
2
n
para n = 72 no aparecen en la tabla, nos aproximaremos a los mismos
mediante los valores de la distribucin normal:
( ) ( ) 40 ' 50 12 96 ' 1
2
1
72 2
2
1
2
2
025 ' 0
2
025 ' 0 , 72
= + = + = Z
( ) ( ) 44 ' 97 12 96 ' 1
2
1
72 2
2
1
2
2
975 ' 0
2
975 ' 0 , 72
= + = + = Z
Por tanto, el intervalo de confianza para la varianza es
2 2
73 1'14 73 1'14
, (0' 97,1'88)
97' 44 50' 40
| |
=
|
\
.
Y para la desviacin tpica ( ) = 88 ' 1 , 97 ' 0 (0987 aos, 1372 aos).

Ejemplo 12:
Los estudiantes de Bachillerato de una cierta comunidad autnoma duermen un nmero de
horas diarias que se distribuye segn una ley normal de media y desviacin tpica de 3 horas.
En una muestra de 30 alumnos se ha obtenido una media de 7 horas de sueo. Halla un intervalo
de confianza al 96% para la media de horas de sueo de dicha poblacin.
|
|

\
|
+

n
Z x
n
Z x


2
1
2
1
,
|
|

\
|
+ =
30
3
7 ,
30
3
7
98 ' 0 98 ' 0
Z Z
Sabemos por la tabla de N(0, 1) que 05 ' 2
9798 ' 0
= Z y que 06 ' 2
9803 ' 0
= Z . Entonces, realizamos
la siguiente interpolacin:
( ) ( )
054 ' 2 05 ' 2
9798 ' 0 9803 ' 0
9798 ' 0 98 ' 0 05 ' 2 06 ' 2
05 ' 2
9798 ' 0 98 ' 0
05 ' 2 06 ' 2
9798 ' 0 9803 ' 0
98 ' 0
98 ' 0
= +

Z
Z
.
Entonces, el intervalo de confianza con las condiciones indicadas ser:
=
|
|

\
|
+
30
3
054 ' 2 7 ,
30
3
054 ' 2 7 (5875 horas, 8125 horas).


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
104
6.4.2.2. Intervalos de confianza para dos poblaciones independientes
(prcticamente infinitas, o finitas y muestreo con reemplazamiento):

POBLACIONES
INTERVALO DE
CONFIANZA
PARA:
INTERVALO
(expresado en la forma b a )
N( )
A A
, , N( )
B B
, ,
A
,
B
CONOCIDAS

B A

( )
B
B
A
A
B A
n n
Z x x
2 2
2
1


N( )
A A
, , N( )
B B
, ,
A

B

DESCONOCIDAS,
30 , 30 > >
B A
n n


B A


( )
B
B
A
A
B A
n
s
n
s
Z x x
2 2
2
1
+



N( )
A A
, , N( )
B B
, ,

A

B

DESCONOCIDAS,

30 , 30
B A
n n




B A

( )
B
B
A
A
B A
n
s
n
s
t x x
2 2
2
1 ,
+


g.l. 2
1 1
2
2
2
2
2
2 2

+
|
|

\
|
+
+
|
|

\
|
|
|

\
|
+
= =
B
B
B
A
A
A
B
B
A
A
n
n
s
n
n
s
n
s
n
s

N( )
A A
, , N( )
B B
, ,

A
=
B

DESCONOCIDAS


B A

( ) b t x x
B A
n n
B A

+
2
1 , 2


|
|

\
|
+
+
+
=
B A B A
B B A A
n n n n
S n S n
b
1 1
2
2 2

B( )
A A
p N , , B( )
B B
p N , ,
30 , 30 > >
B A
n n

B A
p p
( )
B
B B
A
A A
B A
n
q p
n
q p
Z p p +
2


TABLA VI

NOTAS: 1) g.l. = = nmero de grados de libertad.
2) Es de aplicacin la nota (**) de la TABLA V.
3) Adems, si o 2 +
B A
n n son mayores que 30, podemos tomar:

Z t =
,
y

Z t
N A
n n
=
+ , 2


Ejemplo 13:
Una central de transformacin de productos lcteos recibe diariamente la leche de dos
granjas A y B. Deseando estudiar la calidad de los productos recibidos, se extraen dos muestras
al azar (una procedente de cada granja) y se analiza el contenido en materia grasa, obtenindose
los siguientes resultados: Granja A: % 7 ' 8 =
A
x 02 , 1
2
=
A
s 33 =
A
n
Granja B: % 9 ' 10 =
B
x 73 , 1
2
=
B
s 38 =
B
n
Construye un intervalo de confianza del 95% para la diferencia del contenido medio en grasa
de la leche de ambas granjas.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
105
( ) ( ) = = + = +

2765 ' 0 96 ' 1 2 ' 2


38
73 ' 1
33
02 ' 1
9 ' 10 7 ' 8
975 ' 0
2 2
2
1
Z
n
s
n
s
Z x x
B
B
A
A
B A

( ) = + = = 542 ' 0 2 ' 2 , 542 ' 0 2 ' 2 542 ' 0 2 ' 2 (-2742%, -1658%).
Observemos que este intervalo no cubre el 0%, lo cual nos indica que existe diferencia
significativa entre el contenido en grasa de la leche de las dos granjas (la granja A menor
contenido graso que la granja B, evidentemente).


Ejemplo 14:
Un fabricante de televisores est desarrollando un nuevo modelo de televisor, para el que
puede utilizar dos tipos distintos de circuitos. El fabricante selecciona una muestra de 12
circuitos del primer tipo, que le dan una duracin media de 1400 horas y una =
A
s 30 horas.
Tambin selecciona otra muestra de 11 circuitos del segundo tipo, que le dan una duracin media
de 1500 h y una =
B
s 17 h. Entre qu valores podemos estimar que se encuentra la diferencia
de vida media de ambos tipos de circuitos con un nivel de confianza del 95%?
Grados de libertad 19 922 ' 18 2
12
11
17
13
12
30
11
17
12
30
2
1 1
2
2
2
2
2
2 2
2
2
2
2
2
2 2
= =
|
|

\
|
+
|
|

\
|
|
|

\
|
+
=
+
|
|

\
|
+
+
|
|

\
|
|
|

\
|
+
= =
B
B
B
A
A
A
B
B
A
A
n
n
s
n
n
s
n
s
n
s

( ) ( ) = + = +

11
17
12
30
1500 1400
2 2
975 ' 0 , 19
2 2
2
1 ,
t
n
s
n
s
t x x
B
B
A
A
B A


( ) = + = = = 06 ' 21 100 , 06 ' 21 100 06 ' 21 100 063 ' 10 093 ' 2 100
= (-12106 h, -7894 h).
La diferencia de vida media de ambos tipos de circuitos, con un nivel de confianza del 95% se
encuentra entre 78,94 horas y 121,06 horas, a favor del segundo tipo de circuito.


Ejemplo 15:
Se piensa que la concentracin del ingrediente activo de un detergente lquido para ropa est
afectada por el tipo de catalizador utilizado en el proceso de fabricacin. Por experiencias
anteriores se sabe que la desviacin tpica de la concentracin activa es siempre la misma, sin
importar el tipo de catalizador utilizado. Se toman 10 observaciones con cada catalizador y se
obtienen los siguientes datos:
Cat.1 57,90 66,20 65,40 65,40 65,20 62,60 67,60 63,70 67,20 71,00
Cat.2 66,40 71,70 70,30 69,30 64,80 69,60 68,60 69,40 65,30 68,80

Queremos hallar el intervalo de confianza al 95 % para la diferencia en la concentracin
activa bajo la presencia de ambos catalizadores.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
106
Teniendo en cuenta que las varianzas poblacionales son desconocidas pero iguales, aplicamos:
( ) b t x x
B A
n n
B A

+
2
1 , 2

con
|
|

\
|
+
+
+
=
B A B A
B B A A
n n n n
S n S n
b
1 1
2
2 2

Para el catalizador 1, tenemos 22 ' 65 =
A
x y 6776 ' 10
2
=
A
S
Para el catalizador 2, tenemos 42 ' 68 =
B
x y 4516 ' 4
2
=
B
S
Entonces, 2 ' 3 42 ' 68 22 ' 65 = =
B A
x x
2965 ' 1
10
1
10
1
2 10 10
4516 ' 4 10 6776 ' 10 10
= |

\
|
+
+
+
= b
Adems, 1009 ' 2
975 ' 0 , 18
2
1 , 2
= =
+
t t
B A
n n

.
El intervalo de confianza ser
( ) = + 2925 ' 1 1009 ' 2 2 ' 3 , 2965 ' 1 1009 ' 2 2 ' 3 (-59238, -04762).
La concentracin del ingrediente activo depende por lo tanto del catalizador: con el segundo
catalizador se consigue mayor concentracin que con el primero.




6.4.2.3. Intervalos de confianza para dos poblaciones (prcticamente infinitas, o
finitas y muestreo con reemplazamiento) que no son independientes
(datos apareados):


Hasta ahora, cuando trabajbamos con dos poblaciones (o muestras), stas se consideraban
independientes, es decir, sin correlacin entre ellas (leche de dos granjas distintas, dos tipos de
circuitos distintos, dos catalizadores distintos).

Sin embargo, hay casos en que las poblaciones (o muestras) no pueden considerarse
independientes, como cuando medimos una misma caracterstica (o variable aleatoria) en la misma
muestra antes y despus de la aplicacin de algn tratamiento o procedimiento (la administracin
de un medicamento, por ejemplo).

Si elaboramos un modelo matemtico en el que representamos por x la variable aleatoria
antes de la aplicacin del procedimiento, y por y la variable aleatoria despus de la aplicacin,
estas variables no son independientes, de aqu la necesidad de construir otro modelo distinto al
estudiado hasta ahora.

Supongamos, para concretar, que tanto x como y siguen distribuciones normales
( )
x x
N , y ( )
y y
N , , respectivamente, de las que no conocemos ni medias ni desviaciones
tpicas; sean ( )
n
x x x ,..., ,
2 1
una muestra genrica de la primera poblacin e ( )
n
y y y ,..., ,
2 1
una
muestra genrica de la segunda poblacin.

Queremos encontrar un intervalo de confianza para la diferencia de medias ( )
y x
d = .

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
107
Debemos construir la nueva variable aleatoria
i i i
y x d = , con n i ,..., 2 , 1 = , y tendremos
que calcular:

=
=
n
i
i
d
n
d
1
1
y ( )

=
n
i
i d
d d
n
s
1
2 2
1
1



Entonces, obtendramos los siguientes intervalos de confianza para la diferencia de
medias de datos apareados:

POBLACIONES
INTERVALO DE
CONFIANZA PARA:
INTERVALO
N( )
x x
, , N( )
y y
,
30 > n

y x
d =
|
|

\
|
+

n
s
Z d
n
s
Z d
d d
2
1
2
1
,


N( )
x x
, , N( )
y y
,
30 n

y x
d =
|
|

\
|
+

n
s
t d
n
s
t d
d
n
d
n
2
1 , 1
2
1 , 1
,


TABLA VII


Ejemplo 16:
Se quiere probar la efectividad de un antitrmico infantil en reducir la fiebre. Con tal fin se
tom la temperatura a diez nios de dos aos afectados de gripe, antes y despus de la
administracin del antitrmico, y los resultados fueron:
Paciente 1 2 3 4 5 6 7 8 9 10
Temperatura
(C) antes ( ) x

393

397

399

400

389

397

393

396

399

400
Temperatura
(C) despus ( ) y

381

380

383

383

379

387

383

370

369

390
Suponiendo que la caracterstica en estudio sea normal, encuentra un intervalo de confianza
del 99% para la diferencia media de temperaturas.
Se trata de datos apareados, puesto que las variables (temperaturas) se toman sobre los
mismos individuos y, por tanto, no son independientes (es decir, el valor en un individuo de una
variable nos proporciona informacin acerca del valor de la otra variable sobre el mismo
individuo).
Para construir el intervalo de confianza, pues, necesitamos conocer la tabla de las
diferencias:
Paciente 1 2 3 4 5 6 7 8 9 10
Diferencia de
temperatura (C)
y x d =

12

17

16

17

10

10

10

26

30

10
Con esta tabla calculamos

=
=
n
i
i
d d
1
10
1
=158 C y =
d
s 071 C
Entonces,
|
|

\
|
+

n
s
t d
n
s
t d
d
n
d
n
2
1 , 1
2
1 , 1
,

= =
|
|

\
|
+
10
71 ' 0
58 ' 1 ,
10
71 ' 0
58 ' 1
995 ' 0 , 9 995 ' 0 , 9
t t
( ) = + = 2245 ' 0 2498 ' 3 58 ' 1 , 2245 ' 0 2498 ' 3 58 ' 1 (085 C, 231 C).

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
108
6.4.3. Error de estimacin y tamao de la muestra

An no hemos hablado del tamao que deben tener las muestras cuando pensamos llevar a
cabo estimaciones a partir de ellas. Nos ocuparemos ahora de este aspecto e indicaremos el modo
en que puede ser determinado el tamao muestral, teniendo en cuenta el riesgo asumido en la
estimacin y el error mximo admitido (o error tolerado).

En general, la mejor muestra ser la que resulte ms pequea, pues nos ahorrar grandes
costes econmicos, de tiempo, etc. Por otra parte, si la muestra es demasiado pequea, la
precisin, el grado de confianza que deseamos tener, tal vez no sea el adecuado.

Por este motivo, es necesario determinar cul es el tamao mnimo exigido a una muestra
para poder realizar estimaciones con un nivel de confianza y un error mximo fijados.
Aunque tambin ser interesante, en ocasiones, calcular el error mximo que se comete para un
tamao muestral determinado, o tambin- hallar el nivel de confianza que tendremos para un
tamao muestral y un error determinados.

Sabemos que, cuando se realiza una estimacin del valor de un parmetro de la poblacin
mediante un intervalo de confianza, cometemos, en general (y excepto para la
2
, que no es
simtrica), un error igual en valor absoluto a b , que casi siempre depende de n.

Llamando b E = al error tpico o estndar (error mximo admitido o error tolerado),
veamos a continuacin algunas relaciones entre errores y tamaos de las muestras en algunos
casos de estimacin por intervalos ya reseados:


Tamao de una muestra para la media.
En el caso de la media, para poblaciones prcticamente infinitas,
n
Z E

2
1
.
Dado el error E
0
que, como mximo, queremos cometer, planteamos
0
2
1
E
n
Z

, de
donde n es el menor nmero natural tal que
2
0
2
2
2
1
E
Z n

.
En la prctica, cuando sea desconocida, se sustituye por la s obtenida en una muestra
aleatoria.

Ejemplo 17:
Para conocer el coste mensual medio del alquiler de una vivienda se toma una muestra de 25
viviendas, obtenindose un alquiler medio en la muestra de 880 , con una desviacin tpica de
330 . La cuasivarianza muestral es 5 ' 113437 330
24
25
2 2
= = s . El tamao muestral medio con un
intervalo de radio (error), por ejemplo, 100 , con un nivel de confianza del 95% es
578 , 43
100
5 ' 113437 96 ' 1
2
2
2
0
2 2
975 ' 0
=

n
E
s Z
n . Por tanto, tomaremos n = 44 viviendas.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
109
Tamao de una muestra para la varianza.
Si la poblacin es ( ) , N con desconocida, y el tamao de la muestra es muy grande
( ) 100 > n ,
n
s Z E
2
2
2
1
=

, y el tamao de la muestra es el menor entero n tal que


2
0
4
2
2
1
2
E
s
Z n

.
NOTA: A efectos prcticos puede estimarse
2
por
2
s o por
2
S (sin tener en cuenta la
correccin de Bessel), ya que para tamaos de la muestra muy grandes son similares.

Ejemplo 18:
Nos interesa calcular con una confianza de 099 la variabilidad de las puntuaciones alcanzadas
por alumnos universitarios en una prueba de velocidad lectora. Si con una muestra aleatoria de
alumnos hemos obtenido una varianza de 103, que nos ha permitido estimar la varianza
poblacional con un error mximo tolerado de 002, cul habr sido el tamao de la muestra?
Al ser un error muy pequeo, debemos esperar una muestra muy grande.
Tomando como estimador de la varianza la varianza muestral, tenemos
15 ' 35172
02 ' 0
03 ' 1
575 ' 2 2 2
2
2
2
2
0
4
2
995 ' 0
= =
E
S
Z n . Por tanto, el tamao de la muestra habr sido
de, al menos, 35173 alumnos.


Tamao de una muestra para la proporcin.
Para la proporcin
n
q p
Z E

=

2
1

. Por tanto, dado E
0
,
0
2
1
E
n
q p
Z

, de donde n es
el menor entero tal que
2
0
2
2
1
E
q p
Z n

.
Si no disponemos de una estimacin previa podemos utilizar que el valor mximo de q p es
4
1
25 ' 0 5 ' 0 5 ' 0 = = , por tanto
0
2
1
2
1
4
1
E
n
Z
n
q p
Z



, de donde
2
0
2
2
1
4E
Z
n

.

Ejemplo 19:
Queremos estimar la probabilidad p de que determinado tipo de grano de maz se abra al
frerlo. Se ha estudiado una muestra de 60 granos en la que se obtuvo que 48 se abran, es decir
8 ' 0
60
48
= = p . El tamao de una muestra con la que estar seguros al nivel del 90% de que el error
mximo que se cometa al estimar la proporcin sea de 001, deber ser tal que:
64 ' 4329
01 ' 0
2 ' 0 8 ' 0
645 ' 1
01 ' 0
2 ' 0 8 ' 0
2
2
2
2
95 ' 0
=

Z n . Entonces tomaremos n 4330 granos.


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
110

Ejemplo 20:
El tamao muestral necesario para estimar la proporcin de una poblacin con una
probabilidad del 997% de que el error cometido en la estimacin sea como mucho del 2%,
teniendo en cuenta que no tenemos estimacin previa sera:
=

=

5 ' 5494
02 ' 0 4
965 ' 2
02 ' 0 4 4
2
2
2
2
9985 ' 0
2
0
2
2
1
Z
E
Z
n

5495 n .


TODO LO ANTERIOR PUEDE RESUMIRSE EN LA SIGUIENTE TABLA, QUE NOS
DA EL ERROR TPICO Y EL TAMAO DE LA MUESTRA DE DISTINTOS
PARMETROS A ESTIMAR, PARA UNA NICA POBLACIN PRCTICAMENTE
INFINITA ( ) N n % 5 , O FINITA Y MUESTREO CON REEMPLAZAMIENTO:


POBLACIN PARMETRO A
ESTIMAR
ERROR TPICO O
ESTNDAR
TAMAO DE LA
MUESTRA
N( ) , ,
CONOCIDA


n
Z E

2
1

2
0
2
2
2
1
E
Z n


N( ) , ,
DESCONOCIDA,
30 > n


n
s
Z E =

2
1


2
0
2
2
2
1
E
s
Z n


B( ) p N, ,
30 > n


p
n
q p
Z E

=

2
1


2
0
2
2
1
E
q p
Z n


N( ) , ,
DESCONOCIDA,
100 > n

2

n
s Z E
2
2
2
1
=


2
0
4
2
2
1
2
E
s
Z n


TABLA VIII


Poblaciones finitas.
Cuando la muestra supera el 5% de la poblacin, sta se considera a efectos prcticos como
finita. Sin embargo, una poblacin finita en la que se realiza un muestreo con reemplazamiento
puede tericamente ser considerada como infinita, puesto que puede extraerse cualquier nmero
de muestras sin agotar la poblacin. Por ejemplo, si se extraen sucesivamente 10 bolas sin
reemplazamiento de una urna que contiene 100, se est tomando una muestra de una poblacin
finita, mientras que si se lanza una moneda al aire 50 veces, anotndose el nmero de caras, se
est muestreando en una poblacin infinita.
Cuando ocurre lo primero (que la poblacin sea finita y el muestreo sin reemplazamiento),
el error de las estimaciones, tanto para obtener el intervalo de confianza como para el tamao de
la muestra, debe quedar multiplicado por el factor
1
N n
N

.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
111
En ese caso, para hallar el tamao de la muestra para la media plantearamos
0
2
1
1
E
N
n N
n
Z

, de donde
) 1 (
2
0
2 2
2
1
2 2
2
1
+

N E Z
Z N
n

.
El intervalo de confianza para la proporcin, en el caso de poblacin finita vendra dado por
|
|

\
|



1
,
1
2
1
2
1
N
n N
n
q p
Z p
N
n N
n
q p
Z p

.

Ejemplo 21:
Seleccionamos una muestra aleatoria de 32 alumnos absentistas, pertenecientes a una
poblacin de 304 alumnos absentistas registrada en una provincia, y recogemos la edad de los
mismos, siendo 12 = x aos y
2
1' 4641 S = . Para hallar el error de estimacin de la media con
una confianza de 099, al tratarse de una poblacin finita y tomando como estimador de la
varianza poblacional la cuasivarianza muestral,
2294 ' 1 5113 ' 1 5113 ' 1 4641 ' 1
31
32
1
2 2
= = = =

= s S
n
n
s , planteamos:
53 ' 0
1 304
32 304
32
2294 ' 1
575 ' 2
1
995 ' 0
=

=
N
n N
n
s
Z E aos.


TODO LO ANTERIOR PUEDE RESUMIRSE EN LA SIGUIENTE TABLA, QUE NOS
DA EL ERROR TPICO Y EL TAMAO DE LA MUESTRA DE DISTINTOS
PARMETROS A ESTIMAR, PARA UNA NICA POBLACIN FINITA Y MUESTREO
SIN REEMPLAZAMIENTO:



POBLACIN
PARMETRO
A
ESTIMAR
ERROR
TPICO
O ESTNDAR
TAMAO
DE LA
MUESTRA
N( ) , ,

CONOCIDA




1
2
1

N
n N
n
Z E


) 1 (
2
0
2 2
2
1
2 2
2
1
+

N E Z
Z N
n



N( ) , ,
DESCONOCIDA,
30 > n




1
2
1

N
n N
n
s
Z E


) 1 (
2
0
2 2
2
1
2 2
2
1
+

N E s Z
s Z N
n




B( ) p N, ,
30 > n



p

1
2
1

N
n N
n
q p
Z E


) 1 (
2
0
2
2
1
2
2
1
+

N E q p Z
q p Z N
n


TABLA IX

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
112

NOTAS A LAS TABLAS VIII Y IX:

1) En todos los casos, el tamao de la muestra, n , puede despejarse de la expresin que
nos da el error E (y viceversa), expresin que en la mayor parte de los casos- puede
extraerse de los valores que aparecen en la TABLA V y su correspondiente segunda
nota, (**). Veamos un par de casos:
a) Si = =

n
Z E
n
Z b E
2
2
2
1
2
0
2
1



2
0
2
2
2
1
E
Z n

.
b) Si



1 1
2
2
2
1
2
0
2
1
0
N
n N
n
Z E
N
n N
n
Z E





n Z N Z n N E
2 2
2
1
2 2
2
1
2
) 1 (



(

+

N Z n N E Z
2 2
2
1
2
0
2 2
2
1
) 1 (



) 1 (
2
0
2 2
2
1
2 2
2
1
+

N E Z
Z N
n

.

2) Hemos visto que el tamao de las muestras se calcula teniendo en cuenta el parmetro
poblacional que se desea estimar. Sin embargo, en un mismo estudio es posible que nos
interese llevar a cabo estimaciones de distintos parmetros, y no por eso
trabajaremos con distintas muestras.

Lo habitual en la investigacin es calcular el tamao de las muestras referido a las
proporciones, utilizando las expresiones que aparecen en las tablas. Estas frmulas de
clculo tienen la ventaja sobre las otras (las del clculo del tamao de la muestra en la
estimacin de la media o la varianza) de que no es necesario para calcular el tamao
de la muestra- conocer ningn parmetro poblacional; incluso pueden utilizarse si no
conocemos la proporcin muestral, pues (en dicho caso) la solucin ms frecuente es
emplear el mximo producto q p , es decir, 0,50 x 0,50, que es el caso ms
desfavorable, puesto que exige una muestra de mayor tamao. Por ese motivo, las
frmulas de clculo del tamao de las muestras referido a las proporciones
pueden ser utilizadas antes de iniciar el proceso de muestreo.

En cambio, las otras frmulas, al depender de valores de la varianza poblacional (o de
su estimacin puntual a partir de la muestra), requieren o un conocimiento previo de
este parmetro de la poblacin o que la muestra hubiera sido previamente extrada y
hallado el valor del estadstico utilizado como estimador. Es decir, en dichos casos el
tamao podra calcularse solamente a posteriori, para conocer si extrajimos una
muestra de dimensiones suficientes de acuerdo con la confianza o precisin con la que
queremos trabajar.

Tanto en el caso de poblaciones infinitas como en el de poblaciones finitas, al tratar
con proporciones, el error E suele expresarse en porcentajes, que deben ser
trasladados a proporciones antes de aplicar las frmulas. As, por ejemplo, un error
del 7 % significar 07 , 0 = E .

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
113
Relacin de problemas del Tema 6.

MUESTREO:
1. A un centro de enseanza asisten 500 alumnos y se desea extraer una muestra aleatoria de ta-
mao 25. Describe la eleccin de dicha muestra en los casos de utilizar:
a) El muestreo aleatorio simple.
b) El muestreo sistemtico.
2. Una biblioteca pblica est organizada en 5 secciones, en cada una de las cuales hay un
determinado nmero de libros, como muestra la tabla:
Seccin 1 Seccin 2 Seccin 3 Seccin 4 Seccin 5
500 860 1 200 700 740

Para estimar el porcentaje de libros de edicin espaola se quiere seleccionar una muestra del
5% del nmero total de libros. Cuntos libros seleccionaremos de cada seccin?
a) A travs del muestreo estratificado.
b) A travs del muestreo estratificado controlado.
3. Para efectuar una encuesta se eligen al azar 10 provincias espaolas, a continuacin se eligen de
manera aleatoria, en cada provincia, el 20% de sus municipios y finalmente se eligen, tambin al
azar, 7 familias de cada municipio escogido. Cul es el tipo de muestreo escogido?
4. La tabla adjunta recoge datos del tamao de 800 parcelas y si
poseen chalet o no. Nos planteamos elegir una muestra de 20
parcelas para actualizar el precio de los solares, indica cmo elegir
las muestras, en el supuesto de muestreo aleatorio sin
reemplazamiento, en los siguientes casos:
a) Entre todas las parcelas.
b) Entre todas las parcelas de modo sistemtico.
c) Eligiendo parcelas de tipo mediano.
d) En proporcin a la estratificacin respecto al tamao.
5. Un centro de secundaria tiene un equipo de ftbol sala y otro de baloncesto. Los integrantes de
cada uno de los equipos son:
Ftbol sala: Pepe, Javier, Joaqun, Juanjo, Vicente, Mario, Jorge y Daniel.
Baloncesto: Luis, Antonio, David, Jess, Fernando, Lolo y Jacinto.
Un canal de televisin invita a 3 estudiantes del equipo de ftbol sala y a 2 del equipo de
baloncesto a participar en uno de sus programas. Utiliza un muestreo aleatorio simple para
seleccionar a los 5 estudiantes invitados. Explica con todo detalle el procedimiento que sigues
para dicha seleccin.
6. En cierto barrio se quieren realizar diversos estudios. Escoge el tipo ms adecuado de muestreo
segn el estudio:
a) Conocer mejor el tipo de actividad de ocio que gusta a sus habitantes.
b) Equipo de ftbol favorito.
Tamao Si No
Pequeo 80 80
Mediano 160 80
Grande 240 160
Poseen chalet
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
114
ESTIMACIN:
1. Se toma una muestra aleatoria de 64 personas en una poblacin de 100.000, de forma que una de
sus caractersticas se distribuye normalmente con parmetros 10 y 3 = = . Calcula:
a) La probabilidad de que la media de la muestra est comprendida entre 9 y 11.
b) La probabilidad de que la media de la muestra sea mayor que 11.
2. Ciertas pilas elctricas fabricadas por una compaa tienen una duracin media de 900 horas y
una desviacin tpica de 80 horas. La compaa vende todas las semanas 1000 lotes de 100 pilas
cada uno. Se pide calcular:
a) En cuntos lotes cabe esperar que la media de las duraciones sobrepase las 910 horas?
b) La probabilidad de que una muestra al azar de 64 pilas tenga una duracin media mayor de
910 horas.
3. Si se sabe que la distribucin muestral de medias para muestras de tamao 36 tiene varianza 8,
cul ser la desviacin tpica de la poblacin original?
4. Una mquina ha fabricado 800 piezas de precisin con un peso medio de 150 gramos y una
desviacin tpica de 20 gramos. Calcula la probabilidad de que una muestra de 80 piezas elegidas
al azar entre las fabricadas tenga un peso total de ms de 124 kg.
5. Sabiendo que de cada 5 personas accidentadas hay una mujer, calcula la probabilidad de que en
los prximos 200 accidentes automovilsticos:
a) Sean hombres menos del 75% de los accidentados.
b) Sean hombres ms del 84% de los accidentados.
c) El nmero de hombres est comprendido entre el 72% y el 83% de los accidentados.
6. Se sabe que el 60% de los adultos de un rea geogrfica asiste regularmente a programas
culturales. Se obtiene una muestra aleatoria de 150 adultos. Se desea conocer cul es la pro-
babilidad de que la proporcin muestral est comprendida entre los valores 0,5 y 0,7.
7. De 120 alumnos la proporcin de que tengan dos o ms hermanos es de 48/120. Encuentra los
parmetros de la distribucin a la que se ajustarn las muestras de tamao 40.
8. Renfe sabe que el tiempo de retraso de los trenes de largo recorrido sigue una distribucin
normal de media 15 minutos y desviacin tpica 3 minutos y para los trenes de corto recorrido la
media es de 25 minutos y la desviacin tpica de 5 minutos. En muestras de 150 trenes tomadas al
azar cul es la probabilidad de que la diferencia en los tiempos medios de retraso no supere los
9 minutos?
9. Las bolsas de sal envasadas por una mquina tienen 500 = g y 35 = g. Las bolsas se
empaquetaron en cajas de 100 unidades.
a) Calcula la probabilidad de que la media de los pesos de las bolsas de un paquete sea
menor que 495 g.
b) Halla la probabilidad de que una caja de 100 bolsas pese ms de 51 kg.
10. La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin
normal de media 168 m y de desviacin tpica 012 m. Cul es la probabilidad de que la media de
una muestra aleatoria de 100 alumnas sea mayor que 166 m?
11. En una prueba de aptitud la puntuacin media de los estudiantes era de 72 puntos con una
desviacin tpica de 8 puntos. Cul es la probabilidad de que dos grupos de estudiantes formados
por 50 y 70 estudiantes, respectivamente, difieran su media entre 3 y 5 puntos?
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
115
12. Los resultados de una eleccin demostraron que un cierto candidato obtuvo el 46 % de los votos.
Halla la probabilidad de que de 1000 individuos elegidos al azar de entre la poblacin votante se
obtuviera mayora de votos para dicho candidato.
13. El cociente intelectual de los alumnos de un instituto se distribuye con media 110 y desviacin
tpica desconocida. Si se sabe que el 25,46% de las muestras con reemplazamiento de 36 alumnos
tienen un cociente intelectual medio superior a 112, halla la desviacin tpica poblacional.
14. El dimetro medio interior de una muestra de 200 tubos producidos por una mquina es de 0,502
cm y la desviacin tpica es de 0,05 cm. El uso de los tubos permite una tolerancia en el dimetro
de 0,496 a 0,508 cm; si no, se considerarn defectuosos. Determina el porcentaje de tubos
defectuosos, supuesto que los tubos producidos por esa mquina estn normalmente distribuidos.
15. Las calificaciones en los exmenes de Economa que se han realizado a los 625 alumnos de cierta
facultad siguen una distribucin normal con media 53 y desviacin tpica 12.
a) Calcula la media y la desviacin tpica de la distribucin muestral de las muestras de tamao
20 que se pueden obtener.
b) Halla la probabilidad de que una muestra de tamao 100 tenga la media entre 53 y 57.
16. Los tiempos de reaccin, en milisegundos, de 17 sujetos frente a una seal fueron los siguientes:
448, 460, 514, 488, 592, 490, 507, 513, 492, 534, 523, 452, 464, 562, 584, 507, 461.
Suponiendo que el tiempo de reaccin se distribuye normalmente:
a) Determina un intervalo de confianza para la media a un nivel de significacin del 5%.
b) Calcula a un nivel de confianza del 90% un intervalo de confianza para la varianza.
c) Indica cual sera el mximo error por exceso y por defecto que podra cometerse utilizando
el estimador insesgado de la varianza.
17. La poblacin adulta de una determinada comunidad autnoma alcanza una estatura que se
distribuye segn una ley normal de media desconocida y varianza 225 cm
2
. A partir de una
muestra aleatoria de 400 adultos se ha obtenido una estatura media muestral de 175 cm.
a) Calcula un intervalo de confianza para la estatura media de la poblacin adulta de
dicha comunidad autnoma con un nivel de confianza del 96%.
b) Si queremos que el error que cometamos no supere el valor de 1 cm, con el mismo nivel
de confianza, qu tamao mnimo debera haber tenido la muestra?
18. En unas elecciones presidenciales de un determinado pas, de una muestra aleatoria de 100
votantes, 45 se declararon partidarios de un determinado candidato.
a) Halla el intervalo, con un nivel de confianza del 95%, en el cual se encuentra el
porcentaje de poblacin votante favorable a dicho candidato.
b) Si queremos que, dentro del mismo nivel de confianza, el porcentaje de votantes
favorables a este candidato no difiera del de la muestra en ms de un 1%, de qu
tamao como mnimo debera ser la muestra?
19. Para una muestra de 81 alumnas de 2 de Bachillerato se obtuvo una estatura media de 165 cm. Si
se sabe que la desviacin tpica poblacional es de 8 cm:
a) Entre qu valores podemos considerar comprendida la altura media de esta poblacin
con un nivel de confianza del 92%?
b) Qu tamao muestral sera necesario, con el mencionado nivel de confianza, si se
admite un error mximo de 1 cm?
20. Una compaa produce bolas de cojinetes de peso medio 638 g y desviacin tpica 012 g. Halla los
lmites de confianza al 95% para los pesos de lotes de 100 bolas cada uno.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
116
21. La media de los dimetros de una muestra de 150 remaches manufacturados por una cierta
empresa es de 0750 cm. Si sabemos que la desviacin tpica de todos los remaches fabricados
por dicha empresa es de 0047 cm, a) halla los lmites de confianza al 99% para el dimetro medio
de todos los remaches producidos; b) si ahora queremos que con el mismo nivel de confianza- el
error no supere los 0005 cm, de qu tamao mnimo debera ser la muestra?
22. Para determinar la ratio de alumnos por aula en los centros educativos de una localidad se ha
elegido una muestra aleatoria de 26 aulas. Para esa muestra, la media es 28 y la varianza 5,29.
Entre qu valores se encuentra la ratio media de la localidad, con una confianza del 99%?
23. Al medir el coeficiente de inteligencia en una muestra de 27 alumnos de Educacin Especial, se
observa una media de 70 y una desviacin tpica de 3. Suponiendo que esta variable se distribuye
normalmente en la poblacin, entre qu lmites se encuentra la varianza de la poblacin de
alumnos de Educacin Especial, con una confianza del 95%?
24. Los gastos mensuales de las familias de un municipio se distribuyen normalmente. Seleccionamos
al azar a 30 familias y obtenemos como media 1.500 de gastos y desviacin tpica 300 .
Encuentra un intervalo de confianza para la media de gastos con un nivel de significacin del 10%.
25. Los sueldos en un municipio se distribuyen normalmente. Se ha seleccionado al azar a 25 personas
y se obtiene una desviacin tpica de 100 . Encuentra un intervalo de confianza para la
desviacin tpica poblacional de los sueldos a un nivel de confianza del 90%.
26. Se ha tomado una muestra de los precios de un mismo producto en 16 comercios, elegidos al azar
en un barrio de una ciudad, encontrndose los siguientes precios (en euros):
95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103 y 110.
Suponiendo que los precios de este producto se distribuyen segn una ley normal de varianza 25 y
media desconocida, cul es la distribucin de la media muestral? Determina el intervalo de
confianza, al 95%, para la media poblacional.
27. La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 175 m. Se
sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una
distribucin normal con varianza 016.
a) Construye un intervalo, de un 95% de confianza, para la media poblacional.
b) Cul sera el mnimo tamao muestral necesario para que la media poblacional est a
menos de 2 cm de la media muestral con un nivel de confianza del 90%?
28. Se desea estimar la proporcin, p , de individuos daltnicos de una poblacin a travs del
porcentaje observado en una muestra aleatoria de individuos, de tamao n .
a) Si el porcentaje de individuos daltnicos en la muestra el del 30%, calcula el valor de
n , para que, con un nivel de confianza de 095, el error cometido en la estimacin sea
inferior al 31%.
b) Si el tamao de la muestra es de 64 individuos, y el porcentaje de individuos
daltnicos en la muestra es del 35%, determina, usando un nivel de significacin del
1%, el correspondiente intervalo de confianza para la proporcin de daltnicos en la
poblacin.
29. Las alturas de 100 estudiantes varones de un universidad, que representan una muestra aleatoria
de los 1.546 estudiantes de la misma, tienen una media de 171 cm y una desviacin tpica de 74
cm. Halla el intervalo de confianza para la media con un nivel de significacin del 1%.
30. La nota media de 300 estudiantes de Estadstica es de 57 con una desviacin tpica de 18.
Calcula el tamao muestral necesario para que se cometa un error mximo de 1 punto con un nivel
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
117
de significacin del 2%.
31. En dos grupos similares de pacientes, A y B, con 50 y 100 individuos, respectivamente, se
suministr al A un nuevo tipo de somnfero y al B uno convencional. Para los del grupo A el nmero
medio de horas de sueo fue de 782 horas y desviacin tpica 024 horas. Para los del grupo B,
675 y 030 horas, respectivamente. Halla el intervalo de confianza al 99% de la diferencia de
medias.
32. Una muestra al azar de 50 notas de matemticas de entre un total de 200, revela una media de
75 y una desviacin tpica de 1.
a) Halla el intervalo de confianza al 80%.
b) Con qu nivel de confianza afirmaremos que la media de las 200 notas est entre 74 y 76?
33. Una muestra de 200 tuercas de cierta mquina prob que 15 eran defectuosas, mientras que una
muestra de 100 tuercas de otra mquina dio 12 defectuosas. Halla los lmites de confianza al
9973% para la diferencia de proporciones de tuercas defectuosas de las dos mquinas.
34. Un fabricante de bombillas sabe que la desviacin tpica de la duracin de bombillas es 100 horas.
Calcula el tamao de la muestra para tener una confianza del 95% de que el error de la duracin
media que se calcule sea menor que 10 horas.
35. Al medir el tiempo de reaccin, un psiclogo estima que la desviacin tpica del mismo es de 05
segundos. Cul ser el nmero de medidas que deber hacer para que sea del 99% la confianza
de que el error de su estimacin no exceda de 01 segundos?
36. En una muestra de 50 jvenes encontramos que la dedicacin media diaria de ocio es de 400
minutos y su desviacin tpica de 63 minutos. Qu tamao debe tener una muestra con un nivel
de confianza del 95% para que el error mximo en la estimacin de la media sea de 80 minutos.
37. En una lnea de produccin sabemos que la proporcin de objetos defectuosos es del 5%. De qu
tamao debemos tomar una muestra para tener una confianza del 95% de que la proporcin
estimada no difiere de la verdadera en ms de un 2%?
38. De una poblacin normal con desviacin tpica 8 extraemos una muestra aleatoria simple. Se sabe
que la probabilidad de cometer un error de 392 o ms al estimar la media mediante la media
muestral es 005. Qu tamao debe tener la muestra?
39. Con una muestra de 2000 personas se obtuvo que en el ao pasado el gasto medio anual en
alimentacin por persona fue de 2550 , con una desviacin tpica de 870 . Construye un
intervalo del 95% para esta caracterstica en la poblacin espaola.
40. Extraemos una muestra de 81 alumnos universitarios y recogemos su media de ingresos
mensuales, obtenindose 300 (trescientos euros). Si sabemos que la varianza de los ingresos
mensuales es, en la poblacin de alumnos universitarios, de 10000 (euros al cuadrado), cules
sern los lmites entre los que se halla el nivel medio de ingresos de los alumnos universitarios con
una confianza del 95%? De qu tamao mnimo debera ser la muestra para que, con el mismo
nivel de confianza, la media poblacional no se separe en ms de 15 (quince euros) de la media
muestral?
41. Para determinar la ratio de alumnos por aula en los centros educativos de una provincia elegimos
una muestra aleatoria de 26 aulas y calculamos su media, 28, y su varianza, que vale 529. Entre
qu valores se encuentra la ratio media de la provincia, con una confianza del 99%?
42. Los gastos mensuales de las familias de un determinado pas europeo se distribuyen normalmente.
Si seleccionamos aleatoriamente 25 familias y obtenemos como media 2000 euros de gastos y
desviacin tpica 350 euros, halla un intervalo de confianza para la media de los gastos mensuales
de las familias de dicho pas, con un nivel de confianza del 90%.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
118

43. La poblacin adulta de un determinado municipio asciende a 2000 habitantes, y alcanza una
estatura que se distribuye segn una ley normal de media desconocida y desviacin tpica 15 cm.
A partir de una muestra aleatoria de 400 adultos se ha obtenido una estatura media muestral
de 171 cm.
a) Calcula un intervalo, con un nivel de confianza del 96%, para la estatura media de la
poblacin adulta de dicho municipio.
b) Con este mismo nivel de riesgo (4%), qu tamao muestral mnimo sera necesario si
se admite un error estndar mximo de 1 cm?
44. La edad media de 26 estudiantes de una cierta Universidad, elegidos al azar, es de 22 aos, con
una desviacin tpica de 3 aos. Suponiendo que la variable edad se distribuye normalmente:
a) Entre qu valores se encuentra la desviacin tpica de la edad de dicha poblacin
universitaria, con una confianza del 98%?
b) Cul es el intervalo de confianza, con el mismo nivel de confianza del 98%, para la edad
media de la referida poblacin universitaria?
45. Al medir el C.I. en una muestra de 27 alumnos de Educacin Especial, se observa una media de 70
y una desviacin tpica de 3. Suponiendo que esta variable se distribuye normalmente en la
poblacin, entre qu lmites se encuentra la varianza de la poblacin de alumnos de Educacin
Especial, con una confianza de 0,95?
46. Las ventas mensuales de una conocida tienda de electrodomsticos que lleva diez aos abierta al
pblico se distribuyen segn una ley normal, con desviacin tpica 900 . En un estudio estadstico
de las ventas realizadas en los ltimos nueve meses, se ha encontrado un intervalo de confianza
para la media mensual de ventas cuyos extremos son 4663 y 5839 .
a) Cul ha sido la media de las ventas en estos nueve meses?
b) Cul es el nivel de confianza para este intervalo?
c) Si, con el mismo nivel de confianza del apartado anterior, hubisemos pretendido que el
error en la estimacin de la media mensual de ventas no superase los 500 , durante
cuntos meses deberamos haber realizado el estudio?
47. En una campaa electoral se considera a priori que determinado candidato cuenta con un apoyo
cifrado entre el 50% y el 70% de los votantes. Para estimar con mayor precisin (error del 5%) el
porcentaje de apoyo, se realiza un sondeo sobre una muestra aleatoria de votantes. Cul deber
ser el tamao de la muestra, si queremos llevar a cabo la estimacin con una confianza de 0,95?
48. En una poblacin de 12269 profesores no universitarios, pretendemos extraer una muestra
necesaria para llevar a cabo determinado estudio. Si queremos trabajar con un nivel de confianza
del 99% y un error tolerado del 3%, cul debe ser el tamao de la muestra?
49. Una empresa farmacutica ha elaborado un nuevo medicamento contra el colesterol en sangre y lo
ha probado en diez pacientes, obteniendo los siguientes resultados (medidos en mg por 100 ml):
Paciente 1 2 3 4 5 6 7 8 9 10
Antes 217 252 229 200 209 213 215 260 232 216
Despus 209 241 230 208 206 211 209 228 224 203
Construye un intervalo de confianza del 95% para la diferencia de contenido medio de colesterol
en sangre antes y despus del tratamiento.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
119
7. Contrastes de hiptesis.

7.1. Introduccin.

Ya hemos comentado que las dos vas a travs de las cuales podemos llevar a cabo inferencias
estadsticas son la estimacin de parmetros y el contraste de hiptesis. Nos centraremos ahora
en los contrastes de hiptesis.

Cuando tratbamos la estimacin de parmetros, intentbamos obtener un valor o un intervalo
de valores que constituyesen la mejor estimacin del parmetro desconocido a partir de la
informacin muestral, del correspondiente estadstico. Muy a menudo, en la prctica, se trata de
utilizar los datos obtenidos a partir de una muestra para tomar una decisin sobre la poblacin.

Se llama contraste (o prueba, test o ensayo) de hiptesis al procedimiento que permite
comprobar ciertas afirmaciones (hiptesis) que realizamos sobre una poblacin, referidas a sus
parmetros o a la forma en que dicha poblacin se distribuye. Este procedimiento tambin recibe
los nombres de prueba (ensayo o test) de significacin o regla de decisin. Mediante este tipo
de pruebas (o contrastes) podremos decidir acerca del ajuste de las distribuciones observadas a
distribuciones tericas, la existencia de diferencias entre grupos, relaciones entre variables, etc.
Tales decisiones se llaman decisiones estadsticas. Hay que tener en cuenta que estas decisiones
estn tomadas sobre una base probabilstica, es decir, el acierto o error de la decisin se mide
cuantitativamente en trminos de probabilidad.

As, podran aplicarse pruebas de significacin (contrastes de hiptesis) para decidir, a
partir de los datos obtenidos del muestreo, por ejemplo, si las puntuaciones obtenidas en un
determinada prueba por un grupo de alumnos se distribuyen siguiendo el modelo de distribucin
de la curva normal; si un frmaco nuevo es realmente efectivo para el tratamiento de una
enfermedad; si un mtodo de aprendizaje es mejor que otro; si existe una relacin significativa
entre el nivel de atencin de los alumnos y las calificaciones escolares que consiguen; si unos
nuevos productos manufacturados son mejores que los fabricados con anterioridad; si hay
diferencias de rendimiento econmico entre dos determinadas estrategias de mercado; etc.

Para realizar un contraste de hiptesis es necesario seguir un proceso cuyos pasos
trataremos de presentar a lo largo de este tema. La informacin a partir de la cual tratamos de
llegar a resultados relativos a una poblacin es, como en el caso de la estimacin de parmetros,
la que procede de muestras extradas de esa poblacin.

Supongamos que estamos realizando una investigacin del tipo que sea y queremos ver si un
procedimiento nuevo recientemente descubierto es mejor que el que se ha estado siguiendo hasta
ahora. Entonces adoptaremos lo que en Estadstica se denomina una hiptesis cero (o hiptesis
nula), es decir, supondremos que no hay una diferencia real entre el nuevo procedimiento y el
antiguo. Supondremos provisionalmente que los resultados muestrales obtenidos por el nuevo
procedimiento podran haberse obtenido con la misma poblacin con el procedimiento normal.
Entonces resultara que el procedimiento nuevo habra producido simplemente una muestra de
calidad superior. Habra, entonces, que calcular la probabilidad de que el procedimiento habitual
nos d una muestra tan buena como la que hemos obtenido con el procedimiento recin
descubierto. Si comprobramos que esa probabilidad es muy pequea, aunque la muestra fuese
pequea, rechazaramos la hiptesis cero, por ser muy poco probable, y concluiramos que el
nuevo procedimiento es realmente superior. En cambio, si se demostrara que el procedimiento
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
120
normal puede producir una muestra como esa con relativa frecuencia, sera precipitado afirmar
inmediatamente que el nuevo procedimiento es superior.

Cuando un resultado tiene muy poca probabilidad de darse por azar decimos que es
estadsticamente significativo, que quiere decir sencillamente que sera muy raro que se debiera
al azar y que debe reconocerse que la diferencia entre uno y otro procedimiento es real. Como el
juicio se basa en la probabilidad, expresamos el nivel de significacin (probabilidad) que ponemos
en la realidad de la diferencia, clasificndola como probablemente significativa, significativa
o muy significativa, segn el nivel de probabilidad con que emitamos el juicio. As, por ejemplo,
un resultado que aparece por simple azar en una prueba de cada veinte ser probablemente
significativo; uno que aparece slo por azar en una prueba de cada cien ser significativo; si se
da en una de cada mil ser muy significativo. Es mejor, por supuesto, no utilizar simplemente
estas palabras, sino indicar el nivel de probabilidad de que el resultado ocurra por azar,
05 ' 0 = p , 01 ' 0 = p , 001 ' 0 = p . Estas probabilidades reciben el nombre de nivel de significacin
de la decisin estadstica que tomemos.

Qu puntos prcticos se desprenden de todo esto? Ante todo, no debera presentarse nunca
de hecho una cuestin que exija una decisin basada nicamente en una prueba de significacin
(contraste de hiptesis) estadstica. Las consideraciones prcticas deben ocupar siempre el
primer lugar. No podemos olvidar nunca el sentido comn y otros factores importantes que no
entran en la Estadstica. La Estadstica prctica es slo una de las muchas herramientas.

La importancia de las consideraciones ajenas a la Estadstica quedar patente considerando,
por ejemplo, el siguiente caso hipottico: Supongamos que, tras una buena investigacin, un nuevo
procedimiento nos da resultados muy significativos ( ) 001 ' 0 = p . Antes de reemplazar el
procedimiento actual por el nuevo, hay que tener en cuenta una serie de cosas. En primer lugar, la
alta significacin estadstica se relaciona slo con la realidad de la diferencia entre nuestro
nuevo procedimiento y el que est en vigor. Pero una diferencia real puede ser tambin muy
pequea. No slo tendramos que mostrar que nuestro nuevo procedimiento es significativo desde
el punto de vista estadstico, sino tambin que es importante la diferencia prctica. La magnitud
de la diferencia depender, entre otras cosas, de lo difcil y costoso que resulte el cambio del
proceso. De modo que la eleccin de los niveles de significacin implica tomar en cuenta no slo el
grado de certeza estadstica propia, sino adems las posibilidades econmicas y prcticas.
Primero hay que determinar lgicamente la realidad de la diferencia y luego estimar su magnitud
e importancia prctica.

Es fcil comprender que no hay posibilidad alguna de alcanzar una certeza absoluta en ninguna
prueba de significacin estadstica (contraste de hiptesis). Siempre existirn los dos riesgos del
muestreo, a saber: concluir que existe una diferencia real entre los dos procedimientos cuando,
en realidad, no es as, o concluir que no existe tal diferencia cuando verdaderamente existe.

Como una buena primera aproximacin a los contrastes de hiptesis, podemos utilizar el
concepto de error tpico (o standard) de una estimacin, definido en el tema anterior, al
tratar sobre la estimacin de parmetros de la poblacin (pgina 95) como la desviacin tpica
de la distribucin muestral correspondiente. Debemos saber que son relativamente raras las
desviaciones mayores de dos desviaciones tpicas (aproximadamente una de cada veinte pruebas
con muestras tomadas al azar, 05 ' 0 = p ). Es evidente que tenemos aqu una primera forma de
verificar la significacin estadstica de la diferencia entre los estadsticos muestrales.
Consideraremos, pues, probablemente significativa una diferencia mayor de dos errores tpicos,
es decir, poco susceptible de ser originada por el azar y, por consiguiente, indicadora de una
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
121
diferencia real entre los parmetros de las dos poblaciones de donde provienen las muestras. Una
diferencia de tres o ms errores tpicos se considera decididamente significativa, con una
probabilidad de que una diferencia tan grande aparezca en el muestreo por azar de menos del
05% ( 005 ' 0 < p ). Veamos esto con un par de ejemplos:

Ejemplo 1:
En los Estados Unidos, la amplitud torcica media en 74459 hombres, clasificados como
Grado I, con motivo del examen mdico para el servicio militar, fue de 358 pulgadas, con una
desviacin tpica para el grupo de 194 pulgadas. En 2146 hombres, clasificados como Grado IV, la
amplitud media fue de 348 pulgadas, con una desviacin tpica para este grupo de 201 pulgadas.
Existe una diferencia significativa entre los dos Grados?

044 ' 0
2146
01 ' 2
74459
94 ' 1
2 2 2 2
= + = + =

IV
IV
I
I
x x
n n
IV I

pulgadas, y ste es el error tpico de la
diferencia de medias.
Por otra parte, 1 8 ' 34 8 ' 35 = =
IV I
x x pulgada, ms de veinte veces su error tpico.
La conclusin es que la diferencia observada entre las dos medias muestrales, aunque no es
muy grande, es muy significativa.


Ejemplo 2:
Los datos sobre el tratamiento de la difteria con antitoxina en el hospital City of Toronto
correspondientes al primer decenio del siglo XX son:
Tratamiento Casos Muertes
Antitoxina (A) 228 37
Convencional (B) 337 28
Se debe concluir que la mayor frecuencia de
muertes en el grupo tratado con antitoxina es
insignificante?
Tenemos que 162 ' 0
228
37
= =
A
p , 228 =
A
n , 083 ' 0
337
28
= =
B
p y 337 =
B
n .
Suponiendo la poblacin de infectados distribuida normalmente, si calculamos el error tpico
de la diferencia de proporciones, obtenemos:
( ) ( )
029 ' 0
337
083 ' 0 1 083 ' 0
228
162 ' 0 1 162 ' 0
=

+

=

=
B
B B
A
A A
n
q p
n
q p

Si ahora calculamos la diferencia de las proporciones muestrales, obtenemos que
079 ' 0 083 ' 0 162 ' 0 = =
B A
p p , que es ciertamente muy significativa, casi igual a tres errores
tpicos. La probabilidad de que una diferencia tan grande se deba al azar es muy pequea y es
preciso concluir que el tratamiento con antitoxina influy en el hecho de que la mortalidad fuera
mayor.

Llegados a este punto, hay que olvidar la Estadstica como tal y echar mano del sentido
comn. Segn estos datos, se debe concluir necesariamente que el tratamiento con antitoxina
fue malo? No hay que sacar conclusiones generales de casos particulares sin tener en cuenta los
peligros que entraa ese proceder. No quiere decir que no haya que prestar atencin a esos
casos. Lo primero que nos debemos preguntar es si los dos grupos corran el mismo riesgo. No
sucedera que los tratados con antitoxina eran los ms graves? En situaciones semejantes no se
pueden extraer conclusiones vlidas sea cual sea la significacin de la diferencia en la tasa de
mortalidad, a menos que el riesgo y el tratamiento sean iguales. Lo nico que reflejar la
significacin estadstica es la desigual exposicin al riesgo. Mientras no se tenga una respuesta
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
122
satisfactoria a estas preguntas, no es posible afirmar nada sobre la significacin prctica de los
datos. Exactamente iguales tienen que ser las precauciones cuando los datos son favorables para
una vacuna o tratamiento determinados. Bien pudiera ser, por ejemplo, que la parte de la
poblacin que se vacuna voluntariamente constituye un grupo menos expuesto al riesgo en virtud
de su mayor educacin, mejor alimentacin, vestido y vivienda adecuados... Por otra parte, la
confianza que ponemos en los tratamientos de inmunizacin y en la variedad de antitoxinas, se
basa en gran parte en experimentos hechos con animales y no es raro que uno se pregunte hasta
qu punto sern vlidas para los seres humanos esas conclusiones. Es verdad sin duda que el
mayor avance en la lucha contra las enfermedades infecciosas ha sido el aumento, en general, del
nivel de vida. Al eliminarse en gran parte el hacinamiento, contar con un sistema ms civilizado de
alcantarillado, extenderse el uso del jabn y proteger a los nios contra la explotacin del
trabajo en condiciones precarias y al alimentarlos adecuadamente, no es sorprendente que
desaparezcan de nuestro entorno muchas de esas enfermedades, con tratamientos o sin ellos



7.2. Hiptesis estadsticas.

En cualquier estudio sobre algn aspecto de la realidad, nos planteamos interrogantes a los
que tratamos de dar respuesta. En la indagacin sobre dichos interrogantes, formulamos
hiptesis, que no son sino posibles soluciones o respuestas a los problemas planteados. Tales
hiptesis permanecern en el terreno de la conjetura hasta tanto no sean comprobadas.

La estadstica permite comprobar hiptesis cientficas a partir de los datos recogidos de un
problema, pero para ello es necesario que tales hiptesis sean formuladas en trminos
estadsticos. Es decir, las hiptesis cientficas tienen que ser expresadas para ser operativas-
en forma de afirmaciones sobre parmetros. Por tanto, en una prueba de decisin estadstica,
no contrastamos directamente las hiptesis cientficas, sino que trabajamos con hiptesis
estadsticas, que son una traduccin de aqullas. Tras comprobar la hiptesis estadstica,
podemos inferir que la hiptesis cientfica queda validada.


Las hiptesis estadsticas son proposiciones sobre los parmetros de la poblacin (media,
proporcin, varianza, diferencia de medias, etc.) o sobre su distribucin. Cuando llevamos a cabo
un contraste de hiptesis, estamos trabajando con una hiptesis llamada hiptesis nula, que
simbolizamos por
0
H . Junto a sta, consideramos la denominada hiptesis alternativa,
opuesta a la anterior, simbolizada por
1
H . Veamos en qu consiste cada una de ellas:

a) Hiptesis nula ( )
0
H : Generalmente, niega la hiptesis cientfica que queremos someter a
contraste, de ah su denominacin como nula. Por ejemplo, si se quiere decidir sobre si
un medicamento es mejor que otro, se formula la hiptesis de que no hay diferencia entre
los medicamentos a comparar. Otro ejemplo: si se quiere decidir si una moneda est
cargada (esto es, trucada, amaada), se formula la hiptesis de que la moneda est bien,
es decir, que la probabilidad de obtener cara es 5 , 0 = p ( 5 , 0 :
0
= p H ). Se denomina
as, nula, porque, por ejemplo, en el caso de la moneda, si fuera cierta, 0 5 , 0 = p . La
hiptesis nula puede afirmar, por ejemplo, que no existe relacin entre dos variables, que
no existen diferencias entre dos distribuciones, etc., atribuyendo al azar cualquier
posible relacin o diferencia observada.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
123
b) Hiptesis alternativa ( )
1
H : Cualquier hiptesis que difiera de una hiptesis nula dada se
llama hiptesis alternativa. Por ejemplo, en el caso de la decisin sobre si una moneda est
cargada o no, hiptesis alternativas son: 8 , 0 = p ; 5 , 0 p ; 5 , 0 > p ; etc. En definitiva,
la hiptesis alternativa afirmara que las relaciones, diferencias, etc. observadas no son
debidas al azar y, por tanto, resultan estadsticamente significativas.

Puesto que cada una de estas hiptesis afirma lo contrario que la otra, es incompatible que
ambas sean ciertas. Por tanto, si llegamos a la conclusin de que la hiptesis nula no se cumple,
podremos afirmar que se cumple la hiptesis alternativa. Y, a la inversa, si mantenemos la
hiptesis nula, tendremos que considerar que la hiptesis alternativa no se cumple. En general, la
hiptesis cientfica queda confirmada cuando rechazamos la hiptesis nula y, por consiguiente,
aceptamos la hiptesis alternativa.

En definitiva, las pruebas de significacin estadstica (contrastes de hiptesis) tienen como
objetivo el contrastar la verdad o falsedad de la hiptesis nula. Ahora bien, la hiptesis nula no
es ms que un medio del que nos valemos para comprobar la hiptesis alternativa, ya que, si
conseguimos rechazar la hiptesis nula, estaremos aceptando la hiptesis alternativa.


7.3. Tipos de contrastes.

Los contrastes de hiptesis pueden clasificarse en dos grandes clases:

- Contrastes paramtricos: establecen hiptesis sobre los valores de los parmetros
de una o ms poblaciones de distribucin conocida. Por ejemplo, la media de una
poblacin normal es 7 ( ) 7 :
0
= H , la diferencia de proporciones de dos poblaciones
binomiales es menor o igual que 0,05 ( ) 05 , 0 :
0

B A
p p H , etc.

- Contrastes no paramtricos: establecen otro tipo de hiptesis. Por ejemplo, el ajuste
de la poblacin a un modelo de distribucin determinada (normal, binomial, etc.), la
homogeneidad o heterogeneidad de poblaciones, la dependencia o independencia
entre dos variables de una misma poblacin, etc.

En definitiva, los contrastes de tipo paramtrico requieren del conocimiento de la
distribucin o distribuciones de las poblaciones en estudio (generalmente distribuciones
normales); en cambio, los contrastes de tipo no paramtrico no hacen ningn tipo de suposicin
acerca de la forma exacta de las poblaciones de las que fueron extradas las muestras (a
menos que sea esa forma lo que precisamente se quiere contrastar) y, a lo sumo, se exige que la
distribucin sea continua, o simtrica, pero no se llega a predeterminar la forma de la
distribucin, como ocurre cuando se exige, por ejemplo, que sta se adapte a la curva normal.


7.4. Estadstico de contraste.

En la estimacin de parmetros, para hacer inferencias sobre las poblaciones, nos
basbamos en la informacin aportada por muestras. Esto es tambin as en el caso del contraste
de hiptesis. Para contrastar las hiptesis estadsticas, nos apoyamos en algn estadstico
calculado a partir de los datos que poseemos de muestras extradas de las poblaciones en
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
124
estudio. Al estadstico utilizado se le denomina estadstico de contraste. Es decir, un
estadstico de contraste (o estadstico de prueba, T) es una funcin de los datos muestrales que
nos permitir decidir si aceptamos o rechazamos
0
H .

Siempre que se cumplan ciertos supuestos, podemos conocer la distribucin muestral del
estadstico de contraste (T). A partir de dicha distribucin muestral cuando consideramos
cierta la hiptesis nula, podremos tomar decisiones sobre dicha hiptesis (aceptarla, o rechazarla
y entonces- considerar cierta la hiptesis alternativa).

Como acabamos de afirmar, para conocer la distribucin muestral del estadstico de
contraste, es necesario contar con ciertos supuestos. Habitualmente, estos supuestos se
refieren a dos aspectos:

a) Caractersticas de los datos: Se trata de condiciones que deben cumplir los datos,
como, por ejemplo, conocer o no la varianza poblacional (en el caso de contrastes para
la media desconocida de dicha poblacin) o la media poblacional (en contrastes para la
varianza poblacional desconocida), cumplir el supuesto de independencia (en
contrastes de comparacin de dos poblaciones), etc.

b) Forma de la distribucin de partida: Es frecuente, en las pruebas de decisin
estadstica paramtricas (o contrastes de hiptesis paramtricos), suponer una
determinada distribucin (generalmente la distribucin normal) en la poblacin en
estudio.

Cuando se incumplen los supuestos asumidos en el contraste de hiptesis, no podemos estar
completamente seguros de que las conclusiones que saquemos (y, por tanto, las decisiones que
tomemos) sern vlidas y, consecuentemente, sera preferible no utilizar dicho estadstico de
contraste. No obstante, en ciertos casos, el incumplimiento de los supuestos no acarrea
problemas demasiado graves.


ESTADSTICO DE
CONTRASTE ( ) T
DISTRIBUCIN DE
PROBABILIDAD
n
x
T


=

Z (normal tipificada),
N(0, 1)
n
pq
p p
T

=

Z (normal tipificada),
N(0, 1)
n
s
x
T

=

t de Student
2
2
2
2
) 1 (

nS s n
T =

=
2
de Pearson
TABLA X:
PRINCIPALES ESTADSTICOS DE CONTRASTE PARAMTRICO
PARA UNA NICA POBLACIN
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
125

7.5. Decisin estadstica. Contrastes bilaterales y unilaterales.

Cuando se realiza un test de hiptesis y se acepta la afirmacin inicial, no quiere decir que
hayamos probado, en el sentido matemtico estricto, dicha afirmacin, puesto que sta puede ser
rechazada por los datos de otra muestra. Para probarla deberamos ver que todos los individuos
de la poblacin verifican dicha hiptesis (y eso es lo que queremos evitar con el muestreo, por
razones econmicas, de tiempo, de destruccin del material, etc.). Lo que s podemos argumentar
es que las discrepancias que existen entre los datos observados y los valores que se esperaban se
deben al azar.

Suponiendo que la hiptesis nula es cierta, podramos basarnos en la distribucin muestral del
estadstico de contraste para saber cul es el valor esperado para esa distribucin. En la medida
en que el valor observado para una muestra aleatoria se aproxime al valor que cabra esperar si la
hiptesis nula es cierta, habremos obtenido un resultado compatible con dicha hiptesis nula. Si,
por el contrario, encontramos para una muestra aleatoria un valor del estadstico de contraste
que se aleja del valor que cabra esperar, habremos obtenido un resultado poco probable bajo el
supuesto de que la hiptesis nula sea cierta, y podramos dudar de la veracidad de sta.

Por tanto, en caso de que el valor generado por la muestra sea compatible con la hiptesis
nula, mantendremos dicha hiptesis como cierta. En caso contrario, rechazaremos la hiptesis
nula y aceptaremos la hiptesis alternativa. Es decir, la decisin estadstica consiste en aceptar
o rechazar la hiptesis nula en funcin de los resultados obtenidos al calcular el valor del
estadstico de contraste para una muestra aleatoria extrada de la poblacin (o dos muestras de
sendas poblaciones en el caso de querer comparar dichas poblaciones).

Esto es, si, suponiendo cierta una determinada hiptesis,
0
H , encontramos que los resultados
observados en una muestra al azar difieren marcadamente de aqullos que cabra esperar con la
hiptesis
0
H y con la variacin propia del muestreo, diremos que las diferencias observadas son
significativas y estaramos en condiciones de rechazar la hiptesis
0
H (o, al menos, no
aceptarla de acuerdo con la evidencia obtenida).

Lo primero que debemos hacer es fijar un cierto intervalo dentro del cual es normal que haya
variaciones en el estadstico de contraste, es decir, una regin tal que, si el estadstico de
contraste se mantiene en dicho intervalo, seguimos aceptando
0
H , pues esas pequeas
variaciones son debidas al azar. Ese intervalo o regin se denomina regin de aceptacin, y ser
mayor o menor dependiendo del nivel de confianza, 1 , que precisemos. La regin que queda
fuera de la regin de aceptacin indica que, en este caso, las variaciones no pueden ser atribuidas
al azar y, por tanto, hemos de rechazar
0
H y aceptar
1
H . Tal regin se llama regin crtica o
de rechazo. Los valores del estadstico de contraste que delimitan la regin de rechazo se
denominan valores crticos.

Puesto que conocemos la distribucin muestral del estadstico de contraste, podemos hablar
de las regiones de aceptacin y de rechazo (o crtica) en trminos de probabilidad. A la
probabilidad de que una muestra aleatoria genere un valor para el estadstico de contraste que se
encuentre dentro de la regin de rechazo la llamamos nivel de riesgo o de significacin y suele
nombrarse mediante la letra . A la probabilidad de que la muestra genere un valor del
estadstico de contraste que se site fuera de la regin de rechazo (es decir, dentro de la regin
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
126
de aceptacin) se le denomina nivel de confianza (que coincide con el nivel de confianza
estudiado en la estimacin por intervalos) y se representa, lgicamente, por 1 .


Veamos todos estos conceptos de manera ms esquemtica:

- Regin de aceptacin ( )
A
R : intervalo de valores para el estadstico muestral que
hace que aceptemos
0
H con probabilidad 1 .
- Regin crtica o de rechazo ( )
C
R : intervalo complementario al anterior, con
probabilidad .
- Nivel de confianza ( ) 1 : representa la probabilidad que deseamos tener de
aceptar
0
H cuando es cierta. Nos da la probabilidad de la regin de aceptacin bajo
la hiptesis nula.
- Nivel de significacin ( ) : representa la probabilidad de rechazar
0
H cuando es
cierta y es la complementaria del nivel de confianza. Nos da la probabilidad de la
regin crtica bajo la hiptesis nula. Como ya vimos en la introduccin de este tema
(apartado 7.1., pgina 120), representa la probabilidad de que un determinado
resultado ocurra slo por azar y sus tres valores ms utilizados son 0001 (resultado
muy o altamente- significativo), 001 (resultado significativo) y 005 (resultado
probablemente significativo). Los resultados significativos a un nivel superior a 005
( ) 05 ' 0 > se consideran no significativos.



Por otra parte, a la hora de plantear los contrastes de hiptesis hemos de distinguir entre
dos tipos de contrastes, segn se nos presente la regin de rechazo:

a) Contrastes bilaterales o de dos colas: la hiptesis nula es una hiptesis simple, es
decir, se presenta de manera que los valores de los parmetros poblacionales
desconocidos quedan unvocamente determinados ( 2 :
0
=
B A
H , por ejemplo);
se presentan estos contrastes cuando consideramos los valores que se alejan de
0
H
por ser muy grandes y, tambin, los valores que se alejan por ser muy pequeos. La
regin crtica est formada por las dos colas de la distribucin correspondiente, se
encuentra a ambos extremos de los valores esperados bajo
0
H . El rea (nivel de
riesgo o significacin) se reparte en dos reas iguales, de una extensin
correspondiente a 2 , situadas en cada extremo de la curva.




REGIN CRTICA

REGIN DE ACEPTACIN
REGIN CRTICA Y REGIN DE ACEPTACIN EN CONTRASTES BILATERALES



b) Contrastes unilaterales o de una cola: la hiptesis nula es una hiptesis compuesta
( 3 ' 0 :
0
p H , 2 :
0

B A
H , por ejemplo), es decir, cuando consideramos que,
para rechazar la hiptesis nula, slo sirven los valores que se alejan de
0
H en un sentido
(muy grandes o muy pequeos, pero no muy grandes y muy pequeos).

Si la regin de rechazo est constituida slo por los valores que se alejan de la
hiptesis nula por ser muy pequeos, hablamos de un contraste unilateral izquierdo y
la hiptesis nula es de la forma
0
,
0
p p ,
0
, a
B A
, etc; en
los contrastes de medias o proporciones (distribuciones Z t ), y en los de
diferencias de dichos parmetros, se utiliza un contraste unilateral izquierdo
cuando el estadstico de contraste es negativo ( ) 0 < T .

Si la regin de rechazo corresponde a los valores que se alejan de la hiptesis nula
por ser muy grandes, hablamos de un contraste unilateral derecho y la hiptesis
nula es de la forma
0
,
0
p p ,
0
, a
B A
, etc; en los contrastes
de medias o proporciones (distribuciones Z t ), y en los de diferencias de dichos
parmetros, se utiliza un contraste unilateral derecho cuando el estadstico de
contraste es positivo ( ) 0 > T .





7.6. Contrastes paramtricos.

Los pasos a seguir en todo contraste de hiptesis sern:
a) A partir del problema planteado, establecer la distribucin de la poblacin, la hiptesis nula y
la hiptesis alternativa.
b) Fijar el nivel de confianza, 1 , y el tamao de la muestra, n .
c) Seleccionar una muestra y calcular el valor del correspondiente estadstico de contraste,
cuya distribucin ser conocida bajo la hiptesis nula.
d) Determinar la regin de aceptacin y la regin crtica (o de rechazo).
e) Aceptar la hiptesis nula si el valor del estadstico de contraste se encuentra dentro de la
regin de aceptacin, o rechazarlo en caso contrario (aceptando entonces la alternativa).
f) Interpretar la decisin de acuerdo con el problema inicial.


En las siguientes tablas aparecen los distintos estadsticos que se utilizarn, as como las
regiones crticas, segn el tipo de contraste paramtrico que se realice:





(Debemos tener en cuenta los recuadros sobre contrastes unilaterales de la pgina 127)

POBLACIN
HIPTESIS
NULA,
0
H
HIPTESIS
ALTERNA-
TIVA,
1
H
ESTADSTICO
DE
CONTRASTE
REGIN
CRTICA,
C
R

( ) , N ,

CONOCIDA

0
=


0

0

0



0
<
0
>

n
x
T

=
2
1

Z T

Z T

1
Z T

( ) , N ,
DESCO-
NOCIDA

0
=


0

0

0



0
<
0
>

n
s
x
T
0

=
2
1 , 1

n
t T

, 1

n
t T

1 , 1 n
t T




( ) , N


0
=



0

0



0




0
<
0
>



( )
2
0
2
1

s n
T

=


2
2
, 1
2
2
1 , 1

n
n
T

T


2
, 1

n
T
2
1 , 1

n
T


( ) p N B , ,
30 > n
0
p p =


0
p p
0
p p
0
p p


0
p p <
0
p p >

n
q p
p p
T
0 0
0

=
2
1

Z T

Z T

1
Z T
TABLA XI

Por supuesto, se cumplen, como siempre, las siguientes equivalencias:
( )
2 2
1 s n S n = o, lo que es lo mismo,
n
s
n
S
=
1


Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
129
Veamos algunos ejemplos:

Ejemplo 3:
Una embotelladora de refrescos tiene una mquina que llena botellas de 32 onzas.
Necesitamos controlar la varianza
2
de la cantidad de lquido con que se llena cada botella. Se
considera aceptable una varianza de, como mucho, 0004 ' 0
2
= , y la compaa ajustar la
mquina cuando la varianza exceda ese valor. Se tom una muestra de 28 = n botellas, siendo la
cuasivarianza de esta muestra de 0007 ' 0
2
= s . Ser satisfactoria la variabilidad de este
proceso con un nivel de significacin de 005 (nivel de confianza del 95%)?
La decisin se tomar utilizando el procedimiento de prueba de hiptesis de cuatro pasos:
1. Establecer las hiptesis nula y alternativa:

> >

02 ' 0 0004 ' 0 :
02 ' 0 0004 ' 0 :
2
1
2
0


H
H

2. Establecer un criterio de contraste: 113 ' 40
28
05 ' 0
2
95 ' 0 , 27
2
1 , 1
= =
)
`

=
=

n
n


113 ' 40
2
95 ' 0 , 27
=
3. Calcular el estadstico de contraste:
2
0
2
) 1 (

s n
T

= 25 ' 47
0004 ' 0
0007 ' 0 27
=

=

113 ' 40
2
95 ' 0 , 27
= 25 ' 47 = T

4. Conclusin:
Como
2
1 , 1


>
n
T , estamos dentro de la regin crtica, es decir, fuera de la regin de
aceptacin; luego, segn los datos obtenidos de la muestra, debemos rechazar la hiptesis nula,
es decir, que, con un nivel de significacin de 005, se concluye que hay evidencia suficiente para
afirmar que la variabilidad del proceso de llenado de las botellas no es satisfactoria.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
130
Ejemplo 4:
El dimetro de los ejes de un determinado modelo de automvil sigue una distribucin normal
de media desconocida y desviacin tpica 2 mm. En una muestra aleatoria de 36 vehculos de ese
modelo se obtiene un dimetro medio de 37 mm. Se puede afirmar con un nivel de significacin
del 1% que la media de los dimetros de los ejes de todos los vehculos de ese modelo es de 40
mm?
40 :
0
= H mm 40 :
1
H mm

n
x
T

= 9
6
2
40 37
=

=
2
1
:

Z T R
c

Como 575 ' 2
995 ' 0
2
1
= =

Z Z

y 575 ' 2 9 > = T , estamos dentro de la regin crtica, es decir,
fuera de la regin de aceptacin; luego, segn los datos obtenidos de la muestra, debemos
rechazar la hiptesis nula, es decir, rechazamos que la media del dimetro de los ejes de ese
modelo de automvil sea 40 mm a un nivel de significacin de 001, o, lo que es lo mismo, a un nivel
de confianza del 99%.
En este ejemplo cometeramos un error (de tipo I, como definiremos ms adelante) si
realmente el valor de la media de la poblacin es 40 mm, pero que hemos rechazado segn los
datos obtenidos de la muestra.
Cometeramos otro error (de tipo II, como indicaremos ms adelante) si el verdadero valor
de la media poblacional fuese distinto de 40 mm y, por los datos que tengamos de una muestra, al
calcular el valor del estadstico de contraste, ste estuviese dentro de la regin de aceptacin,
por lo que aceptaramos
0
H siendo sta realmente falsa.

Este clculo tambin podra haberse llevado a cabo hallando el intervalo de confianza para la
media poblacional a un nivel de confianza del 99% que, con nuestros datos muestrales, sera:
|
|

\
|
+

n
Z x
n
Z x


2
1
2
1
, =
|
|

\
|
+ =
36
2
575 ' 2 37 ,
36
2
575 ' 2 37 (361417, 378583),
que no contiene al valor 40.


Ejemplo 5:
En un estudio realizado sobre la influencia de la educacin infantil sobre el CI se aseguraba
que los nios que haban seguido la educacin infantil en un centro pblico tenan efectos
beneficiosos sobre el CI, puesto que se obtuvo como media 115 (a los seis aos), siendo la media
de la poblacin menor de 105. Dicho estudio ha sido criticado por el sector de la enseanza
privada aludiendo que la media de la poblacin es, como mnimo, 105. Para contrastar dicha
hiptesis a un nivel de significacin del 5%, se seleccionan 26 nios de seis aos y se obtiene una
media de 103 y una desviacin tpica de 5. Se supone que el CI se distribuye normalmente.
105 :
0
H 105 :
1
< H

n
s
x
T
0

= 2
25
5
105 103
1
0
=

=
n
S
x

, 1
:

<
n c
t T R
Como, por simetra, 7081 ' 1
95 ' 0 , 25 05 ' 0 , 25
= = t t y 7081 ' 1 2 < = T , estamos dentro de la
regin crtica, es decir, fuera de la regin de aceptacin; luego, segn los datos obtenidos de la
muestra, debemos rechazar la hiptesis nula, es decir, rechazamos que la media poblacional del
CI sea, como mnimo, 105 y suponemos que ser menor de 105 (hiptesis alternativa).
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
131



Ejemplo 6:

En una prueba de acceso a un cierto grado universitario el porcentaje de admitidos ha sido
del 40%. De los que prepararon el acceso a distancia se escogi una muestra de 200, de los que
fueron admitidos 70. Podemos concluir, con un nivel de confianza del 95%, que la proporcin de
alumnos admitidos que prepararon el acceso a distancia es distinta del 40%?

4 ' 0 % 40 :
0
= = p H 4 ' 0 :
1
p H

n
q p
p p
T
0 0
0

= 44 ' 1
200
6 ' 0 4 ' 0
4 ' 0
200
70
=

= :
c
R
2
1

Z T

Como 96 ' 1
975 ' 0
= Z y 44 ' 1 = T , nos encontramos fuera de la regin crtica, esto es, dentro
de la regin de aceptacin; luego, segn los datos de la muestra, debemos aceptar la hiptesis
nula, es decir, aceptamos que el porcentaje (proporcin) de alumnos admitidos que se prepararon
el acceso a distancia no difiere del porcentaje total de admitidos en ese grado universitario
(40%).



Ejemplo 7:

En una muestra de 18 unidades de un determinado modelo de semiconductor se obtuvo para
el espesor, expresado en milsimas de pulgada, una cuasivarianza de 068. El proceso de
fabricacin de dichos semiconductores se considera correcto si la desviacin tpica del espesor
no es mayor de 06 milsimas de pulgada.

Si suponemos que las medidas del espesor de los semiconductores de este modelo siguen una
ley normal, contrastar la hiptesis nula de que la desviacin tpica de toda la poblacin de
semiconductores de este tipo es menor o igual que 06 milsimas de pulgada, con un nivel de
significacin del 5%.

36 ' 0 6 ' 0 :
2
0
H 36 ' 0 6 ' 0 :
2
1
> > H

2
0
2
) 1 (

s n
T

= 111 ' 32
36 ' 0
68 ' 0 17
=

= :
c
R
2
1 , 1


>
n
T 587 ' 27
2
95 ' 0 , 17
= =

Como 587 ' 27 111 ' 32 > , estamos dentro de la regin crtica, es decir, fuera de la regin de
aceptacin; luego, segn los datos obtenidos de la muestra, debemos rechazar la hiptesis nula
y reajustar el proceso de fabricacin de estos semiconductores, si deseamos que la variabilidad
de los mismos corresponda a una varianza menor de 036, con un nivel de significacin del 5%.





(Debemos tener en cuenta los recuadros sobre contrastes unilaterales de la pgina 127)

POBLACIONES
HIPTESIS
NULA,
0
H
HIPTESIS
ALTERNA-
TIVA,
1
H
ESTADSTICO
DE
CONTRASTE
REGIN
CRTICA,
C
R
N( )
A A
, ,
N( )
B B
, ,
A
y
B

CONOCIDAS
a
B A
=

a
B A

a
B A

a
B A


a
B A
<
a
B A
>
B
B
A
A
B A
n n
a x x
T
2 2

+

=
2
1

Z T

Z T

1
Z T
N( )
A A
, ,
N( )
B B
, ,

B
DES-
CONOCIDAS,
30 >
A
n , 30 >
B
n
a
B A
=


a
B A

a
B A

a
B A



a
B A
<
a
B A
>

B
B
A
A
B A
n
s
n
s
a x x
T
2 2
+

=
2
1

Z T

Z T

1
Z T
N( )
A A
, ,
N( )
B B
, ,

B
DES-
CONOCIDAS,
30
A
n , 30
B
n
a
B A
=


a
B A

a
B A

a
B A



a
B A
<
a
B A
>

B
B
A
A
B A
n
s
n
s
a x x
T
2 2
+

=
2
1 ,


t T
NOTA ( ) *
,
t T

1 ,
t T
N( )
A A
, ,
N( )
B B
, ,
=
A

B
DES-
CONOCIDAS
a
B A
=

a
B A

a
B A

a
B A


a
B A
<
a
B A
>
b
a x x
T
B A

=
NOTA ( ) * *

2
1 , 2

+

B A
n n
t T
, 2 +

B A
n n
t T
+

1 , 2
B A
n n
t T
( )
A A
p N B , ,
( )
B B
p N B , ,

30 >
A
n , 30 >
B
n
a p p
B A
=

a p p
B A

a p p
B A

a p p
B A


a p p
B A
<
a p p
B A
>
B
B B
A
A A
B A
n
q p
n
q p
a p p
T


=
2
1

Z T

Z T

1
Z T
TABLA XII




NOTA ( ) * * * : Adems, si 2 +
B A
n n son mayores que 30, podemos tomar:


Z t =
,
y

Z t
B A
n n
=
+ , 2






Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
134
327 ' 3
100
75 ' 0 25 ' 0
100
92 ' 0 08 ' 0
25 ' 0 08 ' 0 0
=

=
+

=
B
B B
A
A A
B A
n
q p
n
q p
p p
T
Con un nivel de significacin del 5%, 645 ' 1 05 ' 0
95 ' 0 05 ' 0
= = = = Z Z Z

. Entonces,
como

Z T < , estamos dentro de la regin crtica y debemos rechazar la hiptesis nula y


aceptar la hiptesis alternativa, con lo que concluimos que la eficacia de la vacuna es
probablemente significativa.
Con un nivel de confianza del 99%, 327 ' 2 01 ' 0
99 ' 0 01 ' 0
= = = = Z Z Z

. Entonces,
como sigue siendo

Z T < , seguimos estando dentro de la regin crtica y debemos rechazar


la hiptesis nula y aceptar la hiptesis alternativa, con lo que concluimos que la eficacia de la
vacuna es significativa.
Con un nivel de significacin de 0001, 09 ' 3 001 ' 0
999 ' 0 001 ' 0
= = = = Z Z Z

.
Entonces, como sigue siendo

Z T < , seguimos estando dentro de la regin crtica y debemos


rechazar la hiptesis nula y aceptar la hiptesis alternativa, con lo que concluimos que la
eficacia de la vacuna es muy (o altamente) significativa.

Es decir, que la vacuna es eficaz a los tres niveles de significacin ms usuales.


Ejemplo 10:
Se comprob un micrmetro con una serie de piezas patrn, obtenindose la siguiente tabla,
donde todas las medidas son en micras. Tiene error el instrumento?

Patrn Lectura
00003 00002
01000 01000
02000 01996
03000 02996
04000 04001
05000 04999
06000 06000
07000 06997
08000 07998
09000 08997
10000 10004
Para detectar si un aparato tiene o no un error sistemtico
(relacionado con un patrn) comprobaremos si la media
P
es igual a la
media
L
o no es igual a
L
(en este caso diramos que el micrmetro
tiene error).
Supondremos distribuciones normales para ambas medidas (las de las
piezas patrn y las propias lecturas).
Tenemos que calcular
P
x ,
2
P
s ,
L
x y
2
L
s . Hagamos dichos clculos:
5000 ' 0
11
= =

P
i
P
x
x micras.
= =

09997 ' 0
11
2
2
2
P
i
P
x
x
S
P
10997 ' 0
10
11
2 2
= =
P P
S s

4999 ' 0
11
= =

L
i
L
x
x micras. = =

10001 ' 0
11
2
2
2
L
i
L
x
x
S
L
11001 ' 0
10
11
2 2
= =
L L
S s
Tambin tendremos que calcular los grados de libertad:
22 2
12
11
11001 ' 0
12
11
10997 ' 0
11
11001 ' 0
11
10997 ' 0
2
1 1
2 2
2
2
2
2
2
2
2 2
=
|

\
|
+
|

\
|
|

\
|
+
=
+
|
|

\
|
+
+
|
|

\
|
|
|

\
|
+
=
L
L
L
P
P
P
L
L
P
P
n
n
s
n
n
s
n
s
n
s
(donde hemos tomado el
valor entero positivo ms prximo al resultado).

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
135
Las hiptesis a contrastar son:
0 :
0
= =
L P L P
H 0 :
1

L P L P
H
El estadstico de contraste: 00071 ' 0
11
11001 ' 0
11
10997 ' 0
4999 ' 0 5000 ' 0 0
2 2
=
+

=
+

=
L
L
P
P
L P
n
s
n
s
x x
T
La regin crtica:
2
1 ,


t T (con 05 ' 0 = , 01 ' 0 = 001 ' 0 = , respectivamente).

Con un nivel de significacin del 5%, 0739 ' 2
975 ' 0 , 22
= t , por lo que nos hallamos fuera de la
regin crtica y, por consiguiente, dentro de la regin de aceptacin, con lo que aceptamos la
hiptesis nula y afirmamos que la ausencia de error en el micrmetro es probablemente
significativa.

Con un nivel de significacin del 1%, 8188 ' 2
995 ' 0 , 22
= t , por lo que nos hallamos fuera de la
regin crtica y, por consiguiente, dentro de la regin de aceptacin, con lo que aceptamos la
hiptesis nula y afirmamos que la ausencia de error en el micrmetro es significativa.

Con un nivel de significacin del 01%, 5050 ' 3
9995 ' 0 , 22
> t , por lo que nos hallamos fuera de la
regin crtica y, por consiguiente, dentro de la regin de aceptacin, con lo que aceptamos la
hiptesis nula y afirmamos que la ausencia de error en el micrmetro es muy (o altamente)
significativa.

Luego para los tres niveles de significacin ms usuales (005, 001 y 0001) podemos afirmar
que el micrmetro no tiene error y las diferencias que se observan en las medidas no dependen
del aparato y sern, por tanto, debidas al azar o al observador.



7.6.3. CONTRASTES DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS DE DATOS
APAREADOS


Como ya vimos en el apartado 6.4.2.3. (pgina 106), hasta ahora, cuando trabajbamos con
dos poblaciones (o muestras), stas se consideraban independientes cuando no hay correlacin
entre ellas. Sin embargo, hay casos en que las poblaciones (o muestras) no pueden considerarse
independientes, como cuando medimos una misma caracterstica (o variable aleatoria) en la misma
muestra antes y despus de la aplicacin de algn tratamiento o procedimiento (la administracin
de un medicamento, por ejemplo). Volveremos a realizar un desarrollo paralelo al que hicimos en el
apartado mencionado.

Si elaboramos un modelo matemtico en el que representamos por x la variable aleatoria
antes de la aplicacin del procedimiento, y por y la variable aleatoria despus de la aplicacin,
estas variables no son independientes, de aqu la necesidad de construir otro modelo distinto al
estudiado hasta ahora.

Supongamos, para concretar, que tanto x como y siguen distribuciones normales
( )
x x
N , y ( )
y y
N , , respectivamente, de las que no conocemos ni medias ni desviaciones


(Debemos tener en cuenta los recuadros sobre contrastes unilaterales de la pgina 127)

POBLACIONES
HIPTESIS
NULA,
0
H
HIPTESIS
ALTERNA-
TIVA,
1
H
ESTADSTICO
DE
CONTRASTE
REGIN
CRTICA,
C
R
N( )
x x
, ,
N( )
y y
, ,
x
y
y

DESCONOCIDAS,
30 > n
a d
y x
= =


a d
y x
=
a d
y x
=
a d
y x
=


a d
y x
< =
a d
y x
> =

n
s
a d
T
d
2

=
2
1

Z T

Z T

1
Z T
N( )
x x
, ,
N( )
y y
, ,
x
y
y

DESCONOCIDAS,
30 n
a d
y x
= =


a d
y x
=
a d
y x
=
a d
y x
=


a d
y x
< =
a d
y x
> =

n
s
a d
T
d
2

=
2
1 , 1

n
t T

, 1

n
t T

1 , 1 n
t T
TABLA XIII




Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
137
y que ( )

=
n
i
i d
d d
n
s
1
2 2
1
1
=
( ) ( ) ( )
1 , 45
5
5 , 0 5 , 0 5 , 10 5 , 3 5 , 8 5 , 5
2 2 2 2 2 2
=
+ + + + +
= .
El estadstico de contraste vale, entonces,
n
s
a d
T
d
2

= 9119 , 0
6
1 , 45
0 5 , 2
=

=
La regin crtica:

>
11 n
t T

Con un nivel de significacin del 5%, 0150 , 2
95 ' 0 , 5 1 , 1
= =

t t
n
, y

<
1 , 1 n
t T , por lo que nos
hallamos fuera de la regin crtica y, por consiguiente, dentro de la regin de aceptacin, con
lo que aceptamos la hiptesis nula y afirmamos que no se puede afirmar estadsticamente, de
manera significativa, la bondad del medicamento en la reduccin de los triglicridos.

Con un nivel de significacin del 1%, 3649 , 3
99 ' 0 , 5 1 , 1
= =

t t
n
, y

<
1 , 1 n
t T , por lo que nos
hallamos fuera de la regin crtica y, por consiguiente, dentro de la regin de aceptacin, con
lo que aceptamos la hiptesis nula y afirmamos que no se puede afirmar estadsticamente, de
manera probablemente significativa, la bondad del medicamento en la reduccin de los
triglicridos.

Con un nivel de significacin del 0,1%, 8935 , 5
999 ' 0 , 5 1 , 1
= =

t t
n
, y

<
1 , 1 n
t T , por lo que
nos hallamos fuera de la regin crtica y, por consiguiente, dentro de la regin de aceptacin,
con lo que aceptamos la hiptesis nula y afirmamos que no se puede afirmar estadsticamente,
de manera muy (o altamente) significativa, la bondad del medicamento en la reduccin de
los triglicridos.

Luego para los tres niveles de significacin ms usuales (005, 001 y 0001) podemos afirmar
que no se puede afirmar estadsticamente la bondad del medicamento en la reduccin de los
triglicridos.




7.6.4. RELACIN ENTRE INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPTESIS

Cuando se realiza un contraste de hiptesis bilateral y se rechaza la hiptesis nula, no
sabemos cul es el valor del parmetro de la poblacin que estamos considerando, sino nicamente
qu valor no es, con un determinado nivel de confianza.

Como ya vimos en el ejemplo 4 (pgina 130), a veces, en lugar de realizar un contraste de
hiptesis, podemos construir el intervalo de confianza para el parmetro de que se trate
(intervalo que deja a su izquierda y a su derecha sendas reas iguales a 2 ) y, con ello,
podemos rechazar todas aquellas hiptesis nulas de la forma
0 0
: k parmetro H = siempre que
el valor
0
k no se encuentre dentro del intervalo de confianza construido.

En el caso de contrastes de hiptesis unilaterales:

a) Contrastamos
0 0
: k parmetro H frente a
0 1
: k parmetro H > (contraste unilateral
derecho). Se construye un intervalo de confianza ilimitado por la izquierda y que deja a su
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
138
derecha un rea igual a . Si el valor
0
k es mayor que el extremo superior de dicho
intervalo, debemos rechazar la hiptesis
0
H .

b) Contrastamos
0 0
: k parmetro H frente a
0 1
: k parmetro H < (contraste unilateral
izquierdo). Se construye un intervalo de confianza ilimitado por la derecha y que deja a su
izquierda un rea igual a . Si el valor
0
k es menor que el extremo inferior de dicho
intervalo, debemos rechazar la hiptesis
0
H .



Ejemplo 12:

Un instituto de investigaciones agronmicas siembra, en cinco parcelas diferentes, dos tipos
de maz. Las producciones, en quintales mtricos por hectrea, son las siguientes:

Parcela 1 2 3 4 5
Maz I 90 85 95 76 80
Maz II 84 87 90 92 90

Considerando ambas producciones distribuidas normalmente con medias desconocidas y
varianzas desconocidas pero iguales, contrasta la hiptesis de que las medias poblacionales de
produccin son distintas para el maz I y para el maz II, con un nivel de confianza del 95%.
0 :
0
=
II I
H 0 :
1

II I
H
Este ejercicio, en lugar de resolverlo mediante contraste de hiptesis (que dara el mismo
resultado), vamos a resolverlo mediante la construccin del correspondiente intervalo de
confianza.

Dadas las condiciones enunciadas y al tratarse de poblaciones independientes, el intervalo de
confianza para la diferencia de medias vendr dado, tal y como indica la TABLA VI (pgina 104),
por ( ) b t x x
II I
n n
II I

+
2
1 , 2

, donde
|
|

\
|
+
+
+
=
II I II I
II II I I
n n n n
S n S n
b
1 1
2
2 2

Tendremos que calcular primero las medias y las varianzas de las muestras:
16 ' 46 2 ' 85
5
80 76 95 85 90
2 ' 85
5
80 76 95 85 90
2
2 2 2 2 2
2
=
+ + + +
= =
+ + + +
=
I I
S x .
84 ' 7 6 ' 88
5
90 92 90 87 84
6 ' 88
5
90 92 90 87 84
2
2 2 2 2 2
2
=
+ + + +
= =
+ + + +
=
II II
S x .
Entonces, 674 ' 3
5
1
5
1
2 5 5
84 ' 7 5 16 ' 46 5
= |

\
|
+
+
+
= b .
Por otra parte, 3060 ' 2
975 ' 0 , 8
2
1 , 2
= =
+
t t
II I
n n

.
Obtenemos ( ) ( ) = = =
+
47 ' 8 4 ' 3 674 ' 3 3060 ' 2 6 ' 88 2 ' 85
2
1 , 2
b t x x
II I
n n
II I

= (-1187 quintales por hectrea, 507 quintales por hectrea) intervalo en el que, con un nivel
de confianza del 95%, debe encontrarse la diferencia de producciones medias poblacionales.
Como este intervalo contiene el valor 0, podemos aceptar 0 :
0
=
II I
H y rechazar que haya
diferencia significativa entre las medias de produccin.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
139
7.7. Tipos de errores y potencia de un contraste.

Las hiptesis nula y alternativa son aseveraciones sobre la poblacin que compiten entre s. O
la hiptesis nula
0
H es verdadera, o lo es la hiptesis alternativa
1
H , pero no ambas. En el caso
ideal, el procedimiento de contraste de hiptesis debe conducir a la aceptacin de
0
H

cuando
sea verdadera y al rechazo de
0
H

cuando sea verdadera
1
H . Desafortunadamente, no siempre
son posibles las conclusiones correctas. Como las pruebas de hiptesis se basan en informacin
muestral, debemos considerar la posibilidad de errores.

Cuando llevamos a cabo un contraste de hiptesis, nos basamos en los valores de un
estadstico cuya funcin de probabilidad debemos conocer bajo la hiptesis nula. Entonces los
datos de la muestra nos pueden llevar a dos tipos de errores:

- Error de tipo I: error que se comete cuando rechazamos la hiptesis nula
0
H
siendo verdadera.
- Error de tipo II: error que se comete cuando aceptamos la hiptesis nula
0
H
siendo falsa, o, lo que es lo mismo, rechazamos
1
H siendo verdadera.
- Potencia de un contraste: representa la probabilidad de rechazar
0
H cuando es
falsa, es decir, cuando es verdadera
1
H :
1 = P (rechazar
0
H /
0
H falsa)

Cules son las probabilidades de cometer cada uno de los dos tipos de errores?
a) P (cometer
I
E ) = P (rechazar
0
H /
0
H verdadera) = [ ] =
C H
R x P
0
, es decir, la
probabilidad de cometer un error de tipo I es, evidentemente, el propio nivel de
significacin.
b) P (cometer
II
E ) = P (aceptar
0
H /
1
H verdadera) = [ ] =
A H
R x P
1
. Depende del
verdadero valor del parmetro y se hace tanto menor cuanto mayor sea n .

Todo esto puede resumirse en la siguiente tabla, llamada a veces matriz de decisin (en la
que se indican, adems, las probabilidades respectivas):

SITUACIN REAL
DECISIN TOMADA




0
H VERDADERA,

1
H FALSA


0
H FALSA,

1
H VERDADERA

ACEPTAR
0
H
DECISIN CORRECTA

Probabilidad =1
ERROR DE TIPO II ( )
II
E

Probabilidad =

RECHAZAR
0
H
ERROR DE TIPO I ( )
I
E

Probabilidad =
DECISIN CORRECTA
Probabilidad = Potencia =
=1
TABLA XIV

Las probabilidades de los errores de tipo I y II son, como vemos, funciones complementarias
entre s en el sentido de que aumentando una disminuye la otra y viceversa, por lo que se tratar
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
140
de minimizar aquel error que se considere ms grave a costa de aumentar el otro, aunque est
claro que las probabilidades de ambos errores disminuirn si aumentamos el tamao muestral.
Una solucin consiste en buscar el tamao muestral que hace compatibles los niveles de error de
tipo I ( ) y de tipo II ( ) , es decir, fijado uno hallar el tamao de la muestra necesario para
que el otro se encuentre dentro de los mrgenes deseados.

Supongamos, por ejemplo, una variable aleatoria X que sigue una distribucin normal N( ) , ,
con conocida, y sean
0
H y
1
H dos hiptesis que queremos contrastar mediante una muestra
de n elementos (contraste unilateral derecho):

> =

0 1 1
0 0
:
:


H
H

- Si
0
H es cierta, x sigue una distribucin N
|
|

\
|
n
0
0
,

.
- Si
1
H es cierta, x sigue una distribucin N
|
|

\
|
n
1
1
,

.
Todo esto puede verse representado en la siguiente figura:

La grfica de la izquierda representa la distribucin de x bajo
0
H . La de la derecha, la
distribucin de x bajo
1
H . En la figura vemos que, cuanto menor sea , mayor ser . La
nica forma de disminuir ambos errores, es aumentar el tamao de la muestra ( ) n .
Cuando se trate se un contraste bilateral con un nivel de significacin , a cada cola de la
distribucin de
0
H le corresponde una probabilidad (rea bajo la curva normal tipificada) 2 .

En general, en los contrastes se controla , pero no . A la hora de seleccionar un
estadstico para contrastar una determinada hiptesis se elegir aqul cuya potencia sea mxima
( sea mnima) entre todos los que tengan el mismo nivel de confianza. Con el propsito de
obtener una baja, tendremos que tolerar una alta, o aumentar el tamao ( ) n de la muestra.
En realidad, puede asumir infinitos valores distintos de
0
. Si es cierta
1
H y el
verdadero valor ( )
1
no dista excesivamente del postulado en
0
H , es posible aceptar sta
siendo falsa. Como el valor observado x cae en el rea de aceptacin de
0
H , no se rechaza la
hiptesis; sin embargo, el valor verdadero es distinto de
0
(
0 1
> ).
Llamamos l al lmite de la regin crtica (de rechazo) de
0
H , es decir, al valor de separacin
entre las dos zonas centrales coloreadas, y ). Si l x > , se rechaza
0
H .
Entonces, [ ] = > l x P
H
0
(contraste unilateral) [ ]
2
0

= > l x P
H
(contraste bilateral),
y [ ] = l x P
H
1
.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
141
Ejemplo 13:
Una compaa fabrica cuerdas cuya resistencia a la rotura alcanza un valor medio de 150 kilos
y una desviacin tpica de 12 kilos. Se cree que mediante un nuevo proceso de fabricacin puede
incrementarse la resistencia media.
a) Disea una regla de decisin para rechazar el proceso primitivo al nivel de significacin del
1%, si se pone de manifiesto que debe rechazarse al ensayar 64 cuerdas.
b) Bajo la regla de decisin del apartado anterior, cul es la probabilidad de aceptar el
proceso primitivo cuando, en efecto, el nuevo proceso incrementa la resistencia media a 155
kilos? Suponemos que la desviacin tpica se mantiene en 12 kilos.

a) Si es la resistencia media de las cuerdas, queremos decidir entre las hiptesis:
150 :
0
H kilos, y el nuevo proceso es igual que el primitivo.
150 :
1
> H kilos, y el nuevo proceso es mejor que el primitivo.
Suponemos que la distribucin es normal. Como se trata de un contraste unilateral
derecho con 01 ' 0 = , tendremos que la regin crtica (de rechazo) es

>
1
Z T , con
64
12
150
0

=

=
x
n
x
T

. Como 33 ' 2
99 ' 0 1
= =

Z Z

,
5 ' 153
8
12
33 ' 2 150 33 ' 2
64
12
150
= + > >

x
x
kilos.
Regla de decisin:
(1) Se rechaza
0
H si la resistencia media de la muestra de 64 cuerdas supera los
1535 kilos, y el nuevo proceso es mejor que el primitivo.
(2) Se acepta
0
H en caso contrario, y el nuevo proceso no es mejor.

b) Considrense las dos hiptesis 150 :
0
= H kilos y 155 :
1
= H kilos. Las
distribuciones de las resistencias medias correspondientes a estas dos hiptesis se
representan, respectivamente con las distribuciones normales de la izquierda y de la derecha
de la siguiente figura:
H
0
H
1

150 1535 155

La probabilidad de aceptar el proceso primitivo cuando la nueva resistencia media sea
realmente 155 kilos se representa por el rea de la figura, que se calcula as:
[ ] [ ] [ ] [ ] = < = > = < =
(
(
(
(

< = < = 00 ' 1 1 00 ' 1 00 ' 1


64
12
155 5 ' 153
5 ' 153
1
Z P Z P Z P Z P X P
H

= = = 1587 ' 0 8413 ' 0 1 15,87% = probabilidad de error de tipo II.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
142
Ejemplo 14:
Para ensayar la hiptesis de que una moneda est bien hecha (que no est cargada,
trucada), se toma la siguiente regla de decisin: (1) se acepta la hiptesis si el nmero de caras
en una serie de 100 lanzamientos se encuentra entre 40 y 60, ambos inclusive (lo mismo se podra
establecer con el nmero de cruces); (2) en caso contrario, se rechaza la hiptesis de que la
moneda est bien hecha.
a) Halla la probabilidad de rechazar la hiptesis, cuando en realidad es cierta (error
de tipo I).
b) Calcula la probabilidad de aceptar la hiptesis, cuando realmente debera
rechazarse (error de tipo II), por ser, por ejemplo, 7 ' 0 = p , en lugar de 5 ' 0 = p .
c) Y la probabilidad de un error de tipo II cuando realmente 6 ' 0 = p en vez de
5 ' 0 = p ?

a) Tendremos que empezar calculando la probabilidad de no obtener entre 40 y 60 caras
incluso si la moneda est bien hecha ( ) 5 ' 0 = p :
Como 50 = = nq np , aproximamos esta distribucin binomial ( ) 5 ' 0 , 100 B por una normal
( ) 5 , 50 N , ya que 50 5 ' 0 100 = = = np y 5 5 ' 0 5 ' 0 100 = = = npq . Entonces,
[ ] [ ] =
(


< <

= < < = =
5
50 5 ' 60
5
50 5 ' 39
5 ' 60 ' 5 ' 39 60 40 1 Z P X P X P
[ ] [ ] [ ] [ ] [ ] ( ) = < < = < < = < < = 1 ' 2 1 1 ' 2 1 ' 2 1 ' 2 1 ' 2 1 ' 2 Z P Z P Z P Z P Z P
[ ] 0358 ' 0 9821 ' 0 1 9642 ' 0 1 9821 ' 0 2 1 1 ' 2 2 = = = = < = Z P
Es decir, P (error tipo I) = = 00358 = 358%.

b) Si la probabilidad de cara es 7 ' 0 = p , entonces la distribucin de caras en 100
lanzamientos est representada por la curva normal de la derecha en la siguiente figura:
5 ' 0 = p 7 ' 0 = p

395 50 605 70

En el diagrama se ve claramente que la probabilidad de aceptar
0
H ( ) 5 ' 0 = p cuando
realmente 7 ' 0 = p (es decir, la probabilidad de un error tipo II), viene dada por el rea
rayada de la figura.
Para calcular dicha rea se observa que la distribucin bajo la hiptesis 7 ' 0 = p tiene
una media 70 7 ' 0 100
7 ' 0
= = y una desviacin tpica 58 ' 4 3 ' 0 7 ' 0 100
7 ' 0
= = .
Entonces,
[ ] [ ] = < < =
(


<

= < < = 07 ' 2 66 ' 6


58 ' 4
70 5 ' 60
58 ' 4
70 5 ' 39
5 ' 60 ' 5 ' 39
7 ' 0
Z P Z P X P
[ ] [ ] [ ] = < < = < < = 07 ' 2 66 ' 6 66 ' 6 07 ' 2 Z P Z P Z P 0192 ' 0 9808 ' 0 1 = .
Es decir,
7 ' 0
P (error tipo II) = = 00192 = 192%.
As, pues, con la regla de decisin dada hay muy poco riesgo de aceptar la hiptesis de
que la moneda est bien hecha, cuando realmente 7 ' 0 = p .
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
143
c) Procediendo como en el apartado anterior, tendramos (ya que ahora 6 ' 0 = p ):
60 6 ' 0 100
6 ' 0
= = y 90 ' 4 4 ' 0 6 ' 0 100
6 ' 0
= =
Entonces, [ ] =
(


< <

= < < =
90 ' 4
60 5 ' 60
90 ' 4
60 5 ' 39
5 ' 60 ' 5 ' 39
6 ' 0
Z P X P
[ ] = < < = 10 ' 0 18 ' 4 Z P [ ] [ ] [ ] [ ] = > < = < < 18 ' 4 10 ' 0 18 ' 4 10 ' 0 Z P Z P Z P Z P
[ ] [ ] [ ] [ ] ( ) 18 ' 4 1 10 ' 0 18 ' 4 10 ' 0 < < = > < = Z P Z P Z P Z P ( ) 5398 ' 0 1 1 5398 ' 0 = = .
Es decir,
6 ' 0
P (error tipo II) = = 05398 = 5398%.
As, pues, con la regla de decisin dada hay un gran riesgo de aceptar la hiptesis de que
la moneda est bien hecha, cuando realmente 6 ' 0 = p .


Relacin entre , y n (tamao de la muestra en funcin de y )
Sabemos que [ ] = > l x P
H
0
(contraste unilateral) [ ]
2
0

= > l x P
H
(contraste bilateral),
y que [ ] = l x P
H
1
. Entonces,


[ ]

(
(


= =
(
(


>

=
= >
n
l
Z P
n
l
Z P
n
x
Z
l x P
H
H
0
0
0
0
0
0
1
0
0


=
(
(

1
0
0
n
l
Z P

1
0
0
Z
n
l
(1)

Por otra parte,
[ ]
(
(


= =
n
l
Z P l x P
H H
1
1
1 1

= =

1
1
1
Z Z
n
l
(2)

Como l es comn a (1) y (2), despejando de ambas, tenemos:
= +

=
+ =

n
Z
n
Z
n
Z l
n
Z l
1
1 1
0
1 0
1
1 1
0
1 0


( ) = +
0 1 1 1 0 1
1


Z Z
n
0 1
1 1 0 1


+
=

Z Z
n
Es decir, que el tamao mnimo de la muestra, una vez fijadas las probabilidades ( y
) de los dos tipos de errores, sera:

2
0 1
1 1 0 1
|
|

\
|

+
=




Z Z
n (contraste unilateral)
(contraste bilateral)
2
0 1
1 1 0
2
1
|
|
|

\
|

+
=




Z Z
n
Esto es, que, si fijamos y , tenemos
1
Z (
2 1
Z ) y
1
Z , y podemos calcular n .
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
144
Ejemplo 15:
En el caso del ejemplo 13 , queremos imponer las siguientes restricciones: (A) la probabilidad
de rechazar
0
H cuando realmente sea correcta debe ser como mucho del 1%; (B) la probabilidad
de aceptar
0
H cuando realmente la media con el nuevo proceso sea de 152 kilos no debe superar
el 25%. Determina el tamao muestral mnimo necesario y enuncia la regla de decisin
resultante. Suponemos que se mantiene la misma desviacin tpica igual a 12 kilos.

Aqu se ha puesto lmite al riesgo de error del tipo I y al riesgo de error de tipo II: la
restriccin (A) impuesta requiere que la probabilidad de error del tipo I sea 01 ' 0 , mientras
que la restriccin (B) requiere que la probabilidad de error del tipo II sea 025 ' 0 . La
situacin planteada se ve grficamente en la siguiente figura, en la que se indican los valores
mximos que aceptamos para y :

H
0
H
1

150 l 152
01 ' 0 = 025 ' 0 =

[ ]


= =
(


>

=
= = >
n
l
Z P
n
l
Z P
n
x
n
x
Z
l x P
H
H
12
150
1 01 ' 0
12
150
12
150
01 ' 0
0
0
0
0


33 ' 2
12
150
99 ' 0 01 ' 0 1
12
150
99 ' 0
= =

= =
(


Z
n
l
n
l
Z P (1)
Por otra parte,
[ ] 96 ' 1
12
152
12
152
025 ' 0
975 ' 0
1 1
= =


= = = Z
n
l
n
l
Z P l x P
H H
(2)
Como l es comn a (1) y (2), despejando de ambas, tenemos:
= +

=
+ =
n n
n
l
n
l
12
96 ' 1 152
12
33 ' 2 150
12
96 ' 1 152
12
33 ' 2 150

( ) = + 150 152 12 96 ' 1 12 33 ' 2
1
n
74 ' 25
150 152
12 96 ' 1 12 33 ' 2
=

+
= n
Es decir, que el tamao mnimo de la muestra sera = =
2
74 ' 25 n 663 cuerdas.
Adems, 1 ' 151
74 ' 25
12
33 ' 2 150 = + = l kilos. Entonces, la regla de decisin sera:
(1) Se rechaza
0
H si la resistencia media de la muestra de las 663 cuerdas supera
los 1511 kilos, y el nuevo proceso es mejor que el primitivo.
(2) Se acepta
0
H en caso contrario, y el nuevo proceso no es mejor.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
145
Ejemplo 16:
Para contrastar la hiptesis de que una moneda est bien hecha ( ) 5 ' 0 = p mediante un
nmero de lanzamientos de la moneda, se desea imponer las siguientes restricciones: (A) la
probabilidad de rechazar la hiptesis cuando sea realmente correcta debe ser a lo sumo 005;
(B) la probabilidad de aceptar la hiptesis cuando p difiera de 05 en 01 o ms (es decir,
6 ' 0 p o 4 ' 0 p ) debe ser a lo sumo 005. Determina el tamao muestral mnimo necesario y
enuncia la regla de decisin resultante.

Aqu se ha puesto lmite al riesgo de error del tipo I y al riesgo de error de tipo II: la
restriccin (A) impuesta requiere que la probabilidad de error del tipo I sea 05 ' 0 , mientras
que la restriccin (B) requiere que la probabilidad de error del tipo II sea 05 ' 0 . La situacin
planteada se ve grficamente en la siguiente figura, en la que se indican los valores mximos que
aceptamos para y :

5 ' 0
1
= p 6 ' 0
2
= p

k
1
np l
2
np
025 ' 0
2
=

05 ' 0 =


Llamemos n al tamao muestral mnimo pedido, y l al nmero de caras en los n
lanzamientos, por encima del cual se rechaza la hiptesis de que 5 ' 0 = p .

Procederemos de manera anloga a lo realizado en la pgina anterior:

+ = =


=


=

+ = =


=


=

n n l
n
n l
Z
n
n l
Z
q np
np l
n n l
n
n l
Z
n
n l
Z
q np
np l
6 ' 0 806 ' 0 645 ' 1
49 ' 0
6 ' 0
4 ' 0 6 ' 0
6 ' 0
5 ' 0 980 ' 0 96 ' 1
5 ' 0
5 ' 0
5 ' 0 5 ' 0
5 ' 0
95 ' 0
2 2
2
975 ' 0
2
1
1 1
1

= = = + = + 86 ' 17
1 ' 0
786 ' 1
786 ' 1 1 ' 0 6 ' 0 806 ' 0 5 ' 0 980 ' 0 n n n n n n n
= =
2
86 ' 17 n 319 lanzamientos.

Adems, = + = 319 5 ' 0 86 ' 17 980 ' 0 l 177 veces cara.
Entonces, 5 ' 17 5 ' 159 177 5 ' 159 5 ' 0 319
1
= = = np y = = 5 ' 17 5 ' 159 k 142 veces cara.

La regla de decisin ser entonces:
1) Se acepta la hiptesis de que la moneda est bien hecha ( ) 5 ' 0 = p si el
nmero de veces que sale cara en 319 lanzamientos est comprendido
entre 142 y 177.
2) Se rechaza la hiptesis en caso contrario.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
146
7.8. Contrastes no paramtricos.

Ya dijimos que, mientras que los contrastes paramtricos establecen hiptesis sobre los
valores de los parmetros de una o ms poblaciones de distribucin conocida, (por ejemplo, la
media de una poblacin normal es 7, la diferencia de proporciones de dos poblaciones binomiales
es menor o igual que 005, etc.), los contrastes no paramtricos establecen otro tipo de
hiptesis (por ejemplo, el ajuste de la poblacin a un modelo de distribucin determinada, la
homogeneidad o heterogeneidad de poblaciones, la dependencia o independencia entre dos
variables de una misma poblacin, etc.)
Adems de la importancia de la distribucin
2
como la distribucin a la que se ajusta la
distribucin muestral de la varianza de una poblacin normal, y su posterior aplicacin en el
contraste de la varianza, otra aplicacin importante de dicha distribucin es su utilizacin en los
tres tipos de contrastes no paramtricos que vamos a estudiar:
1) Test de bondad de ajuste.
2) Test de independencia.
3) Test de homogeneidad.


7.8.1. Test de bondad de ajuste
Consideramos una poblacin y el carcter X que presenta las siguientes modalidades
k
x x x ,..., ,
2 1
, excluyentes, con sus correspondientes probabilidades
k
p p p ,..., ,
2 1
. Tenemos una
muestra de tamao n en la que observamos el carcter X y nos planteamos hasta qu punto esta
muestra se puede considerar como perteneciente a una poblacin con una distribucin terica ya
conocida.
Independientemente de la distribucin terica que consideremos, siempre existirn
diferencias entre los valores tericos esperados y los valores observados. El problema est en
saber en qu medida dichos valores son debidos al azar o son debidos a la falta de ajuste de los
datos a la distribucin terica considerada.
Si denotamos por:
=
i
O nmero de elementos observados en la muestra con el carcter
i
x .
=
i
p probabilidad terica de que la variable aleatoria X tome el valor
i
x , verificndose
que 1
1
=

=
k
i
i
p .
Si tenemos una muestra de tamao n , el nmero de elementos que cabe esperar que tomen el
valor
i
x es:
i i
p n e = , verificndose que n e
k
i
i
=

=1
.



( )

=
k
i i
i i
e
e O
T
1
2
, lo que es lo mismo, n
e
O
T
k
i i
i
=

=1
2



Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
148
Ejemplo 17:
Las leyes de la herencia de Mendel predicen la aparicin de tipos de guisantes con
ascendencia especfica en la relacin 9 : 3 : 3 : 1 para las clases lisa y amarilla ( ) LA , lisa y verde
( ) LV , arrugada y amarilla ( ) AA , y arrugada y verde ( ) AV , respectivamente. En cierto
experimento se obtuvieron, respectivamente, 315, 108, 101 y 32. A un nivel de significacin del
5%, coinciden los datos obtenidos con la teora?
Las frecuencias esperadas en este caso las podemos hallar directamente de la teora
mediante lo que denominamos en matemticas un reparto proporcional directo:

= =
= =
= =
= =
= =
+ + +
+ + +
= = = =
75 , 34 1 75 , 34
25 , 104 3 75 , 34
25 , 104 3 75 , 34
75 , 312 9 75 , 34
75 , 34
16
556
1 3 3 9 1 3 3 9
AV
AA
LV
LA
AV AA LV LA AV AA LV LA

Tendramos, entonces, la siguiente tabla de contingencia:
Variable X LA LV AA AV
Frecuencias observadas 315 108 101 32
Frecuencias esperadas 312,75 104,25 104,25 34,75
:
0
H No existe diferencia entre los datos observados y la teora.
:
1
H S existe diferencia entre los datos observados y la teora.
n
e
O
T
k
i i
i
=

=1
2
470 , 0 556
75 , 34
32
25 , 104
101
25 , 104
108
75 , 312
315
2 2 2 2
= + + + =
815 , 7
2
95 ' 0 , 3
2
1 , 1
= =


k

Tenemos, entonces, como
2
1 , 1


<
k
T , que estamos dentro de la regin de aceptacin,
aceptamos
0
H y afirmamos que los datos observados coinciden con la teora.

Ejemplo 18:
Las puntuaciones de un test de agilidad mental realizado en un curso universitario dieron
como resultado la siguiente tabla:
Puntuaciones 45-55 55-65 65-75 75-85 85-95 95-105
N estudiantes 6 7 12 18 13 8
Comprueba si las puntuaciones fueron o no distribuidas segn una ley normal a un nivel de
significacin 05 , 0 = .

El mtodo de aplicacin de la prueba de ajuste para la normalidad de una distribucin de
frecuencias es como sigue:

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
149
1) Si no nos los dieran as, clasificamos los datos en una distribucin de frecuencias:
Intervalos
i
x
i i
f O =
i
p
i i
p n e =
2
i
O
i
i
e
O
2

45-55 50 6 0,0469 3,0016 36 11,9936
55-65 60 7 0,1328 8,4992 49 5,7652
65-75 70 12 0,2364 15,1296 144 9,5178
75-85 80 18 0,2629 16,8256 324 19,2564
85-95 90 13 0,1915 12,2560 169 13,7892
95-105 100 8 0,0869 5,5616 64 11,5075
SUMAS = ------------ 64 ---------- --------- ------------ 71,8297

2) Hallamos el tamao de la muestra, la media y la desviacin tpica:
64 = =
i
O n 656 , 77 =

= =

n
O x
x
i i
550 , 14
2
2
=

= =

x
n
O x
S
i
i

3) Como queremos ver el ajuste a una distribucin normal, calculamos las
i
p hallando las
probabilidades de cada intervalo mediante la tabla de la normal:
[ ] [ ] = < < =
(


< <

= < < = 56 , 1 24 , 2
550 , 14
656 , 77 55
550 , 14
656 , 77 45
55 45
1
Z P Z P x P p
[ ] [ ] [ ] [ ] 0469 , 0 9406 , 0 9875 , 0 56 , 1 24 , 2 24 , 2 56 , 1 = = < < = < < = Z P Z P Z P Z P
[ ] [ ] = < < =
(


< <

= < < = 87 , 0 56 , 1
550 , 14
656 , 77 65
550 , 14
656 , 77 55
65 55
2
Z P Z P x P p
[ ] [ ] [ ] [ ] 1328 , 0 8078 , 0 9406 , 0 87 , 0 56 , 1 56 , 1 87 , 0 = = < < = < < = Z P Z P Z P Z P
[ ] [ ] = < < =
(


< <

= < < = 18 , 0 87 , 0
550 , 14
656 , 77 75
550 , 14
656 , 77 65
75 65
3
Z P Z P x P p
[ ] [ ] [ ] [ ] 2364 , 0 5714 , 0 8078 , 0 18 , 0 87 , 0 87 , 0 18 , 0 = = < < = < < = Z P Z P Z P Z P
[ ] [ ] = < < =
(


< <

= < < = 50 , 0 18 , 0
550 , 14
656 , 77 85
550 , 14
656 , 77 75
85 75
4
Z P Z P x P p
[ ] [ ] [ ] [ ] 2629 , 0 1 5714 , 0 6915 , 0 1 18 , 0 50 , 0 18 , 0 50 , 0 = + = < + < = < < = Z P Z P Z P Z P
[ ] [ ] = < < =
(


< <

= < < = 19 , 1 50 , 0
550 , 14
656 , 77 95
550 , 14
656 , 77 85
95 85
5
Z P Z P x P p
[ ] [ ] 1915 , 0 6915 , 0 8830 , 0 50 , 0 19 , 1 = = < < = Z P Z P
[ ] [ ] = < < =
(


< <

= < < = 88 , 1 19 , 1
550 , 14
656 , 77 105
550 , 14
656 , 77 95
105 95
6
Z P Z P x P p
[ ] [ ] 0869 , 0 8830 , 0 9699 , 0 19 , 1 88 , 1 = = < < = Z P Z P

4) Hallamos las frecuencias esperadas ( )
i
e multiplicando las probabilidades por el tamao de la
muestra (64).
5) Calculamos el estadstico de contraste: n
e
O
T
k
i i
i
=

=1
2
8297 , 7 64 8297 , 71 = =
6) Hallamos el valor de la
2
, teniendo en cuenta que el nmero de grados de libertad es
3 2 1 6 1 = = m k , ya que hemos tenido que calcular dos parmetros: y .
815 , 7
2
95 ' 0 , 3
=

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
150
Como
2
95 ' 0 , 3
> T (aunque por poco), estamos dentro de la regin crtica y debemos rechazar
que las puntuaciones se distribuyan normalmente con un nivel de significacin del 5%.
Sin embargo, si el nivel de significacin fuera un poco menor, el valor de
2
sera algo
mayor y estaramos dentro de la regin de aceptacin, por lo que aceptaramos la hiptesis nula
de que las puntuaciones se distribuyen normalmente.



7.8.2. Contraste de dependencia o independencia de caracteres

En el apartado anterior hemos utilizado la
2
para saber si una serie de datos empricos se
ajustaban o no a una distribucin terica. Podemos igualmente comparar dos o ms distribuciones
empricas entre s si cada una de ellas es comparable a una misma distribucin terica.
Supongamos que queremos comparar en una misma poblacin dos caracteres X e Y que
admiten las modalidades siguientes:
X:
k
x x x ,..., ,
2 1
Y:
m
y y y ,..., ,
2 1

Para ello tomamos una muestra de tamao n . Representando por
ij
O la frecuencia emprica,
es decir, el nmero de elementos de la muestra que presentaron la modalidad
i
x de X e
j
y de Y,
podemos formar la siguiente tabla de contingencia (donde
ij
e es el nmero de elementos que se
espera que presenten las modalidades mencionadas
i
x e
j
y , es decir, la frecuencia terica):
Y
X
1
y

j
y

m
y
Frecuencias
absolutas de X
1
x
11
O
(
11
e )


j
O
1

(
j
e
1
)


m
O
1

(
m
e
1
)
1
x
O

i
x
1 i
O
(
1 i
e )


ij
O
(
ij
e )


im
O
(
im
e )
i
x
O

k
x
1 k
O
(
1 k
e )


kj
O
(
kj
e )


km
O
(
km
e )
k
x
O
Frecuencias
absolutas de Y
1
y
O

j
y
O

m
y
O
n
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
151
siendo n O O O
m
j
y
k
i
x
m k
j i
ij
j i
= = =

= = = 1
,
1 ,
.
Para el clculo de las frecuencias tericas (esperadas) podemos utilizar la siguiente frmula
si las dos variables son independientes:
n
O O
n
n
O
n
O
n p e
j i j
i
y x y x
ij ij

= = = con k i ,..., 2 , 1 = y m j ,..., 2 , 1 =


siendo
n
O
n
O
p
j
i
y x
ij
= las probabilidades de que un elemento tomado de la muestra presente las
modalidades
i
x de X e
j
y de Y.

Consideramos como hiptesis nula e hiptesis alternativa las siguientes:
:
0
H X e Y son independientes (o no existe diferencia significativa entre las dos distribuciones
empricas de X e Y).
:
1
H X e Y no son independientes (o existe diferencia significativa entre las dos distribuciones).
Si aceptamos la hiptesis nula, podemos considerar que no tenemos evidencias que nos hagan
suponer una dependencia entre las dos variables a un nivel de confianza de 1 .

Consideramos como estadstico de contraste:
( )
n
e
O
e
e O
T
k
i
m
j ij
ij
k
i
m
j ij
ij ij
=

=

= = = = 1 1
2
1 1
2

La distribucin de dicho estadstico es una
2
con ( )( ) 1 1 m k grados de libertad en caso
de que las variables sean independientes.
A un nivel de confianza 1 :
Se acepta
0
H

si
( )( )
2
1 , 1 1


<
m k
T

(REGIN DE ACEPTACIN).
Se rechaza
0
H si
( )( )
2
1 , 1 1

m k
T (REGIN CRTICA).

Ejemplo 19:
El consejo de administracin de una compaa telefnica desea conocer si la opinin, Y, de sus
accionistas respecto a una posible fusin es independiente del nmero de acciones, X, que poseen.
Una muestra de 500 accionistas proporciona la tabla de la siguiente pgina. Contrasta a un nivel
de confianza del 99,5% la independencia de las variables X e Y.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
152
VALORES OBSERVADOS (EMPRICOS):
Y
X
A
favor
En
contra

Indecisos

Total
Menos de
200
25 18 21 64
200-1000
93 62 67 222
Ms de
1000
82 70 62 214
Total
200 150 150 500
La poblacin en estudio son los accionistas de la compaa telefnica y deseamos ver si existe
dependencia entre el nmero de acciones y la opinin acerca de una posible fusin.
Se trata de un test no paramtrico donde las hiptesis nula y alternativa son:
:
0
H X e Y son independientes.
:
1
H X e Y no son independientes.
El nivel de confianza es 995 ' 0 1 = , 3 = k , 3 = m , y el tamao muestral 500 = n .
Calculamos los valores esperados
n
O O
e
j i
y x
ij

= bajo la hiptesis nula:


2 , 64
500
150 214
2 , 64
500
150 214
6 , 85
500
200 214
6 , 66
500
150 222
6 , 66
500
150 222
8 , 88
500
200 222
2 , 19
500
150 64
2 , 19
500
150 64
6 , 25
500
200 64
33 32 31
23 22 21
13 12 11
=

= =

= =

=
=

= =

= =

=
=

= =

= =

=
e e e
e e e
e e e

VALORES ESPERADOS (TERICOS):
Y
X
A favor En contra Indecisos Total
Menos de 200 25,6 19,2 19,2 64
200-1000 88,8 66,6 66,6 222
Ms de 1000 85,6 64,2 64,2 214
Total 200 150 150 500
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
153
El valor del estadstico de contraste vale:
527 , 1 500
2 , 64
62
2 , 64
70
6 , 85
82
6 , 66
67
6 , 66
62
8 , 88
93
2 , 19
21
2 , 19
18
6 , 25
25
2 2 2 2 2 2 2 2 2
1 1
2
= + + + + + + + + = =

= =
n
e
O
T
k
i
m
j ij
ij
y
( )( )
860 , 14
2
995 ' 0 , 4
2
1 , 1 1
= =


m k
. Como
( )( )
2
1 , 1 1


<
m k
T , se acepta
0
H y podemos decir que
no tenemos evidencias de que X e Y sean dependientes y se acepta la hiptesis de que la
opinin de los accionistas es independiente del nmero de acciones que poseen con un nivel de
riesgo (o significacin) del 0,5%; o, lo que es lo mismo, con un nivel de confianza del 99,5%.

Ejemplo 20:
La tabla adjunta muestra el
resultado de un experimento para
investigar el efecto de la vacunacin
de animales de laboratorio contra una
determinada enfermedad.
Sufrieron la
enfermedad
No sufrieron la
enfermedad
Vacunados 9 42
No vacunados 18 28
a) Influye la vacuna a un nivel 05 , 0 = ? b) Y a un nivel 01 , 0 = ?
Para saber si influye o no la vacuna en la enfermedad, hacemos la hiptesis
0
H consistente
en suponer que no hay dependencia entre la vacuna y los animales que la sufrieron. Podemos
formar con los datos la siguiente tabla de contingencia de valores observados:
Sufrieron la
enfermedad
No sufrieron la
enfermedad
Total
Vacunados 9 42 51
No vacunados 18 28 46
Total 27 70 97
Aplicando la frmula
n
O O
e
j i
y x
ij

= , obtenemos para los valores esperados la siguiente


tabla de contingencia de valores esperados:
Deberan sufrir la
enfermedad
No deberan
Vacunados
20 , 14
97
27 51
11
=

= e 80 . 36
97
70 51
12
=

= e
No
vacunados
80 , 12
97
27 46
21
=

= e 20 , 33
97
70 46
22
=

= e
Entonces, 566 , 5 97
20 , 33
28
80 , 12
18
80 , 36
42
20 , 14
9
2 2 2 2
1 1
2
= + + + = =

= =
n
e
O
T
k
i
m
j ij
ij

a)
( )( )
841 , 3 05 , 0
2
95 ' 0 , 1
2
1 , 1 1
= = =


m k
. Como
( )( )
2
1 , 1 1


>
m k
T , rechazamos la
hiptesis
0
H a un nivel 05 , 0 = . Es decir, las vacunas influyen en la enfermedad.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
154
b)
( )( )
635 , 6 01 , 0
2
99 ' 0 , 1
2
1 , 1 1
= = =


m k
. Como
( )( )
2
1 , 1 1


<
m k
T , aceptamos la hiptesis
0
H de que la vacuna no influye en la enfermedad a un nivel 01 , 0 = .


7.8.3. Test de homogeneidad de varias muestras
Se trata de determinar si varias muestras que estudian el mismo carcter A han sido
tomadas o no de la misma poblacin, respecto de dicha caracterstica A.
Supongamos que tenemos k muestras de tamaos
k
n n n ,..., ,
2 1
, siendo
k
a a a ,..., ,
2 1
los
nmeros de elementos de cada muestra que presentan una determinada caracterstica A y
k k
a n a n a n ,..., ,
2 2 1 1
los que no la presentan.
Si suponemos que todas las muestras provienen de la misma poblacin, la proporcin de
elementos que presentan la caracterstica A sera:

k
k
n n n
a a a
p
+ + +
+ + +
=
...
...
2 1
2 1

Si suponemos que las muestras provienen de la misma poblacin, los valores esperados para la
caracterstica A en cada muestra seran, respectivamente, ,
1
p n ,
2
p n , p n
k
, y los que
no la poseen, ,
1 1
p n n ,
2 2
p n n , p n n
k k
. Podramos formar la siguiente tabla de
contingencia en la que aparecen los valores observados y los valores esperados:

Muestras
Presentan el carcter A
Se esperan con el
carcter A
No presentan el
carcter A
Se esperan sin el
carcter A
Tamao de
las
muestras
Primera
muestra
1
a
p n
1

1 1
a n
( ) p n 1
1


1
n

i-sima
muestra
i
a
p n
i

i i
a n
( ) p n
i
1

i
n

k-sima
muestra
k
a
p n
k

k k
a n
( ) p n
k
1

k
n
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
155
Consideramos como hiptesis nula e hiptesis alternativa las siguientes:
:
0
H Todas las muestras provienen de la misma de la poblacin.
:
1
H Se rechaza que provengan de la misma poblacin.
Si aceptamos la hiptesis nula, podemos considerar que las muestras provienen de la misma
poblacin y las diferencias entre los valores observados y los valores esperados son debidas al
azar.
El estadstico de contraste que se utilizar ser:
( )
( )

=
k
i i
i i
n
p n a
p p
T
1
2
1
1

La distribucin de dicho estadstico es una
2
con 1 k grados de libertad en el caso de no
existir discrepancias entre los valores observados y los esperados a un nivel de confianza 1 .
El nmero de grados de libertad es 1 k , ya que tenemos k 2 parmetros a lo que hay que
restar 1 + k parmetros que hemos obtenido de las muestras (el parmetro p y los k
parmetros p n n
i i
).
Se acepta
0
H

si
2
1 , 1


<
k
T (REGIN DE ACEPTACIN).
Se rechaza
0
H si
2
1 , 1

k
T (REGIN CRTICA).

Ejemplo 21:
Para curar una cierta enfermedad se sabe que existen cuatro tratamientos diferentes.
Aplicados por separado a cuatro grupos distintos de enfermos, se han observado los siguientes
resultados:
Enfermos: Curados No curados Totales
Tratamiento A 60 23 83
Tratamiento B 46 10 56
Tratamiento C 70 17 87
Tratamiento D 54 30 84
Totales 230 80 310
Se puede considerar que la eficacia de los cuatro tratamientos es la misma con un nivel de
confianza del 95%?
Este problema lo podemos considerar como cuatro muestras de 83, 56, 87 y 84 personas, de
las cuales hay, respectivamente, 60, 46, 70 y 54 personas curadas.
Hacemos entonces la hiptesis
0
H , consistente en suponer los cuatro tratamientos
(muestras) de la misma eficacia, lo que nos llevara a afirmar que la proporcin de personas
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
156
curadas en cada muestra es la misma,
310
230
= p y la de personas no curadas
310
80
1 = p .
Tenemos entonces la siguiente tabla:
Tratamiento
(muestra)
i
n
i
a p n
i
p n a
i i

( )
2
p n a
i i
( )
i
i i
n
p n a
2


A 83 60 61,58 -1,58 2,50 0,03
B 56 46 41,55 4,45 19,80 0,35
C 87 70 64,55 5,45 29,70 0,34
D 84 54 62,32 -8,32 69,22 0,82
Totales 310 230 --------- ---------- ------------ 1,54
El estadstico de contraste es:
( )
( )
043 , 8 54 , 1
80
310
230
310
1
1
1
2
= =

=

=
k
i i
i i
n
p n a
p p
T
En este caso, el nmero de grados de libertad es 3 1 4 1 = = k . Entonces,
815 , 7
2
95 ' 0 , 3
2
1 , 1
= =


k
y, como
2
1 , 1


>
k
T , rechazamos la hiptesis
0
H de que no existe
diferencia entre los tratamientos, con un nivel de confianza del 95%, es decir, los
tratamientos a efectos de curar a los pacientes tienen diferente eficacia.
NOTA: Este problema se puede resolver tambin mediante una tabla de contingencia 2x4 de
un contraste de dependencia o independencia de caracteres.

RESUMEN:
Todos estos contrastes no paramtricos podemos resumirlos en la siguiente tabla:


CONTRASTE
(TEST)
HIPTESIS
NULA,
0
H
HIPTESIS
ALTERNA-
TIVA,
1
H
ESTADSTICO
DE
CONTRASTE
REGIN
CRTICA,
C
R


BONDAD DE
AJUSTE
La distribucin
emprica se
ajusta a la
distribucin
terica
considerada


Se rechaza
el ajuste

n
e
O
T
k
i i
i
=

=1
2


2
1 , 1

k
T


2
1 , 1

m k
T

DEPENDENCIA O
INDEPENDENCIA
DE CARACTERES
X e Y son
independientes
X e Y no son
independientes
n
e
O
T
k
i
m
j
ij
ij
=

= = 1 1
2


( )( )
2
1 , 1 1

m k
T

HOMOGENEIDAD
DE VARIAS
MUESTRAS
Todas las
muestras
provienen de la
misma de la
poblacin
Se rechaza
que provengan
de la misma
poblacin

( )
( )

=
k
i i
i i
n
p n a
p p
T
1
2
1
1


2
1 , 1

k
T

TABLA XV: CONTRASTES NO PARAMTRICOS

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
157
Relacin de problemas del Tema 7.
1. En una poblacin la desviacin tpica es 29 = . Contrasta la hiptesis de que 347 = , con
un nivel de significacin del 1%, mediante una muestra de 200 individuos en la que 352 = x .
2. En los folletos de publicidad, una empresa asegura que las bombillas que fabrica tienen una
duracin media de 1600 horas. A fin de contrastar este dato, se toma una muestra aleatoria
de 100 bombillas, obtenindose una duracin media de 1570 horas, con una desviacin tpica
de 120 horas. Puede aceptarse la informacin de los folletos con un nivel de confianza del
95%?
3. Segn la normativa sobre contaminacin atmosfrica, los motores de los automviles no deben
emitir ms de 5 ppm (partes por milln) de CO
2
. Dentro de sus procesos de control de
calidad, un fabricante ha medido las emisiones de 10 motores, encontrando una media de 5,5
ppm y una desviacin tpica de 0,6 ppm. Contrasta, con un nivel de significacin del 5%, la
hiptesis de que los motores de ese fabricante cumplen en trmino medio la normativa sobre
contaminacin.
4. En funcin de la informacin disponible, la direccin de un centro de secundaria ha
establecido que la media de horas semanales dedicadas por el alumnado de ese centro al
estudio es superior a 15, con una desviacin tpica de 1 hora. Durante el presente curso, el
Departamento de Matemticas quiere demostrar que esta media ha disminuido. Para ello,
elige una muestra aleatoria de 150 alumnos y alumnas, obteniendo una media muestral de 12,7
horas. Puede afirmarse, con un nivel de confianza del 90%, que ha disminuido el tiempo
medio dedicado al estudio por el alumnado del centro?
5. Se sabe que la desviacin tpica de las notas de cierto examen de Matemticas es 2,4. Para
una muestra de 36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para
confirmar la hiptesis de que la nota media del examen fue de 6, con un nivel de confianza del
95%?
6. Un socilogo ha pronosticado que, en una determinada ciudad, el nivel de abstencin en las
prximas elecciones ser del 40% como mnimo. Se elige al azar una muestra de 200
individuos con derecho a voto, de los cuales slo 130 estaran dispuestos a votar. Determina,
con un nivel de significacin del 1%, si se puede admitir el pronstico del socilogo.
7. Un informe indica que el precio medio del billete de avin entre dos ciudades es, como
mximo, de 120 , con una desviacin tpica de 40 . Se toma una muestra de 100 viajeros y
se obtiene que la media del precio de sus billetes es de 128 . Se puede aceptar, con un nivel
de significacin del 10%, la afirmacin de partida?
8. Una marca de nueces afirma que, como mximo, el 6% de las nueces que envasa estn vacas.
Se eligieron al azar 300 nueces de esa marca y se detectaron 21 vacas.
a) Con un nivel de significacin del 1%, se puede aceptar la afirmacin de la marca?
b) Si se mantiene el porcentaje muestral de nueces vacas, y con un nivel de confianza del
95%, qu tamao muestral se necesita para estimar la proporcin de nueces de la marca
vacas con un error menor del 1%?
9. El control de calidad de una fbrica de pilas y bateras sospecha que hubo defectos en la
produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin.
Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media
300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote
producido, antes de enviarlo al mercado, se obtuvo que, de una muestra de 60 bateras, el
tiempo medio de duracin en conversacin fue de 290 minutos. Suponiendo que la distribucin
de ese tiempo sigue siendo normal con la misma desviacin tpica, se puede concluir que las
sospechas del control de calidad son ciertas a un nivel de significacin del 2%?
10. Se cree que el nivel medio de protrombina en una poblacin normal es de 20 mg/100 ml de
plasma, con una desviacin tpica de 4 mg/100 ml. Para comprobarlo, se toma una muestra de
40 individuos en los que la media es de 18,5 mg/100 ml. Se puede aceptar la hiptesis con un
nivel de significacin del 5%?
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
158
11. Un laboratorio farmacutico fabrica un producto para la cada del cabello que envasa en
botes, en cuyo etiquetado indica que su contenido es de 10 cm
3
. Se eligen al azar 7 de esos
botes y se miden sus contenidos, dando (en cm
3
) los siguientes resultados:
9,7 10,1 10,2 9,9 9,8 10 10,3
Si sabemos que el contenido es una variable normal de desviacin tpica 0,2 cm
3
, podemos
asegurar, con un nivel de confianza del 95%, que la capacidad media de los botes que se
fabrican es la indicada en el bote?
12. Un dentista afirma que el 40% de los nios de diez aos presenta indicios de caries dental.
Tomada una muestra de 100 nios, se observ que 30 presentaban indicios de caries.
Utilizando la aproximacin normal comprueba, al nivel de significacin del 5%, si el resultado
proporciona evidencia que permita rechazar la afirmacin del dentista.
13. Un laboratorio afirma que un determinado calmante quita la jaqueca en catorce minutos, como
mucho, en los casos corrientes. Con el fin de comprobar esta afirmacin, se eligen al azar 28
pacientes con jaqueca y se toma como variable en el experimento el tiempo que transcurre
entre la administracin del calmante y el momento en que desaparece la jaqueca. En esta
muestra se obtuvo una media de diecisiete minutos y una desviacin tpica de siete minutos.
Podemos admitir como cierta la afirmacin del laboratorio a un nivel de confianza del 95%?
14. Un fabricante de lmparas elctricas est ensayando un nuevo mtodo que se considerar
aceptable si las lmparas obtenidas por este mtodo dan lugar a una poblacin normal de
duracin media mnima de 2400 horas, con una desviacin tpica igual a 300 horas. Se toma
una muestra de 100 lmparas producidas por este mtodo y esta muestra da una duracin
media de 2320 horas. Se puede aceptar la hiptesis de validez del nuevo proceso de
fabricacin con un riesgo igual o menor que el 5%? Cunto valen en este caso las
probabilidades de los errores de tipo I y de tipo II?
15. Se lanza una moneda 200 veces y se obtienen 115 caras y 85 cruces. La moneda est bien
hecha? Riesgo = 5%.
16. En una investigacin cientfica para comprobar si la vitamina C es positiva para la prevencin
de resfriados, se seleccionaron 279 esquiadores y durante siete das se les suministr o un
placebo o un gramo de vitamina C. Pasado este tiempo se observaron los siguientes
resultados:
Resfriado No resfriado
Placebo 31 109
Vitamina C 17 122
Podemos afirmar, con un nivel de confianza
del 99%, que la vitamina C ayuda en la
prevencin del resfriado?
17. Tomada una muestra al azar de 500 personas se encontr que 200 lean algn peridico
habitualmente. Podemos afirmar que el porcentaje de la poblacin que lee habitualmente
algn peridico es del 43%, con un nivel de confianza del 95%?
18. Una mquina automtica fabrica piezas cuya longitud sigue una distribucin normal de
desviacin tpica 0,5 mm. Tomamos una muestra de 25 piezas, que nos da una media muestral
de 50 mm. Se puede afirmar, con un nivel de confianza del 95%, que la longitud media de
todas las piezas fabricadas es de 50,4 mm?
19. Los sueldos de los habitantes de una ciudad se distribuyen normalmente. Para una muestra de
25 habitantes de dicha ciudad se obtiene una desviacin tpica de sus sueldos de 60 . Con un
nivel de significacin del 2%, puede afirmarse que la desviacin tpica de los sueldos de toda
la poblacin es, como mucho, de 61,50 ?
20. Se est haciendo un estudio sobre presin arterial. Se consideran las presiones sistlicas de
un grupo de nios con uno de sus padres hipertenso y otro grupo de nios cuyos padres tienen
presin normal. Suponemos distribuciones normales. Los datos han sido los siguientes:
8 , 107
1
= x mm de Hg; 51 , 50
2
1
= s ; 10
1
= n ; 2 , 97
2
= x mm de Hg; 41 , 50
2
2
= s ; 9
2
= n .
Contrasta estadsticamente, con un nivel de significacin del 5%, si el tener algn progenitor
hipertenso influye en un aumento de, al menos, 2 mm de Hg, en la presin arterial de los
hijos, si las varianzas poblacionales son iguales.
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
159
21. Una muestra aleatoria de 100 alumnos que se presentan a las pruebas de acceso a la
Universidad revela que la edad media es de 18,1 aos. Sabiendo que la desviacin tpica de la
poblacin de estudiantes que se presenta es de 0,4 aos, podemos afirmar, con un nivel de
significacin del 5%, que la edad media de dicha poblacin es de 18 aos?
22. Se sabe que la duracin de una determinada enfermedad sigue una ley normal. Para la
curacin de dicha enfermedad se emplean dos tipos de antibiticos y se desea comprobar
estadsticamente cul de los dos es ms eficaz con respecto a la duracin de la enfermedad.
A tal fin, se observan seis enfermos a los que se les aplica el primer antibitico y cinco
enfermos a los que se les aplica el segundo. Los resultados han sido los siguientes:
12
1
= x das; 16
2
1
= s ; 6
1
= n ; 15
2
= x das; 16
2
2
= s ; 5
2
= n .
Si las distribuciones son normales y las varianzas poblacionales son iguales, cul de los dos
antibiticos es ms eficaz a un nivel de significacin de 0,05?
23. Se quiere comparar dos poblaciones de rana Pipiens aisladas geogrficamente. Se toman al
azar dos muestras de ranas, una de cada poblacin, y se mide la longitud del cuerpo. Los
resultados son los siguientes: 74
1
= x mm; 225
2
1
= s ; 42
1
= n ; 78
2
= x mm; 169
2
2
= s ;
56
2
= n . Contrasta estadsticamente si existe diferencia entre las longitudes del cuerpo de
las dos poblaciones de ranas a un nivel de significacin del 1%, si sabemos que las
distribuciones son normales y las varianzas poblacionales son distintas.
24. De cien vstagos de un cierto cruce de conejos, quince son negros y los otros no lo son. De
acuerdo con el modelo gentico, los conejos deberan estar en proporcin 3/13 (negros/no
negros). Se pide contrastar la hiptesis de consistencia de los datos, con un nivel de
significacin del 5%.
25. Disea una regla de decisin para contrastar la hiptesis de que una moneda est bien hecha
si en una muestra de 64 lanzamientos se toma un nivel de significacin de: a) 0,05 b) 0,01.
26. En un experimento sobre percepcin extrasensorial (E.S.P.) un individuo (sujeto) en una
habitacin fue preguntado sobre el color (rojo o azul) de una carta elegida por otro individuo
en otra habitacin de un conjunto de 50 cartas bien barajadas. El sujeto desconoce cuntas
cartas rojas o azules hay en el mazo. Si el sujeto identifica correctamente 32 cartas,
determina si los resultados son significativos al nivel de significacin de: a) 0,05 b) 0,01.
27. El fabricante de una patente mdica sostiene que la misma tiene un 90% mnimo de
efectividad en el alivio de una alergia, por un perodo de ocho horas. En una muestra de 200
individuos que tenan la alergia, la medicina suministrada alivi a 160 personas. Con un nivel de
significacin de 0,01, podemos considerar cierta la aseveracin del fabricante?
28. La altura media de 50 estudiantes de un colegio estadounidense que tomaban parte en unas
pruebas atlticas fue de 68,2 pulgadas con desviacin tpica de 2,5 pulgadas, mientras que 50
estudiantes que no mostraban inters en tal participacin tenan una altura media de 67,5
pulgadas con una desviacin tpica de 2,8 pulgadas. Ensaya la hiptesis de que los estudiantes
que participan en las pruebas atlticas son ms altos que los otros con = 0,05.
29. En el pasado una mquina ha producido arandelas con un grosor de 0,050 pulgadas. Para
determinar si la mquina sigue en buenas condiciones de produccin, se toma una muestra de
10 arandelas, que resulta tener un grosor medio de 0,053 pulgadas y una desviacin tpica de
0,003 pulgadas. Contrasta la hiptesis de que la mquina sigue en buenas condiciones de
produccin al nivel de significacin de: a) 0,05 b) 0.01 c) 0,001.
30. La desviacin tpica de la resistencia a la rotura de ciertos cables producidos por una
compaa viene dada por 120 kilos. Despus de introducir un cambio en el proceso de
produccin de estos cables, la resistencia a la rotura de una muestra de 8 cables dio una
desviacin tpica de 150 kilos. Investiga el aparente incremento en la variabilidad, con un nivel
de confianza del: a) 95% b) 99% c) 99,9%.
31. La resistencia a la rotura de los cables producidos por un fabricante tiene una media de 900
kilos y una desviacin tpica de 50 kilos. Mediante una nueva tcnica en el proceso de
fabricacin, se aspira a que esta resistencia pueda ser incrementada. Para ensayar esta
Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
160
aspiracin, se ensaya una muestra de 50 cables fabricados con el nuevo procedimiento y se
encuentra que su resistencia media es de 925 kilos. Puede mantenerse que, en efecto, hay
un aumento de resistencia al nivel de significacin del 0,01?
32. Se hizo un examen a dos clases formadas por 20 y 25 estudiantes, respectivamente. En la
primera clase la puntuacin media fue de 7,4 con una desviacin tpica de 0,8. En la segunda
clase la puntuacin media fue de 7,8 con una desviacin tpica de 0,7. Hay una diferencia
significativa entre los resultados de ambas clases para (a) = 0,05 (b) = 0,01?
33. Dos tipos de soluciones qumicas, A y B, fueron ensayadas para ver su pH (grado de acidez de
la solucin). Anlisis de 6 muestras de A dieron un pH medio de 7,52 con una desviacin tpica
de 0,024. Anlisis de 5 muestras de B dieron un pH medio de 7,49 con una desviacin tpica
de 0,032. Con un nivel de significacin del 5%, determina si los dos tipos de soluciones tienen
diferentes valores de pH. Y con un nivel de confianza del 99%?
34. En el pasado la desviacin tpica de ciertos paquetes de 400 gramos, llenados por una
mquina, era de 2,5 gramos. Una muestra al azar de 20 paquetes nos da una desviacin tpica
de 3,2 gramos. Es el aparente incremento de variabilidad significativo al nivel de
significacin de (a) 0,05 (b) 0,01 (c) 0,001? Deber revisarse la mquina?
35. En una estacin agrcola se deseaba ensayar el efecto de un determinado fertilizante sobre
la produccin de trigo. Para ello, se eligieron 24 parcelas de terreno de igual superficie; la
mitad de ellas fueron tratadas con el fertilizante y la otra no (grupo testigo). Todas las
dems condiciones fueron las mismas. La media de trigo conseguida en las parcelas no
tratadas fue de 4,8 fanegas con una desviacin tpica de 0,40 fanegas, mientras que la media
en las parcelas tratadas fue de 5,4 fanegas con una desviacin tpica de 0,36 fanegas. Puede
deducirse que hay un incremento significativo de, al menos, 0,3 fanegas, en la produccin
media de trigo por el empleo del fertilizante, al nivel de significacin de: (a) 1% (b) 5%?
36. Diez sujetos participaron en un experimento para estudiar la efectividad de cierta dieta,
combinada con un programa de ejercicios, en la reduccin de los niveles de colesterol en
suero. La tabla siguiente muestra dichos niveles de colesterol en suero al comienzo y al final
del programa:
Comienzo 211 241 231 270 238 247 336 245 250 277
Final 200 236 216 233 224 216 296 195 207 247
Es efectivo el programa dieta-ejercicios en la reduccin de, al menos, 10 puntos, en los
niveles de colesterol con un nivel 001 , 0 = ? Y con un nivel de confianza del 99%?
37. El fabricante de un cierto medicamento asegura que ste alivia una cierta alergia en ms de
un 90% de los casos. En una muestra de 200 pacientes que tenan la alergia, la medicina
suministrada alivi a 185 de ellos.
a) Con un nivel de significacin 0,01, determina si puede aceptarse la afirmacin del
fabricante del medicamento.
b) Con el mismo nivel de significacin (0,01) e idntica proporcin muestral, cul debera
ser el tamao mnimo de la muestra para poder aceptar la afirmacin del fabricante?
38. El tamao medio de una muestra de 18 piezas de precisin producidas en una fbrica es de 10
mm, y la cuasivarianza muestral es 0,68. Podemos afirmar, con un nivel de significacin del
5%, que el tamao medio del total de piezas fabricadas supera los 9,8 mm?
39. Seguimos con la misma muestra del problema anterior. Teniendo en cuenta que dichas piezas
se consideran no defectuosas si la varianza de toda la poblacin fabricada no alcanza el valor
de 0,36 y con un nivel de significacin de 0,05, debera aconsejarse modificar el proceso de
fabricacin?
40. En una cuestin concerniente a las horas de biblioteca en una determinada universidad,
cuarenta de cincuenta hombres entrevistados fueron favorables a incrementar las horas de
apertura, mientras que setenta y ocho de ochenta mujeres fueron favorables a la idea.
Existe evidencia, con un nivel de confianza del 95%, de una diferencia entre las
proporciones de todos los hombres y mujeres favorables a la idea?

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
161

41. La elasticidad del plstico puede variar dependiendo del proceso por el cual el plstico es
preparado. Para comparar la elasticidad del plstico producido por dos procesos diferentes,
la elasticidad de seis piezas extradas de cada proceso fue analizada. Los datos fueron:
Proceso A 6,1 9,2 8,7 7,5 9,0 7,3
Proceso B 9,2 8,1 6,9 7,9 6,5 9,0
Presentan los datos suficiente evidencia para poder asegurar que existe diferencia entre
las elasticidades medias de los dos procesos con un nivel de significacin del 1%?
42. Para ensayar la hiptesis de que la esperanza media de vida de los habitantes de un pas es de
80 aos con una desviacin tpica de 10 aos, se toma la siguiente regla de decisin: (1) se
acepta la hiptesis si en una muestra aleatoria de cien personas recin fallecidas la edad se
encontraba entre 78 y 82 aos; (2) en caso contrario, se rechaza la hiptesis.
a) Halla la probabilidad de rechazar la hiptesis, cuando en realidad es cierta.
b) Calcula la probabilidad de aceptar la hiptesis, cuando realmente debera rechazarse, por
ser, por ejemplo, la esperanza media de vida de 84 aos (con la misma desviacin tpica), en
vez de los 80 aos mencionados.
c) Cunto vale la potencia del contraste?
43. Para contrastar la hiptesis de que la esperanza media de vida de los habitantes de un pas es
de 80 aos (con una desviacin tpica de 10 aos) mediante una muestra aleatoria, queremos
imponer las siguientes restricciones: (A) la probabilidad de rechazar la hiptesis cuando sea
realmente correcta debe ser a lo sumo del 1%; (B) la probabilidad de aceptar la hiptesis
cuando la esperanza media de vida sea de 84 aos (con la misma desviacin tpica) debe ser a
lo sumo del 1%. Determina el tamao muestral mnimo necesario y enuncia la regla de decisin
resultante.
44. Sobre una decisin de importancia nacional los votos de los dos partidos mayoritarios de un
determinado pas registraron los datos de la siguiente tabla:
Votos A favor En contra Abstenciones
Partido A 85 79 40
Partido B 120 62 26
a) Hay diferencia entre ambos partidos a un nivel 05 , 0 = ?
b) Y a un nivel 01 , 0 = ?
45. Al tirar un dado 120 veces, obtuvimos 25 veces un 1, 17 veces un 2, 15 veces un 3, 23 veces un
4, 24 veces un 5, y 16 veces un 6. Contrasta la hiptesis de que el dado est bien hecho con
un nivel de significacin del 5%. Y con 01 , 0 = ?
46. En una prueba verdadero-falso una estudiante contest correctamente sesenta preguntas de
un total de cien. Por pruebas anteriores, se sabe que los que conocen realmente la materia del
examen contestan correctamente al 80% de las preguntas en una prueba de este tipo.
a) Con un riesgo del 10%, contest la estudiante simplemente a ojo?
b) Con el mismo riesgo anterior, cuntas preguntas debera contestar la alumna para
demostrar que conoce la materia del examen?
47. Tres mtodos de empaquetado de tomates fueron probados durante un perodo de cuatro
meses; se hizo un recuento del nmero de kilos por millar que llegaron estropeados,
obtenindose la siguiente tabla:
Meses Mtodo A Mtodo B Mtodo C Totales
1 6 10 10 26
2 8 12 12 32
3 8 8 14 30
4 9 14 16 39
Totales 31 44 52 127
Con un nivel de significacin de 005, comprueba que los tres mtodos son igualmente buenos.

Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
162

48. Un botnico lleva a cabo un experimento de germinacin con tres especies diferentes de
plantas del desierto, en presencia de una concentracin de sales del 0,20%. Los resultados
obtenidos son: de la especie A, germinan 91 plantas y no lo hacen 9; de la especie B, germinan
86 y no germinan 14; y de la especie C, 81 germinan y 19 no germinan. Puede considerarse
distinta la proporcin de plantas germinadas segn la especie con 025 , 0 = ?
49. Una encuesta sobre 320 familias con 5 hijos/as dio la distribucin que aparece en la tabla:
Nmero de
nios y nias
5 nios
0 nias
4 nios
1 nia
3 nios
2 nias
2 nios
3 nias
1 nio
4 nias
0 nios
5 nias
Total
Nmero de
familias
18 56 110 88 40 8 320
Es este resultado consistente con la hiptesis de que los nacimientos de nio o nia son
igualmente probables?
50. Una acreditada zapatera es abastecida por cuatro fabricantes. Cada par de zapatos es
inspeccionado antes de ponerlo en venta. Hay tres defectos diferentes que causaran la
devolucin al fabricante. Durante una muestra se encontraron los siguientes defectos:
Defecto
Fabricante
I II III
A 17 10 13
B 10 10 10
C 18 15 17
D 15 5 10
Se puede decir que los defectos son independientes del fabricante a un nivel de
significacin del 1%?
51. Una cadena de grandes almacenes tiene cinco divisiones, una en cada piso. De una muestra
aleatoria de mil clientes se obtuvo la siguiente clasificacin doble:
Tipo de pago Ropa y
calzado
Cosmticos y
belleza
Muebles y
hogar
Regalos y
joyas
Juguetes
Al contado
(efectivo)
20 30 10 10 30
Al contado
(cheque)
100 90 30 20 60
Tarjeta de
crdito del
almacn

40

30

10

30

10
Tarjeta de
crdito
bancaria

140

150

50

40

100
Para 05 ' 0 = , es el tipo de pago independiente de la divisin de compra?











Estadstica Bachillerato
CARLOS M. MASCORT SUREZ MANUEL ORTEGA GUTIRREZ
163

BIBLIOGRAFA:

- Asencio Rubio, M. J., Romero Lpez, J. A. y de Vicente Fernndez, E. (1999):
Estadstica. McGraw-Hill, Madrid.

- Boursin, J.-L. (1968): Las Estructuras del Azar. Ediciones Martnez Roca, Barcelona.

- Gil Martos, J., Rivera, M., Vzquez, C. y Caruncho, J. (1986): Matemtica (COU).
Ediciones Santillana, Madrid.

- Gonzlez Garca, C., Llorente Medrano, J. y Ruiz Jimnez, M. J. (2008): Matemticas
Aplicadas a las Ciencias Sociales (1 Bachillerato). Editorial Editex, Madrid.

- Gonzlez Garca, C., Llorente Medrano, J. y Ruiz Jimnez, M. J. (2008): Matemticas
Aplicadas a las Ciencias Sociales (2 Bachillerato). Editorial Editex, Madrid.

- Moroney, M. J. (1979): Introduccin a la Estadstica. EUNSA, Pamplona.

- Quesada Paloma, V., Isidoro Martn, A. y Lpez Martn, L. A. (1982): Curso y
Ejercicios de Estadstica. Editorial Alhambra, Madrid.

- Ramrez Fernndez, A. J., Esteve Arolas, R., del Valle Garca, F. y Navarro Garca, T.
(1988): Matemticas II (C.O.U. opciones C y D). Editorial Ecir, Valencia.

- Rey Pastor, J. y de Castro Brzezicki, A. (1972): Elementos de Matemticas.
S.A.E.T.A., Madrid.

- Spiegel, Murray R. (1970): Estadstica. McGraw-Hill (serie Schaum), Mxico.

- Vizmanos, J. R., Hernndez, J. y Alcaide, F. (2008): Matemticas 1 (Ciencias y
Tecnologa). Ediciones SM, Madrid.



OTROS MEDIOS (INFORMTICOS):

- Pginas web:

http://es.wikipedia.org/wiki/

http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm

http://www.ditutor.com/inferencia_estadistica/estadistica_inferencial.html

http://www.hrc.es/bioest/estadis_1.html

http://www.vitutor.com/estadistica.html

- Enciclopedia Microsoft Encarta 2007 / Biblioteca Premium.

S-ar putea să vă placă și