Sunteți pe pagina 1din 8

Media y varianza de una variable

9
aleatoria. Desigualdad de
Tchebishev

Introducción
La media es un parámetro de localización, mientras que la varianza es un parámetro
de forma. Estos dos parámetros toman mucho sentido cuando se comparan dos Pafnuty Lvóvich Tchebishev
variables aleatorias entre sí, cada una con su media y su varianza, como veremos en
algunos ejemplos. Pafnuty Tchebishev, uno de los más
célebres matemáticos del siglo XIX, nació
el 16 de mayo de 1821 en Okatovo, en el
Cuando solamente se conocen la media y la varianza de una variable aleatoria, pero oeste de Rusia, y murió en San Petersburgo
no su distribución probabilística, se las puede emplear para establecer cotas de la el 8 de diciembre de 1894. Sus trabajos
probabilidad de que la variable tome un valor en cierto intervalo. matemáticos se pueden clasificar en las
cuatro ramas siguientes: mecanismos y
teoría de la aproximación de funciones;
Objetivos del módulo teoría de los números; teoría de
probabilidades; teoría de la integración. Sin
embargo, escribió acerca de muchos otros
1. Conocer el concepto de media y de varianza. temas: formas cuadráticas, construcción
2. Conocer la variabilidad de una variable aleatoria. de mapas, cálculo geométrico de
3. Establecer cotas para las probabilidades, a pesar de desconocer la distribución de volúmenes, etc., y dejó más de 80
una variable aleatoria. publicaciones, algunas de las cuales no
tienen títulos matemáticos: «Sobre un
mecanismo», «Sobre la confección de
Preguntas básicas vestidos», «Sobre la construcción de
mapas geográficos», «Sobre las ruedas
dentadas»…
1. ¿Qué son la media y la varianza de una variable aleatoria?
2. Compare dos distribuciones empleando los parámetros de localización y de for- A Tchebishev se le reconoce como el
ma. creador de la escuela matemática de San
Petersburgo, cuyo eco e influencia ha
3. Establezca una cota para la probabilidad de que la variable tome un valor en un llegado hasta nuestro tiempo en muchas
intervalo simétrico respecto a la media. ramas de esta ciencia. Esta escuela se
distinguía por la tendencia a relacionar los
problemas teóricos de la matemática con
Contenidos del módulo los problemas de la técnica y de la

9.1 La media de una variable aleatoria


9.1.1 Caso discreto
9.1.2 Caso continuo
9.2 La varianza de una variable aleatoria
9.2.1 Caso discreto
9.2.2 Caso continuo
9.3 Desigualdad de Tchebishev Vea el módulo 9 del programa
de televisión Estadística.

Estadística
85
Capítulo 3: Variable aleatoria

naturaleza. Según el propio Tchebishev, «la


unión de la teoría y la práctica proporciona
9.1 La media de una variable aleatoria
los resultados más provechosos. Con ello,
no sólo gana la práctica, sino que también Para establecer la definición de la media de una variable aleatoria tendremos en
salen beneficiadas las ciencias. La práctica
cuenta si es discreta o continua.
descubre a la teoría nuevos objetivos de
investigación o nuevas facetas en los objetos
ya conocidos». En otra ocasión escribió: 9.1.1 Caso discreto
«La mayor parte de los problemas
prácticos se reduce a problemas de
máximo y mínimo que son nuevos para la Sea una X una variable aleatoria discreta y sea

^( x1 , p( x1 )), ( x2 , p( x2 )),..., ( xn , p( xn )),...`


ciencia y sólo su resolución puede satisfacer
a la práctica, que siempre busca lo mejor y
más ventajoso».

Adaptado de:
su distribución de probabilidades.
„ Francisco Luquin (Universidad del País
Vasco). Definimos la media así:
http://www.divulgamat.net/weborriak/

P ( (X ) ¦ xi p( xi ).
Historia/MateOspetsuak/Chebyshev.asp

xi RX

Ejemplo

Tenemos la siguiente distribución de probabilidad:

(1, 0.15), (5, 0.25), (7.3, 0.20), (10, 0.30), (16, 0.10).

Su media será:

P (1)(0.15)  (5)(0.25)  (7.3)(0.20)  (10)(0.30)  (16)(0.10) 7.46.

Tenemos pues que la media será la suma de los valores ponderados por su respec-
tiva probabilidad.

9.1.2 Caso continuo

Sea X una variable aleatoria continua y sean RX su dominio y f ( x ) su función de


densidad.

Definimos la media así:

P E( X ) ³RX
xf ( x) dx.

Ejemplo

Tenemos la siguiente función de densidad:

f ( x) 2 x, x  [0, 1].

86
Módulo 9: Media y varianza de una variable aleatoria. Desigualdad de Tchebishev

Su media será:

P ³
1 2
x (2 x) dx .
0 3

En ambos casos (discreto y continuo) podemos interpretar la media como el centro


de masa de la distribución.

9.2 La varianza de una variable aleatoria


9.2.1 Caso discreto

Sea X una variable aleatoria discreta y sea

^( x1 , p( x1 )), ( x2 , p( x2 )),..., ( xn , p( xn )),...`

su distribución de probabilidades.

Definimos la varianza así:

V2 ( (( X  P ) 2 ) ¦ ( xi  P ) p ( xi ).
2

xi RX

Ejemplo

Tomemos la misma distribución de probabilidad del ejemplo de la sección 9.1.1:

(1, 0.15), (5, 0.25), (7.3, 0.20), (10, 0.30), (16, 0.10).

Habíamos obtenido que la media era 7.46. Ahora hallaremos la varianza:

V2 ¦ ( xi  7.46) p ( xi ).
2

xi RX

Es decir,

V2 (1  7.46) 2 (0.15)  (5  7.46) 2 (0.25)  (7.3  7.46) 2 (0.20)


 (10  7.46) 2 (0.30)  (16  7.46) 2 (0.10) 17.006.

9.2.2 Caso continuo

Sea X una variable aleatoria continua y sean RX su dominio y f (x ) su densidad.

Definimos la varianza así:

Estadística
87
Capítulo 3: Variable aleatoria

V2 ( (( X  P ) 2 ) ³RX
( x  P ) 2 f ( x) dx.

Ejemplo

Retomemos la función de densidad utilizada en el ejemplo de la sección 9.1.2:

f (x) = 2x, x  [0, 1].

Hallamos que la media valía 2/3. Ahora hallaremos la varianza:


§ 2 ·
( ¨¨ ¨§ X  ¸· ¸¸ ³RX ¨© x  3 ¸¹ f ( x) dx ³ 0 ¨© x  3 ¸¹ (2 x) dx
§ 2· § 2·
V2
2 2 2
1
©© 3¹ ¹
1
.
18

Por su propia definición la varianza siempre será no negativa, tanto en el caso


discreto como en el caso continuo.

9.3 Desigualdad de Tchebishev


Si observamos de nuevo la fórmula de la varianza en el caso discreto, notamos que
la varianza consiste en la suma ponderada de los errores cuadráticos respecto a la
media. El factor de ponderación es precisamente la probabilidad asociada a cada
valor:

V2 ( (( X  P ) 2 ) ¦ ( xi  P ) p ( xi ).
2

xi R X

Se acostumbra extraer la raíz cuadrada de la varianza para obtener la desviación


estándar:

V V2.

La desviación estándar se expresa en el mismo orden de magnitud que la variable


aleatoria y mide la variabilidad de la distribución. Cuando la distribución concentra
las probabilidades en las vecindades de la media, la desviación estándar es peque-

no a la media. En cambio si V es alta, existe una probabilidad alta de obtener valores


ña. En este caso existe una alta probabilidad de que la variable tome un valor cerca-

lejanos de la media.

intervalo simétrico respecto a P 


Tomemos como referencia la ubicación de la media y propongamos el siguiente

P  kV  X  P  kV ,

o lo que es lo mismo:

X  P  kV .

88
Módulo 9: Media y varianza de una variable aleatoria. Desigualdad de Tchebishev

Veamos la siguiente desigualdad (llamada desigualdad de Tchebishev) que estable-


ce una cota superior para la probabilidad de que la variable tome un valor lejano, o
sea fuera de este intervalo:

P ( X  P t kV ) d
1
.
k2

Podemos asignar valores de k cada vez más y más grandes, de manera que la

bilidad de que la variable aleatoria X tome un valor que esté más lejos de 2V (lo cual
probabilidad de obtener valores lejanos desciende cuadráticamente. Así, la proba-

aleatoria X tome un valor más lejano de 3V es a lo sumo 1/9 y así sucesivamente.


ocurre cuando k = 2) es a lo sumo 1/4, mientras que la probabilidad de que la variable

Mientras más nos alejamos, la probabilidad es más pequeña, cuadráticamente.

Demostremos la desigualdad de Tchebishev asumiendo que la variable aleatoria X


es discreta. Un procedimiento similar se cumple para el caso continuo.

Partimos del concepto de varianza:

V2 E (( X  P 2 )) ¦ (x
xi RX
i  P ) 2 p ( xi ).

Podemos descomponer la suma en tres regiones:

R1 , R2 , R3 .

a. La región R2 comprende los posibles valores cercanos, o sea valores que


quedan contenidos en la región

X  P  kV .

b. La región R1 se refiere a los valores lejanos que están a la izquierda, o sea


donde

X  P d kV .

c. La región R3 se refiere a los valores lejanos que están a la derecha, es decir,


donde

X  P t kV .

Así, tendremos:

V2 ¦ (x  P)
xi R1
i
2
p( xi )  ¦ (x  P)
xi R2
i
2
p( xi )  ¦ (x  P)
xi R3
i
2
p( xi ).

Estadística
89
Capítulo 3: Variable aleatoria

Dado que la expresión

( xi  P ) 2 p ( xi )

no puede ser negativa, la suma anterior sobre R2 es no negativa, y sin ella la suma

en las regiones izquierda y derecha es menor o igual que V 2 . Así:

V2 t ¦ (x  P)
xi R1
i
2
p( xi )  ¦ (x  P)
xi R3
i
2
p( xi ).
(1)

En ambas regiones se está cumpliendo que:

xi  P t kV ,

lo cual nos permite plantear que:

( xi  P ) 2 t k 2V 2 ,

y por tanto, regresando a la expresión (1), tendremos:

V2 t ¦kV
xi R1
2 2
p ( xi )  ¦kV
xi R3
2 2
p ( xi ),

de donde:

t ¦ p( xi )  ¦ p ( xi )
1
k 2 xi R1 xi R3

t P( X  P t kV ),

que era lo que queríamos demostrar.

La desigualdad de Tchebishev también se acostumbra plantear en términos del


suceso complementario:

P ( X  P  kV ) t 1 
1
.
k2
Ejemplo

En promedio, la demanda diaria de cierto artículo es 28 y su varianza es 16. ¿Cuántos


artículos deben estar disponibles para cubrir la demanda en al menos el 90% de los
días?

Lo primero que haremos es definir la variable aleatoria de interés.

90
Módulo 9: Media y varianza de una variable aleatoria. Desigualdad de Tchebishev

Sea X = demanda de artículos en un día cualquiera. Desconocemos la distribución


de probabilidad de esta variable aleatoria, lo cual nos permitiría hallar los valores de
la variable que garanticen una confiabilidad de al menos el 90% de los días. Pero con
la desigualdad de Tchebishev podemos hacer la siguiente formulación:

Queremos conocer un cierto umbral k tal que:

P ( X  k ) t 0.90.

Si el inventario se provee con k artículos, en al menos el 90% de los días tendremos


suficientes existencias. O equivalentemente,

P ( X t k ) d 0.10

teniendo en cuenta el suceso complementario.

También podemos formular el problema como la búsqueda de un cierto valor c tal


que:

P ( X  28 t c) d 0.10.

Tengamos en cuenta que:

P ( X  28 t c) d P ( X  28 t c ) P ( X  28 t kV ) d
1
,
k2
así que
1
0.10.
k2

Por tanto,

2 1
k= ,
0 .1 0

y en consecuencia,

k2 10 y k 10.

Como la varianza vale 16 eso quiere decir que la desviación estándar es de 4. Así que

kV 4 10 y c 4 10,

lo cual nos permite formular el suceso:

X  28 t 4 10.

Estadística
91
Capítulo 3: Variable aleatoria

Por tanto, la provisión de artículos debe ser:

X t 28  4 10.

En conclusión, la provisión del inventario debe ser de al menos 41 artículos.

Resumen
Hemos estudiado los importantes conceptos de media y varianza de una variable aleatoria. La media se considera un
parámetro de posición, mientras que la varianza se considera un parámetro de forma. También vimos la desigualdad de
Tchebishev, que es un recurso muy útil para situaciones donde tenemos la media y la varianza, pero no conocemos la
distribución de la variable considerada.

Actividades de autoestudio

1. En el lanzamiento de un par de dados defina varias variables aletorias, discretas y continuas.

2. La variable aleatoria de nuestro interés consiste en el puntaje total que se obtiene al lanzar dos dados. Sea Y esta
variable.

a. Obtenga su domino RY y su distribución de probabilidad.


b. Muestre los resultados en una tabla.
c. Obtenga su media y su varianza ( PY y V Y 2 ).
d. Calcule la probabilidad de los siguientes sucesos:

„ ^5 d Y d 10` .
„ ^5  Y  10.3` .

3. Proponga una función de densidad constante en el intervalo [0, 4.1].

4. Si marcamos dos puntos al azar en un círculo y nos interesamos por la distancia entre ellos, ¿cuál sería el dominio de
esta variable aleatoria? Si suponemos que la función de densidad es constante, ¿cuánto debe valer?

5. Utilice un triángulo isósceles para proponer una función de densidad cuyo dominio es el intervalo [0, 2] . Sea X una
variable aleatoria continua cuya densidad y dominio son los que acabamos de obtener. Encuentre la media y la
varianza de X ( P X y V X2 ).

6. En el caso continuo se dice que una distribución es triangular cuando su función de densidad tiene forma de
triángulo. Obviamente, el área de ese triángulo tiene que valer 1. Una distribución triangular puede caracterizarse con
tres valores: el mínimo, el más probable y el máximo. El mínimo y el máximo definen un intervalo que es el dominio de
la variable, mientras que el más probable indica dónde debe localizarse la altura del triángulo. Asuma los valores
(1, 3, 5).

92

S-ar putea să vă placă și