Sunteți pe pagina 1din 18

Estadstica, Probabilidades y

Simulacion

UNI - Maestra en Ingeniera Civil

Luis A. Navarro H.

Septiembre, 2017
Indice

1 Introduccion 2

2 Estadstica Descriptiva 3
2.1 Tablas de Frecuencias y Gracos . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1.1 Tablas de Frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.2 Gracos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2 Medidas de Tendencia y de Dispersion . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Medidas de Tendencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.2 Medidas de Dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3 Probabilidades 12
3.1 Experimento Aleatorio, Espacio Muestral y Eventos . . . . . . . . . . . . . . 12
3.2 Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2.1 Frecuencia Relativa y Probabilidad . . . . . . . . . . . . . . . . . . . . 13
3.2.2 Probabilidad Condicional e Independencia . . . . . . . . . . . . . . . . 14
3.3 Variables Aleatorias - Esperanza y Varianza . . . . . . . . . . . . . . . . . . . 14
3.3.1 Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1
Captulo 1

Introduccion

El proposito del presente material es exponer algunos metodos estadsticos referidos al


tratamiento de datos registrados u obtenidos por experimentacion vinculados al campo de
transporte. El contenido comprende estadstica descriptiva, probabilidades, algunos modelos
de probabilidad, Procesos de llegadas, y simulacion estocastica.

2
Captulo 2

Estadstica Descriptiva

Esta parte de la Estadstica comprende el tratamiento de datos con el proposito de organi-


zar y resumir la informacion, para identicar algunos patrones de comportamientos para que
enseguida estas sirvan para postular modelos probabilsticos que expliquen posibles compor-
tamientos futuros de interes en sector de transporte.
Tipos de Medidas
Es de vital importancia antes de iniciar cualquier tipo de analisis, identicar el tipo de
medida, pues de esta depende postular el mejor modelo que describa el fenomeno y as
responder las preguntas sin perder informacion objetiva o subjetiva del problema que se
este analizando. En esta direccion, los valores de una medida son de tipo numerico y no
numerico. Las medidas de tipo numerico se denominan Variables que a su vez se clasican
en Discreto y Continuo. Las medidas de tipo no numericos se denominan Atributos que a su
vez se clasican en Nominal y Ordinal. La mejor escala de medicion es la escala numerica
(Discreta/Continua), seguida por la escala Ordinal y nalmente la escala Nominal, en ese
orden. Un ejemplo de medicion Nominal es el Atributo Sexo con valores masculino y fe-
menino. Un ejemplo de medicion Ordinal es el Atributo Condicion despues de una ispeccion
de un pavimento con posibles valores: Bueno, Aparentemente Bueno, Mas o Menos,
Aparentemente Malo y Malo 1
Independiente de los valores que tome una medida, siempre se podra Organizar la infor-
macion. La organizacion de la informacion se hara mediante Distribuciones de Frecuencia
(Tablas y/o gracos) como lo mencionamos anteriormente. Sin embargo, cuando se quiera
Resumir la informacion, se denen herramientas apropiadas para medidas numericas (Disc-
reta/Continua): medidas de tendencia central: media, mediana, etc., medidas de dispersion:
varianza, desvo padron, etc., y medidas de forma: coeciente de kurtosis, coeciente de
asimetra.

2.1 Tablas de Frecuencias y Graficos


En la practica es frecuente trabajar con conjuntos de datos recopilados u obtenidos medi-
ante ensayos con el objetivo de explorar e interpretar posibles relaciones entres las diversas
lecturas en un estudio en particular. La estadstica descriptiva identica estructuras o pa-
trones de comportamiento que muchas veces no son posibles de detectar a simple vista. Por
ejemplo, en la determinacion de si cantidad de vehculos que estan dentro del tiempo de
permanencia en un determinado paradero es mayor en vehculos tipo custer con respecto a
1
Observar que existe una relacion de orden entre estos valores

3
CAPITULO 2. ESTADISTICA DESCRIPTIVA 4

las combis, se puede concluir organizando la informacion mediante la tabulacion de medidas


de los tiempos de uso de paradero mediante una tabla y/o histograma de frecuencias para
ambas tipos de vehculos.
Una forma de organizar los datos es a traves de la Distribucion de Frecuencias. Esta dis-
tribucion puede ser mostrada mediante una tabla y/o grafico obteniendo una caracterizacion
completa de estos datos. Una caracterizacion parcial de los datos son hechas con la denicion
apropiada de medidas de resumenes para mediciones de tipo numericas unicamente.
Los datos pueden ser recopilados de muchas formas y tamanos. Una de las formas mas
comunes es una base de datos rectangular hechas de las y columnas. Cada la contiene
informacion de una unidad de analisis y es comunmente llamada de registro u observacion.
Cada columna contiene informacion acerca de una medida que llamaremos de variable si es
numerica o atributo si es no numerica.

2.1.1 Tablas de Frecuencias


Suponga que se tiene recopilado un conjunto de datos de tamano N de una medida X. La
tabulacion de estos datos se realiza mediante las Distribuciones de Frecuencias. Una tabla
que resume los datos de manera sistematica las frecuencias de X se denomina de Tabla de
Frecuencias.

1. Si el numero de registros es pequeno y la cantidad de valores posibles de X son


pequenos, entonces se lista la informacion en su forma extensa.
2. Si el numero de registros son de gran tamano y la cantidad de valores posibles de X
son pequenos, se organiza la informacion como Datos No Agrupados
3. Si el numero de registros son de gran tamano y la cantidad de valores posibles de X
son de gran tamano, se organiza la informacion como Datos Agrupados.

Datos No Agrupados - Medida Numerica


Frecuencias Absolutas Frecuencias Relativas
Datos Simples Acumuladas Simples Acumuladas
x1 n1 N1 = n 1 f1 = n1 /N F1 = N1 /N
x2 n2 N2 = n1 + n2 f2 = n2 /N F2 = N2 /N
. . . . .
. . . . .
. . . . .
xk nk Nk = N fk = nk /N Fk = Nk /N = 1
k k
Totales i=1 ni = N i=1 fi = 1

Datos No Agrupados - Medida No Numerica


Frecuencias Absolutas Frecuencias Relativas
Datos Simples Acumuladas Simples Acumuladas
a1 n1 N1 = n1 f1 = n1 /N F1 = N1 /N
a2 n2 N2 = n1 + n2 f2 = n2 /N F2 = N2 /N
. . . . .
. . . . .
. . . . .
ak nk Nk = N fk = nk /N Fk = Nk /N = 1
k k
Totales n
i=1 i = N f
i=1 i = 1
CAPITULO 2. ESTADISTICA DESCRIPTIVA 5

Datos Agrupados - Medida Numerica

Frecuencias Absolutas Frecuencias Relativas


Datos Marcas Simples Acumuladas Simples Acumuladas
de Clase
L0 L1 x1 n1 N1 = n1 f1 = n1 /N F1 = N1 /N
L1 L2 x2 n2 N2 = n1 + n2 f2 = n2 /N F2 = N2 /N
. . . . .
. . . . .
. . . . .
Lk1 Lk xk nk Nk = N fk = nk /N Fk = Nk /N = 1
k k
Totales i=1 ni =N i=1 fi = 1

Donde,

ci = Li Li1 : Longitud del i esimo intervalo


xi = Li1 Li /2 : M arca de Clase i esimo intervalo
di = ni /ci : Densidad de f recuencia del i esimo intervalo
x = M edia para datos agrupados

k = N

El contenido de estas tablas presenta la frecuencia de ocurrencia de valores de una unica


medida. En particular, en la construccion de la Tabla de Frecuencias para Datos Agrupados,
la determinacion del numero de intervalos de clase sigue un criterio especco. 2 .
2
Para construir un intervalo de clase, debe seguirse los siguientes pasos:
Crear intervalos de Clase que sean mutuamente exclusivos y que incluya todos los datos. Por ejemplo,
si el primer intervalo es 0- 5, comenzar el siguiente intervalo con 6 no con 5. Por otra parte, definir
cuales son los lmites verdaderos. El lmite superior de 0 - 5 es 5.4999...para muchas medidas, y a veces
5.999 para otras.
Use un numero relativamente grande de intervalos relativamente reducido para su analisis inicial. Es
posible combinar intervalos en lo sucesivo del trabajo. En general, debe tener en mente entre 4 a 8
intervalos.
Crear una categora de desconocidos. Por ejemplo, en el agrupamiento de una variable edad la categora
creada para los desconocidos pueden ser: Edad no establecida, Desconocido, No establecido.
Existen varias estrategias para la creacion de intervalos de clase. A continuacion se presentara la mas
comunmente utilizadas
1. Hallar el rango de valores de su conjunto de datos. Es decir, hallar la diferencia entre el valor maximo
(o algun valor ligeramente mayor) y cero (o el valor mnimo)
2. Decidir cuantos intervalos de clase se desea construir. Para tablas generalmente se utiliza entre 4 a 8
intervalos de claseuna formula muy utilizada es la Regla de Sturges 1 + 3.3 log10 (N ). para graficos
y mapas de 3 a 6 intervalos de clase. Sin embargo, el numero de intervalos de clases dependera de
algunos aspectos que se desea explorar en los datos.
3. Hallar el tamano del intervalo de clase que se desea usar dividiendo el rango por el numero de intervalos
de clase que se ha decidido trabajar, si se trabajara con longitudes iguales de intervalos de clases.
4. Definir el valor mnimo como el lmite inferior del primer intervalo y especificar los intervalos de clase
de los tamanos anteriormente establecidos hasta alcanzar el valor maximo de sus datos.
CAPITULO 2. ESTADISTICA DESCRIPTIVA 6

2.1.2 Graficos
Otra manera de organizar la informacion es mediante gracos. La organizacion de la infor-
macion mediante gracos ayuda a identicar estructuras, tendencias, aberraciones, posibles
diferencias entre los datos, etc. En general, se utilizan gracos en coordenadas rectangulares
que tienen dos ejes: una vertical y otra horizontal. Usualmente se utiliza el eje horizontal
para mostrar los valores de un caractero varios si se desea realizar un analisis de datos
agrupados. Se utiliza el eje vertical para mostrar las frecuencias y/o valores de una variable.

Histograma
Es un graco que muestra la Distribucion de Frecuencias para Datos Agrupadosequivalente
a la Tabla de Frecuencias para Datos Agrupados. Se utiliza columnas adjuntas para repre-
sentar la frecuencia de observaciones en cada intervalo de clase. El area de cada columna es
proporcional a el numero de observaciones en tal intervalo.
La idea del Histograma es representar frecuencias por medio de rectangulos cuya base
corresponde al intervalo de clase. Se dibuja sobre cada intervalo de clase un rectangulo de
area proporcional a la frecuencia de ocurrencias en dicho intervalo. Si las longitudes de
los intervalos no son iguales, cada rectangulo tendra una altura igual a la densidad de la
frecuencia di . Si por el contrario, las longitudes de los intervalos son iguales, se utiliza como
altura la frecuencia absoluta ni .
Finalmente, si se unen los puntos medios de la parte superior de los rectangulos mediante
trazos lineales, se obtendra un polgono de frecuencia que permite visualizar la forma o
concentracion de ocurrencias de los valores de X recopilados.

Grafico de Barras
Elgrafico de barra mas sencillo es aquella que muestra datos de una tabla con una unica
variable. Cada valor o categora de la variable es representada por una barra. la longitud
de la barra es proporcional al numero de de personas o eventos en cada categora.
Las variables mostradas en las gracas de barras deben ser del tipo nominal u ordinal.
Las barras pueden ser presentadas horizontalmente o verticalmente. Longitud de cada barra
es proporcional a la frecuencia del evento en cada categora.

2.2 Medidas de Tendencia y de Dispersion


En esta seccion, las deniciones alcanzan solo para medidas de tipo numerico (variables).

2.2.1 Medidas de Tendencia


Es posible denir medidas de posicion central como la media (aritmetica, armonica,
geometrica, etc.), la mediana y la moda; y medidas de posicion no centrales como los cuar-
tiles, deciles y percentiles por ejemplo. En lo que sigue, se asume que se dispone de un
conjunto de N datos y registro de una unica variable X, cuya distribucion de frecuencias
viene dada por Xi = {xi , ni }
CAPITULO 2. ESTADISTICA DESCRIPTIVA 7

Media Aritmetica
Se dene como
1
k
X= xi n i
N i
En el caso de distribuciones agrupadas el valor de xi representa la marca de clase.

Mediana
Como se sabe la media aritmetica es afectada por los valores extremos, de manera que un
valor muy grande o muy pequeno afecta de modo importante el valor de la media. Con el
objetivo de disponer de una media que no dependa de la magnitud de los datos se introduce
la mediana.
Siempre que se disponga de los datos ordenados de menor a mayor. Se dene la Mediana,
como aquel valor que deja a la derecha y a la izquierda el mismo numero de observaciones.
Por lo tanto, el valor de la Mediana no depende del valor de los datos, sino de la posicion
que ocupa dentro de la muestra.
Calculo de la Mediana
Se trata de encontrar un valor cuya frecuencia acumulada sea igual N/2.
[Datos No Agrupados] En distribuciones no agrupadas en intervalos se siguen los siguientes
pasos:
1. Se ordenan los datos de menor a mayor

2. Se obtienen las frecuencias acumuladas Ni y se calcula N/2

3. Si existe algun dato xi de modo que Ni = N/2, la Mediana sera cualquier valor
dentro del intervalo < xi , xi+1 > y se toma como mediana el punto medio, es decir
Me = (xi + xi+1 )/2

4. Caso contrario, la Mediana es el primer dato tal que Ni > N/2


[Datos Agrupados] En el caso de distribuciones agrupadas en intervalos, es necesario conocer
en que intervalo se encuentra la Mediana (intervalo mediano), para posteriormente calcularla
de modo aproximado. Los pasos a seguir son los siguientes.

1. Se calculan las frecuencias Ni y N/2

2. Se localiza el intervalo mediano, que es el primer intervalo cuya frecuencia acumulada


es igual o mayor que N/2

3. Una vez localizado el intervalo mediano se aplica la formula

N
Ni1
Me = Li1 + 2
ci
ni
Esto ultimo se deduce de la lnea recta que pasa por (Li1 , Ni1 ) y (Li , Ni ), en donde
se debe cumplir
Me Li1 N
Ni1
= 2
Li Li1 Ni Ni1
Ver Figura 2.1
CAPITULO 2. ESTADISTICA DESCRIPTIVA 8

Figura 2.1: Calculo de la Mediana

Moda
La Moda es el valor de la variable que ocurre con mayor frecuencia.
La Moda es entonces el valor que se repite mas veces y por lo tanto no tiene porque
ser unica. En distribuciones agrupadas se utiliza una formula aproximada. Por ejemplo, si
se supone que todos los intervalos de clase tienen la misma longitud y que las siguientes
hipotesis se cumplen:

1. Los datos se distribuyen de manera uniforme en cada intervalo

2. Una vez localizado el intervalo modal la moda esta mas proxima al intervalo contiguo
con mayor frecuencia, de modo que la distancia entre la Moda y los intervalos contiguos
es inversamente proporcional a las frecuencias de esos intervalos

3. En el caso de intervalos de distinta longitud, se trabaja con las densidades de cada


intervalo (di = ncii ). Finalmente, el calculo de la Moda aproximada es
ni+1
Mo = Li1 + ci
ni1 + ni+1

Si se trata de intervalos de diferentes longitudes, se obtienen previamente las densidades


de frecuencia de los intervalos y se elige el intervalo con mayor densidad. Finalmente
se aplica la formula

di+1
Mo = Li1 + ci
di1 + di+1

La formula anterior, para intervalos de igual longitud, se deduce la relacion de propor-


cionalidad inversa:
ni+1 (Li h) = ni1 (h Li1 )

de donde,
ni+1 h Li1
=
ni1 Li h
CAPITULO 2. ESTADISTICA DESCRIPTIVA 9

Figura 2.2: Calculo de la Moda

y usando una propiedad de razones geometricas, se obtiene


ni+1 h Li1
=
ni1 + ni+1 Li Li1

Ver Figura 2.2

Cuantiles: Cuartiles, Deciles y percentiles


Los cuantiles son medidas de posicion no centrales que permiten dividir a los datos en
grupos, de manera que cada grupo contiene el mismo numero de observaciones. Existen
diferentes formas de agrupar los datos como por ejemplo los Cuartiles (4 partes), los Deciles
(10 partes), los Percentiles (100 partes), etc.

Cuartiles
Los Cuartiles de un conjunto de datos son tres valores(primer cuartil segundo cuartil o
Mediana y tercer cuartil), que dividen a la distribucion en cuatro partes iguales, conteniendo
cada parte el 25% de los datos.
En el caso de distribuciones no agrupadas en intervalos, el calculo de los cuartiles se realiza de
manera similar a la Mediana. En el caso de distribuciones agrupadas se comienza localizando
el intervalo donde se situa el cuartil, que sera el primer intervalo tal que Ni rN 4 . Para
ontener el Qr cuartil se aplica la siguiente formula
r
4N Ni1
Qr = Li1 + ci r = 1, 2, 3
ni
Deciles
Los Deciles de una distribucion de frecuencias son nueve valores que dividen a la distribucion
en diez partes iguales, conteniendo cada parte el 10
Para su calculo en distribuciones agrupadas se procede de manera similar que los cuartiles
(Es decir, sera el primer intervalo tal que Ni rN
10 r = 1, 2, ..., 9). Una vez determinado el
intervalo donde se encuentra el correspondiente decil, se aplica la formula
CAPITULO 2. ESTADISTICA DESCRIPTIVA 10

r
10 N Ni1
Dr = Li1 + ci r = 1, 2, ..., 9
ni
Percentiles
Los Percentiles de una distribucion de frecuencias son noventa y nueve valores que dividen
a la distribucion en cien parte iguales, conteniendo cada parte el 1% de los datos.
Para su calculo en distribuciones agrupadas se procede de manera similar que los cuartiles y
deciles (Es decir, sera el primer intervalo tal que Ni rN
100 r = 1, 2, ..., 99). En distribuciones
agrupadas se aplica la formula
r
100 N Ni1
Pr = Li1 + ci r = 1, 2, ..., 99
ni

2.2.2 Medidas de Dispersion


Las medidas de dispersion estudian la separacion existente entre los diversos valores que
toma la variable. Se dividen en medidas de dispersion absoluta y relativa. Las medidas de
dispersion absolutas suelen hacer referencia a una medida de tendencia central y miden la
dispersion respecto a esta medida de tendencia central. Este tipo de medida depende de las
unidades lo que es un inconveniente para realizar comparaciones entre diferentes poblaciones.
Por otra parte, las medidas de dispersion relativas no dependen de las unidades y permiten
comparar dispersion entre valores de diversos caracteres.

Medidas de Dispersion Absolutas


Rango
Se denomina Rango, amplitud o recorrido a la diferencia entre los valores maximo y mnimo
de los datos
R = max{x1 , ..., xk } min{x1 , ..., xk }
Rango Intercuartlico
Se denomina Rango o recorrido intercuartlico a la diferencia entre el tercer y primer cuartil

RI = Q3 Q1

Esta medida permite estudiar la dispersion en el intervalo < Q1 , Q3 > , que contiene el 50%
de los datos y tiene la ventaja de no verse inuenciada por valores extremos.

Varianza y Desviacion Estandar


2 de una variable estadstica X, como
Se dene la varianza SX

1 k
2
SX = (xi x)2 ni
N i=1
Se dene la desviacion estandar como

SX = 2
SX
CAPITULO 2. ESTADISTICA DESCRIPTIVA 11

Medidas de Dispersion Relativas


Suponga que en el analisis de dos variables cualesquiera se desea saber cual de las dos
medias es mas representativa. Si las dos variables tienen la misma media, elegimos aquella
con menor varianza. Sin embargo, si la media no es la misma la varianza no es valida como
medida comparativa, puesto que no tenemos el mismo punto de comparacion. Una situacion
similar se produce cuando las variables no vienen expresadas en las mismas unidades. Por
lo tanto, se requieren de medidas de dispersion relativas.
Coeficiente de Variacion
El Coeciente de Variacion es el cociente entre la desviacion estandar y la media
SX
CVX =
|X|

Es un coeciente adimensional

Es invariante frente a cambios de escala en los datos


Captulo 3

Probabilidades

Se entiende como probabilidad a una medida utilizada para dimensionar incertidumbre a


eventos vinculados al azar.

3.1 Experimento Aleatorio, Espacio Muestral y Eventos


La denicion de Probabilidad y sus propiedades estan vinculados con un Experimento Aleato-
rio, un Espacio Muestral y Eventos.
Se dene a un experimento aleatorio como aquel proceso que genera resultado que no
se pueden anticipar de antemano. Se llama espacio muestral al conjunto que contiene a
todos los resultados elementales generados por el experimento aleatorio
Cualquier subconjunto A del espacio muestral se le denomina de evento. Es decir, un
evento es tambien un conjunto de resultados elementales posibles del experimento aleatorio.
Si el resultado del experimento esta en A, se dice que el evento A ha ocurrido.

3.2 Probabilidad
A continuacion se ilustrara la forma de asignar un valor numerico o medida llamada de
probabilidad a eventos. Se replicara los resultados de un experimento aleatorio mediante
simulacion y se prestara especial atencion a un resultado en particular.

Ejemplo Suponga que se recrea de manera articial un experimento aleatorio que consiste
en lanzar una moneda y observar los resultados que aparecen un numero determinado
de veces. Enseguida, se calcula la proporcion de veces que aparece el evento Cara, y
se analiza la evolucion de esta proporcion a medida que se incrementa el numero de
experimentos. Ver Figura 3.1

*Configura generado de numeros aleatorios.


SET RNG=MC SEED=RANDOM.
COMPUTE numCasoTotales=$CASENUM.
*Genera resultados de un experimento de lanzamiento de una moneda.
COMPUTE lanMoneda=RV.BERNOULLI(0.5).
*Crea una nueva variable de Proporciones de veces que se obtiene una cara (C)==1 .
CREATE numSumaCaras=CSUM(lanMoneda).
COMPUTE propCaras=numSumaCaras/numCasoTotales.
* Grafica de las proporciones vs numero de experimentos ensayados.
IGRAPH
/VIEWNAME=Line Chart
/X1=VAR(numCasoTotales) TYPE=SCALE
/Y=VAR(propCaras) TYPE=SCALE

12
CAPITULO 3. PROBABILIDADES 13

Figura 3.1: Simulacion de proporciones

/COORDINATE=VERTICAL
/YLENGTH=5.2
/X1LENGTH=6.5
/CHARTLOOK=NONE
/LINE(MEAN) KEY=OFF STYLE=LINE DROPLINE=OFF INTERPOLATE=STRAIGHT BREAK=MISSING.

EXECUTE .

3.2.1 Frecuencia Relativa y Probabilidad


La frecuencia relativa o proporcion mide cuantas veces un evento de interes ocurre en una
serie de ejecuciones de experimentos aleatorios en la cual este evento puede ocurrir. Cuando
el numero de experimentos se incrementa, esta proporcion se aproxima a un valor constante,
que representa una manera de calcular la probabilidad de que este este evento ocurra.
La definicion actual de probabilidad se baso inicialmente en esta forma de hacer calculo
de la ocurrencia de un evento vinculado al azar. Ademas, las propiedades que acompanan a
la decnion de probabilidad se asemeja a las propiedades que se cumplen con las frecuencias
relativas de eventos.

Definicion Sea un espacio muestral asociado a un experimento aleatorio. Una aplicacion:

P : R

Que a cada evento A le asigna un numero real P (A) es una probabilidad, si verica
los siguientes axiomas:

1. P (A) 0
2. P () = 1

3. Si A1 ,...,An ,... son eventos incompatibles dos a dos Ai Aj = 0, para i = j
entonces
P( Ak ) = P (Ak )
k=1 k=1
CAPITULO 3. PROBABILIDADES 14

3.2.2 Probabilidad Condicional e Independencia


Se dene la probabilidad condicional de un evento A con respecto a otro evento B como
P [A|B]. Si los eventos son mutuamente exclusivos P [A|B] = 0. En general se dene la
probabilidad condicional como
P [A B]
P [A|B] =
P [B]
Se dice que dos eventos son estadsticamente independientes si se cumple la siguiente
relacion
P [A B] = P [A].P [B]

Probabilidad Total - Teorema de Bayes


La probabilidad de un evento de interes puede ser calculado a partir de informacion desagre-
gada de una particion del espacio muestral. que a su vez esta compuesto parcialmente de un
grupo de conjuntos mutuamente exclusivos. Si C es el evento que se quiere calcular P (C) y
sea A1 ,...,An una particion de , entonces se puede demostrar que

P [C] = P [C A1 ] + P [C A2 ] + ... + P [C An ]

A esta ultima expresion se le denomina de ley de probabilidad total.


El Teorema de Bayes, se obtiene como una consecuencia de actualizar probabilidades de
la ocurrencia de un cierto evento, y es dado por

P [C|Aj ]P [Aj ]
P [Aj |C] = n
i=1 P [C|Ai ]P [Ai ]

3.3 Variables Aleatorias - Esperanza y Varianza


3.3.1 Variables Aleatorias
Una variable aleatoria es una funcion que mapea eventos a un valor real. Los diferentes tipos
de variables aleatorias se corresponden con los diferentes tipos de datos: discretas y continuas,
que a su vez pueden ser unidimensionales, bidimensionales o n-dimensionales, dependiendo
que se observen una, dos o n-caractersticas. Toda variable aleatoria tiene vinculados a dos
tipos de funciones: Funciones de Distribucion Acumulada (F) y Funcion de Densidad (f),
En esta parte se estudiara las variables aleatorias unidimensionales mencionando algunas
propiedades resaltantes de estas.

Definicion Sea (, P ) un espacio probabilstica asociado a un experimento aleatorio. Una


aplicacion:
X: R
en donde a cada evento elemental se le asocia un numero real, es una variable aleatoria
si para cualquier valor de x, el conjunto:

[w : < X(w) < x]

Es un evento
CAPITULO 3. PROBABILIDADES 15

Funcion de Distribucion de una Variable Aleatoria


La funcion de Distribucion o funcion de Distribucion Acumulada de una Variable Aleatoria
es una funcion que se introduce para conocer como se reparte la probabilidad sobre los
valores que toma la variable.

Definicion La funcion de Distribucion asociada a una variable aleatoria es una funcion que
a cada numero real x le asocia la probabilidad de que la variable tome valores menores
o iguales que x. Se dene como

F (x) = P [w : < X(w) x] = P [ < X x] = P [X x]

Donde x R

Toda funcion de Distribucion satisface ciertas propiedades. El siguiente resultado caracteriza


a las funciones de Distribucion:

Teorema La funcion F(x) es una funcion de Distribucion si y solo si satisface las siguientes
cuatro condiciones:

1. F (x) es una funcion monotona no decreciente si x1 x2 entonces F (x1) F (x2)


2. Se verica que F () = 0
3. Se verica queF () = 1
4. F (x) es continua por la derecha: limxx+ F (x) = F (x0 )
0

Variable Aleatoria Discreta


Definicion Una variable aleatoria X se dice que es discreta si el conjunto de valores que toma
con probabilidad no nula es nito o innito contable. Al conjunto de probabilidades
asociados con cada valor se le denomina de funcion de cuanta

Una funcion de densidad discreta verica dos propiedades:


1. 0 P [X = x] 1

2. i=1 P [X = xi ]
A partir de la funcion de densidad se puede obtener la funcion de Distribucion, acumu-
lando las correspondientes probabilidades:

F (x) = P [X x] = P [X = xj ] (3.1)
xj x

La representacion graca de una funcion de Distribucion discreta es una funcion escalonada,


donde los saltos se producen en los valores que toma la variable.

Variable Aleatoria Continua


Definicion Una variable aleatoria se dice que es continua si existe una funcion f(x) que esta
vinculada con la su Funcion de Distribucion de la siguiente manera
x
F (x) = P [X x] = f (t)dt

CAPITULO 3. PROBABILIDADES 16

Figura 3.2: Distribuciones Probabilidad - Discretas

Figura 3.3: Distribuciones Probabilidad - Continuas

Utilizando el teorema fundamental del calculo, si f(x) es continua, se cumple:

dF (x)
= f (x)
dx
Para que una funcion f(x) sea la funcion de densidad de una variable aleatoria continua,
debe satisfacer que:

1. f (x) 0 para todo x R



2. f (x)dx = 1

Esperanza
Uno de los conceptos mas utiles en probabilidad es el de Esperanza de una variable aleatoria.
Si X es una variable aleatoria discreta que toma uno de los posibles valores x1 , x2 ,... entonces
CAPITULO 3. PROBABILIDADES 17

la esperanza de X, llamado tambien de media de X y denotado por E[X], se dene como



E[X] = xi P [X = xi ]
i

Es decir, el valor esperado de X es un promedio ponderado de los valores que puede tomar
X, donde el peso esta dado por la probabilidad de que X lo tome.
Si X es una variable aleatoria continua con funcion de densidad de probabilidad f. En-
tonces, el valor esperado de X es

E[X] = f (x)dx

S-ar putea să vă placă și