Documente Academic
Documente Profesional
Documente Cultură
Simulacion
Luis A. Navarro H.
Septiembre, 2017
Indice
1 Introduccion 2
2 Estadstica Descriptiva 3
2.1 Tablas de Frecuencias y Gracos . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1.1 Tablas de Frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.2 Gracos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2 Medidas de Tendencia y de Dispersion . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Medidas de Tendencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.2 Medidas de Dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3 Probabilidades 12
3.1 Experimento Aleatorio, Espacio Muestral y Eventos . . . . . . . . . . . . . . 12
3.2 Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2.1 Frecuencia Relativa y Probabilidad . . . . . . . . . . . . . . . . . . . . 13
3.2.2 Probabilidad Condicional e Independencia . . . . . . . . . . . . . . . . 14
3.3 Variables Aleatorias - Esperanza y Varianza . . . . . . . . . . . . . . . . . . . 14
3.3.1 Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1
Captulo 1
Introduccion
2
Captulo 2
Estadstica Descriptiva
3
CAPITULO 2. ESTADISTICA DESCRIPTIVA 4
Donde,
2.1.2 Graficos
Otra manera de organizar la informacion es mediante gracos. La organizacion de la infor-
macion mediante gracos ayuda a identicar estructuras, tendencias, aberraciones, posibles
diferencias entre los datos, etc. En general, se utilizan gracos en coordenadas rectangulares
que tienen dos ejes: una vertical y otra horizontal. Usualmente se utiliza el eje horizontal
para mostrar los valores de un caractero varios si se desea realizar un analisis de datos
agrupados. Se utiliza el eje vertical para mostrar las frecuencias y/o valores de una variable.
Histograma
Es un graco que muestra la Distribucion de Frecuencias para Datos Agrupadosequivalente
a la Tabla de Frecuencias para Datos Agrupados. Se utiliza columnas adjuntas para repre-
sentar la frecuencia de observaciones en cada intervalo de clase. El area de cada columna es
proporcional a el numero de observaciones en tal intervalo.
La idea del Histograma es representar frecuencias por medio de rectangulos cuya base
corresponde al intervalo de clase. Se dibuja sobre cada intervalo de clase un rectangulo de
area proporcional a la frecuencia de ocurrencias en dicho intervalo. Si las longitudes de
los intervalos no son iguales, cada rectangulo tendra una altura igual a la densidad de la
frecuencia di . Si por el contrario, las longitudes de los intervalos son iguales, se utiliza como
altura la frecuencia absoluta ni .
Finalmente, si se unen los puntos medios de la parte superior de los rectangulos mediante
trazos lineales, se obtendra un polgono de frecuencia que permite visualizar la forma o
concentracion de ocurrencias de los valores de X recopilados.
Grafico de Barras
Elgrafico de barra mas sencillo es aquella que muestra datos de una tabla con una unica
variable. Cada valor o categora de la variable es representada por una barra. la longitud
de la barra es proporcional al numero de de personas o eventos en cada categora.
Las variables mostradas en las gracas de barras deben ser del tipo nominal u ordinal.
Las barras pueden ser presentadas horizontalmente o verticalmente. Longitud de cada barra
es proporcional a la frecuencia del evento en cada categora.
Media Aritmetica
Se dene como
1
k
X= xi n i
N i
En el caso de distribuciones agrupadas el valor de xi representa la marca de clase.
Mediana
Como se sabe la media aritmetica es afectada por los valores extremos, de manera que un
valor muy grande o muy pequeno afecta de modo importante el valor de la media. Con el
objetivo de disponer de una media que no dependa de la magnitud de los datos se introduce
la mediana.
Siempre que se disponga de los datos ordenados de menor a mayor. Se dene la Mediana,
como aquel valor que deja a la derecha y a la izquierda el mismo numero de observaciones.
Por lo tanto, el valor de la Mediana no depende del valor de los datos, sino de la posicion
que ocupa dentro de la muestra.
Calculo de la Mediana
Se trata de encontrar un valor cuya frecuencia acumulada sea igual N/2.
[Datos No Agrupados] En distribuciones no agrupadas en intervalos se siguen los siguientes
pasos:
1. Se ordenan los datos de menor a mayor
3. Si existe algun dato xi de modo que Ni = N/2, la Mediana sera cualquier valor
dentro del intervalo < xi , xi+1 > y se toma como mediana el punto medio, es decir
Me = (xi + xi+1 )/2
N
Ni1
Me = Li1 + 2
ci
ni
Esto ultimo se deduce de la lnea recta que pasa por (Li1 , Ni1 ) y (Li , Ni ), en donde
se debe cumplir
Me Li1 N
Ni1
= 2
Li Li1 Ni Ni1
Ver Figura 2.1
CAPITULO 2. ESTADISTICA DESCRIPTIVA 8
Moda
La Moda es el valor de la variable que ocurre con mayor frecuencia.
La Moda es entonces el valor que se repite mas veces y por lo tanto no tiene porque
ser unica. En distribuciones agrupadas se utiliza una formula aproximada. Por ejemplo, si
se supone que todos los intervalos de clase tienen la misma longitud y que las siguientes
hipotesis se cumplen:
2. Una vez localizado el intervalo modal la moda esta mas proxima al intervalo contiguo
con mayor frecuencia, de modo que la distancia entre la Moda y los intervalos contiguos
es inversamente proporcional a las frecuencias de esos intervalos
di+1
Mo = Li1 + ci
di1 + di+1
de donde,
ni+1 h Li1
=
ni1 Li h
CAPITULO 2. ESTADISTICA DESCRIPTIVA 9
Cuartiles
Los Cuartiles de un conjunto de datos son tres valores(primer cuartil segundo cuartil o
Mediana y tercer cuartil), que dividen a la distribucion en cuatro partes iguales, conteniendo
cada parte el 25% de los datos.
En el caso de distribuciones no agrupadas en intervalos, el calculo de los cuartiles se realiza de
manera similar a la Mediana. En el caso de distribuciones agrupadas se comienza localizando
el intervalo donde se situa el cuartil, que sera el primer intervalo tal que Ni rN 4 . Para
ontener el Qr cuartil se aplica la siguiente formula
r
4N Ni1
Qr = Li1 + ci r = 1, 2, 3
ni
Deciles
Los Deciles de una distribucion de frecuencias son nueve valores que dividen a la distribucion
en diez partes iguales, conteniendo cada parte el 10
Para su calculo en distribuciones agrupadas se procede de manera similar que los cuartiles
(Es decir, sera el primer intervalo tal que Ni rN
10 r = 1, 2, ..., 9). Una vez determinado el
intervalo donde se encuentra el correspondiente decil, se aplica la formula
CAPITULO 2. ESTADISTICA DESCRIPTIVA 10
r
10 N Ni1
Dr = Li1 + ci r = 1, 2, ..., 9
ni
Percentiles
Los Percentiles de una distribucion de frecuencias son noventa y nueve valores que dividen
a la distribucion en cien parte iguales, conteniendo cada parte el 1% de los datos.
Para su calculo en distribuciones agrupadas se procede de manera similar que los cuartiles y
deciles (Es decir, sera el primer intervalo tal que Ni rN
100 r = 1, 2, ..., 99). En distribuciones
agrupadas se aplica la formula
r
100 N Ni1
Pr = Li1 + ci r = 1, 2, ..., 99
ni
RI = Q3 Q1
Esta medida permite estudiar la dispersion en el intervalo < Q1 , Q3 > , que contiene el 50%
de los datos y tiene la ventaja de no verse inuenciada por valores extremos.
1 k
2
SX = (xi x)2 ni
N i=1
Se dene la desviacion estandar como
SX = 2
SX
CAPITULO 2. ESTADISTICA DESCRIPTIVA 11
Es un coeciente adimensional
Probabilidades
3.2 Probabilidad
A continuacion se ilustrara la forma de asignar un valor numerico o medida llamada de
probabilidad a eventos. Se replicara los resultados de un experimento aleatorio mediante
simulacion y se prestara especial atencion a un resultado en particular.
Ejemplo Suponga que se recrea de manera articial un experimento aleatorio que consiste
en lanzar una moneda y observar los resultados que aparecen un numero determinado
de veces. Enseguida, se calcula la proporcion de veces que aparece el evento Cara, y
se analiza la evolucion de esta proporcion a medida que se incrementa el numero de
experimentos. Ver Figura 3.1
12
CAPITULO 3. PROBABILIDADES 13
/COORDINATE=VERTICAL
/YLENGTH=5.2
/X1LENGTH=6.5
/CHARTLOOK=NONE
/LINE(MEAN) KEY=OFF STYLE=LINE DROPLINE=OFF INTERPOLATE=STRAIGHT BREAK=MISSING.
EXECUTE .
P : R
Que a cada evento A le asigna un numero real P (A) es una probabilidad, si verica
los siguientes axiomas:
1. P (A) 0
2. P () = 1
3. Si A1 ,...,An ,... son eventos incompatibles dos a dos Ai Aj = 0, para i = j
entonces
P( Ak ) = P (Ak )
k=1 k=1
CAPITULO 3. PROBABILIDADES 14
P [C] = P [C A1 ] + P [C A2 ] + ... + P [C An ]
P [C|Aj ]P [Aj ]
P [Aj |C] = n
i=1 P [C|Ai ]P [Ai ]
Es un evento
CAPITULO 3. PROBABILIDADES 15
Definicion La funcion de Distribucion asociada a una variable aleatoria es una funcion que
a cada numero real x le asocia la probabilidad de que la variable tome valores menores
o iguales que x. Se dene como
Donde x R
Teorema La funcion F(x) es una funcion de Distribucion si y solo si satisface las siguientes
cuatro condiciones:
dF (x)
= f (x)
dx
Para que una funcion f(x) sea la funcion de densidad de una variable aleatoria continua,
debe satisfacer que:
Esperanza
Uno de los conceptos mas utiles en probabilidad es el de Esperanza de una variable aleatoria.
Si X es una variable aleatoria discreta que toma uno de los posibles valores x1 , x2 ,... entonces
CAPITULO 3. PROBABILIDADES 17
Es decir, el valor esperado de X es un promedio ponderado de los valores que puede tomar
X, donde el peso esta dado por la probabilidad de que X lo tome.
Si X es una variable aleatoria continua con funcion de densidad de probabilidad f. En-
tonces, el valor esperado de X es
E[X] = f (x)dx