Sunteți pe pagina 1din 25

Recordando la Estadstica

Recordando la Estadstica
Poblacin:
Es la recoleccin completa de todas las observaciones
de inters para el investigador
Parmetro:
Es una medida descriptiva de la poblacin total de todas
las observaciones de inters para el investigador.
Muestra:
Es una parte representativa de la poblacin que se
selecciona para ser estudiada
Estadstico:
Elemento que describe una muestra y sirve como una
estimacin del parmetro de la poblacin
Variable:
Es una caracterstica de la poblacin que se esta
analizando en un estudio estadstico.

Medidas de Tendencia Central


La media:
Es la medida de tendencia central que normalmente es
considerada como el promedio.
Si tenemos 56, 67, 52, 45, 67, la media se calcula as:
__

56 67 52 45 67
57.4
5

Medidas de Tendencia Central


La mediana:
La mitad de las observaciones estar por debajo de ella
y la otra mitad por encima.
Posicin de la mediana =

n 1
5 1
3
=
2
2

Para los datos ordenados, la mediana es 56 (la tercera


posicin).
Si tenemos: 35, 45, 52, 56, 67 y 67. (n es par),
promediamos los dos valores medios (52 + 56)/2 = 54
4

Medidas de Tendencia Central


La moda:
Observacin que ocurre con mayor frecuencia.
Si tenemos 35, 45, 52, 56, 67, 67, la moda es 67
Si agregramos una observacin adicional de 56, el
conjunto de datos seria bimodal, con modas 56 y 67.

Medidas de Dispersin
Miden que tanto se dispersan las observaciones alrededor
de su media.
El rango:
Es la diferencia entre la observacin mas alta y mas baja.
Su desventaja es que considera solo dos observaciones
del total de observaciones.

Medidas de Dispersin
La Varianza:
Es el promedio de las desviaciones respecto a su media
elevadas al cuadrado
Varianza poblacional:

2
2
2
2
xi 2

x1 x2 x3 ... xN

Varianza de una muestra:

__

x1 X

S
2

__

x2 X

__

x3 X

n 1

__

... xn X

__

xi X
n 1

Medidas de Dispersin
La Varianza:
Si tenemos: 87, 120, 54, 92, 73, 80 y 63
__

X 81.29
(87 81.29) 2 (120 81.29) 2 ... (63 81.29) 2
S
465.9
7 1
2

S 465.9 21.58

La media de los valores observados es de 81.29, con


tendencia a variar por arriba o debajo de dicha media en
21.58
8

Intervalos de Confianza
__

El teorema del limite central asume que el resultado de X


tendr una distribucin normal.
Supongamos que la simulacin se esta utilizando para
analizar las demoras en un proceso de produccin.
Cada replica independiente del modelo produce una
respuesta potencial de la distribucin de todas las
posibles demoras. Una sola salida, produce solo una
muestra de la distribucin.

Intervalos de Confianza
Asumamos 100 puntos estimados del promedio de
demora en un proceso esta normalmente distribuido con
una media de 40 y una desviacin estndar de 12.
Cien muestras de esta distribucin pueden ser
distribuidas como siguen

10

Intervalos de Confianza

23
19 22
14 19 21
12 17 21

< 16

27
27
27
26
26
25
25

31
31
31
30
30
30
29
29
29

35
35
35
35
34
34
34
34
33
33
33
33

39
39
39
39
38
38
38
38
37
37
37
37
37

43
43
43
43
42
42
42
42
41
41
41
41
41

47
47
47
47
46
46
46
46
45
45
45
45

Distribucin Normal
= 40
= 12
51
51
51
50
50
50
49
49
49

55
55
55
54
54
53
53

58
58 63
57 63 69
57 61 66

16-20 20-24 24-28 28-32 32-36 36-40 40-44 44-48 48-52 52-56 56-60 60-64

> 64

11

Intervalos de Confianza
Los principios de inferencia estadstica, nos permiten
hacer estimaciones de una media verdadera y una
varianza 2
Suponga que los siguientes valores son aleatoriamente
seleccionados de la distribucin mostrada en el grfico
anterior: 26, 31, 38, 49, 50 y 58.
Un punto estimado de es designado como:
__

X ( 6)

26 31 38 49 50 58
42
6

La varianza de la distribucin es aproximada como:


6

S 2 ( 6)

__

[ Xi X (6)]
1

6 1

152.4

12

Intervalos de Confianza
Como la cantidad de datos (n=6) es menor que 30, usamos
un valor t de una distribucin t, para construir el intervalo de
confianza para el punto estimado ,
__

X (n) tn 1,1 / 2
42 2.015

S 2 ( n)
n
152.4
6

Usamos =
10%
Un 90% de
certeza

31.84 52.16

un intervalo de confianza nos dice con que certeza


(90%), el parmetro de la media verdadera esta contenida
dentro de nuestro intervalo calculado.
13

Media Muestral vs. Verdadera


_
= 40

Media
Poblacional

X = 42

Media
Muestral
14

Intervalos de Confianza
Que son?
Un intervalo, expresado en el formato (min,
max), el cual provee un estimado realista del
valor verdadero de un parmetro del sistema
particular tal como el ciclo de tiempo o el
promedio diario de atenciones.

La longitud del intervalo depende del


tamao n de la muestra.
Los niveles tpicos son: 90%, 95% y 99%.
15

Intervalos de Confianza
95%

u = 40

_
X = 42

90%

Media
Media
Verdadera Muestral

16

Intervalos de Confianza

El principio del intervalo de confianza puede ser


demostrado utilizando los nmeros descritos en la
distribucin normal anterior.
El siguiente ejercicio ilustra esta explicacin.
1) Coloque los nmeros de la distribucin normal en 100 papeles
pequeos.
2) Ponga los papeles en un contenedor.
3) Busque en el contenedor y extraiga seis papeles.
4) Registre el nmero mostrado en cada papel seleccionado.
5) Calcule un intervalo de confianza a un 90%, para los seis
valores obtenidos.
6) Retorne todos los papeles al contenedor.

17

Intervalos de Confianza
Si ejecutamos los pasos tres al seis, 100 veces,
podemos esperar que 90 de los intervalos de confianza
calculados, contienen el parmetro de la media
verdadera ( = 40 en este ejemplo).
Desarrollar el siguiente ejemplo y verifique los
resultados para 10 repeticiones.

18

Intervalos de Confianza
Exp.

Valores
Seleccionados

__

X (6)

S 2 (6)

Intervalo

Intervalo contiene
a = 40?

1
2
3
4
5
6
7
8
9
10
19

Nmero de Rplicas
Un mtodo esencial para mejorar la confiabilidad de los
resultados es ejecutar mltiples replicas independientes
de la simulacin.
Los resultados de mltiples rplicas del modelo deben
ser analizados con principios de inferencia estadstica
para realizar conclusiones validas.
El ejm. anterior puede ser usado para demostrar el nivel
de confianza asociado al numero de replicas necesarias
para asegurar la exactitud de (un punto estimado de )
con respecto a la media verdadera de la distribucin

20

Nmero de Rplicas
La simulacin usa el principio RIRO

Random
Input

Random
Output

21

Nmero de Rplicas
La ecuacin para conocer el numero de replicas necesarias es:

Donde:
N:
S(n):
e:
t:

t n 1,1 / 2 S
N

Numero de replicas necesarias para lograr un nivel de exactitud deseado


Es un punto estimado de , basado en n replicas del modelo.
Denota la cantidad de error entre la media estimada y
Valor critico de la tabla t

22

Nmero de Rplicas

Deseamos conocer cuantas replicas del modelo deben ser


realizadas para tener un 90% de confianza que nuestra media
estimada no varia de la media verdadera por mas de 9 das.

Media
Verdadera

e=9

Media
Muestral
23

Nmero de Rplicas

Estimamos el valor de , seleccionando aleatoriamente seis valores


de la distribucin (en la simulacin esto equivale a realizar 6 replicas
independientes del modelo)
Si los valores seleccionados son 26, 31, 38, 49, 50 y 58
El estimado de la desviacin estndar es 12.3
Insertando estos valores en la ecuacin anterior, esto nos da N=8.
Implica que si aleatoriamente seleccionamos
8 muestras de la
__
distribucin y calculamos un valor de X
Podemos esperar__ que aproximadamente 90 veces de un total de
100, el valor de X no variara de la media verdadera = 40, por mas
de 9 das, verificar estos resultados en la siguiente tabla.

t n 1,1 / 2 S

(2.015)(12.3)
N

7.58 8
24

Nmero de Rplicas
verificar los resultados anteriores en la siguiente tabla:
exp.

Valores
Seleccionados

__

X (8)

Dentro del limite 9?


( = 40)

1
2
3
4
5
6
7
8
9
10

25

S-ar putea să vă placă și