Sunteți pe pagina 1din 23

DISTRIBUCIONES DE PROBABILIDAD

Una distribucin de probabilidad describe los valores posibles que puede


tomar una variable aleatoria y las probabilidades asociadas a esos valores.
Dependiendo del tipo de variable aleatoria, podemos tener distribuciones
continuas, definidas por la densidad de probabilidad, o distribuciones
discretas, definidas por la funcin de probabilidad. Tanto la densidad como
la funcin de probabilidad dependen de uno o ms parmetros. Algunas
distribuciones continuas pueden asumir diferentes formas y tamaos,
dependiendo del valor de los parmetros.
Si la variable es discreta, existe la probabilidad de que la variable tome un
valor especfico.
Si la variable es continua, slo se puede determinar la probabilidad de que
la variable tome un valor dentro de un intervalo.
Existen tres tipos de parmetros bsicos:
PARAMETRO DE FORMA: que controla la forma bsica de la
distribucin, y que dependiendo del tipo de distribucin, el cambio puede
ser leve o severo.
PARAMETRO DE ESCALA: que controla la unidad de medida dentro
del rango de la distribucin. Cambiando este parmetro, la distribucin se
contrae o se expande a lo largo del eje horizontal.
PARAMETRO DE LOCALIZACION: que especifica la localizacin de
la distribucin relativa al cero en el eje horizontal.
Algunas distribuciones pueden no tener los tres parmetros, mientras que
otras pueden tener ms de un parmetro de forma.

DISTRIBUCION NORMAL
Es una distribucin simtrica y tiene la propiedad que la media, la mediana
y la moda son iguales.

La distribucin normal estndar esta tabulada, y el rea bajo la curva de


esta distribucin estandarizada refleja la probabilidad entre el valor
negativo infinito (-) y z estndar sobre o bajo la media cuando z esta dado
por:

Tericamente una variable normal puede tener cualquier valor entre (-) y
(+) pero en la prctica podemos despreciar la posibilidad de que un valor
x caiga fuera de los limites de 3.
Este hecho es una regla importante de la distribucin normal y se llama la
regla de 3 sigma, que nos indica que dentro de los limites 3 se
encuentran el 99.7 % de los datos, entre los lmites 2 estn el 95.4%
de los datos y dentro de los lmites estn el 68.3% de los datos.

PARAMETROS: tiene dos parmetros, la media que es un parmetro de


localizacin, y la desviacin estndar que es un parmetro de escala.
APLICACIONES: Tasas de rendimiento, tasas de inflacin, precios de
bienes y servicios, peso, estatura.
FORMULA:
La densidad de probabilidad es:

f x

1 x 2

2 2

EJEMPLO:
En un proceso de produccin se desea analizar el peso de cada unidad.
Segn el estndar, dicho peso debe estar normalizado con una media de
430g y se admite una variacin (desviacin estndar) de 5g. N(430, 5). Si
se toma una muestra aleatoria:

Determinar la probabilidad de que tal muestra sea a lo ms de 422g.


X

P X 422 P Z

422 430

P Z
PZ 1.6 0.0548
5

Lo que significa que hay un 5,48% de probabilidad de


que la muestra registre un peso inferior a 422g.

EN EXCEL:

OTRA OPCION EXCEL:

Normal(430 5)
8

Values x 10^-2

< 5,5%
422,00

94,5%

445

440

435

430

425

420

415

>
+Infinity

Determinar la probabilidad de que tal muestra sea al menos de 422g.

P X 422 P Z

422 430

P Z
PZ 1.6
5

1 0.0548 0.9452
Normal(430 5)
Normal(430 5)

8
1,0

0,9
0,8

0,6

0,5
0,4

0,3

2
0,2

0,1

94,5%

>
+Infinity

< 5,5%
422,00

94,5%

445

440

435

430

425

420

445

440

435

430

425

420

< 5,5%
422,00

415

0,0

415

Values x 10^-2

0,7

>
+Infinity

Determinar la probabilidad de que la muestra se encuentre entre


435g y 438g.

P X 1 435 P Z

435 430

P Z
PZ 1.0 0.8413
5

P X 2 438 P Z

438 430

P Z
PZ 1.6 0.9452
5

PZ 1.6 PZ 1.0 0.9452 0.8413


P1 Z 1.6 0.1039
Normal(430 5)
8

<

84,1%

445

440

435

430

425

420

415

Values x 10^-2

5,5% >
435,00

PRUEBA JARQUE BERA


Es una prueba de bondad de ajuste para verificar si un conjunto de
datos siguen una distribucin normal.

Ejercicio Prueba de Normalidad


En el archivo adjunto se encuentran los rendimientos diarios de un
proceso. Aplique la prueba Jarque-Bera, utilizando las frmulas de
Excel para dichos datos.
Si los rendimientos tienen distribucin normal, determinar la
probabilidad de que el rendimiento sea menor o igual a -1,25.
Si los rendimientos tienen distribucin normal, determinar la
probabilidad de que el rendimiento sea mayor o igual al 0,75.
Si los rendimientos tienen distribucin normal, determinar la
probabilidad de que el rendimiento se encuentre entre -1,0 y
1,5.
Determinar un intervalo de confianza al 95% para el

NOTA: este mtodo de


estimacin por intervalo se basa en el
supuesto de que puede utilizarse la
distribucin Normal de probabilidad.
Esta suposicin es vlida cuando 1)
n 30 debido al teorema del Lmite
Central, o 2) cuando n 30 pero la
poblacin tiene distribucin normal y se
conoce
la
desviacin
estndar
poblacional
rendimiento promedio.

JARQUE BERA
SESGO
0.12923191
CURTOSIS RELATIVA -0.17352191
CUENTA
250
JB
1.00951454
MEDIA
0,0483
DESV. ESTANADAR
1,011

VALORES CRITICOS
NIVEL DE CONFIANZA VALOR
90%
4.61
95%
5.99
99%
9.21

CONCLUSION:

COMO JB = 1.0095 ES MENOR QUE 4.61 NO SE RECHAZA


HIPOTESIS DE NORMALIDAD AL 90%

SOLUCION:
Columna1
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta

0,04837951
0,06400354
0,07572965
-1,18574008
1,01198477
1,02411317
-0,17352191
0,12923191
5,9496233
-3,05401045
2,89561285
12,0948778
250

Si los rendimientos tienen distribucin normal, determinar la


probabilidad de que el rendimiento sea menor o igual a -1,25.

Normal(0,0483; 1,011)
0,40

Mean = 0,048300
0,35

0,30

Normal

0,25

0,20

0,15

0,10

0,05

< 10,0%
-1,250

90,0%

2,5

2,0

1,5

1,0

0,5

0,0

-0,5

-1,0

-1,5

-2,0

-2,5

0,00

>
35,000

Si los rendimientos tienen distribucin normal, determinar la


probabilidad de que el rendimiento sea mayor o igual al 0,75.
Normal(0,0483; 1,011)
0,40

Mean = 0,048300
0,35

0,30

Normal

0,25

0,20

0,15

0,10

0,05

<

75,6%
0,750

2,5

2,0

1,5

1,0

0,5

0,0

-0,5

-1,0

-1,5

-2,0

-2,5

0,00

24,4% >
35,000

Si los rendimientos tienen distribucin normal, determinar la


probabilidad de que el rendimiento se encuentre entre -1,0 y
1,5.

Normal(0,0483; 1,011)
0,40

Mean = 0,048300
0,35

0,30

Normal

0,25

0,20

0,15

0,10

0,05

< 15,0%
-1,000

77,5%

2,5

2,0

1,5

1,0

0,5

0,0

-0,5

-1,0

-1,5

-2,0

-2,5

0,00

7,6% >
1,500

Determinar

un intervalo de confianza al 95% para el


rendimiento promedio.
TEOREMA DEL LIMITE CENTRAL: al aumentar el
tamao de la muestra, la distribucin muestral de la media se
aproxima a la forma de la distribucin Normal sin importar la
forma de la distribucin de las mediciones individuales de la
poblacin. Para propsitos prcticos, puede suponerse que la
distribucin muestral de la media es aproximadamente Normal
cuando el tamao de la muestra es

n 30 .

NIVEL DE CONFIANZA: es el valor de la probabilidad que


el investigador escoge para la estimacin que hace de la
importancia o del posible significado prctico de su
investigacin. Por lo general se trabaja con el 95% o 99% de
confianza.
ERROR TIPICO:

Sx

S
1,011

0,064
n 1
250 1

El valor Z al 95% de confianza lo podemos calcular con la


ayuda de Excel, por tratarse de una prueba bilateral, el nivel de
significancia 5% lo repartimos en las dos colas de la
distribucin Normal, con lo que la probabilidad que debemos
ingresar en Excel es: 95%

5%
97,5% 0,975
2

Distribution Plot

Normal; Mean=0; StDev=1


0,4
0,975

Density

0,3

0,2

0,1

0,0

0
X

1,96

INTERVALO DE CONFIANZA: se puede estimar un rango


de valores para la media, de la siguiente manera:

Intervalo de confianza = media muetral Z * error tpico

Intervalo de confianza = 0,0483 1,96*0,064


De tal manera que el rendimiento promedio de la inversin se
encontrar con un 95% de confianza en el intervalo:

0,077 0,0483 0,173

EJEMPLO 2
Una empresa ha registrado las unidades vendidas diariamente en la
siguiente tabla:
DIA
da 1
da 2
da 3
da 4
da 5
da 6
da 7
da 8
da 9
da 10
da 11
da 12
da 13
da 14
da 15
da 16
da 17
da 18
da 19
da 20
da 21
da 22
da 23
da 24
da 25
da 26
da 27
da 28

VENTAS
4
1
6
9
9
10
2
4
8
2
3
0
1
2
3
1
3
4
5
4
4
4
9
5
4
3
11
8

da 29
da 30
da 31
da 32
da 33

12
3
10
0
7

Aplique la prueba Jarque-Bera para determinar si las ventas se


pueden modelar mediante una distribucin Normal.

SOLUCION:

Frecuencia

Histograma
14
12
10
8
6
4
2
0

Frecuencia

2,4

4,8

7,2

9,6

y
mayor...

Clase

Columna1
Media
4,88
Error tpico
0,58
Mediana
4
Moda
4
Desviacin estndar
3,34
Varianza de la muestra 11,17
Curtosis
-0,73
Coeficiente de asimetra 0,56
Rango
12
Mnimo
0
Mximo
12
Suma
161
Cuenta
33

0,56 2 0,732
JB 33

2,45
6
24

VALORES CRITICOS
NIVEL DE CONFIANZA VALOR
90%
4.61
95%
5.99
99%
9.21

CONCLUSION:
COMO JB = 2.45 ES MENOR QUE 4.61 NO SE RECHAZA
HIPOTESIS DE NORMALIDAD AL 90%. En este caso los
parmetros de la distribucin sern: N(5, 3.34)

EJEMPLO 3
Una empresa ha registrado los precios de venta histricos de su
producto en la siguiente tabla:
PRECIOS
96,3
99,9
98,6
99,5
95,4
98,5
95,0
103,0
102,6
100,6
98,9
102,0
97,3
99,4
100,9
Aplique la prueba Jarque-Bera para determinar si las ventas se
pueden modelar mediante una distribucin Normal.

EJEMPLO 4
Una empresa ha registrado los costos de compra histricos de su
producto en la siguiente tabla:
COSTOS
93,7
91,6
86,5
87,9
90,0
80,3
84,3
87,7
87,6
83,5
92,1
80,1
84,8
91,5
82,4
86,8
92,2
83,7
81,7
90,5
83,4
84,5
89,8
81,4
90,1
89,1
85,4
87,4

Aplique la prueba Jarque-Bera para determinar si las ventas se


pueden modelar mediante una distribucin Normal.

DETERMINACION DEL TAMAO DE UNA


MUESTRA
Pueden presentarse 2 casos:
Cuando se conoce la poblacin:

N * 2 * Z 2
n
N 1 * E 2 2 * Z 2

Donde:
n = tamao de la muestra.
N = tamao de la poblacin.
2 = varianza = p*q= S2
Z = nivel de confianza.
E = error admisible.
p = probabilidad de xito (0,5).
q = probabilidad de fracaso (0,5).
Cuando no se conoce la poblacin:

2 *Z2
E2

EJERCICIO:
Para una investigacin de campo, en una poblacin de 8400 empresarios,
mediante estimacin se propone un error admisible del 6% y un 95% de
nivel de confianza. Calcular el tamao de la muestra.

SOLUCION:
N = tamao de la poblacin = 8400
2 = varianza = p*q= S2 = 0,5*0,5 = 0,25
Z = nivel de confianza = 95% = 0,95 = 1,96
E = error admisible = 6%
p = probabilidad de xito (0,5).
q = probabilidad de fracaso (0,5).

Distribution Plot

Normal; Mean=0; StDev=1


0,4
0,975

Density

0,3

0,2

0,1

0,0

0
X

1,96

N * 2 * Z 2
n
N 1 * E 2 2 * Z 2

8400*0,25* 1,96

8400 1 * 0,06 0,25 * 1,96

258,59 259

El tamao de la muestra debe ser de 259


personas.

EJERCICIOS DE APLICACIN 1
Resolver el ejercicio anterior, considerando que no se conoce el tamao de
la poblacin.

EJERCICIOS DE APLICACIN 3
Aplique la prueba Jarque-Bera para determinar si los datos se
pueden modelar mediante una distribucin Normal.
DATOS
22,5
25,3
25,2
24,4
23,0
23,7
30,6
29,5
18,6

25,5
22,5
28,3
26,6
29,7
22,4
24,1
30,3
23,4
27,1
24,6
25,6
26,2
18,9
26,1
23,8
24,4
27,9
28,5
19,1
23,9
28,5
23,2
23,7
26,7
22,8
20,7
22,2
19,0
29,3
26,8
20,2
27,2
26,4
30,0
26,5
22,0
23,3
21,9
26,9
23,3

EJERCICIOS DE APLICACIN 4
1.- Una fbrica de telas ha determinado que la resistencia a la rotura de una
tela sinttica se distribuye de acuerdo con: N(800, 12) Newtons. El
comprador de la tela exige que sta tenga una resistencia de al menos 772
Newtons.
a) Si se selecciona aleatoriamente una muestra de la tela, determinar la
probabilidad de que tal muestra cumpla con las exigencias del
comprador.
b) Existe otro comprador al que le interesa que la tela tenga mximo
una resistencia de 780 Newtons.
c) Determinar la probabilidad de que la tela tenga mximo 810
Newtons de resistencia.
d) Calcular la probabilidad de que la tela tenga una resistencia entre 785
y 815 Newtons.
e) Para un tamao de muestra de 45 determinar el intervalo de
confianza para la media al 95%.

S-ar putea să vă placă și