Sunteți pe pagina 1din 45

ANLISIS DE DATOS

Introduccin a las Probabilidades y


sus Principales Distribuciones

Toms Minauro La Torre


Sesin 4
tminauro@esan.edu.pe

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
2

Si usted apuesta a un caballo, juega por


dinero. Si usted apuesta a que obtendr tres
cartas de diamantes, se trata de un
entretenimiento. Si usted apuesta a que el
precio del algodn subir tres puntos, es
cuestin de negocios.
Ve usted la diferencia?.

Blackie Sherrod.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
3

Incertidumbres

Los administradores a menudo basan sus decisiones en un


anlisis de las incertidumbres, tales como las siguientes:
Cules son las probabilidades de que las ventas se
reduzcan si los precios aumentan?
Cul es la probabilidad de que un nuevo mtodo de
montaje incrementar la productividad?
Cules son las probabilidades de que una nueva
inversin ser rentable?

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
4

Probabilidades

La probabilidad es una medida numrica de las


posibilidades de que un evento ocurra.
Los valores de probabilidad siempre se asignan en
una escala de 0 a 1.
Una probabilidad cercana a cero indica que un
evento es muy poco probable que ocurra.
Una probabilidad cercana a uno indica que un evento
es casi seguro que se produzca.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
5

Probabilidad: Medida Numrica de la


Posibilidad de Ocurrencia
Aumentando la Posibilidad de Ocurrencia

0 0.5 1
Probabilidad:

El Evento El evento es El evento


es igualmente es
imposible posible que cierto
que ocurra como que que
ocurra. no ocurra. ocurre.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
6

Experimento Estadstico
En estadstica, la idea de un experimento es algo diferente
a la de un experimento en las ciencias fsicas.
En experimentos estadsticos, la probabilidad determina
los resultados.
A pesar de que se repite el experimento exactamente de
la misma manera, puede ocurrir un resultado
completamente diferente.
Por esta razn, los experimentos estadsticos son llamados
experimentos aleatorios

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
7

Experimento y Espacio Muestral


Un experimento es toda accin sobre la
cual vamos a realizar una medicin u
observacin, es decir cualquier proceso que
genera un resultado definido.
El Espacio Muestral de un experimento es
el conjunto de todos los resultados posibles.
Un Punto Muestral es un elemento del
espacio muestral de cualquier experimento
dado.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
8

Asignacin de Probabilidades
Requisitos bsicos para la asignacin de probabilidades
1. La probabilidad asignada a cada resultado debe estar
entre 0 y 1.
0 < P(Ei) < 1 para todo i
donde:
Ei es el i-simo resultado y P(Ei) es su probabilidad.
2. La suma de las probabilidades para todos los resultados
experimentales debe ser igual a 1.
P(E1) + P(E2) + . . . + P(En) = 1
donde:
n es el nmero de resultados
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
9

Asignacin de Probabilidades
Mtodo Clsico
Asigna probabilidades basado en el supuesto de que
Todos los resultados son igualmente probables.
Mtodo de Frecuencia Relativa
Asigna probabilidades basado en la experimentacin
o data histrica.
Mtodo Subjetivo
Asigna probabilidades basado en el criterio del
asignador.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
10

Eventos y sus Probabilidades


Un evento es un conjunto de puntos
muestrales.
La probabilidad de cualquier evento
es igual a la suma de las probabilidades
de los puntos muestrales pertenecientes
a dicho evento.
Si podemos identificar todos los puntos muestrales de un
experimento y les asignamos probabilidades a cada uno
de ellos, entonces podremos calcular la probabilidad de
cualquier evento.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
11

Algunas relaciones bsicas


entre eventos
Complemento de un Evento
Unin de Dos Eventos
Interseccin de Dos Eventos
Eventos Mutualmente Excluyentes

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
12

Regla de Adicin
La Regla de adicin nos da la forma de calcular la
probabilidad de que ocurra el evento A, o el B, o
ambos.
La regla de adicin se escribe as:
P ( A B ) = P(A) + P(B) - P(A B)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
13

Eventos Mutuamente Excluyentes


Dos eventos se dice que son mutuamente excluyentes
si no tienen ningn punto en comn.
Dos eventos son mutuamente excluyentes si, cuando
ocurre uno de ellos, el otro no puede ocurrir.

Espacio
Evento A Evento B Muestral S

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
14

Regla de Adicin:
Eventos Mutuamente Excluyentes
Si A y B son eventos mutuamente excluyentes si,
P(A B) = 0.
La regla de adicin, para eventos mutuamente
excluyentes sera:
P ( A B ) = P(A) + P(B)

No es necesario
incluir - P(A B)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
15

Probabilidad Condicional
La probabilidad de que ocurra un evento dado que
otro evento ya ha ocurrido se llama probabilidad
condicional .
La probabilidad condicional de A dado B se denota
por P(A|B).
La probabilidad condicional se calcula como sigue :

P (A B)
P (A | B) =
P (B)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
16

Regla de Multiplicacin
La regla de multiplicacin provee una forma de
calcular la probabilidad de la interseccin de dos
eventos.
La regla se escribe as:
P(A B) = P(B) P(A|B)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
17

Eventos Independientes
Dos eventos A y B son estadsticamente
independientes, si la ocurrencia de uno de
ellos no afecta las probabilidades de
ocurrencia del otro.
Es decir, se debe cumplir que:
P (A | B) = P (A) o P (B | A) = P (B)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
18

Regla de Multiplicacin para


Eventos Independientes
La regla de multiplicacin tambin se usa como
una prueba para ver si dos eventos son
independientes.
La regla se escribe como:
P (A B) = P(A) P(B)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
19

Teorema de Bayes
Frecuentemente iniciamos un anlisis de probabilidades con
una asignacin inicial, probabilidad a priori.
Entonces, por una muestra, un reporte especial, o un test de
producto obtenemos alguna informacin adicional.
Dada esta informacin, calculamos las probabilidades
revisadas o a posteriori.
El Teorema de Bayes provee los medios para revisar las
probabilidades a priori.
Aplicacin
Probabilidades Nueva Probabilidades
del Teorema
A Priori Information A Posteriori
de Bayes

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
20

Ejemplo: W.M.Company
W.M.Company es una empresa que recibe
partes de dos proveedores.
En la actualidad, el 75% de las partes compradas
por la compaa son del proveedor 1, y el 25%
restante proviene del proveedor 2.
Sabemos adems que la calidad de las partes
compradas vara de acuerdo con el proveedor.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
21

Ejemplo: W.M.Company
Probabilidades a priori
Definimos:
A1 = la parte es comprada del proveedor 1
A2 = la parte es comprada del proveedor 2

Usando estadsticas de compras:

P (A1) = 0.75, P (A2) = 0.25

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
22

Ejemplo: W.M.Company
Nueva Informacin
Supongamos que sabemos por informacin histrica las
probabilidades de partes malas de cada proveedor.
Definimos el evento B como una parte es mala.
Dado que ha ocurrido B, podra revisar las probabilida-
des de que proveedor nos vendi la parte?

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
23

Ejemplo: W.M.Company
Probabilidades Condicionales
La historia pasada de las experiencias
con los proveedores indican lo siguiente:

P(B|A1) = .02 P(B|A2) = .05

Entonces: P(BC|A1) = .98 P(BC|A2) = .95

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
24

Ejemplo: W.M.Company
Diagrama de rbol
Calidad del
Proveedor Resultados
Proveedor

P(B|A1) = .02
P(A1 B) = .0150
P(A1) = .75
P(A1 Bc) = .7350
P(Bc|A1) = .98

P(B|A2) = .05
P(A2 B) = .0125
P(A2) = .25
c P(A2 Bc) = .2375
P(B |A2) = .95
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
25

Ejemplo: W.M.Company

P(B) = P(A1 B) + P(A2 B) = 0.0150 + 0.0125


P(B) = 0.0275
P(BC) = P(A1 BC) + P(A2 BC) = 0.7350 + 0.2375
P(BC) = 0.9725
P(A1|B) = 0.0150 / 0.2750 = 0.5454
P(A2|B) = 0.0125 / 0.2750 = 0.4546
P(A1|BC) = 0.7350 / 0.9725 = 0.7558
P(A2|BC) = 0.2375 / 0.9725 = 0.2442

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
26

Variable Aleatoria
Una variable aleatoria es una descripcin numrica
de los resultados de un experimento.
Una variable aleatoria discreta puede asumir ambos
una secuencia finita o una infinita de valores.
Una variable aleatoria continua puede asumir
cualquier valor en un intervalo o en un conjunto de
intervalos.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
27

Valor Esperado
Valor Esperado o media de una variable aleatoria es la
medida de tendencia central
Valor esperado = = E(x) = xi f(xi)
El valor esperado es un promedio ponderado de los
valores que la variable aleatoria puede asumir. Las
ponderaciones son las probabilidades.
El valor esperado no tiene que ser un valor que la
variable aleatoria pueda asumir.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
28

Distribucin de Probabilidades Binomial


Propiedades del Experimento Binomial
1. Secuencia de n Ensayos Idnticos
2. Cada ensayo tiene slo 2 resultados: xito (Resultado
deseado) o Fracaso
3. Las Probabilidades en todos los ensayos son constantes
4. Los Ensayos son Independientes.

Dos mtodos de muestreo diferentes


Poblacin Infinita sin Reemplazo
Poblacin Finita con Reemplazo

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
29

Distribucin de Probabilidades
Binomial: Funcin
n!
f(x) = p x (1 - p )n - x
x !( n - x )!
f(x) = probabilidad de X = x dados n & p
n = nmero de ensayos
p = probabilidad de xito
x = numero de xitos en las n repeticiones
(X = 0, 1, 2, ..., n)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
30

Distribucin de Probabilidades Binomial


Valor esperado E (x) = = n p

Varianza Var(x) = 2 = n*p*(1 - p)

Desviacin Estndar DS(x) = = n*p*(1 - p)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
31

Distribucin de Poisson
Una variable aleatoria que sigue la distribucin de
Poisson es til para estimar el nmero de ocurrencias
en un especfico intervalo de tiempo o espacio.
Es una variable discreta que puede asumir un nmero
infinito de valores. (X = 0, 1, 2, 3, . . . ).

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
32

Distribucin de Poisson

Ejemplos de Variables Aleatorias de Poisson:

El nmero de llamadas que ingresan a una


central telefnica en una hora

El nmero de vehculos que pasan por


una caseta de peaje en media hora

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
33

Distribucin de Poisson
Dos Propiedades del Experimento de Poisson:
1. La probabilidad de ocurrencia es la misma para
cualquier par de intervalos de igual tamao.
2. La ocurrencia o no ocurrencia en cualquier
intervalo es independiente de la ocurrencia o
no ocurrencia en cualquier otro intervalo.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
34

Distribucin de Poisson: Funcin


- x
e
f(x) =
x!
f(x) = probabilidad de que X = x dado
= Valor esperado (media) del nmero de
xitos
e = 2.71828 (base de logaritmos naturales)
x = nmero de xitos por unidad

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
35

Distribucin de Poisson
Funcin de probabilidad de Poisson
Puesto que no hay lmite superior indicado por el
nmero de casos, la funcin de probabilidad f (x) se
aplica a los valores de x = 0, 1, 2, ... sin lmites.
En las aplicaciones prcticas, x solo alcanza un valor lo
suficientemente grande como para que f(x) sea
aproximadamente igual a cero y la probabilidad de que
tome valores ms grandes es insignificante.
Una caracterstica de la distribucin de Poisson es que la
media y la varianza son iguales ( = 2)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
36

Distribucin Continua de Probabilidad


Una variable aleatoria continua puede asumir cualquier
valor en un intervalo de la recta de nmeros reales o en un
conjunto de intervalos.
No es posible hablar de la probabilidad de que la variable
aleatoria asuma un valor en particular.
En lugar de ello, hablamos de la probabilidad de que la
variable aleatoria asuma un valor dentro de un intervalo dado.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
37

Distribucin Continua de Probabilidad


La probabilidad de que una variable aleatoria asuma
un valor en un intervalo dado de X1 a X2 se define
como el rea bajo la curva de la funcin de densidad
de probabilidades dentro de dicho intervalo.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Distribucin Normal
Es la distribucin ms importante
para describir la distribucin de f (x)
variables aleatorias continuas
1. Forma de Campana & Simtrica
2. Media, Mediana, Moda son
iguales x

3. Variable aleatoria que tiene Media


rango infinito. Mediana
Moda

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
39

Importancia de la Distribucin Normal


1. Hay muchos experimentos de variables continuas
que siguen esta distribucin o que pueden ser
aproximados por ella.
2. Esta distribucin se puede usar para aproximar
algunas distribuciones de variable discreta.
3. La distribucin normal constituye la base para la
inferencia estadstica clsica por su relacin con
el Teorema del Lmite Central.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
40

Distribucin Normal: caractersticas


99.72%
95.44%
68.26%

x
+ 3
3 1 + 1
2 + 2
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Distribucin Normal: caractersticas
Probabilidad es d

f ( x)dx ?
el rea bajo la
curva! P (c X d ) =
c

f(X)

c d X
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
42

Distribucin Normal Estndar


X -
Z=
Distribucin Normal
Distribucin Normal
Estndar
z = 1

X Z = 0 Z
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Probando Normalidad
Comparar caractersticas de la Grfico de Probabilidad Normal
Data con Propiedades de la
X 90
Distribucin Normal.
Evaluar el Grfico de 60
Probabilidad Normal. 30 Z
Graficar los Datos X vs. -2 -1 0 1 2
valores Z estandarizados.
Buscar una lnea recta!

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
44

Aproximaciones a la
Distribucin Binomial
Cuando el nmero de repeticiones en una variable BINOMIAL
es muy grande, se presentan dificultades para el clculo de las
probabilidades usando la funcin Binomial. En estos casos es
prctico utilizar aproximaciones para los clculos.
Se pueden utilizar tanto la variable POISSON como la NORMAL,
dependiendo de la probabilidad de xito de la distribucin
(Binomial) original.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.
Anlisis de Datos
45

Aproximaciones a la
Distribucin Binomial
Para usar la aproximacin por Poisson, hacemos:
= nxp
y para usar la aproximacin por Normal, hacemos:
= nxp 2 = nxpx(1-p)
como parmetros con los que queda definida la correspondiente
distribucin.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2017.

S-ar putea să vă placă și