Documente Academic
Documente Profesional
Documente Cultură
decisiones de negocios
Profesor:
Dr. Mauricio Ortigosa
Abril - Junio 2018
CURRICULUM VITAE
Dr. Mauricio Ortigosa Hernández
Estudios realizados:
Estudió la Licenciatura en Actuaría en la Universidad Nacional Autónoma de México, posteriormente
obtuvo un Diploma de Posgrado en Métodos Cuantitativos e Informáticos Aplicados a la Gestión, en la
Universidad de Barcelona. Tiene el Master en Marketing en la Universidad Autónoma de Madrid y la
Maestría en Administración de Empresas en el Instituto Tecnológico y de Estudios Superiores de
Monterrey en la ciudad de México. Tiene el “Diplomado de Formación de Consultores”. Por último, obtuvo
el grado de Doctor por la Universidad de Barcelona en Estudios Empresariales dentro de la especialidad
de Investigación y Técnicas de Mercado con la Tesis: Una propuesta metodológica para medir el valor del
cliente en la incertidumbre.
Experiencia Profesional:
Como experiencia Profesional estuvo como jefe de la oficina de Estadística a cargo del sistema de
información a nivel nacional del Instituto Nacional para la Educación de los Adultos; desempeñó el puesto
de jefe de Departamento de Programación y Presupuesto en la XLIX Legislatura Local de la Cámara de
Diputados del Estado de México; Asesor de operaciones en la casa de Bolsa Probursa; Ejecutivo Adjunto
de Estadística en A.C. Nielsen Company en el área de investigación de mercados; Ha estado como
colaborador externo en la empresa Gallup México y en el Instituto DYM en Barcelona en el área
cuantitativa de investigación de mercados.
Experiencia Académica:
Ha trabajado como profesor en España en la Universidad Autónoma de Barcelona y Universidad de
Barcelona. En México en la Universidad Intercontinental, UNAM, Lasalle, UVM, ITAM e ITESM (Campus
Ciudad de México y Santa Fe). Ha sido profesor de diplomados en el área de capacitación de empresas del
ITESM impartiendo cursos en el D.F., el interior de la República Mexicana y en Ecuador. En los últimos
años en Barcelona, ha colaborado en diferentes Escuelas de Negocios e instituciones educativas tales
como la Universidad de Barcelona Virtual, Instituto Superior de Marketing y Escuela de Administración de
Empresas (EAE). En la actualidad es profesor-investigador en el Centro de Alta Dirección en Economía y
Negocios (CADEN) de la Universidad Anáhuac México Norte
correo electrónico: mauricio.ortigosa@anahuac.mx
Correo electrónico: mauriciortigosa@hotmail.com
Análisis de datos para la toma de decisiones de
negocios
Objetivo General de la materia
La materia tiene la finalidad de proporcionar al alumno herramientas de
estadística que sean útiles en el análisis de datos para mejorar el
desempeño de las actividades empresariales
El alumno:
1. Analizará las variables propias de los negocios a partir de la
aplicación e interpretación de las medidas de estadística descriptiva.
Se realizarán varias sesiones con el apoyo del Excel para que el alumno se
familiarice con estas herramientas en futuros análisis de datos.
Durante el curso, además de dar un marco teórico básico, se apoyarán las sesiones
con el desarrollo de ejemplos del mundo empresarial.
Programa de la asignatura
Temas y subtemas
1. Introducción a la Estadística
1.1 Definición de Estadística y conceptos básicos
1.2 Ramas de la Estadística: Descriptiva e Inferencial
1.3 Tipos de Variables y escalas de medición
Prácticas en Excel
Programa de la asignatura
4. Probabilidad
4.1 Enfoques de probabilidad: Axiomas
4.2 Distribuciones de probabilidad
4.3 Valor esperado (Esperanza matemática)
4.4 Distribución de probabilidad Binomial
4.5 Distribución de probabilidad Poisson
4.6 Distribución de probabilidad Normal
5. Análisis de decisiones
5.1 Toma de decisiones bajo certidumbre
5.2 Toma de decisiones bajo incertidumbre
5.3 Toma de decisiones bajo riesgo: pago esperado y valor de la
información perfecta
6. Estimación de parámetros
6.1 Proceso de estimación: puntual y por intervalo
6.2 Distribuciones muestrales o de muestreo de la media y la
proporción
6.3 El nivel de confianza y su interpretación
6.4 Estimación de la media
6.5 Estimación de la proporción
Programa de la asignatura
7. Pruebas de hipótesis
7.1 Proceso de las pruebas de hipótesis
7.2 Nivel de significancia y su interpretación: Tipos de pruebas
7.3 Pruebas de hipótesis de la media (Regla de oro)
7.4 Prueba de hipótesis de la proporción
Nota:
La participación es tomada en cuenta con la asistencia de la siguiente
forma:
11 asistencias calificación 10 (ninguna falta)
10 asistencias calificación 9 (una falta)
9 asistencias calificación 8 (dos faltas)
8 asistencias calificación 7 (tres faltas casos excepcionales)
Introducción a la estadística
En otras palabras…
Muestra
Es simplemente una parte (o subconjunto) de esas observaciones
(individuos u objetos)
Ejemplos:
• 500 de las cuentas de crédito hipotecario que tienen Santander
• 10 de los Bancos que operan en el territorio mexicano
• Las amas de casa de 30 a 60 años de la calle “Paseos de la Herradura”
Nota: La población y la muestra están determinadas por el problema, ya
que una muestra puede jugar el papel de población y viceversa
Población y muestra
Conceptos básicos
Parámetro (parámetro poblacional)
Es cualquier valor característico de la población. Sin embargo estos valores
son desconocidos porque no siempre podemos tener todos los datos de la
población para calcularlos.
Ejemplos:
• La edad media de la población de México: ?
• La proporción de fumadores en México: P?
La varianza de las edades de la población en México: ?
2
•
P p
Conceptos básicos
Estadístico (estadístico muestral)
Es el valor calculado en base a los datos que se obtienen sobre una
muestra. Es decir, el estadístico es la característica de una muestra y por lo
tanto es una estimación de los parámetros.
n n n 1
Ejemplos de estadísticos: _
• La edad media de una muestra de 10,000 personas de México es: x 45.3
• La proporción de fumadores de la muestra anterior: p p p 3000 0.30
10000
• La varianza de las edades de la misma muestra: S2 81
Parámetros y estadísticos
Ramas de la Estadística
Estadística descriptiva.
Se dedica a resumir datos provenientes de una muestra o de
toda la población con la finalidad de poder tener una mejor
comprensión del fenómeno en Estudio.
Los datos pueden ser resumidos numérica o gráficamente.
Las dos
clasificaciones
más comunes
población
muestra
Tipos de variables
Por lo general, los datos estadísticos se obtienen contando o midiendo
objetos. Ejemplos de ellos son la tasa de desempleo, las ventas
mensuales de Liverpool, el número de mujeres ejecutivas en las
sucursales del Banco Santander, entre otros ejemplos más. A las
medidas anteriores se les llaman variables.
Por tanto, una variable es: un elemento de interés que puede tomar
muchos valores numéricos diferentes.
0 1 2 3 4 5 6 7 8 9 10
Escalas de medición
MEDIR
- Es la asignación de números a las observaciones, de modo que los
números sean susceptibles de análisis por medio de manipulaciones y
operaciones de acuerdo con ciertas reglas.
Para preparar datos para el análisis se debe estar familiarizado con una
jerarquía de cuatro escalas (numéricas) de medición o medida:
Nominal, Ordinal, Intervalo (Intervalar) y de Razón. Cuanto más alta
sea la posición que ocupa el tipo de dato en esta jerarquía, más
información contendrá la variable medida.
+
Variables Razón
cualitativas
Intervalo
Ordinal Variables
- Nominal
cuantitativas
Escala nominal
Las variables medidas en escalas nominales, se utilizan cuando se
pueden establecer categorías sin ningún orden. Las categorías sólo se
nombran o se enumeran pero no se pueden comparar.
Características de las categorías:
Son mutuamente excluyentes, puesto que cada individuo, objeto o
medida se clasifica en sólo una de ellas.
Los códigos (o números) utilizados en estas variables, no poseen ni
orden, ni distancia, ni origen.
Los números sirven sólo como etiquetas para identificar y clasificar
objetos. Los números carecen de valor matemático incluso podrían
ser letras.
Ejemplos: Estado civil, ocupación, sexo, religión, etc.
Ocupación:
1. Médico
2. Enfermera
Códigos: 1 2 3 4 5 3. Odontólogo
¿Eres mayor de edad? 4. Ingenieros
1 Si ( )
Código: Código: 2 No ( ) 5. Periodistas
Mujer F - 0 Hombre M - 1 6. Otras
ocupaciones
Escala ordinal
Las variables en escala ordinal, se componen de distintas categorías en las
que hay implícito un orden (más no la distancia métrica en ese orden).
Ordinal
¿Cuántos años tiene? ___
Propiedades y comparación entre las escalas
Niveles de medición
Propiedades Nominal Ordinal Intervalo Razón
Frecuencia
Conteo
Mínimo
Máximo
Moda
Mediana
Media
Rango
Desviación estándar
Varianza
Cuantiles (Percentiles)
Sesgo
Curtosis
TEMA 2
Una vez reunidos los datos, deben procesarse de tal manera que pueda
observarse cualquier patrón significativo. Lo anterior permite obtener
información significativa y con ella tomar decisiones.
Tablas de distribución de frecuencia
Color Frecuencia 31 a 40 2
41 a 50 6
Rojo 12
51 a 60 6
Verde 8 61 a 70 26
Azul 8 71 a 80 18
81 a 90 8
Amarillo 4
Total 66
Tablas de distribución de frecuencia
El Banco X establece, sobre la base de sus registros, que el número de
clientes que hicieron uso del “modelo de banca preferente”, durante
los últimos dos meses en una sucursal de muestra son los que se
presentan a continuación:
87 65 78 87 60 87 34 31 43 87
78 90 65 68 62 70 80 61 62 72
95 64 80 90 68 80 30 35 40 75
59 68 65 92 70 78 95 33 72 65
70 95 50 75 31 60 43 78 70 60
65 60 30 90 40 80 59 27 92 65
Número de
clientes Días
LI LS f
27 35 8
36 44 4
45 53 1
54 62 9
63 71 14
72 80 11
81 89 5
90 98 8
Tablas de distribución de frecuencia
Una de las columnas que podemos generar puede ser la que representa a
la frecuencia acumulada (fai) i
fa i f j
j1
Es decir, la que nos responderá a la pregunta de ¿cuántos datos se fueron
presentando desde el primer intervalo (j=1) hasta el intervalo i?
De esta forma tendremos:
0.50 a 0.90 6
0.90 a 1.30 6
1.30 a 1.70 26
1.70 a 2.10 18
2.10 a 2.50 8
Total 66
Tablas de distribución de frecuencia
Respuesta:
Total 66 100
Tablas de distribución de frecuencia
Ejercicio: El Gerente de una tienda reunió la siguiente información sobre
la cantidad de veces que un cliente visita la tienda durante un mes.
Las respuestas de 51 clientes fueron las siguientes:
5 3 3 1 4 4 5 6 4 2
6 6 6 7 1 1 14 1 2 4
4 4 5 6 3 5 3 4 5 6
8 4 7 6 5 9 11 3 12 4
7 6 5 15 1 1 10 8 9 2
12
Gráfica de barras:
Es un método habitual de presentar en forma gráfica datos con escala
nominal u ordinal es decir, cualitativos . Cada barra representa la
frecuencia de una categoría y la altura es proporcional al número de
elementos de esa categoría. Se suelen separar las barras ya que el
eje horizontal no es la recta numérica
Ejemplos de gráfica de barras
Ejemplos de gráfica de barras
Gráficas: barras y pastel
Gráfica de pastel: (Pie, Circular o de Sectores)
Sobre todo se utiliza para datos cualitativos , este tipo de diagrama es útil
si se quiere hacer hincapié en los tamaños relativos de las
componentes de los datos. El circulo completo de 360 grados
representa el número total de observaciones.
Se suelen ordenar los sectores para hacer más evidente sus diferencias.
A partir de la frecuencia relativa se obtienen los grados y hay dos
alternativas:
grados i fri 360 grados i % i 3.6
Histogramas, Polígonos y Ojivas
Histograma:
Se utiliza esta gráfica cuando los datos corresponde a escalas de
intervalos o de razón, es decir, se utilizan con datos cuantitativos.
La interpretación es similar a la grafica de barras
Ejemplos de histograma
Ejemplos de histograma
Ejemplos de histograma
Histogramas, Polígonos y Ojivas
Polígono de frecuencia:
Es otra alternativa similar al histograma y consiste en segmentos de recta
que conectan los puntos que forman las intersecciones de las
marcas de clase y las frecuencias de clase.
Ejemplo de histograma y polígono de frecuencia
Histogramas, Polígonos y Ojivas
Ojiva:
Concepto:
• La ojiva es un polígono de frecuencias acumuladas, es decir, en las
abscisas (horizontal) se colocan los límites superiores de cada
intervalo de clase y en las ordenadas (vertical) se coloca la frecuencia
acumulada (absoluta o relativa) de la clase.
Ejemplos de Ojivas:
Gráficas de líneas
Datos no agrupados
xi = cada uno de
n
x
los datos
i
i 1
x= Número total
n de datos = n
10 12 36 25 58 141
x 28.2
5 5
Media aritmética: Simple y ponderada
Media aritmética simple
Media aritmética simple para datos agrupados: la media de un conjunto de
valores agrupados (tabla de frecuencia) numéricos es la suma del
producto de la frecuencia de cada renglón por la marca de clase de
dicho renglón dividida entre el número de valores
Datos Agrupados
frecuencia por la marca de clase
k de cada renglón
f x
i 1
i i
x= Número total de
n datos = n
f x i i
(166 22.5) (437 32.5) .... (1 82.5) 91407.5
X= i 1
44.57
n 2051 2051
Media aritmética: Simple y ponderada
Media aritmética simple
Ejemplo: calcular el salario promedio de los 82 empleados de las
sucursales en la Cd. de México del Banco Santander:
f
f
12,500 17,500 $15,000 18
n 82
17,500 22,500 $20,000 35
22,500 27,500 $25,000 29
x
15000 *18 20000 * 35 25000 * 29 1695000 $20,670.70
82 82
Media aritmética: Simple y ponderada
Media aritmética ponderada
Media aritmética ponderada: Es el promedio de los datos en donde se le
da un peso o importancia específica a cada observación. Se calcula:
w x
Producto de cada uno
de los datos por su
i i ponderación
i 1
x w= n
w
i 1
i
Suma de las
ponderaciones
Media aritmética: Simple y ponderada
Ejemplo de media aritmética ponderada:
Suponga que los datos siguientes corresponden a tres compras de
materia prima en los últimos tres meses. Suponga que se desea
saber el precio promedio por kilo de la materia prima adquirida en
esos meses.
Observe que el precio varía desde $17.80 hasta $79.45 y que la cantidad
comprada varía desde los 19 Kg hasta los 75 Kg
Precio del Cantidad
Producto/kg comprada
Xi en Kg (Wi)
17.80 35.90 79.45 133.15
$17.80 75 x $44.38
$35.90 56 3 3
$79.45 19
w x i i
(33,333.33 * 0.7) (33,333.33 * 0.7) (33,333.33 * 0.7)
cartera= i 1
n
w
100,000
i
i 1
Ejemplo: Encontrar la moda de; 47, 48, 49, 49, 49, 51, 51, 52. Podemos
observar que el número que más se repite es el 49. Si ningún valor
se repite, no existe moda
Datos Agrupados:
Se localiza la clase modal buscando la frecuencia más alta y después se
aplica la siguiente fórmula:
1
X̂ = FI + * i Donde FI = Límite inferior de la clase modal
1 2 f = frecuencia más alta
i = amplitud del intervalo de la clase modal
donde : 1 f fanterior
2 f fposterior
1 17
X̂ = FI + * i 17500 * 5000 $21,195 .65
1 2 17 6
donde : 1 f fanterior 35 18 17
2 f fposterior 35 29 6 Tamaño de intervalo
(22500-17500)
Mediana
Mediana : Es el valor central, el que delimita al 50% de los datos, es decir,
es el valor que se encuentra exactamente en la mitad de los datos.
Datos No agrupados:
En los datos ordenados se aplica la siguiente relación, para encontrar la
posición de los datos.
n 1
posición
2 Donde n = número total de datos
Entonces podemos tener sólo dos alternativas
1. El valor de la posición puede ser entero y lo único que debemos hacer
es contar el número de lugares que nos indica esta formula.
2. El valor de la posición nos da un valor decimal (.5) y entonces
debemos: sumar los valores involucrados y dividirlos entre 2.
Ejemplo: Obtener la mediana de los datos: 8, 7, 5, 13
Si tenemos los valores ordenados 5, 7, 8, 13 entonces la posición nos da
2.5 por tanto, tendremos que seleccionar a los números 7 y 8 para
luego sumarlos (15) y dividirlos entre 2 (7.5) . De esta manera
podemos afirmar que la mediana es 7.5
Mediana
Datos Agrupados:
Se localiza la clase o renglón que contiene a la mediana, con la siguiente
condición
n +1
fa posición
2
Es decir debemos encontrar la primera frecuencia acumulada que sea
mayor o igual a la posición, para posteriormente aplicar la siguiente
fórmula:
~ posición fa anterior
X = FI + *i
f
Donde:
FI = Frontera o límite verdadero inferior del renglón de la mediana
fa = Frecuencia acumulada anterior al renglón de la mediana
f = Frecuencia del renglón de la mediana
i = Tamaño del intervalo en el renglón de la mediana
Mediana
Datos Agrupados:
Ejemplo: Calcular el sueldo mediano de:
Lím. Inf. Lím. Sup. Salario No. de Frecuencia
x empleados acumulada
f fa
12,500 17,500 $15,000 18 18
17,500 22,500 $20,000 35 53
22,500 27,500 $25,000 29 82
Relación Simetría
Simétrica
~=X
X̂ X
~ X Sesgo positivo
X̂ X
X̂ X~>X Sesgo negativo
Ejemplo:
Si una persona ganó $30,000 en el año 2000 y $50,000 en el año 2010
¿Cuál es la tasa anual de incremento durante este período?
Note que los valores de 1.10, 1.20 y 1.30 son resultado de realizar lo
siguiente:
crecimiento porcentual 10
Y1 1 1 ( ) 1.10
100 100
Para el primer caso y se deberá hacer lo mismo para los otros dos datos.
Medidas de dispersión:
En general describen la variabilidad de un conjunto de datos y sirven de
complemento junto con las anteriores medidas de tendencia central
para obtener una descripción numérica más completa de los datos.
Rango
Desviación estándar y varianza
Coeficiente de variación
Datos agrupados:
rango LSk LI1
2 = i 1
N
o en forma simplificada
N
xi
2
2 i 1 2
N
Varianza y desviación estándar
EJEMPLO:
Supongamos que tenemos registrados el ingreso de una población de 12
familias
Núm. de Ingreso Núm. de Ingresos
familia familiar $ familia familiar $
1 19,000 7 45,000
2 17,000 8 39,000
3 22,000 9 38,000
4 18,000 10 44,000
5 28,000 11 34,000
6 34,000 12 10,000
( xi ) 2
(19,000 29,000) 2 (17,000 29,000) 2 ... (34,000 29,000) 2 (10,000 29,000) 2
=
2 i 1
N 12
n
( xi ) 2
1488,000,000
2 = i 1
124,000,000
N 12
$29,000
Varianza y desviación estándar
Otro ejemplo:
Si dos poblaciones tienen la misma media y tienen dos desviaciones
estándar poblacionales, podemos tener una fotografía de la
dispersión de ambas poblaciones:
Promedio de ingresos: $29,000 ambas poblaciones
$2,000
1
$5,000
2
Varianza y desviación estándar
n
i
x x 2
i 1
S2 =
n -1
o en forma simplificada
n 2
xi
2
S2 i 1 n x
n -1 n 1
Varianza y desviación estándar
x x
4.52 4.64 -0.12 0.02 2
4.43 4.64 -0.21 0.05 i
i 1
4.03 4.64 -0.61 0.38 S2 =
3.97 4.64 -0.67 0.45 n -1
4.30 4.64 -0.34 0.12
4.14 4.64 -0.50 0.25
4.04 4.64 -0.60 0.36
Promedio 4.64 Suma 10.09 S = S2
Varianza 0.44
Desviación estándar 0.66
Varianza y desviación estándar
Varianza poblacional:
k
f i x i
2
2 = i 1
N
o en forma simplificada
k 2
fi x i
2 i 1 2
N
Varianza muestral
k
f i x i x
2
i 1
S2 =
n -1
o en forma simplificada
k 2
fi x i
n x
2
S
2 i 1
n - 1 n - 1
fi x i
2
=2 i 1 2
N
Coeficiente de variación
Coeficiente de variación (CV): (Dispersión Relativa)
En ocasiones es necesario un estadístico descriptivo que indique cuán
grande es la desviación estándar en relación con la media. Esa
medida es el coeficiente de variación y se expresa como porcentaje
S
CV = 100, CV 100
x
Nota: Observe que para una población, la S = S se sustituye por 2
2
y la X por la
Conclusión:
SA 5.4 SB 3.4
CV A
(100) (100) 8.38% CVB
(100) (100) 26.15%
64.40 xB 13
xA
Respuesta: La acción B tienen un CV más grande que la acción A, por
tanto la acción B es más riesgosa
Coeficiente de variación
Otro ejemplo.
El consejo de administración de una corporación está estudiando la
posibilidad de adquirir una de las dos siguientes empresas (A o B) y
con mucho detenimiento analiza la administración de cada una de
ellas.
En los últimos cinco años, la empresa A alcanzó un promedio de
rendimiento sobre la inversión del 28%, con una desviación estándar
de 5.3%
La empresa B, en el mismo período, tuvo un promedio de rendimiento
sobre la inversión de 37.8% con una desviación estándar de 4.8%.
Considere en este caso, datos poblacionales
Suponemos que el riesgo se acompaña de una mayor dispersión relativa.
Empresa A A 28% A 5.3% CV 18.93%
A
Para cada valor xi, existe otro valor llamado punto zi (o valor
estandarizado) que se obtiene mediante la siguiente fórmula de
transformación:
x x
i
z
i
s
Importante:
Al punto zi puede ser interpretado como el número de desviaciones
estándar a las que xi se encuentra de la media x
Observación: z0
Valor (punto) z
(valores estandarizados)
Explicación con ejemplos:
Supongamos un reporte de ventas (en miles) en 5 sucursales cuya
cantidad en cada una es: 46, 54, 42, 46 y 32.
La media de ventas y la desviación estándar son: x 44 s8
Calcular los puntos z que son equivalentes a los valores de ventas
originales anteriores:
x 2S
- Si z = 3 , al menos el 89% de los valores caen dentro de 3
desviaciones estándar alrededor de la media:
x 3S
- Si z = 4 , al menos el 94% de los valores caen dentro de 4
desviaciones estándar alrededor de la media:
x 4S
Teorema de Chebyshev
Problema 3 Teorema de Chebyshev:
Intercam, está elaborando un estudio relacionado con el tamaño de las
carteras de inversión de clientes considerados como pequeños y
medianos.
Para ello, se tomo un muestra de clientes donde se calculó el importe de la
cartera promedio que fue de $2,800,000 con una desviación estándar
de $500,000. Si un histograma revela que la distribución de la cartera
no se acerca a la normal, aplica el teorema de Chebyshev para
determinar dentro de qué rango de valores caería al menos el 85% de
las inversiones.
1
Solución:
1 2
0.85 z 2.58
z
El teorema dice que al menos el 85% de los valores están dentro de
z a partir de la media.
Para una media de $2,800,000 y una desviación estándar de $500,000, el
tamaño de las carteras se encuentran dentro de:
2,800,000 2.58(500,000) 2,800,000 1,290,000
($1,510,000;$4,090,000)
Teorema de Chebyshev
Problema 4 Teorema de Chebyshev:
Merrill Lynch concluyó un estudio relacionado con el tamaño de las
carteras de inversión en línea (acciones, bonos, fondos mutuos, y
certificados de depósito) en una muestra de clientes del grupo de 40 a 50
años de edad. A continuación se muestra el valor de las inversiones en
miles de dólares de los 70 participantes
Inversiones en miles de dólares
669.9 7.5 77.2 7.5 125.7 516.9 219.9 645.2
301.9 235.4 716.4 145.3 26.6 187.2 315.5 89.2
136.4 616.9 440.6 408.2 34.4 296.1 185.4 526.3
380.7 3.3 363.2 51.9 52.2 107.5 82.9 63
228.6 308.7 126.7 430.3 82 227 321.1 403.4
39.5 124.3 118.1 23.9 352.8 156.7 276.3 23.5
31.3 301.2 35.7 154.9 174.3 100.6 236.7 171.9
221.1 43.4 212.3 243.3 315.4 5.9 1002.2 171.7
295.7 437 87.8 302.1 268.1 899.5
x zs
242.73 1.41( 211.52) 242.73 298.24 ( 55.51,540.97)
x 3S
desviaciones estándar alrededor de la media:
Regla empírica
Ejercicio 1 Regla empírica:
Supongamos que Domino´s Pizza tienen durante un registro de 30 días
que la entrega promedio es de 20 minutos con una desviación
estándar de 5 minutos. Si asumimos que el tiempo de entrega a
domicilio se distribuye en forma de campana.
¿Podrías decirle rápidamente a la empresa cuantas pizzas tendrá que
regalar si llegan pasando los 30 minutos?. Utiliza la regla empírica
para dar una respuesta aproximada.
Respuestas:
El 68% de las pizzas son entregadas a domicilio entre los 15 y 25 minutos
Coeficiente de Sesgo
sesgo de Pearson
a3 =0 No hay sesgo. La
distribución es insesgada
a 3 próximos a 3 La distribución tiene sesgo
positivo o sesgo derecho.
a 3 próximos a -3< 0 La distribución tiene sesgo
negativo o sesgo izquierdo.
Medidas de forma: Momentos
Momento respecto de la Media:
Son resultados para calcular la simetría y curtosis
x x
n
r
Datos No Agrupados: i
mr i 1
n
fi x i x
n
r
Datos Agrupados mr i 1
n
En particular:
El primer momento respecto a la media (r=1) siempre es igual a cero.
El segundo momento respecto a la media (r=2) es la varianza
poblacional.
Medidas de forma: sesgo y curtosis
n n x i x 3
Datos no agrupados
a3 *
(n - 1)(n - 2) i 1 s
En términos de momentos es
n
i
3
x x
Datos no agrupados m3
a3 3
i1
S ns 3
Xi es la marca de clase
k fi la frecuencia de clase
f i x i x
3
S desviación estándar
Datos agrupados
a3 i 1
ns 3
Medidas de forma: sesgo y curtosis
Coeficiente Sesgo
momento de sesgo
(Coeficiente de
asimetría)
a3 = 0 No hay sesgo. La distribución es
insesgada
a3 > 0 La distribución tiene sesgo
positivo o sesgo derecho.
a3 < 0 La distribución tiene sesgo
negativo o sesgo izquierdo.
Medidas de forma: sesgo y curtosis
Curtosis:
Mide qué tan puntiaguda es una distribución, con respecto a la Normal, es
decir, analiza el comportamiento de los datos con respecto al eje de
las “Y”.
La distribución puede ser:
• Leptocúrtica: La distribución es más puntiaguda que la Normal, ya
que su desviación estándar es muy pequeña.
• Mesocúrtica: solo la distribución Normal (es el término medio).
• Platicúrtica: La distribución es menos puntiaguda que la Normal,
debido a que presenta una desviación estándar muy grande con
respecto a la distribución normal.
Medidas de forma: sesgo y curtosis
En términos de momentos, a 4 se calcula dividiendo el cuarto momento
respecto a la media entre la varianza al cuadrado (o la desviación
estándar a la cuarta) menos 3
n = Número total de datos
Datos No Agrupados: n
i
x x 4 y
S = desviación estándar
m4
a4 4 3 i 1
4
3
S nS
n
Datos agrupados
f i x i x
4 Xi = es la marca de clase
m4 fi = la frecuencia de clase
a4 4 3 i 1
4
3 y
S nS S = desviación estándar
n(n 1) n
xi x
4
3(n - 1) 2
a4
(n - 1)(n - 2)(n - 3) i 1 s (n - 2)(n - 3)
Medidas de forma: sesgo y curtosis
n 1
En donde:
xi = Valores de la variable x
yi = Valores de la variable y
x = media aritmética de la variable x
y = media aritmética de la variable y
(x i x )( yi y )
Covarianza poblacional: xy i 1
N
Medidas de asociación entre dos variables (cuantitativas)
Interpretación de la Covarianza:
S xy 0 S xy 0 S xy 0
Medidas de asociación entre dos variables (cuantitativas)
Ejemplo de covarianza:
Suponga que un administrador desea comprobar la relación lineal entre el
número de comerciales en un fin de semana y las ventas de
televisores a la semana siguiente y recaba una muestra de
observaciones durante 10 semanas
Nuestro administrador piensa que los comerciales (x) y el volumen de
venta (y) están relacionados Número de Volumen de
comerciales ventas
Semana (x) ($100s) (y)
1 2 50
2 5 57
3 1 41
4 3 54
5 4 54
6 1 38
7 5 63
8 3 48
9 4 59
10 2 46
Medidas de asociación entre dos variables (cuantitativas)
Diagrama de dispersión entre el número de comerciales (x) y el volumen
de ventas $ (y)
Medidas de asociación entre dos variables (cuantitativas)
Calculo de la covarianza muestral
Número de Ventas
semana Comerciales (miles) xi x yi y ( xi x)( y i y )
xi yi
1 2 50 -1 -1 1
2 5 57 2 6 12
3 1 41 -2 -10 20
4 3 54 0 3 0
5 4 54 1 3 3
6 1 38 -2 -13 26
7 5 63 2 12 24
8 3 48 0 -3 0
9 4 59 1 8 8
10 2 46 -1 -5 5
Total 30 510 0 0 99
x 3 y 51
(x i x)( yi y )
99 Como es mayor que cero, tienen
S xy i 1
11 una relación lineal positiva las
n 1 10 1
variables
Medidas de asociación entre dos variables (cuantitativas)
En ocasiones se suele utilizar la siguiente fórmula alterna para calcular la
covarianza:
Nota: Observe que en este caso Sxy esta dividido entre n y no entre n-1 lo
que puede ocasionar una ligera diferencia, según la fórmula elegida.
n n
( x x)( y y) x y
i i i i
S xy i 1
i 1
xy
n n
Medidas de asociación entre dos variables (cuantitativas)
Ejemplo de covarianza: (con la fórmula alterna)
Suponga que un funcionario de cierto banco desea saber si existe
relación lineal entre el salario de sus clientes y la cantidad mensual
que ahorran, y para ello obtiene una muestra con los siguientes
datos:
año salario promedio en $ (x) Ahorro promedio (y)
1999 8590 171.8
2000 8323 158.1
2001 8055 185.3
2002 7788 155.8
2003 7520 142.9
2004 7253 166.8
2005 6985 139.7
2006 6651 126.4
2007 6584 151.4
2008 6116 122.3
La covarianza: x y i i
11343293.9
S xy i 1
xy (7386.5 x 152.05) 11212.065
n 10
Medidas de asociación entre dos variables (cuantitativas)
Si S xy 11212.065 0
Interpretación:
Es positivo, lo que implica que el salario y el ahorro se comportan de
manera similar y en el mismo sentido. A mayor cantidad de salario,
mayor cantidad de ahorro.
S xy Cov xy
rxy
SxS y SxS y
Medidas de asociación entre dos variables (cuantitativas)
Coeficiente de Correlación (de producto-momento de Pearson):
Es una medida del grado de relación (correlación) lineal entre dos
variables con datos cuantitativos
Nota importante: puede existir alta correlación , pero no necesariamente
una relación de causalidad. Ejemplo la calidad de los restaurantes y
el precio de los mismos; el número de personas en la política y la
delincuencia
Se utiliza habitualmente una Gráfica de Dispersión para ver si existe una
relación lineal entre las dos variables de interés X e Y.
Medidas de asociación entre dos variables (cuantitativas)
Si rxy es el coeficiente de correlación entre dos variables: 1 rxy 1
Diagrama que resume la fuerza y la dirección del coeficiente de
correlación:
Correlación Correlación
negativa No hay positiva
perfecta correlación perfecta
-1 -0.5 0 0.5 1
Correlación negativa Correlación positiva
Medidas de asociación entre dos variables (cuantitativas)
Ejemplos con diferentes niveles de correlación: 1 rxy 1
Medidas de asociación entre dos variables (cuantitativas)
En estadística podremos calcular el coeficiente de correlación (muestral)
de Pearson con la siguiente formula.
S xy Covxy
rxy
SxSy SxSy
Ejemplo: Calcular el coeficiente de correlación del problema de los
comerciales y las ventas de televisores:
Semana
Comerciales
xi
Ventas
yi
x i x y i y ( xi x) 2 ( yi y ) 2
1 2 50 -1 -1 1 1
2 5 57 2 6 4 36
3 1 41 -2 -10 4 100 S xy
4 3 54 0 3 0 9
rxy
SxS y
5 4 54 1 3 1 9
6 1 38 -2 -13 4 169 11
7 5 63 2 12 4 144 0.93
(1.49)(7.93)
8 3 48 0 -3 0 9
9 4 59 1 8 1 64
10 2 46 -1 -5 1 25
Total 30 510 0 0 20 566
x 3 y 51
Sx
(x i x) 2
20
1.49 Sy
(y i y) 2
566
7.93
n 1 9 n 1 9
Medidas de asociación entre dos variables (cuantitativas)
xy
xy
x y
xy = covarianza poblacional
x = desviación estándar poblacional de x
y = desviación estándar poblacional de y
Medidas de asociación entre dos variables (cuantitativas)
Diagrama de dispersión
1.00
DJIA S&P500
0.80
0.20 0.24
0.60
0.82 0.19
0.40
-0.99 -0.91 S&P500
0.20
0.04 0.08 0.00
Series1
-0.24 -0.33 -1.50 -1.00 -0.50
-0.20
0.00 0.50 1.00 1.50
Probabilidad
Probabilidad 0 0.5 1
Un accidente de tráfico
Un factura impagada
Conjunto Intersección: A B {x A _ y _ x B}
U
Conjunto Complemento: A
c
{x A} A B
0 P( A) 1
2. Si S es el evento seguro, P(S ) 1
3. Si A y B son eventos mutuamente excluyentes, es decir: A B
P( A B) P( A) P( B)
4. Si A1, A2,… son mutuamente excluyentes
P( A1 A2 ...) P( A1) P( A2) ...
A continuación veremos unos teoremas que se desprenden directamente de los axiomas
anteriores…
Probabilidad
(Se llaman en ocasiones “reglas de probabilidad”)
Teorema 1 Si es el conjunto vacío, entonces
P( ) 0
Teorema 2. Si Ac es el complemento del evento A , entonces
P ( A c ) 1 P ( A)
Teorema 3. Si A B entonces
P( A) P( B)
P( A B) P( A) P( A B)
Teorema 5. Si A y B son dos eventos, entonces
P( A B) P( A) P( B) P( A B)
Distribuciones de probabilidad
Para comprender mejor el concepto de distribuciones de probabilidad
conviene entender primero el significado de una variable aleatoria
S
_ 0 +
xi 1 2 3 4 5 6
P(X = xi)= f(xi) 1/36 3/36 5/36 7/36 9/36 11/36
Observa que
P( X xi) f ( xi) 1
P( X xi) f ( xi) 0
Distribuciones de probabilidad
Representación gráfica de la distribución de probabilidad anterior
11/36
f(xi)
9/36
7/36
6/36
5/36
4/36
3/36
2/36
1/36
xi
1 2 3 4 5 6
xi 1 2 3 4 5 6
P(X = xi)= f(xi) 1/36 3/36 5/36 7/36 9/36 11/36
Distribuciones de probabilidad
Otro ejemplo de variable aleatoria y distribución de probabilidades
Con el mismo experimento de lanzar un par de dados, suponga ahora la
variable aleatoria (o la función) como la suma de los números
superiores en los dados. Es decir el experimento es:
X(S) = {2,3,4,5,6,7,8,9,10,11,12}
La imagen inversa de 2 es: (1,1)
La imagen inversa de 3 es: (2,1) (1,2)
La imagen inversa de 4 es: (2,2), (3,1),(1,3)
La imagen inversa de 5 es: (2,3),(3,2),(4,1),(1,4)
La imagen inversa de 6 es: (3,3),(5,1),(1,5),(4,2),(2,4)
La imagen inversa de 7 es: (4,3)(3,4),(2,5),(5,2)(1,6),(6,1)
La imagen inversa de 8 es: (4,4)(5,3),(3,5),(6,2),(2,6)
La imagen inversa de 9 es: (3,6),(6,3),(5,4),(4,5)
La imagen inversa de 10 es: (5,5),(6,4).(4,6)
La imagen inversa de 11 es: (5,6),(6,5)
La imagen inversa de 12 es: (6,6) y la función de distribución de probabilidades:
xi 2 3 4 5 6 7 8 9 10 11 12
f(xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Distribuciones de probabilidad
Representación gráfica de la distribución de probabilidad anterior
f(xi)
6/36
5/36
4/36
3/36
2/36
1/36
xi
2 3 4 5 6 7 8 9 10 11 12
xi 2 3 4 5 6 7 8 9 10 11 12
f(xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Valor esperado
(Esperanza matemática)
Valor esperado para variables aleatorias discretas : La media o esperanza
matemática denotada por E(X) normalmente, se define como:
n
E ( X ) x1 f ( x1 ) x2 f ( x2 )... xn f ( xn ) i 1 xi f ( xi ) xi P( X xi )
n
i 1
E ( X ) 1(1 / 36) 2(3 / 36) 3(5 / 36) 4(7 / 36) 5(9 / 36) 6(11 / 36) 4.47
Interpretación…
E( X ) 2(1 / 36) 3(2 / 36) 4(3 / 36) ... 11(2 / 36) 12(1 / 36) 7
Interpretación…
Valor esperado
(Esperanza matemática)
Ejemplo 1
Se sabe que en determinado Banco la cancelación de cuentas de
derechohabientes durante una semana sigue la siguiente
distribución:
xi P(X=xi) = f(xi)
No de Probabilidad de
cuentas que suceda en
canceladas cualquier
semana
0 0.021
1 0.325
2 0.258
3 0.205
4 0.191
Sumas 1
Obtener el número promedio de cuentas canceladas que se espera para la
próxima semana.
Para determinar el valor esperado debemos multiplicar las cuentas por su
probabilidad y obtenemos:
No de cuentas Probabilidad
canceladas de que suceda
en cualquier
semana
xi f(xi) xi * f(xi)
0 0.021 0
1 0.325 0.325
2 0.258 0.516
3 0.205 0.615
4 0.191 0.764
Sumas 1 2.22
Ejemplos
El lanzamiento de una moneda 5 veces (verificar los puntos anteriores)
a (na,a,a) 2
na a (na,a,na) 1
na
na a (na,na,a) 1
na (na,na,na) 0
Distribución de probabilidad Binomial
¿Cuál es la probabilidad de que el Banco les autorice un crédito de auto a
los 3 próximos clientes que lleguen (3 éxitos)?
3 3!
Sólo hay una posibilidad y se comprueba con: 1
El único escenario es: 3 3!(3 3)!
(a,a,a) con probabilidad de este resultado = ppp = 0.30 x 0.30 x 0.30 = 0.027
→ f(3) = 0.027
x f (x)
3
0.30 0 (0.70) 3 0.343
0 0
3
0.301 (0.70) 2 0.441
1 1 1
3
0.30 2 (0.70)1 0.189
2 2
3
0.30 3 (0.70) 0 0.027
3 3
Distribución de probabilidad Binomial
Gráfica de la distribución de probabilidad binomial del ejercicio anterior:
f(xi)
0.60
0.50
0.40
0.30
0.20
0.10
xi
0 1 2 3
Número de clientes que se les autorice el crédito
Distribución de probabilidad Binomial
Problema 2
Un estudio de la Sociedad Americana de Inversores, descubrió que el 30%
de los inversionistas particulares había utilizado un agente o consultor
de inversiones (considere este resultado como éxito). En una muestra
aleatoria de 9 personas (inversionistas). ¿Cuál es la probabilidad de
que:
a) Exactamente dos personas hayan utilizado un consultor de
inversiones
b) Exactamente cuatro personas hayan utilizado un consultor
c) Ninguna persona haya utilizado un consultor de inversiones
d) Por lo menos tres personas hayan utilizado un consultor
Por Excel: Binomial con parámetros (n, p) = Binomial (9, 0.30)
a) Probabilidad = 0.2668 P ( X 2) 0.2668
xe
P( X x) f ( x) , x 0,1,2,3,...
x!
Donde:
f(x) = probabilidad de x ocurrencias en un intervalo
e 2.71828
Distribución de probabilidad Poisson
Ejemplo con intervalo de tiempo
Problema 1
En un centro telefónico de atención a clientes de una institución
financiera, se reciben en promedio 5 llamadas por hora. ¿Cuál es la
probabilidad de que en una hora seleccionada aleatoriamente se
reciban exactamente 3 llamadas?
5 e 2.71828 x e 53 e 5
f ( x) f (3) 0.1404
x! 3!
¿Cuál es la probabilidad de obtener en un hora seleccionada en forma
aleatoria, hasta un máximo de 3 llamadas? x
e
5 e 2.71828 f ( x)
x!
P( X 3) P( X 0) P( X 1) P( X 2) P( X 3)
[0.0067 0.0337 0.0842 0.1404]
0.2650
Distribución de probabilidad Poisson
Ejemplo con intervalo de tiempo
Problema 2
En una institución bancaria, un estudio reveló que bajo el formato de “fila
única” para acceder a las cajas, entre las 10:00 y las 13:00 de la
mañana hay un promedio de cuatro clientes en la fila de espera.
¿Cuál es la probabilidad de que al visitar una sucursal de esa institución
bancaria en ese horario se encuentre los siguiente?
a) No exista ningún cliente en la fila de espera:
b) Que exista cuatro clientes en la fila de espera
c) Que existe a lo más cuatro clientes en la fila de espera
d) Que exista al menos cuatro clientes en la fila de espera
Por Excel: Poisson con parámetro 4
a) Probabilidad = 0.0183 P( X 0) 0.0183
x e e 2.71828
f ( x)
x!
0.40 e 0.4
f (0) 0.67
0!
Distribución de probabilidad Poisson
Nota importante: en muchos casos cuando en una distribución binomial la
probabilidad de éxito es muy pequeña y el número de ensayos es
muy grande, se aproxima dicha función por la Poisson haciendo:
Ejemplo:
np
Se calcula que el 0.5% de quienes se comunican al departamento de
servicio al cliente en el Banco Santander escuchará un tono de línea
ocupada
¿Cuál es la probabilidad de que de las 1,200 personas que se comunicaron
hoy, por lo menos 5 hayan escuchado un tono de línea ocupada?
1200(0.005) 6
P( X 5) 1 P( X 5) 1 (0.2851) 0.7149
P( X 5) 1 P( X 4) 1 [ P( X 0) P( X 1)
P( X 2) P( X 3) P( X 4)]
1 (0.0025 0.0149 0.0446 0.0892 0.1339)
1 (0.2851) 0.7149
Distribución de probabilidad Normal
¿Qué diferencia hay al calcular la probabilidad entre una variable aleatoria
discreta como la Distribución Binomial y la Poisson y una variable
aleatoria continua como la normal?
( x )2
1
f ( x) e 2 2
2
Donde : N (, )
= media (parámetro)
= desviación estándar (parámetro)
3.14159
e 2.71828
Distribución de probabilidad Normal
Características importantes sobre la distribución normal.
1. Toda la familia de distribuciones normales se diferencia por medio de
dos parámetros: la media y la desviación estándar
N (, )
2. El punto más alto de la curva normal se encuentra sobre la media, la
cual coincide con la mediana y la moda
X N ( , )
Hay tres tipos de cálculos de probabilidades en términos generales:
P( x1 X x2 ) P( X x2 ) P( X x1 )
3. Probabilidad de que X sea mayor o igual que un valor dado x0
P( X x0 ) 1 P( X x0 )
En la actualidad las operaciones se simplifican mucho con el uso de Excel
u otras herramientas estadísticas
Distribución de probabilidad Normal
Problema 1
1. El precio promedio de las acciones que pertenecen al grupo de
empresas S&P500 es de $30 y las desviación estándar (poblacional)
es de $8.20. Suponga que los precios de las acciones están
distribuidos conforme a una distribución de probabilidades normal.
c) ¿De cuánto deben ser los precios de las acciones de una empresa para
que esté entre el 10% de las empresas de precios altos?
Distribución de probabilidad Normal
Respuestas:
datos: 30 8.2
a) ¿Cuál es la probabilidad de que el precio de las acciones de una
empresa de ese grupo sea por lo menos de $40.00?
P( X 40) 0.8888
P( X 20) ?
En Excel DISTR.NORM.N
P( X 20) 0.1112
Distribución de probabilidad Normal
Respuestas:
datos: 30 8.2
c) ¿De cuánto deben ser los precios de las acciones de una empresa para
que esté entre el 10% de las empresas de precios altos?
30
x 40.51
Distribución de probabilidad Normal
Problema 2
De acuerdo a la información de un operador de Bolsa, el rendimiento de
una acción determinada tiene una distribución normal con media del
10% y una desviación estándar del 2.5%.
P( X 12%) ?
P( X 12%) 1 P( X 12%) 1 0.7881 0.2119
P(7.5% X 12.5%) ?
10%
2.5%
8%
10%
( x )2 z2
1 1
f ( x) e 2 2
f ( z) e 2
2 z
x 2
Donde :
0
1 Ejemplo : z N (0,1)
3.14159
P (0 z Z )
e 2.71828
Distribución de probabilidad Normal Estándar
Calculo de probabilidades con la normal estandarizada ( Normal (0,1), o
normal tipificada)
En Excel es similar a cualquier normal pero se busca como:
Para calcular probabilidades: DISTR.NORM.ESTAND.N
Y para calcular los valores z de la base se usa la inversa:
INV.NORM.ESTAND
Como cualquier normal, se pueden calcular las probabilidades que es el
área bajo la curva entre dos puntos z o en forma acumulada a un
punto z. Ejemplos:
Distribución de probabilidad Normal Estándar
¿Cómo podemos calcular probabilidades con una normal estandarizada?
z N (0,1)
De igual forma, hay tres tipos de cálculos de probabilidades en términos
generales:
P( z1 z z 2 ) P( z z 2 ) P( z z1 )
3. Probabilidad de que z sea mayor o igual que un valor dado z0
P( z z 0 ) 1 P( z z 0 )
Como se mencionó, las operaciones se simplifican mucho con el uso de
Excel u otras herramientas estadísticas
Distribución de probabilidad Normal Estándar
¿Qué relación hay entre una normal con parámetros μ y σ, y la normal
estándar con valores z ?
Hay una relación haciendo una sencilla transformación de los valores
originales de la normal original a la normal estándar con:
x
z
Suponga N ( 2,4) (media 2 y desviación estándar 4)
62 22
Si x = 6 => z= 1 z 1 Si x = 2 => z= 0 z 0
4 4
10 2 32
Si x= 10 => z= 2 z 2 Si x = 3 => z = 0.25 z 0.25
4 4
22 02
Si x = - 2 => Z = -1 z 1 Si x = 0 => z = -0.50 z 0.50
4 4
Recordar que:
zi se interpreta como la distancia de xi a la media μ en términos del
número de desviaciones estándar σ
Distribución de probabilidad Normal Estándar
Interpretación gráfica del problema de las acciones del 10% de las
mejores con precios altos con valores Z
30
8.2 10 % 10 %
30
x 40.51 z 1.28
x 40.51 30
z 1.28
8.2
Distribución de probabilidad Normal Estándar
Si el camino es a la inversa: de valores z a los valores originales del
problema tenemos:
30
10 % 8.2 10 %
30
z 1.28 x 40.51
x 30
1.28
8.2
8.2(1.28) x 30 x 8.2(1.28) 30
x 40.51
TEMA 5
Análisis de decisiones
5.1 Toma de decisiones bajo certidumbre
5.2 Toma de decisiones bajo incertidumbre
5.3 Toma de decisiones bajo riesgo: pago esperado
y valor de la información perfecta
Proceso de toma de decisiones
Ya sea cortarse el cabello o invertir en algún instrumento financiero, las
fases para tomar una buena decisión son básicamente las mismas:
Identificar los
Elaborar una
Identificar el posibles resultados
lista de posibles
problema o estados de la
alternativas
naturaleza
Seleccionar uno
Listar el pago o
de los modelos
utilidad de cada
matemáticos del Aplicar el modelo y
combinación de
proceso de toma tomar una decisión
alternativas y
de decisiones
resultados
Tipos de ambientes en la toma de decisiones
Existen tres tipos de ambientes en el proceso de toma de decisiones:
Ejemplo:
Se tiene $10,000 para invertir en un año:
Alternativa 1. Abrir una cuenta de ahorros que paga 3% de interés
Hay varios resultados posibles para cada alternativa y quien toma las
decisiones no conoce las probabilidades de los diferentes resultados
Criterios
Criterio Maximax – optimista o agresivo (optimista)
Criterio Maximin – pesimista o conservador (pesimista)
Criterio Minimax – arrepentimiento (pesimista o conservador)
Criterio de Laplace (igualdad de probabilidades o principio de
razonamiento insuficiente)
Toma de decisiones bajo incertidumbre
Ejemplo:
Nota: hay una disciplina muy interesante que estudia estos escenarios a
través de la llamada Teoría de la incertidumbre
Análisis por matriz de ganancias
Matriz de Ganancias
El análisis de matriz de ganancias puede ser aplicado cuando:
Matriz de Ganancias
Estados de la naturaleza
Alternativas S1 S2 . . . . . Sm
A1
A2
An
La inversión de Juan Sánchez
Ejemplo:
La inversión de Juan Sánchez
Evaluar la solución
Solución de Juan Sánchez
Construir una matriz de ganancias
Estados de la naturaleza
CETES 60 60 60 60 60
Matriz de ganancias
Estados de la naturaleza
CETES 60 60 60 60 60 60
Matriz de Ganancias
Estados de la naturaleza
Cetes 60 60 60 60 60 60
Alternativas S1 S2 S3 S4 S5 Arrepentimientos
máximos
Oro -600 -150 0 0 -60 -600
Bonos -250 -50 -50 -400 -210 -400
FICE 0 0 -100 -500 -660 -660
Cetes -440 -190 -140 -240 0 -440
Acciones -300 -100 -50 -500 -210 -500
Solución de Juan Sánchez
Seleccionar un criterio de decisión
El criterio de Laplace (igualdad de probabilidades o principio de
razonamiento insuficiente)
Este criterio puede ser utilizado por un tomador de decisiones que no sea
optimista ni pesimista
Estados de la naturaleza
P(S1)=0.20 P(S2)=0.20 P(S3)=0.20 P(S4)=0.20 P(S5)=0.20
Alternativa Gran alza Ligera alza Sin Pequeña Gran baja Ganancia
de del del cambios baja del del esperada
decisión mercado mercado mercado mercado
Oro -100 100 200 300 0 100
Bonos 250 200 150 -100 -150 70
FICE 500 250 100 -200 -600 10
Cetes 60 60 60 60 60 60
Acciones 200 150 150 -200 -150 30
Ejemplo:
Todos los juegos de azar con naipes
La probabilidad de obtener un 5 en el lanzamiento de un dado.
VE ( Ai ) j 1 p jV (i, j )
m
Demanda de 18 langostas es la
langostas ganancia si oferta alternativa que
15 16 17 18 optimiza
15 1282.5 1267.5 1252.5 1237.5 su ganancia
16 1596 1824 1804 1784
17 2964 3420 3876 3836
18 1710 1995 2280 2565
total 7552.5 8506.5 9212.5 9422.5
Valor esperado de la información perfecta
Valor esperado de la información perfecta
VEdIP = VEcIP-VE
Valor esperado de la información perfecta
Interpretación del Valor esperado de la información perfecta VEdIP
Alternativa Gran alza Ligera alza Sin Pequeña Gran baja Ganancia
de del del cambios baja del del esperada
decisión mercado mercado mercado mercado
Oro -100 100 200 300 0 100
Bonos 250 200 150 -100 -150 130
FICE 500 250 100 -200 -600 125
Cetes 60 60 60 60 60 60
Acciones 200 150 150 -200 -150 95
VE (bonos) 250(0.20) 200(0.30) 150(0.30) 100(0.10) 150(0.10)
VE (bonos) 50 60 45 10 15 $130
Continuación al Problema de Juan Sánchez
Una empresa consultora financiera le está recomendando a Juan Sánchez
elaborar un estudio económico para mejorar su decisión (invertir en
bonos).
“información perfecta”
“valor esperado con información perfecta = VEcIP”
“valor esperado” = VE
“valor esperado de la información perfecta = VEdIP”
Continuación al Problema de Juan Sánchez
Si se conocen con certeza que ocurriría una “Gran Alza” en los
mercados,….la decisión óptima es invertir en FICE para obtener
$500……. y así sucesivamente
Estados de la naturaleza
P(S1)=0.20 P(S2)=0.30 P(S3)=0.30 P(S4)=0.10 P(S5)=0.10
Estados de la naturaleza
P(S1)=0.20 P(S2)=0.30 P(S3)=0.30 P(S4)=0.10 P(S5)=0.10
Alternativa Gran alza Ligera alza Sin Pequeña Gran baja Ganancia
de del del cambios baja del del esperada
decisión mercado mercado mercado mercado
Oro -100 100 200 300 0 100
Bonos 250 200 150 -100 -150 130
FICE 500 250 100 -200 -600 125
Cetes 60 60 60 60 60 60
Acciones 200 150 150 -200 -150 95
VEcIP 500(0.20) 250(0.30) 200(0.30) 300(0.10) 60(0.10)
VEcIP 100 75 60 30 6 $271
Continuación al Problema de Juan Sánchez
Recordemos que si se invierte en bonos, el valor esperado VE es de
$130 (con información imperfecta)
Respuesta:
Lo máximo que Juan Sánchez podría o estaría dispuesto a pagar por el
estudio económico sería de $141. Al costarle el estudio $32 resulta
atractivo para poder obtener más información y mejorar su decisión
original de invertir en bonos.
En la medida en que VEdIP sea menor, no será necesario buscar
información adicional al tomar una decisión
Nota:
Hay Métodos Bayesianos que permiten recalcular las probabilidades
iniciales y volver a tomar una decisión con la nueva información
Observaciones interesantes en decisiones bajo riesgo
Se comentó que el método de maximizar el valor monetario es
equivalente a minimizar la pérdida de oportunidad esperada.
Minimizar la perdida de oportunidad esperada: se realiza calculando la
matriz de arrepentimiento o costos de oportunidad y se calcula el valor
esperado ahora con estos valores.
Matriz de arrepentimientos o costos de oportunidad
Estados de la naturaleza Minimizar la
perdida esperada
Alternativas S1 S2 S3 S4 S5 VE con costos de
P(S1)=0.20 P(S1)=0.30 P(S1)=0.30 P(S1)=0.10 P(S1)=0.10 oportunidad
Oro -600 -150 0 0 -60 -171
Bonos -250 -50 -50 -400 -210 -141
FICE 0 0 -100 -500 -660 -146
Cetes -440 -190 -140 -240 0 -211
Acciones -300 -100 -50 -500 -210
-176
Estimación de parámetros
6.1 Proceso de estimación: puntual y por intervalo
6.2 Distribuciones muestrales o de muestreo de la
media y la proporción
6.3 El nivel de confianza y su interpretación
6.4 Estimación de la media
6.5 Estimación de la proporción
Proceso de estimación
El objetivo central del proceso de estimación es estimar el valor de un
parámetro poblacional a través de los llamados estadísticos
(estadísticos muestrales).
Las estimaciones más _ comunes son:
x
p p p P
S
S2 2
Los estimadores serán fórmulas que permitirán la estimación de los
parámetros respectivos. Con las fórmulas ya conocidas:
_
_
x
x i
x # individuos_ con _ x
p p p S
i
( x x ) 2
n n n n 1
Proceso de estimación
_
x 65 k ilos
Tipos de
estimación
Estimación por intervalo: ejemplo
_ _
x 65 3 62 k ilos x 65 3 68 k ilos
_
x 65 k ilos
Proceso de estimación
Interpretación del proceso de estimación:
Parámetro = centro
Estimación puntual
Distribución muestral (o de muestreo) de la media
Para cada muestra diferente se pueden obtener estimaciones puntuales
diferentes.
Si lo anterior se interpreta como una variable aleatoria,
_ entonces podemos
definir una distribución de muestral tanto para xcomo para p
_ _ _ _ _ _
x 1 1 .5 x2 2 x 3 2. 5 x 4 2. 5 x5 3 x 6 3.5
Distribución muestral (o de muestreo) de la media
_
Construyamos la distribución de probabilidades de x
2/6
1/6 _
x
1.5 2 2.5 3 3.5
Distribución muestral (o de muestreo) de la media
_
Calculamos la esperanza matemática de x
E ( x) 1.5(1 / 6) 2(1 / 6) 2.5(2 / 6) 3(1 / 6) 3.5(1 / 6) 2.5
1 2 3 4
Como es un ejemplo corto podemos calcular 2.5
4
Primera conclusión: E ( x) 2.5
_
Del mismo modo la desviación estándar de la distribución de muestreo de x
es con la siguiente notación:
_
x n
_
_ Desviación estándar de x Tamaño de la muestra n
x
Población infinita _ , _ se llama error estándar de la media
x n x
_
Usar la expresión _ para calcular la desviación estándar de x
x n
Siempre que:
1. La población sea infinita
2. La población es finita y el tamaño de la muestra sea menor o igual a un
5% ( Es decir, si n/N< 0.05 )
Distribución muestral (o de muestreo)
_ de la media
Forma de la distribución de muestreo de x
Hay dos casos:
Caso 1: Si la población _ original ya se distribuye como normal, la
distribución muestral de x es una normal para cualquier n
X N ( , ) x N ( , )
x
En resumen:
x N ( , )
_
E( x ) _
x x n
Distribución muestral de la proporción
Definición de distribución de muestreo de la proporción
La distribución de muestreo de p es la distribución de
probabilidad de
todos los posibles valores de la proporción muestral p
E ( p) 1(1 / 6) 0.5(4 / 6) 0(1 / 6) (1 / 6) (2 / 6) 3 / 6 0.5
La _ proporción_ poblacional _ P 2 / 4 0.5 _ coinciden!!!!!!
_
Pr imera _ conclusión :_ E ( p ) P
Distribución muestral de la proporción
p N ( P, ) E ( p ) P P(1 P) _ población _ inf inita
_
_
p p n
N n P(1 P)
_ población _ finita
N 1
_
p n
P(1 P)
p N ( P, )
_
_
p
E( p ) P p n
_
p N ( P, )
p
p
El nivel de confianza y su interpretación
El nivel de confianza es la probabilidad de que el verdadero valor del
parámetro se encuentre en el intervalo de estimación propuesto
El verdadero valor
del parámetro
La estimación por
intervalo es cada
intervalo para cada
muestra diferente.
De hecho, se tiene sólo
un intervalo en una
aplicación
específica
Estimación de la media
Estimación por intervalo:
No es suficiente con que un estimador puntual suministre el valor exacto
del parámetro poblacional, por eso la necesidad de realizar una
estimación por intervalo al sumar y restar al estimador puntual una
cantidad llamada margen de error.
p Margen de error
Las distribuciones de xy p son clave para calcular estas estimaciones
por intervalo
Estimación de la media
Fórmula 1 Estimación de la media suponiendo normalidad en los datos
Se utiliza para cuando σ es conocida (o se conoce) o bien se desconoce el
valor de sigma, pero la muestra es grande: n mayor o igual a 30 de
preferencia
z
Por tanto, sólo falta encontrar / 2 al 95% de confianza y es z / 2 1.96
Se desconoce
x $82
Estimación de la media
Fórmula 2. Estimación de la media suponiendo normalidad en los datos
Se utiliza para cuando σ es desconocida y se sustituye por su estimador S
y el tamaño de muestra es menor a 30
Nota: En estos casos utilizamos una nueva distribución llamada t-de
Student o distribución t
s Recordando que:
x t / 2 n
n ( x x)
i 1
i
2
S=
x Margen de error n -1
Estimación de la media
Distribución de probabilidad t
• La distribución t es una familia de distribuciones de probabilidad
similares; cada distribución t depende de un parámetro conocido como
grados de libertad.
• Cada distribución t es única para cada grado de libertad. Es decir, la
distribución t para un grado es única así como lo es una distribución t
para dos grados, etc.
• A medida que cada grado de libertad aumenta, la diferencia entre la
distribución t y la normal estándar se va reduciendo.
• La razón de que el número de grados de libertad para el valor de t sea
n–1 se debe al uso de s como estimación de la desviación estándar
poblacional σ.
• En el Excel al igual que la distribución de probabilidad normal, se
pueden obtener con facilidad las probabilidades y los valores t
Si vamos a calcular la probabilidad se usa: DISTR.T (VARIAS
OPCIONES)
Si lo que vamos a buscar son los valores t de la base de la función
usamos como siempre INV.T o bien INV.2C según convenga
Estimación de la media
Ejemplo 2
El director de finanzas desea estimar el número de días promedio de
cobranza que tiene para las cuentas por cobrar en su empresa. Para esto
analiza una muestra de 25 cuentas cobradas en el último mes de las
cuales, calcula que cada una se cobró en promedio en 20 días, con una
desviación estándar de la misma muestra de 5 días.
a) Con esta información, estime el número promedio (poblacional) de días
de cobranza con un nivel de confianza del 0.99 de probabilidad (99%)
Sabemos por los datos del problema que:
n
i
( x x ) 2
x 20días S= i 1
5días
n -1
Al no conocer σ usamos la fórmula 2 (además el tamaño de muestra es
menor a 30)
s
x t / 2
n
Buscamos el valor en las tablas t con n-1 = 24 grado de libertad (o en
excel con INV.T)
t / 2 2.797 _ con _ 24 _ grados _ de _ libertad
Estimación de la media
Continuación…
s 5
x t / 2 20 2.797 20 2.797
n 25
P (20 2.797 20 2.797) 0.99
P (17.203 22.797) 0.99
b) Si en lugar de una probabilidad del 0.99 (99%) (nivel de confianza)
relajamos a una probabilidad de 0.90 (90%) ¿Cuál sería el nuevo
intervalo?, menciona si creció o se redujo el nuevo intervalo.
Tamaño de la muestra
Distribución normal Z
(Fórmula 1)
30 o mayor
σ conocida Distribución normal Z
(Fórmula 1)
Población σ no conocida y
normal es estimada por S
Menor que 30 Distribución t
(Fórmula 2)
Población
no normal
y la fórmula es:
p(1 p)
p z / 2
n
p Margen de error
Donde:
1 es el nivel de confianza, z / 2 es el valor en tablas de la normal
100
p 0.25
400
Estimación de la proporción
b) Realice una estimación por intervalo con el 95% de confianza, para la
proporción (poblacional) de clientes “select” que les gustaría el nuevo
producto financiero.
p (1 p )
Sabemos que… p z / 2
n
Sustituimos:
(0.25)(0.75)
0.25 1.96 0.25 1.96 (0.0217 ) 0.25 0.0424
400
O bien : (0.21,0.29)
O bien: (0.02;0.08)
Pruebas de hipótesis
H 0 : p 0.06
H 1 : p 0.06
Proceso de las pruebas de hipótesis
El cliente quien desea hacer una fuerte inversión decide poner a prueba la
hipótesis del operador. Para ello, selecciona una muestra de 15 días
donde registra la cotización diaria de las acciones y el cálculo de la
varianza en la muestra resultó de S 2 = 0.4
Paso 1 (hipótesis)
x 0 x 0 z
p p0 ( n 1 ) S 2
z t p0 (1 p0 ) 2 ,etc.
/ n s/ n 0 2
n
Proceso de las pruebas de hipótesis
5 Pasos recomendables para realizar una prueba de hipótesis:
Estos valores se obtienen con tablas estadísticas o bien con el uso del
Excel.
z , t , * , etc.
* * 2
Proceso de las pruebas de hipótesis
5 Pasos recomendables para realizar una prueba de hipótesis:
5. Comparar el estadístico de prueba con el valor crítico y según la posición
de ambos valores tomar la decisión.
Región de
Región de
rechazo
aceptación
de Ho
de Ho
(No se rechaza Ho)
0.05
Valor crítico
z * 1.645
z Estadístico de prueba
Nota: En caso de programas estadísticos apropiados, esta actividad se
simplifica al utilizar el Método del valor-p (Regla de oro), como
veremos más adelante.
De hecho el valor p en una prueba de hipótesis se define como el menor
nivel de significancia al cual se rechaza la hipótesis nula
Nivel de significancia y su interpretación: Tipos de pruebas
Nivel de significancia α o nivel de riesgo: es la probabilidad de rechazar
H0 cuando es verdadera
Situación Real
H0 es verdadera H0 es falsa
H 0 : 0 Región
Región de
aceptación Región de
rechazo de Ho rechazo
H 1 : 0 de Ho (No se rechaza Ho)
de Ho
/2 /2
z* z*
2. Una cola (ejemplo)
H 0 : 0 Región de
aceptación Región de
de Ho rechazo
H 1 : 0 (No se rechaza Ho)
de Ho
z*
Nivel de significancia y su interpretación: Tipos de pruebas
H 0 : 0
de Ho Región de
aceptación
de Ho
H 1 : 0
(No se rechaza Ho)
z*
Prueba de hipótesis de la media
Problema 1 Prueba de hipótesis para la media con σ conocida
El director de Finanzas de una empresa empacadora de alimento de cereal
está preocupado por el exceso de producto empaquetado. Lo anterior
se basa en una muestra aleatoria de n=25 productos cuyos datos
fueron:
x 372 .5 gramos
s 15 gramos _ se _ toma _ como _ valor _ aceptable_ de _
Si en realidad hay más de 368 gramos que es lo indicado en la etiqueta, la
empresa está perdiendo dinero.
Por tanto, el director de Finanzas está interesado en conocer si el nivel
promedio de llenado es superior a 368 gramos.
Paso 1 (hipótesis)
H 0 : 368 gramos
Región de
aceptación Región de
de Ho rechazo
de Ho
0.05
z * 1.645
z 1.5
Prueba de hipótesis de la media
Método del valor-p
Otra forma de ver esto es con el valor-p del estadístico de prueba:
Valor-p es una probabilidad que aporta una medida de la evidencia
suministrada por la muestra contra la hipótesis H0. Valores-p
pequeños indican una evidencia mayor contra H0.
NOTA: Este método es el más utilizado en los paquetes informáticos
0.05
z
z * 1.645
Prueba de hipótesis de la media
Método del intervalo de confianza para probar una hipótesis de dos colas:
Se utiliza para pruebas de dos colas, ejemplo para la media poblacional:
H 0 : 0
H 1 : 0
1. Seleccionar de la población una muestra aleatoria simple y emplear el
valor de la media muestral x para obtener un intervalo de confianza de la
media poblacional µ.
Fórmula 1 tema estimación de parámetros… x z / 2
n
2. Si el intervalo de confianza contiene el valor hipotético µ0, H0 no es
rechazada. En caso contario H0 es rechazada
Región de
aceptación 0.05
de Ho
(No se rechaza Ho) valor p 0.021
Z * 1.64
Z 2.04
Si el valor-p (o nivel de significancia) es < 0.05 => Se rechaza H0
Paso 1 (hipótesis)
H 0 : 40
H 1 : 40
Prueba de hipótesis de la media
Paso 2 Supongamos un nivel de significancia α=0.05
H 1 : 230
Región de
las _ compras _ tuvieron
aceptación Región de un _ cambio _ significativo
de Ho rechazo
(No se rechaza Ho)
de Ho con _ la _ promoción
0.05
t * 1.67
t 4.29
Prueba de hipótesis de la media
Problema 5 Prueba de hipótesis para proporciones
En una muestra de 105 comercios seleccionados al azar de una zona,
se observa que 27 de ellos han tenido perdidas en este mes.
Un analista en economía de la zona establece que la proporción de
comercios en la zona con pérdidas es igual o superior a 0.35 (35%)
de Excel)
y realizamos la comparación entre los valores z:
Prueba de hipótesis de la media
Paso 5 Decisión:
H 1 : p 0.35
la _ proporción _ de _
comercios _ con _ pérdidas
Región de
aceptación
se _ sospecha _ que es _ menor
Región de
de Ho
rechazo
(No se rechaza Ho) al _ 0.35 _(35%)
de Ho
0.05
z * 1.65
z 1.93
Prueba de hipótesis de la proporción
H 0 : p 0.12
Paso 1 (hipótesis)
H 1 : p 0.12
Prueba de hipótesis de la proporción
Paso 2 Supongamos un nivel de significancia α=0.05
Paso 3 La hipótesis se basa en una muestra de 150 clientes y de ellos 23
han incumplido
_
el pago del crédito automotriz
otorgado
p 23 / 150 0.15 p p0
El estadístico de prueba apropiado es: z
p0 (1 p0 )
n
p p0 0.15 0.12 0.03 0.03 0.03
z 1.15
p0 (1 p0 ) 0.12(0.88) 0.1056 0.000704 0.026
n 150 150
Paso 4 Para una .05 z 1.645 es el valor de tablas (valor crítico)
*
FIN