0 Estadistica 7 - 12 Final

Sesiones 7 - 8
MBA Juan Carlos Orellano

CONTENIDO
Estadística: Definición.
Medidas de Tendencia Central.
Medidas de Dispersión.
Datos agrupados ( Frecuencias).
Relación entre variables.
Estadística
Definicion
La estadística es una rama de las matemáticas que se ocupa de la obtención,
orden y análisis de un conjunto de datos con el fin de obtener explicaciones y
predicciones sobre fenómenos observados.
A tomar en cuenta:
Estadística Descriptiva.
Estadística Inferencial.
Datos e información
Medidas de Tendencia Central
Definición
Las medidas de tendencia central son medidas estadísticasque buscan
resumir en un sólovalor el centro de la distribución de un conjunto de datos.
Principales medidas:
Media
Mediana
Moda
Ejemplo
A continuación se muestran datos del sueldo anual (medido en miles de

soles) de 7 asistentes contablesde una compañía:
35 31 33 36 34 34 33
¿Cuálesla media, la mediana y la moda de esos datos ?

La media
Definición
El promedio o media muestral (cuando los datos provienen de una
muestra) esla suma de los valores del conjunto dividida por el número
total de observaciones (tamaño de la muestra,n)
Es decir: Σ
X 1 + X 2 + ...+ X n n i
=1 Xi
X = =
n n
En nuestroejemplo:
35 + 31 + 33 + 36 + 34 + 34 + 33
X = = 33.7 ∼=34
7
Función en Excel: =PROMEDIO()

La mediana
Definición
La mediana esla observación que ocupa el lugar central cuando todas las
observacionesestán ordenadas en sentido ascendente (odescendente).
Ordenando los datos de nuestro ejemplo en forma ascendente:
31 33 33 34 34 35 36
La mediana es 34.
Función en Excel: =MEDIANA()
Esto esasísi la cantidad de observaciones esimpar (p. ej., n = 7). ¿Qué

pasa si n espar?
La mediana
Supongamos que contamos con solamente las siguientes 6 observaciones:
31 33 33 34 34 35
Tanto el dato 33 como 34 ocupan la posición central. En estos casos, la

mediana esla media de las dos observacionescentrales:
33 + 34
Mediana = = 33, 5
2
¿Media o Mediana?
Si bien la media esmás utilizada por su simplicidad, en algunas situaciones la
mediana puede ser preferible. ¿Cuándo?
En el ejemplo de los siete sueldos de los contadores vimos que:

la media es 33,7
la mediana es 34
Supongamosque el CEO de la compañíaconsidera que un contador (el que
percibía un salario de S/. 35) tiene un alto potencial y espromovido a gerente,
triplicándole su salario (ahora percibe S/105). La nueva distribución de sueldos
es:
31 33 33 34 34 35 105
¿Quépasa con la media y la mediana?

La nueva media esde 43,7 y la mediana sigue siendo 34.
Moraleja
La media es muy sensible a la presencia de valores extremos,

mientras la mediana es una medida más robusta.
En estos casos, la mediana puede ser preferible a la media como

medida de tendencia central.
La moda
Definicion
La moda (o el modo) esel valor másfrecuente dentro del conjunto de
observaciones.
La moda esrelevante solamente en algunos casos ya que puede que:

No exista (no haya observaciones que se repitan),
no estéubicadaen el centro de la distribución, o
haya másdeuna.
En nuestro caso inicial:
35 31 33 36 34 34 33
Función en Excel: =MODA()

Pros y Contras
Medida Pro Contra

-Cálculo sencillo -Sensible a n
-Interpretación clara -No siempreestáen el centro
Moda -Puede calcularse en -Poco sentido para variables continuas
variables cualitativas -Puede haber másde una moda
-Fácil de calcular -Solo para var. numéricas ordenables
Mediana -Robusto aoutliers -Sensible a n
-Concepto no tan familiar
-Fácil de entender -Afectado por outliers
Media -Poco sensible a n -No es útil para variables discretas
-Usa todos los datos
Media ponderada
Medida alternativa de tendenciacentral.
Pone diferente peso o importancia a las distintas observaciones.
Altera el “centro” de los datos.
w : ponderador (número entre 0 y 1 que sumados da 1)
Σ
X = w1X1 + w2X2 + ... + wnX n = wi X i
donde Σ
w1 + w2 + ...+ wn = wi = 1
Noten que en un promedio simple: wi = 1/n
Usos:
Indices bursátiles
Portafolios
Algunas calificaciones
Media móvil
Es un promedio de los valores de una serie temporal para un período de

tiempo dado (ventana de estimación).
Se debe determinar el tamañode la ventana de estimación (p. ej.,
media móvil de 20 días),
esdecir, la cantidad de observaciones (usualmente pasadas) que se
utilizarán en la estimación.
Seutiliza como indicador de tendencia ya que produce un suavizado
sobre la serie temporal.
Las alternativas más conocidas son la media móvilsimple y la
media móvil exponencial.
Aplicación en Excel
Bajar de Yahoo Finance (www.finance.yahoo.com) el precio de cierre

ajustado de General Electric (GE) en forma diaria entre el 4 de enero de
2016 y el 22 de julio de 2016.
Calcular las principales medidas de tendencia central (media, mediana y

moda) durante eseperíodo.
Calcular la media móvil simple de 20 períodosy graficar.

CONTENIDO
Medidas de Dispersión
Si nos limitáramos solamente a fijarnos en las medidas de tendencia central,
no tendríamos una idea acabada de cómo sedistribuyen los datos.
Imaginemos que queremos comparar la cantidad de llamadas recibidas en

un call center por trimestre en 2011 y en 2012 y observamos lo siguiente:
Trimestre 2011 2012

Primer trimestre 1200 1070
Segundo trimestre 1500 2694
Tercer trimestre 1350 6
Cuarto trimestre 1220 1500
Media 1317.5 1317.5
Mediana 1285 1285
La media y la mediana son las mismas en 2011 y 2012,

¿se puede decir que los dos grupos son parecidos?
Medidas de Dispersión
Definicion
Las medidas de dispersión son medidas estadísticasque muestran la
variabilidad en la distribución de los datos.
Principales medidas:
Varianzay desviaciónestándar
Coeficiente de variación
Rango y rango intercuartil
La varianza
Dado que estamos interesados en analizar la dispersión de los valores,

resulta natural fijarnos en sus diferencias respecto de la media.
Es decir, cuántose aleja cadaobservación respecto de lamedia.
Como algunos de los valores son mayores que la media y otros
menores, algunas de estas diferencias seránpositivas y otras
negativas, aunque estarán“equilibradas” (suman0).
Para analizar la dispersión de los datos no nos interesa el signo de las
diferencias.
Las trataremos de igual forma elevando las diferencias al cuadrado.
El promedio de los cuadrados de las diferencias nos proporciona la
medida de lavarianza
Ejemplo
Retomando el ejemplo de los salarios de los Contadores:
Contador X X −X (X − X )2
1 35 (35-33.7)=1.3 1.69
2 31 (31-33.7)=-2.7 7.29
3 33 (33-33.7)=-0.7 0.49
4 36 (36-33.7)=2.3 5.29
5 34 (34-33.7)=0.3 0.09
6 34 (34-33.7)=0.3 0.09
7 35 (35-33.7)=-0.7 0.49
Suma 236 0 15.43
La varianza (S 2 ) resulta:
Σ n i
(X i − X )2
=1 15.43
S =
2
= = 2.6
n −1 6
Cuando n > 30, se divide por n en vez de n − 1.
La desviación Estandar
Si bien la varianza esuna medida de dispersión, resulta difícil de
interpretar. ¡Las unidades quedan elevadas al cuadrado!
Una forma sencilla de volver a las unidades de medida originales es

tomar la raíz cuadrada (positiva) de lavarianza.
Esto seconoce como la desviación estándar (S):
. .
n i
√ Σ (X i − X )2 15.43
S = S2 = =1
= = √ 2.6 = 1.61
n −1 6
El coeficiente de variación
Es una medida de dispersión que se utiliza fundamentalmente para
comparar la variabilidad entre dos o másconjuntos de datos con
distintas unidades de medida o distintas medias.
El coeficiente de variación (CV) se definecomo:
CV = S
X
Se puede multiplicar por 100 para expresarlo entérminosporcentuales.
Ejemplo
¿Enquécaso hay másdispersión?
Bajar de Yahoo Finance (finance.yahoo.com) el precio de cierre ajustado

de Intel eIBM en forma diaria entre el 4 de enero de 2016 y el 22 de julio de
2016.
Compute el retorno diario de cadaacción a través de la siguiente

fórmula:
t
(P t − P t−1 )
R = P t−1 × 100
Utilice el complemento de Excel “Herramienta para análisis” y
obtenga las principales medidas de estadísticadescriptiva de los
retornos durante eseperíodo.
¿Cuálde los dos retornos tiene una mayordispersión?

CONTENIDO
Datos agrupados o Frecuencias
En la práctica, la mayor parte de los conjuntos de datos contienen

muchas observaciones, por lo que cuando la cantidad de información es
muy grande resulta conveniente reducirla agrupando las observaciones
en intervalos o tablas de frecuencia.
Muchas veces, no solo serepresentan los datos en forma agrupada

para reducir la cantidad de información sino también porque hay
variables que son sensibles a lano-respuesta.
Es decir, es más probable que una persona en una encuesta conteste

cierta información cuando se le pide que se ubique en un rango, que
cuando sele pide el valor exacto (ejemplo: nivel deingreso).
Ejemplo
La siguiente tabla tiene datos de ingreso mensual enUS$ de 3200
individuos en ciertaciudad:
Ingresos Nro de individuos

(150-450] 250
(450-750] 800
(750-1050] 1250
(1050-1350] 700
(1350-1650] 180
(1650-1950] 16
(1950-2250] 3
(2250-2550] 1
Suma 3200
El paréntesisexcluye el valor y el corchete incluye el valor.

Frecuencias
Definicion
Se llama frecuencia al númerode observaciones de cadaintervalo.
Definicion
La frecuencia acumulada esel númerototal de observaciones que hay en ese
intervalo y en los anteriores.
Ingresos Frecuencia Frec. Acumulada

(150-450] 250 250
(450-750] 800 1050
(750-1050] 1250 2300
(1050-1350] 700 3000
(1350-1650] 180 3180
(1650-1950] 16 3196
(1950-2250] 3 3199
(2250-2550] 1 3200
Suma 3200
Frecuencia relativa
Definicion
La proporción de observaciones de cada intervalo o clase sedenomina
frecuencia relativa.
Días de ausentismo laboral en el último trimestre:
Histograma
El histograma nos permite hacernos una idea visual rápida y adecuada de la
proporción de observaciones que se encuentran dentro de un determinado
intervalo.
Histograma
Un histograma sirve para:

Tener una primera vista de los datos, cómose distribuyen.
Detectar casosextremos.
Detectar problemas con los datos.
Ver quéeslo que sucedemásfrecuentemente.
Asimetrı́a
La distribución de los datos puede ser simétrica o asimétrica.
Cuando la distribución es:

simétrica: Media=Mediana=Moda
asimétrica a derecha (positiva): Media>Mediana>Moda
asimétrica a izquierda (negativa):Media<Mediana<Moda
Bajar de Yahoo Finance (finance.yahoo.com) el precio de cierre ajustado

de Intel entre el 4 de enero de 2016 y el 22 de julio de 2016.
Compute el retorno diario de Intel a través de la siguientefórmula:

(P t − Pt − 1 ) Pt
Rt = × 100 = − 1 × 100
P t−1 P t−1
Utilice el complemento de Excel “Herramienta para análisis” obtenga
los principales estadísticos descriptivos.
Genere una tabla de frecuencias y grafique el histograma.
¿Quéobserva?
CONTENIDO
Relaciones entre variables
Hasta ahora hemos discutido cómo utilizar las medidas de tendencia

central y variabilidad para resumir un conjunto de datos.
También estamos interesados en medir la fuerza de la relación entre dos

conjuntos de datos.
Por ejemplo, ¿cómo se relaciona el gasto de publicidad con las ventas de
una compañía? ¿Cómo se relaciona el precio de una bebida con la
cantidad consumida?
La relación (lineal) entre dos conjuntos de datos se puede medir a
travésdela correlación.
Diagramas de dispersión (Scatter Plot)
En cada eje (X e Y ) se pone una variable y cada punto corresponde a una

observación.
Coeficiente de correlación de Pearson
Intenta medir cuánasociadas (linealmente) están dos variables.

S XY
rXY =
SX S Y
donde,
S XY esla covarianza entre X eY
S X es la desviación estándar deX
S Y es la desviación estándar deY
En Excel: =COEF.DE.CORREL()
Covarianza
Para calcular el coeficiente de correlación (rXY ) necesitamos calcular la

covarianza (S XY ).
La covarianza indica el co-movimiento de dos variables respecto a su
media.
Formalmente: n
Σ i=1 (X i − X )(Y i − Y )
S XY =
n −1
En Excel: =COVAR()
S XY > 0 indica dependencia lineal directa entre las dos variables
S XY < 0 indica dependencia lineal inversa entre las dos variables
Al igual que la varianza, no esun estadísticolibre de unidades de
medida.
Propiedades del coeficiente decorrelación
Libre de unidades de medida.
Invariante al cambio de unidades (p. ej., si paso se medir X en miles de

USD a millones de USD, no cambia el coeficiente).
−1 ≤ r ≤ 1, ya que estánormalizado por los desvíos.
Su signo estádado por el signo de la covarianza.
Mide dependencia lineal, si los datos (X i , Y i ) tienden a caer sobre una

recta.
Cuantifica la fuerza de la relación, pero no la forma de la recta (su

pendiente y ordenada al origen).
Coeficiente de correlación
¡Correlacion no implica causalidad!
Fuente: tylervigen.com
Bajar de Yahoo Finance (finance.yahoo.com) el precio de cierre

ajustado de Intel, Cisco, General Motors, Microsoft e IBM entre el 4 de
enero de 2016 y el 22 de julio de 2016.
Compute el retorno diario de cada una de estas acciones a travésde la

siguientefórmula:
(P t − Pt − 1 ) × 100 = P t − 1 × 100
Rt = P t−1 P t−1
Utilice el complemento de Excel “Herramienta para análisis” para

obtener la matriz decorrelaciones.
¿Quéobserva?
Sesiones 9 - 10
CONTENIDO
Definiendo probabilidades.
Arboles de decisión.
Variables aliatorias.
Distribución Binomial y Distribución
Normal.
Definiendo la probabilidad ( *)
La probabilidad esun conceptoteóricoy no necesariamente tiene
que coincidir con la frecuencia observada
Definición clásica(frecuentista)
Definicion
La probabilidad de cualquier resultado de un experimento aleatorio esla
proporción de veces que el resultado se da despuésde una larga serie de
repeticiones del experimento.
Experimento aleatorio
Resultados
Espacio muestral (Ω): conjunto que contiene todos los posibles
resultados de un experimento aleatorio.
Evento: subconjunto de Ω.
Ejemplo
Experimento: sacar una carta de un mazo de cartas (52 cartas).
Evento A: sacar un as.
¿Cuálesla P(A)?
Axiomas de probabilidad
Sea A un evento y Ω el espacio muestral, una medida de probabilidad

P satisface:
(a) P(A) ≥ 0, ∀A ⊆ Ω
(b) P(Ω) = 1
(c) Si A y B son eventos mutuamente excluyentes,

P(A ∪ B) = P(A) + P(B)
(a) y (b) implican que 0 ≤ P(A) ≤ 1

) Si la probabilidad es0 (hay certeza de que ese evento NO va a ocurrir)
) Si la probabilidad es1 (hay certeza de que ese evento SI va a ocurrir)
Reglas de probabilidad
Para todo evento A, 0 ≤ P(A) ≤1
P(A) = 1 − P(A c )
P(Ø) = 0
A, B eventos en Ω (A, B ⊆ Ω), si B ⊆ A, entonces P(B) ≤ P(A)
Ejemplo
Tirar un dado, A: divisibles por 2, B: divisibles por 4
Claramente B ⊂ A, entonces P(B) = 1/6 ≤ P(A) = 1/2
Diagrama de Venn
Unión de doseventos
P(A ∪B) = P(A) + P(B) −P(A ∩B)
Si los eventos (conjuntos) son disjuntos (mutuamente excluyentes):
P(A ∩ B) = 0
Entonces, P(A ∪ B) = P(A) + P(B)

Ejercicio
Se extrae una carta de un mazo de cartas francesas (52 cartas):

A= extraer un as
R = extraer un rey
T = extraer trébol
(a) ¿Cuálesla probabilidad de obtener un as o un rey?

(b) ¿Cuálesla probabilidad de obtener un as o una carta de trébol?
CONTENIDO
Distribución Binomial y Distribución Normal.
Probabilidad incondicional, condicional y conjunta
Probabilidad y valor esperado
Para una variable aleatoria discreta, el valor esperado esel promedio

ponderado de todos los posibles resultados de dicha variable, donde los
pesos son las probabilidades asociadas a cada uno de los resultados. Esto
es: n
E (X) = Σ xi p(x i )
i=1
Reglas del valor esperado:

Asigno probabilidades
Computo el valor esperado de cada opción
Elijo la que tiene mayor valor esperado
Aplicación Agronegocios
Sembrétrigo, si no fertilizo obtendré 1500kg/ha si no llueve y 2500kg/ha si

llueve, si fertilizo obtendré 700 kg/ha si no llueve, 3300 si llueve. De acuerdo
al servicio meteorológico nacional la probabilidad que llueva es 0,3.
¿Fertilizo ono?
Arbolesde Decisiones
Técnica gráficapara representar un problema de toma de decisiones.

Se resuelve usandoinducción hacia atrás en base a reglas de
probabilidad y el criterio del valor esperado.
Herramienta en Excel: Simple Decision Tree
Se puede utilizar el add-in: SimpleDecisionTree disponible para Excel

para armar y resolver los árbolesde decisión. Este complemento fue
desarrollado por Thomas Seyller.
Para habilitar el add-in:

Bajar la versión 1.4 del add-in de la siguiente páginaWeb:
h t t p s : / / s i t es . g o o g l e. c o m/ s i t e/ s i mp l ed ec i s i o n t r e e/
Guardar el add-in en el directorio de interés.
Entrar al Excel e ir a Archivo/Opciones Click
en Complementos y luego enIr...
Buscar el add-in en el directorio en el que se guardó
Click en Aceptar
En la pestañade Complementos apareceráel add-in.
El gerente de marketing de una compañíadebe decidir el curso de acción a seguir en la
promoción de un nuevo producto. Inicialmente, el gerente debe decidir si va a
comercializar el nuevo producto directamente o si va a llevar a cambio primero una
prueba piloto. Luego de decidir hacer la prueba piloto, debe decidir si lo abandona
(no lanza el producto al mercado) o lo distribuye a nivelnacional.
Un éxitonacional en el lanzamiento del producto aumentarálas ganancias por

$400.000 y un fracasogenerará pérdidas por $80.000. Abandonar el producto
afectarálas ganancias. La prueba piloto tiene un costo de$10.000.
Si no hace la prueba piloto, la probabilidad de éxitonacional se juzga que esdel 40%.

La probabilidad asumida por un resultado favorable en la prueba piloto es del 50%.
La probabilidad condicional de éxito nacional dado que se dio un resultado favorable
en la prueba piloto esdel 75%, y si la prueba resultódesfavorable, la probabilidad de
éxito nacional estan solo del 10%.
¿Quédebe decidir la compañía?

CONTENIDO
Variable aleatoria
Definicion
Una variable aleatoria esuna variable que toma valores numéricos
determinados por el resultado de un experimento que tiene asociado una
probabilidad.
Notación:en general describimos la variable aleatoria con mayúscula( X ) y el

resultado (realización) con minúscula (x ).
Ejemplo
Se tira una moneda al aire tres veces (experimento), definimos X (variable
aleatoria) como “el númerode caras obtenidas”. Entonces X es una variable
aleatoria que puede tomar los siguientes valores (x ): 0, 1, 2y
3. Cada uno de esos valores va a tener una probabilidad asociada.
¿Se animan a calcularla?

Ejemplo (Resolución)
Se lanza 3 veces una moneda

X = número de caras obtenidas. Entonces, X = 0, 1, 2, 3
Llamemos H a sacar una cara y T a sacar una ceca.
Los resultados posibles son 8: HHH, HHT , HTH, THH, HTT , THT ,
TTH, TTT .
Entonces se puede construir la siguiente tabla:
X P(X = x )
0 1/8=0,125
1 3/8=0,375
2 3/8=0,375
3 1/8=0,125
Tipos de variables aleatorias
Volviendo a las variables aleatorias
Entonces, una variable aleatoria esuna variable para la cual

no sabemos (concerteza)
cuál va a ser (ex-ante) suvalor.
Vamos a centrarnos principalmente en el estudio de variables aleatorias

cuantitativas:
Discretas
Continuas
Variables Aleatorias Discretas
Si X esuna variable aleatoria discreta y x esuno de sus posibles
valores, la probabilidad de que X tome un valor específico x se escribe: p(x
) o P(X = x ). Esto seconoce como la función de probabilidad.
Ejemplo
Se tira un dado. X = variable aleatoria que indica el númeroresultante. Si el
dado esequilibrado, P(X = 1) = ... = P(X = 6) = 1/6,entonces su
función de probabilidad será:
P(X = x) = 1/6 para x = 1,2,3,...,6
¿Cómose vería gráficamentesudistribución de probabilidades?
Esto nos permite calcular distintas probabilidades:

P(2 ≤ X ≤ 4) = P(X = 2) + P(X = 3) + P(X = 4) = 1/2
P(X ≤ 5) = 1 − P(X > 5) = 1 − P(X = 6) = 5/6
Histograma vs Distribución de Probabilidades
Valor esperado (Esperanza Matemática)
Definicion
El valor esperado (o esperanzamatemática) esuna medida de lo que
ocurre con másfrecuencia o en promedio.
El valor esperado de una variable aleatoria discreta X es:
µ = E(X ) = p1x 1 + p 2x 2 + ... + p nxn = Σ i pi xi

Es decir, el valor esperado esel promedio ponderado de todos los posibles
valores que la misma puede adoptar, donde los ponderadores son las
probabilidades asociadas a cada x . Notar que el promedio simple esel caso
particular en que p = 1/n.
Ejemplo
X =cantidad de autos que compra una familia en el lapso de 5 años.
Supongamos que conocemos la probabilidad asociada a cadax :
¿Cuálesel valoresperado?
Ejemplo
X =cantidad de autos que compra una familia en el lapso de 5 años.
Supongamos que conocemos la probabilidad asociada a cadax :
Propiedades de la esperanza
Si a esuna constante (un número) y X una variable aleatoria, entonces:

E (a) = a
E(aX ) = aE(X )
Si tenemos dos variables aleatorias (X e Y ). Entonces,

E(X + Y ) = E(X ) + E(Y )
E(X − Y ) = E(X ) − E(Y )
¡Multiplicarlas y dividirlas esdistinto!
¡Conocer las propiedades de la esperanza nos facilita realizar ciertos

cómputos!
Ejemplo
X = ingreso mensual del jefe de hogar

Y = ingreso mensual del cónyuge
Se sabe que E(X)=8000 y E(Y)=6000.
Ahora, supongamos que todos los jefes de hogar reciben un incremento del
20% en su salario, mientras que sus cónyuges una suma fija de $2000.
¿Cuálesel valor esperado del nuevo ingreso mensual del hogar (jefe +
cónyuge)?
T =nuevo ingreso total familiar.

Entonces, E(T ) = E(1, 2X + Y + 2000).
Aplicando las propiedades:
E(T ) = 1,2E(X ) + E(Y ) + 2000 = 1,2.8000+ 6000+ 2000=$17600
Varianza
Como vimos enestadísticadescriptiva, no podemoslimitarnos

solamente a fijarnos enmedidas de tendencia central como la media.
No tendríamos una idea acabadade cómose distribuyen los datos.
Podemos calcular también la varianza (o el desvío) de una variable
aleatoria como medida dedispersión.
Si X esuna variable aleatoria discreta, la esperanza del desvío al cuadrado

2 2
respecto de la media (X − E (X )) se denomina varianza (V (X ) o σ ):X
Σ
σ2 = V (X ) = E[(X − µ) 2] = i (x − µ) p(x )
2
Notar que: (Fórmula alternativa)
σ2 = V (X ) = E[(X − µ)2] = E(X 2 ) − µ2

Intuición
Σ
σ2 = V (X ) = E[(X − µ)2] = i (x − µ)2p(x )
La varianza (generalmente denotada como σ2) esun promedio

ponderado (por su probabilidad) de la distancia cuadrática entre la
media (µ) y cada x .
Es mayor cuanto más lejos estén los x de la media, y cuanto mayor sea
el peso (probabilidad de ocurrencia) de esosvalores.
Usualmente selo asocia con variabilidad y riesgo.

Ejemplo
En el ejemplo de la cantidad de autos que compra una familia en un lapso de
5 años,si queremos calcular la varianza:
Entonces, σ2 = 2, 02 y σ = 1,42.
Propiedades de la varianza - Creer o reventar
Si a y b son dos números(constantes, no variables) y X una variable

aleatoria, entonces:
V (a) = 0
V (aX ) = a2V (X )
V (a + bX) = b2V (X )
Si X e Y son dos variables aleatorias:

V (X ± Y ) = V (X ) + V (Y ) ± 2COV(X, Y )
V (X ± Y ) = V (X ) + V (Y ) si X eY son variables aleatorias
independientes (no tienen relación lineal, COV (X, Y ) = 0)
Ejemplo (propiedades de la varianza)
X = ingreso mensual del jefe de hogar
Y = ingreso mensual del cónyuge
Sesabe que σ(X ) = 150 y σ(Y ) = 100.
Ahora, supongamos que todos los jefes de hogar reciben un incremento del
20% en su salario, mientras que sus cónyuges una suma fija de $2000.
¿Cuálesel el desvío estándar del nuevo ingreso mensual del hogar (jefe +
cónyuge)? Asuma que el ingreso del jefe de hogar esindependiente del de su
cónyuge
T =nuevo ingreso total familiar.

Entonces, V (T ) = V (1, 2X + Y + 2000).
Aplicando las propiedades:
V (T ) = 1,22V (X ) + V (Y ) = 1,22.1502 + 1002 = 42400
σ(T )=$205.9
Covarianza
La covarianza entre dos variables aleatorias X e Y esuna medida de la
asociación que existe entre ambas. Estádadapor:
Σ Σ
Cov(X, Y ) = E[(X − µX )(Y − µY )] = i j (x − µX )(y − µY )p(x, y)
Para calcularla hay que conocer la probabilidad conjunta (p(x, y )).

Una covarianza positiva (negativa) implica que existe una asociación
lineal positiva (negativa) entre el par de variables aleatorias.
Intuición
Cov (X, Y ) > 0: si ↑ X , Y tiende a subir (o si ↑ Y , X tiende a subir)

Cov (X, Y ) < 0: si ↑ X , Y tiende a bajar (o si ↑ Y , X tiende a bajar)
Cov (X, Y ) = 0: no hay asociación lineal entre X e Y
En la lección anterior vimos que las variables aleatorias X e Y son

independientes si p(x, y ) = p(x ).p(y ) para todos los valores de X e
Y.
Bajo independencia, también severifica que E (XY ) = E (X ).E (Y ).
Entonces, si X eY son independientes, COV (X, Y ) = 0.
Sin embargo, la inversa no esnecesariamente verdadera (puede haber
otro tipo de relación distinta de la lineal).
Correlacion
Como la covarianza depende de las unidades de medición de X e Y ,

muchas veces utilizamos el coeficiente de correlación (ρXY ) que lo
escribimos de la siguiente manera:
Cov(X, Y )
ρX,Y =
σXσY
ρXY mantiene el signo de la covarianza

ρXY es0 cuando la covarianza es 0.
−1 ≤ ρX,Y ≤ 1
El coeficiente de correlación esuna medida MUY utilizada en la prácticay que

retomaremos cuando veamos regresión.
Correlacion
CONTENIDO
Distribuciones
Definicion
Una distribución de probabilidad esuna función que asigna una
probabilidad a cada posible valor de una variable aleatoria.
Vamos a ver dos tipos de distribuciones (las más usuales):

Distribución Binomial
Distribución Normal
Distribuciones
Los conceptos desarrollados anteriormente para las variables aleatorias

discretas seextienden naturalmente a variables aleatorias continuas.
La función de densidad esun concepto similar a la función de

probabilidades.
Figura:Función deprobabilidad Figura:Función de densidad

Probabilidades Binomiales
Ejemplo
Se lanzaráuna moneda tres veces, ¿cuál esla probabilidad de sacar
exactamente una cara?
(a)0.125
(b)0.250
(c)0.333
(d)0.375
(e)0.500
Llamemos H al evento de sacar cara y T al evento de sacar ceca. Vimos
que hay 8 resultados posibles: HHH, HHT, HTH, THH, HTT, THT,
TTH, TTT.
Hay 3 resultados con exactamente una cara: HTT, THT y TTH.
P(sólo 1 cara)=3/8=0.375
OK. Pero si te preguntan ¿cuál esla probabilidad de sacar una cara

cuando se lanza 100 veces unamoneda?
Una forma másautomática esusar la probabilidad binomial.

Un experimento aleatorio arroja dos resultados posibles: éxito (con
probabilidad p) o fracaso (con probabilidad 1 − p).
Se llevan a cabo n repeticiones independientes del experimento.
La distribución de éxitos X resultantes se conoce como distribución
binomial:
n x
P(X = x ) =
x
( )
p (1 −p) n−x
n n!
Donde x = x! (n−x )!
, seconoce como “combinatoria de n en x”
y n! = 1 × 2 × 3 × ... × (n − 1) × n, se conoce como “factorial de n”.
E(X ) = n.p y V (X ) = n.p.(1 −p)

En Excel: DISTR.BINOM()
Ejemplo
Un examen final consta de 10 preguntas multiple choice (con 4 opciones

cada una) donde sólo una respuesta escorrecta. Un alumno no estudió para el
final y no sabe la respuesta de ninguna de las diez preguntas por lo que decide
contestar al azar. ¿Cuálesla probabilidad de aprobar el examen (acertar 5 o
máspreguntas)? (Calcular en Excel)
(a)1%
(b)2.5%
(c)5%
(d)8%
(e)19%
(f)25%
Es la distribución más común (de allí sunombre).
Tiene forma de campana.
Depende de dos parámetros: la media (µ) y la varianza (σ2).
Notación: X ∼ N(µ, σ2) y selee como “X sigue una distribución
Normal con media µ y varianza σ 2 ”.
µ y σ2 definirán la forma de la distribución.
Si se cambia µ sin cambiar σ se produce un desplazamiento de la
curva a lo largo del eje horizontal sin que cambie su dispersión.
En cambio, a mayor varianza (σ 2), la curva presenta mayor dispersión:
Función de DistribuciónAcumulada
La función de distribucióon acumulada, F (x ), es:
F(x) = P(X ≤ x)
Función de DistribuciónAcumulada
Se puede usar la F (x ) para calcular rangos de probabilidad.
Por ejemplo:
P(a ≤ X ≤ b) = F (b) − F (a)
Calcular dichas probabilidades puede ser muy tedioso (para cada µ y

σ2 posibles).
Afortunadamente, los cálculos se facilitan a través del proceso de
estandarización.
Distribución Normal Estándar
Definicion
Si Z esuna variable aleatoria normal con media 0 y varianza 1; esto es, Z
∼ N(0, 1). Entonces Z sedice que sigue una distribución normal
estándar.
El proceso de estandarización consiste en expresar cualquier variable

aleatoria normal en términosde una variable aleatoria normal estándar.
Estandarización
Una variable X ∼ N(µ, σ2) se puede convertir en una Z ∼ N(0, 1) si se le
sustrae su media y sela divide por su desvíoestándar.
X −µ
Z= , donde Z ∼ N(0, 1)
σ
Tabla de la Normal Estándar
El proceso de estandarización permite que, al transformar

X ∼ N(µ, σ2) en Z ∼ N(0, 1), podamos usar la tabla de la
distribución normal estándar acumulada.
Esta tabla nos arroja las probabilidades de que Z sea menor o igual
a un valor dado z : P(Z ≤ z ) = F (z ).
¡La ventaja de usar la tabla la normal estándaresque alguien ya

calculó las probabilidades!
El archivo de Excel dis t r ib u ci o n nor ma l.xls muestra la tabla de

la distribución normal estándar.
Tabla de la Normal Estándar
Dos tipos de problemas
Tipo 1. Encontrar una probabilidad para un valor dado x:
P(X < x ) =?
En Excel: DISTR.NORM(), seindica la media y desvíode una Normal, se

da un valor x hasta el sedesea acumularprobabilidad.
Tipo 2. Dada una probabilidad, encontrar para quévalor de la

distribución Normal se cumple esaprobabilidad:
P(X <?) = p
En Excel: DISTR.NORM.INV(), indicar media y desvío además del

valor de probabilidad, y calcula el valor x hasta el cual se acumula
dicha probabilidad.
Dos tipos de problemas
Ejemplo
X esuna variable aleatoria que representa “la venta semanal de revistas en un
kiosko de diarios y revistas”. En promedio, un kiosko vende 100 revistas
semanales con un desvíode 25. Asuma que las ventas siguen una distribución
normal.
Tipo 1. ¿Cuálesla probabilidad de vender menos de 75 revistas?
Tipo 2. ¿Y si me dicen que quieren saber cuánto es lo máximo que puede

llegar a vender un kiosko con 95% de probabilidad (es decir, el 95% de las
veces)?
Solución:
Tipo 1: P(X < 75) =? ← =DISTR.NORM(75,100,25,VERDADERO)
Tipo 2: P(X <?) = 0, 95 ← =+DISTR.NORM.INV(0.95,100,25)
Valor en Riesgo (Value at Risk) - VaR
Es un método para medir riesgos en el mercado.

En 1990 el CEO de JP Morgan pidió el reporte 4:15 (en una página había
que resumir todo el riesgo de la compañíaa los 15 minutos que cerraba el
mercado)
En 1994 JP Morgan publica la metodología y le dadifusión.
El VaR esmuy utilizado porque en una simple pregunta resume la
idea del riesgo asociado: ¿Qu´é eslo peor que puedepasar?
Veremoscómocalcular el VaR usando la distribución normal.
Ventajas:
) Medida únicaderiesgo
) Relativamente libre de modelo ysupuestos
) No depende de la aversión al riesgo
) Fácil de explicar
) Permite desviaciones del supuesto denormalidad
Valor en Riesgo (Value at Risk) - VaR
Nos concentraremos en la cola izquierda (escenario negativo) de la
distribución normal.
Tenemos que decidir qué riesgo queremos trabajar (¿1%, 5%?)
Ejemplo
Las ventas diarias de mi empresa siguen una distribución normal con una
media de 234 millones de pesos y un desvío de 128 millones de pesos.
Calcular el VaR al 5%. ¿Cómoseinterpreta?
Respuesta: $23,46 millones. ¡Es siempre un problema de Tipo 2!

=DISTR.NORM.INV(0.05,234,128)
Sesiones 11 - 12
CONTENIDO
Distribuciones muestrales.
Intervalos de confianza.
Pruebas de hipótesis.
Regresión Simple.
Estimadores puntuales
Queremoshacer inferencia respecto de una población, basadosen la

información contenida enuna muestraaleatoria.
Nos centraremos en características específicas, parámetros, de la
población. Por ejemplo:
) El nivel medio de consumo de ciertoproducto.
) La proporción de mujerescon cargos jerárquicos enuna empresa.
Cualquierinferencia sobre la población estarábasada enestadísticos
muestrales.
Definicion
Un estadístico esuna función de la información muestral. La elección del
estadísticoadecuadodependeráencuál esel parámetro poblacional de interés.
Estimadores puntuales
Por sus propiedades, ciertos estadísticosson generalmente preferidos como

estimadores de la media poblacional (µ) o la proporción poblacional (p)
Parámetro Estimador
Σ
Xi
µ X = i
n
pˆ= nro éxitos

p n
Muestral vs Poblacional
Todo concepto de que vimos enEstadísticaDescriptiva tiene su correlato

poblacional reemplazando frecuencias observadas porprobabilidades:
Muestral Poblacional
Frecuencia Probabilidad
Histograma Distribución deprobabilidades
Media muestral (X ) Media poblacional (µ)
Varianza muestral (S 2 ) Varianza poblacional (σ2)
Proporción muestral (pˆ) Proporción poblacional (p)
Covarianza muestral (S XY ) Covarianza (COV(X,Y) o σXY )
Coeficiente de correlación (rXY ) Coeficiente de correlación (ρXY )
Distribuciones muestrales
Definicion
Una distribución muestral esla distribución de probabilidad de un estadístico.
¡Sí! ¡Los estadísticos (como X ) son también variables aleatorias! Entonces
podemos estar interesados en conocer su distribución. Pensemos en la media
muestral (X )...
Media muestral (X )
Depende de la muestra, ¡que esaleatoria!

Por ser una variable aleatoria tiene una media y unavarianza.
Si se extrae una muestra aleatoria de una población con media µ y
varianza σ2. La media y la varianza de X serán:
. Σi Xi 1 1
E (X ) = E = Σ X i = nµ = µ
E
n n n
.i Σ
Xi 1 1
V (X ) = V . Σ i = 2 V Σ X i = 2 nσ2= σ 2/n
n n i n
Nota: para el cálculo de la varianza tengan en cuenta que

X1, X2, ..., X n son independientes porque vienen de una muestra
aleatoria.
Distribución muestral de lamedia
Entonces, X tiene:
E (X ) = µ
σ2
V (X ) =
n
El desvío estándar será:
σ
σX = √
n
que en algunas ocasiones recibe el nombre de error estándar de la media
(porque esun estimador).
El “n” importa
A medida que n aumenta, σX disminuye:
Distribución muestral de lamedia
Ya conocemos la media (µ) y la varianza (σ2/n) de la media muestral

(X ). Ahora queremos conocer su distribución.
Si la población tiene distribución normal, entonces ¡X tambíen!

Ya que la suma (finita) de variables aleatorias normales también es
normal.
Si la estandarizamos:
X −µ
Z =
σ/√ n
tiene una distribución normal estándar, N(0, 1).

Teorema Central del Límite(TCL)
Un famoso teorema matemático (el teorema central del límite) mostró que
si el tamaño de la muestra esconsiderablemente grande, entonces la
distribución de la media muestral (de n variables aleatorias IID) se aproxima
a una distribución normal, aunque la población no fuera normal.
A medida que n se incrementa, la distribución muestral de la media muestral

estandarizada seaproxima a una distribución normal con media 0 y varianza
1.
X −µ
Z= ∼ N(0, 1)
σ/√ n
Poniendo a prueba el TCL
En Excel genere 5 variables aleatorias con distribución uniforme (0,1)
con 1000 datos (para cada una) usando la herramienta de análisis de
datos (Analysis ToolPak).
Haga el histograma para una deestasvariables.
Genere una nueva variable aleatoria que sea el promedio de las
anteriores.
Haga el histograma para esta nuevavariable. ¿Qué observa?
Repita el experimento generando10000 variables y 100000datos.

¿Quéforma va tomando el histograma?
La ley de los grandesnúmeros
Esta ley afirma que el promedio de variables aleatorias independientes con

una distribución común va a converger a la media de la distribución a medida
que el tamaño crece.
Es decir, de acuerdo a esta ley, el promedio de los resultados obtenidos de

una larga serie de repeticiones se acerca al valor esperado.
Ley de los Grandes Números: Si X1, X2, ... son variables aleatorias
independientes idénticamente distribuidas (IID), cada una con media E
(X ) = µ. Entonces,
Σ
Xi
X = i
n → µ cuando n → ∞
Ejemplo
Simulamos un experimento en el que arrojamos una moneda.
Sabemos que la probabilidad de que salga cara o ceca es1/2, la siguiente
tabla muestra cómola probabilidad se acerca a 0.5 a medida que
aumentamos la cantidad de repeticiones del experimento:
N Cara Ceca P(Cara) P(Ceca)

10 7 3 0.70 0.30
50 23 27 0.46 0.54
100 49 51 0.49 0.51
500 247 253 0.494 0.506
1000 495 505 0.495 0.505
10000 4980 5020 0.498 0.502
Proporcion muestral
Sea X esel númerode éxitos en una muestra de n observaciones

(independientes entre sí), donde p esla probabilidad de éxito.
Vimos que pˆ(la proporción muestral)es:
X
pˆ=
n
Al igual que con la media muestral, la proporción muestral esun
estadísticoy por lo tanto tendrá asociado una distribución.
Distribución muestral de la proporción muestral
La media y la varianza de la distribución muestral de la proporción

muestral pueden deducirse fácilmente de la media y la varianza del
númerodeéxitos (X ) que vimos queeran:
E (X ) = np V (X ) = np(1 −p)
Entonces:
X X p(1 −p)
E (pˆ) = E = p V (pˆ) = V =
n n n
El desvío estándarde la proporción muestral se conoce como error

estándar:
√ p(1 −p)
n
Distribución muestral de la proporción muestral
Si el tamaño de la muestra (n) eslo suficientemente grande entonces:

pˆ−p
Z = . ∼ N(0, 1)
√ p(1− p) / n
Es decir, ¡la distribución binomial se aproxima a una distribución normal!

A modo de conclusión
X y pˆson estadísticosy, por lo tanto, variables aleatorias.
Entonces, tienen una distribución asociada (distribución muestral).
Necesitamos conocer dichas distribuciones para poderhacer

inferencia estadística.
CONTENIDO
Regresión Simple.
Precisión del estimador puntual
Si la media muestral (X ) se usa para estimar a la media poblacional µ

que no conocemos, ¿cuál esla probabilidad deacertarle?
Ejemplo
Si quiero conocer cuál esel nivel medio de consumo de cerveza anual per
capita en cierto paísy tomo una muestra aleatorio de 100 individuos que me
arroja un X = 80, 2, ¿cuál esla probabilidad de que µ sea efectivamente
80,2?
Prácticamente ¡CERO!
¿Puedo saber “más o menos” en quérango seencontraría el
verdadero valor de la media?
Sí a través de la construcción de intervalos de confianza.
Motivacion
La estimación por intervalo esgeneralmente preferida a la estimación

puntual ya que esta última no proveeinformación respecto al error en la
estimación.
Veremoscómoconstruir intervalos de confianza para la media (µ) y
para la proporción (p).
Definicion
Un intervalo de confianza esun rango de valores que se determina en
base a información muestral, en el cual esprobable que el parámetro
poblacional esté contenido.
Estructura de los intervalos de confianza
Estimador Puntual ± Margen de Error
Los niveles de confianza másusados son 90%, 95% y 99%.
Veremos intervalos de confianza para:

La media poblacional (µ):
X± margen deerror
La proporción poblacional(p):
pˆ±margen deerror
Intervalos de confianza para la media (µ)
P(I 1 < µ < I2) = 1 − α
El intervalo me dice entre quévalores (I1 y I2) se encontraría el verdadero

valor del parámetro µ con una probabilidad de 1 −α.
1 − α: nivel de confianza (usualmente 90%, 95% o99%)

α: nivel de significación (usualmente 10%, 5% o 1%)
Intervalos de confianza para la media (µ)
Hay dos casosposibles:
Caso 1. La varianza poblacional (σ2) esconocida.
Caso 2. La varianza poblacional (σ2) es desconocida.

Caso 1
Supone que σ2 esconocida.
X ±zα/2σ/√ n
Si queremos construir un intervalo de confianza al 95%:
Este caso raramente sucede, cuando desconocemos el valor de σ2 es

razonable reemplazando por la varianza muestralS 2 .
Caso 2
Es un casomásrealista (no conocemos σ2).

No usamos una distribución normal estándar, sino
t = X −µ
S /√ n
otra distribución que sedenomina t de Student con (n-1) grados de

libertad.
Noten que X estáestandarizada usando S en lugar de σ.

El intervalo de confianza correspondiente será:
X ± tn−1,α/2S/√ n
Distribución t de Student
Caso 1 (Z): con varianza poblacional conocida
Ejemplo
Se conoce, de estudios anteriores, que el costo variable de construcción de
determinado tipo de vivienda prefabricada, por metro cuadrado, se distribuye
normalmente con un desvío estándarde $135. Setomóuna muestra aleatoria
de 12 viviendas con las que se calculó un costo variable promedio de $1440.
¿Entre quévalores estaráel costo variable medio de la construcción de

dicho tipo de vivienda si selo estima con una confianza del 95%?
Solución:
Sabemos que σ = 135, n = 12, X = 1440 y 1 − α = 0.95. Entonces,
X ± zα/2σ/ √ n
1440 ± 1.96 × 135/ √ 12
Por lo que el intervalo de confianza al 95% resulta: ($1363,6;$1516,4).

Caso 2 (T): con varianza poblacional desconocida
Aplicación en Excel:
Vuelva a trabajar sobre la base de datos de Excel que se utilizó en el
Módulo 1 en la cual calculó el retorno diario de IBM entre el 4 de
enerode2016 y 22 de julio de 2016.
Utilice nuevamente el complemento de Excel “Herramientas para
análisis”, pero esta vez calcule el intervalo de confianza al 95% del
retorno medio diario de IBM.
¿Y cuál esel intervalo de confianza al 99%?
Intervalos de confianza para la proporción (p)
Si ahora estamos interesados en construir un intervalo de confianza para la

proporción poblacional (p), el intervalo de confianza asociadoserá:
p^(1 − p^)
p^±z α/2 √
n
Ejemplo
Una encuesta realizada a cabo en el mes pasado en una ciudad, se entrevistóa
871 adultos. Con respecto a una pregunta dada, sedeterminó que 53% de los
entrevistados tiene una imagen positiva del gobierno de turno. Calcular el
intervalo de confianza al 95% para la proporción de todos los adultos de la
ciudad que tienen una imagen positiva del gobierno actual.
Solución
Del ejemplo anterior sabemos que n = 871, pˆ= 0.53 y 1 − α = 0.95.

Reemplazando en el intervalo de confianza de la proporción:
.
√ p^(1 − p^)
p^±z α/2
n
.
0.53 × 0.47
0.53 ± 1.96× √
871
Entonces, el intervalo de confianza al 95% resulta: (52,94%; 53,06%).
Para pensar...
¿Quépasarácon el margen de error (aumentaráo disminuirá) si...
aumento el tamaño de la muestra (n)?
tomo otra muestra de igual tamaño, pero con mayor dispersión (S)?
trabajo con un mayor nivel de confianza (1 − α)?

CONTENIDO
Regresión Simple.
Motivacion
Una parte muy útil de la estadísticason las pruebas de hipótesis.
Una hipótesis estadísticaesuna afirmación respecto a alguna característica

desconocida de una población (generalmente parámetros como la media o la
proporción). Ejemplos:
Un legislador afirma que el ingreso medio de la población esde al
menos $8000 mensuales.
La proporción de ciudadanos dispuestos a seguir apoyando al gobierno de
turno en las próximas elecciones esdel 65%.
Buscamos evaluar estashipótesis para decidir si la afirmación se
encuentra apoyada por la evidencia que seobtiene a través de una
muestra.
Motivacion
Entonces, las pruebas de hipótesis serealizan respecto a los parámetros

poblacionales. Utilizamos información muestral para evaluar si la evidencia
empírica valida dichashipótesis.
Veremos pruebas de hipótesis respecto de:

Media poblacional (µ)
Proporción poblacional (p)
Para ello, esnecesario introducir primero algunos conceptos básicos...

Algunos conceptos básicos
HipótesisNula: H0
HipótesisAlternativa: H1
Posibles decisiones que pueden tomarse respecto a la hipótesis nula:
Decisión respecto a la H0
Rechazar No rechazar
α decisión correcta
verdadera
Error de Tipo I 1 −α
decisión correcta β
falsa
potencia = 1 −β Error de Tipo II
No pueden cometerse ambos errores a la misma vez.

Generalmente se achica uno, pero se agranda el otro.
Entonces sefija α en1%, 5% y 10%.
Prueba de Hipótesis para la Media (µ)
Al igual que en la construcción de intervalos de confianza, hay dos casos

posibles:
Caso 1: con varianza poblacional conocida. El estadísticode contraste a

utilizar será:
X −µ0
Z= ∼ N(0, 1)
σ/√ n
Caso 2: con varianza poblacional desconocida. El estadísticode
contraste a utilizar será:

X −µ0
T = ∼ tn−1
S/√ n
Algunos conceptos básicos
Definicion
Una prueba de hipótesis con respecto a una característica desconocida de
cualquier población esuna regla para decidir si serechaza o no la hipótesis
nula.
La decisión se basa en un estadístico que depende solo de

información muestral.
Para ciertos valores de esteestadísticola decisión serárechazar la
hipótesis nula.
Estos valores seconocen como los valores críticos y determinan una
región crítica.
Estructura de una prueba de hipótesis
(1) Formulación de la hipótesis acontrastar.
(2)Establecer el nivel de significación del test ( α).
(3)Cálculo del estadísticode contraste.
(4)Regla de decisión.
(5)Conclusión
Regiones críticas
Si la hipótesis nula sobre el parámetro de interés θ(p. ej., µ o p) es:
H0 : θ = θ0
y si la hipótesis alternativa es de la forma,
H1 : θ> θ0 o H1 : θ < θ0
se dice que esuna hipótesis alternativa unilateral. La región crítica

también recibe el nombre de región de rechazounilateral.
De otro modo, debe establecerse una hipótesis alternativa bilateral:
H1 : θ ƒ= θ0
Una hipótesis alternativa bilateral implica la existencia de una región crítica

bilateral (la cual es simétrica: las dos partes de la región se seleccionan de tal
forma queel áreabajo la curva decadauna de las regiones sea igual).
Regiones críticas
Si α = 0.05, las regiones de rechazo en cada caso estarándadas por:
Prueba de Hipótesis para la Media (µ)
¿Cómodeterminamos si se puede rechazar o no la hipótesis nula?
Hay dos formaalternativas:

1 Calcular el valor del estadísticode contraste (Z o T ) y compararlo
contra el valor crítico (de tabla de la normal estándaro de la t de

Student).
2 Calcular el p-valor y compararlo contra el α (1%, 5% o 10%).

Prueba de Hipótesis para la Media - Caso 1 (Z)
Ejemplo
Sesabe que, históricamente, los precios de una determinada canasta de
productos sedistribuyen normalmente con media $1780 y un desvío estándar
de $110. Este año,una muestra de 40 observacionesproporciónóun precio
promedio de $1900. Con un nivel de significación del 5%, ¿se puede afirmar
que el precio medio de estos productos esmenor o igual que el precio medio
histórico? (Asuma que σ = 110).
H0 : µ ≤1780
H1 : µ > 1780(inflación)
1900 −1780
Z= = 6.899
110/√ 40
zα = 1.645.
Entonces, con un nivel de confianza del 95% se rechaza la hipótesisnula, esdecir, el

precio medio de los productos sería mayor que el precio medio histórico.
Prueba de Hipótesis para la Media
En el ejemplo de reciéncomparamos el valor del estadísticocontra el
valor crítico (de la tabla de la normal estándar) para rechazar H0.
Alternativamente, se puede usar el criterio del p-valor (¡muy útil

cuando trabajamos con softwares!)
El p-valor
Definicion
El p-valor es el nivel de significatividad más pequeño a partir del cual la
hipótesis nula puede ser rechazada. En otras palabras, es la zona crítica que
correspondería al valor del estadístico.
Supongamosotro ejemplo con las siguientes hipótesis:

H0: µ ≤ µ0
H1: µ > µ0
X −µ
El estadístico es: Z= √0
σ/ n
= 1.52
En la tabla de la distribución normal, podemos encontrar que si Z α fuese

1.52, entonces α = 0.0643. Este esentonces el p-valor del test, que
implica que la H0 se puede rechazar para cualquier α mayor a 6,43%.
Regla de rechazo: si p-valor< α ⇒ rechazo H0.
Prueba de Hipótesis para la Media - Caso 2 (T)
Aplicación en Excel:
Vuelva a trabajar sobre la base de datos de Excel que utilizó en el
Módulo 1 en la cual calculó el retorno diario de IBM entre el 4 de
enerode2016 y 22 de julio de 2016.
Utilice nuevamente el complemento de Excel “Herramientas para
análisis”, pero esta vez se le pide que evalúe la validez empírica de la
siguiente hipótesis:
“El retorno medio diaria de IBM esde al menos 1%.”
En este caso, la hipótesis a contrastares:
H0 : µ ≥1%
H1 : µ < 1%
Prueba de Hipótesis para la Proporción (p)
Si estamos interesados en formular una prueba de hipótesis respecto de la

proporción poblacional (p):
H0: p = p0
H1: p =ƒ p0
El estadístico de contraste que usamos es:
P^ −p 0
Z = . ∼ N(0, 1)
^ (1−P^ )
P
n
Procederemos en forma análogaal caso de la media para decidir si hay

evidencia suficiente para rechazar o no la hipótesis nula.
Prueba de Hipótesis para la Proporción (p)
Ejemplo
En una encuesta realizada sobre 871 adultos, el 53% de los entrevistados
estuvieron a favor de un apoyo decidido al gobierno. Con una confianza del
95%, ¿se podría asegurar que la mayoría de los adultos de dicha ciudad est´áno
estáa favor de un apoyo decidido del gobierno?
H0 : p ≤ 0.5
H1 : p > 0.5 (apoyo decidido al gobierno)
0.53 −0.5
Z = . = 1.77
0.53×0.47
871
zα = z0.05 = 1.645
Entonces, con un nivel de confianza del 95% se rechaza la hipótesis nula. Es
decir, hay evidencia estadísticaa favor de un apoyo decidido del gobierno.
CONTENIDO
Regresión Simple.
Análisis de Correlación
Un análisis de correlación expresa la relación entre dos variables

utilizando un único número.
El coeficiente de correlación esuna medida de asociación lineal entre dos

variables.
El coeficiente de correlación nos da una pauta de cuál alineada estála

nube de puntos (gráfico de dispersión) entorno a una recta.
Pero no no dice cuál esesarelación (función), ni puede capturar

relaciones no lineales.
Análisis de Correlación
Fitting line
Utilice la base de datos enExcel: v en t a s . x l s que contiene datos de

ventas e inversiónenpublicidad de una compan˜´ıaentre 1993 y 2007.
Compruebe que el coeficiente de correlación da0.904.
Construya un gráfico de dispersión entre las ventas y los gastos de

publicidad.
Prediga cuántoespera vender el próximo añossi va a gastar 10 mil en

publicidad.
Modelo lineal
Asume:
yi = β0 + β1X i + εi
y : variable dependiente o explicada

X : variable explicativa o regresor
β0 y β1: parámetros desconocidos ε:
error aleatorio
El problema entonces es estimar los parámetros (β0 y β1) basados en
datos de una muestra. Veremos el meétodo de estimación de mínimos
cuadrados ordinarios.
Mínimos Cuadrados Ordinarios (MCO)
Busca aproximar esta relación con nuestras observacionesde forma de:
minimizar la suma de los residuos al cuadrado ( iei ),2 o
que la nube de puntos esté lo más cerca posible de la rectaestimada
Los estimadores MCO
A través de dicha minimización se obtiene la fórmuladel estimadorde la

constante y la pendiente:
Σ (X −X )(Y −Y ) S XY
β^1= Σ =
( X −X )2 S X2
β^0= Y − β^1.X
Interpretación de las estimaciones
¿Qué nosdicen los valores de los coeficiente que obtuvimos?
β^0 esel efecto autónomo (cuando la variable explicativa escero).

Es decir, el valor medio de la variable dependiente.
β^1 esel efecto parcial, esto es, indica cómocambia la variable

explicada cuando la explicativa cambia en una unidad.
En nuestro ejemplo:
yî= 79,324 + 102,59x
Bondad del Ajuste
Una vez estimado el modelo nos interesa saber:

¿Quéporcentaje de la variabilidad en y estásiendo explicada por
X ? ¿Son las observaciones cercanas a la recta estimada?
Para responder a estaspreguntas podemos calcular el R 2 o coeficiente de

determinación.
El R 2
Es la medida másutilizada, pero no la únicay secalcula como la fracción

de la varianza muestral de y que estásiendo explicada por X .
Σ (yî − y) 2 Σ ei2
R2 = = 1−
Σ (yi − y ) 2
Σ
(yi − y ) 2
El R 2 indica quéproporción de la variabilidad total estásiendo

explicada por el modelo.
Está acotadaentre 0 y 1. En nuestro ejemplo: R 2 = 0.82.
En el caso de la regresión simple, R 2 = ρ2 . XY

Inferencia estadística
Para hacer inferencia estadísticaenel contexto de regresión necesitamos

conocer la distribución de los estimadores de MCO (βˆ0 y βˆ1).
Para ello, necesitamoshacer los siguientes supuestos:

Supuesto 1: la distribución condicional de εi dado X i tiene media
cero.
Supuesto 2: (X i , Y i ), i = 1, ..., n son IID a través de las
observaciones.
Supuesto 3: los outliers son poco probables.
Supuestos clásicos
Bajo estos supuestos y mediante el TCL, se puede probar que:

2
. Σ Xi
β^0 ∼ N β0, σε2
n (X i − X )2
. Σ Σ
1
β^1 ∼ N β1, σ ε2
(X − X ) 2
Σ i
Noten que en realidad las varianzas del estimador MCO son desconocidas
por no se conoce σ2.ε
Pero como vimos antes, se puede estimar con:
2 Σ ε2
Sε =
n −2
Inferencia estadística
Test de significatividad individual:
H0 : β1 = 0
H1 : β1 ƒ= 0
Estadı́stico:
βˆ1
t= ∼t n− 2
ˆ 1)
SE (β
Intervalos de confianza: βˆ1± tc .SE (βˆ1)


0 Estadistica 7 - 12 Final

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

0 Estadistica 7 - 12 Final

Încărcat de

Drepturi de autor:

Formate disponibile

Sesiones 7 - 8

MBA Juan Carlos Orellano

A continuación se muestran datos del sueldo anual (medido en miles de

¿Cu´alesla media, la mediana y la moda de esos datos ?

Función en Excel: =PROMEDIO()

Ordenando los datos de nuestro ejemplo en forma ascendente:

Esto esasísi la cantidad de observaciones esimpar (p. ej., n = 7). ¿Qué

Supongamos que contamos con solamente las siguientes 6 observaciones:

Tanto el dato 33 como 34 ocupan la posición central. En estos casos, la

En el ejemplo de los siete sueldos de los contadores vimos que:

¿Qu´epasa con la media y la mediana?

La media es muy sensible a la presencia de valores extremos,

En estos casos, la mediana puede ser preferible a la media como

La moda esrelevante solamente en algunos casos ya que puede que:

Función en Excel: =MODA()

Medida Pro Contra

Es un promedio de los valores de una serie temporal para un período de

Bajar de Yahoo Finance (www.finance.yahoo.com) el precio de cierre

Calcular las principales medidas de tendencia central (media, mediana y

Calcular la media móvil simple de 20 períodosy graficar.

Imaginemos que queremos comparar la cantidad de llamadas recibidas en

Trimestre 2011 2012

La media y la mediana son las mismas en 2011 y 2012,

Dado que estamos interesados en analizar la dispersión de los valores,

Una forma sencilla de volver a las unidades de medida originales es

Esto seconoce como la desviación estándar (S):

Bajar de Yahoo Finance (finance.yahoo.com) el precio de cierre ajustado

Compute el retorno diario de cadaacción a través de la siguiente

¿Cuálde los dos retornos tiene una mayordispersión?

En la práctica, la mayor parte de los conjuntos de datos contienen

Muchas veces, no solo serepresentan los datos en forma agrupada

Es decir, es más probable que una persona en una encuesta conteste

Ingresos Nro de individuos

El paréntesisexcluye el valor y el corchete incluye el valor.

Ingresos Frecuencia Frec. Acumulada

Un histograma sirve para:

La distribución de los datos puede ser simétrica o asimétrica.

Cuando la distribución es:

Bajar de Yahoo Finance (finance.yahoo.com) el precio de cierre ajustado

Compute el retorno diario de Intel a través de la siguientefórmula:

Genere una tabla de frecuencias y grafique el histograma.

Hasta ahora hemos discutido cómo utilizar las medidas de tendencia

También estamos interesados en medir la fuerza de la relación entre dos

En cada eje (X e Y ) se pone una variable y cada punto corresponde a una

Intenta medir cuánasociadas (linealmente) están dos variables.

Para calcular el coeficiente de correlación (rXY ) necesitamos calcular la

Libre de unidades de medida.

Invariante al cambio de unidades (p. ej., si paso se medir X en miles de

−1 ≤ r ≤ 1, ya que estánormalizado por los desvíos.

Su signo estádado por el signo de la covarianza.

Mide dependencia lineal, si los datos (X i , Y i ) tienden a caer sobre una

Cuantifica la fuerza de la relación, pero no la forma de la recta (su

Bajar de Yahoo Finance (finance.yahoo.com) el precio de cierre

Compute el retorno diario de cada una de estas acciones a travésde la

Utilice el complemento de Excel “Herramienta para análisis” para

Experimento: sacar una carta de un mazo de cartas (52 cartas).

Evento A: sacar un as.

Sea A un evento y Ω el espacio muestral, una medida de probabilidad

(c) Si A y B son eventos mutuamente excluyentes,

(a) y (b) implican que 0 ≤ P(A) ≤ 1

Para todo evento A, 0 ≤ P(A) ≤1

A, B eventos en Ω (A, B ⊆ Ω), si B ⊆ A, entonces P(B) ≤ P(A)

P(A ∪B) = P(A) + P(B) −P(A ∩B)

Si los eventos (conjuntos) son disjuntos (mutuamente excluyentes):