Documente Academic
Documente Profesional
Documente Cultură
Estadística: Definición.
Medidas de Tendencia Central.
Medidas de Dispersión.
Datos agrupados ( Frecuencias).
Relación entre variables.
Estadística
Definicion
La estadística es una rama de las matemáticas que se ocupa de la obtención,
orden y análisis de un conjunto de datos con el fin de obtener explicaciones y
predicciones sobre fenómenos observados.
A tomar en cuenta:
Estadística Descriptiva.
Estadística Inferencial.
Datos e información
Medidas de Tendencia Central
Definición
Las medidas de tendencia central son medidas estadísticasque buscan
resumir en un sólovalor el centro de la distribución de un conjunto de datos.
Principales medidas:
Media
Mediana
Moda
Ejemplo
35 31 33 36 34 34 33
Definición
El promedio o media muestral (cuando los datos provienen de una
muestra) esla suma de los valores del conjunto dividida por el número
total de observaciones (tamaño de la muestra,n)
Es decir: Σ
X 1 + X 2 + ...+ X n n i
=1 Xi
X = =
n n
En nuestroejemplo:
35 + 31 + 33 + 36 + 34 + 34 + 33
X = = 33.7 ∼=34
7
Definición
La mediana esla observación que ocupa el lugar central cuando todas las
observacionesestán ordenadas en sentido ascendente (odescendente).
31 33 33 34 34 35 36
La mediana es 34.
Funci´on en Excel: =MEDIANA()
31 33 33 34 34 35
31 33 33 34 34 35 105
Definicion
La moda (o el modo) esel valor másfrecuente dentro del conjunto de
observaciones.
35 31 33 36 34 34 33
Usos:
Indices bursátiles
Portafolios
Algunas calificaciones
Media móvil
Estadística: Definición.
Medidas de Tendencia Central.
Medidas de Dispersión.
Datos agrupados ( Frecuencias).
Relación entre variables.
Medidas de Dispersión
Si nos limitáramos solamente a fijarnos en las medidas de tendencia central,
no tendríamos una idea acabada de cómo sedistribuyen los datos.
Definicion
Las medidas de dispersión son medidas estadísticasque muestran la
variabilidad en la distribución de los datos.
Principales medidas:
Varianzay desviaciónestándar
Coeficiente de variación
Rango y rango intercuartil
La varianza
Contador X X −X (X − X )2
1 35 (35-33.7)=1.3 1.69
2 31 (31-33.7)=-2.7 7.29
3 33 (33-33.7)=-0.7 0.49
4 36 (36-33.7)=2.3 5.29
5 34 (34-33.7)=0.3 0.09
6 34 (34-33.7)=0.3 0.09
7 35 (35-33.7)=-0.7 0.49
Suma 236 0 15.43
La varianza (S 2 ) resulta:
Σ n i
(X i − X )2
=1 15.43
S =
2
= = 2.6
n −1 6
Cuando n > 30, se divide por n en vez de n − 1.
La desviación Estandar
Si bien la varianza esuna medida de dispersión, resulta difícil de
interpretar. ¡Las unidades quedan elevadas al cuadrado!
. .
n i
√ Σ (X i − X )2 15.43
S = S2 = =1
= = √ 2.6 = 1.61
n −1 6
El coeficiente de variación
Es una medida de dispersión que se utiliza fundamentalmente para
comparar la variabilidad entre dos o másconjuntos de datos con
distintas unidades de medida o distintas medias.
El coeficiente de variación (CV) se definecomo:
CV = S
X
Se puede multiplicar por 100 para expresarlo entérminosporcentuales.
Ejemplo
¿Enquécaso hay másdispersión?
Aplicación en Excel
Estadística: Definición.
Medidas de Tendencia Central.
Medidas de Dispersión.
Datos agrupados ( Frecuencias).
Relación entre variables.
Datos agrupados o Frecuencias
Definicion
La frecuencia acumulada esel númerototal de observaciones que hay en ese
intervalo y en los anteriores.
¿Qu´eobserva?
CONTENIDO
Estadística: Definición.
Medidas de Tendencia Central.
Medidas de Dispersión.
Datos agrupados ( Frecuencias).
Relación entre variables.
Relaciones entre variables
donde,
S XY esla covarianza entre X eY
S X es la desviación estándar deX
S Y es la desviación estándar deY
En Excel: =COEF.DE.CORREL()
Covarianza
Fuente: tylervigen.com
Aplicación en Excel
¿Quéobserva?
Sesiones 9 - 10
MBA Juan Carlos Orellano
CONTENIDO
Definiendo probabilidades.
Arboles de decisión.
Variables aliatorias.
Distribución Binomial y Distribución
Normal.
Definiendo la probabilidad ( *)
La probabilidad esun conceptoteóricoy no necesariamente tiene
que coincidir con la frecuencia observada
Definición clásica(frecuentista)
Definicion
La probabilidad de cualquier resultado de un experimento aleatorio esla
proporción de veces que el resultado se da despuésde una larga serie de
repeticiones del experimento.
Experimento aleatorio
Resultados
Espacio muestral (Ω): conjunto que contiene todos los posibles
resultados de un experimento aleatorio.
Evento: subconjunto de Ω.
Ejemplo
¿Cuálesla P(A)?
Axiomas de probabilidad
(a) P(A) ≥ 0, ∀A ⊆ Ω
(b) P(Ω) = 1
P(A) = 1 − P(A c )
P(Ø) = 0
Ejemplo
Tirar un dado, A: divisibles por 2, B: divisibles por 4
Claramente B ⊂ A, entonces P(B) = 1/6 ≤ P(A) = 1/2
Diagrama de Venn
Unión de doseventos
P(A ∩ B) = 0
Definiendo probabilidades.
Arboles de decisión.
Variables aliatorias.
Distribución Binomial y Distribución Normal.
Probabilidad incondicional, condicional y conjunta
Probabilidad y valor esperado
¿Fertilizo ono?
Arbolesde Decisiones
Definiendo probabilidades.
Arboles de decisión.
Variables aliatorias.
Distribución Binomial y Distribución Normal.
Variable aleatoria
Definicion
Una variable aleatoria esuna variable que toma valores numéricos
determinados por el resultado de un experimento que tiene asociado una
probabilidad.
Ejemplo
Se tira una moneda al aire tres veces (experimento), definimos X (variable
aleatoria) como “el númerode caras obtenidas”. Entonces X es una variable
aleatoria que puede tomar los siguientes valores (x ): 0, 1, 2y
3. Cada uno de esos valores va a tener una probabilidad asociada.
X P(X = x )
0 1/8=0,125
1 3/8=0,375
2 3/8=0,375
3 1/8=0,125
Tipos de variables aleatorias
Volviendo a las variables aleatorias
Ejemplo
Se tira un dado. X = variable aleatoria que indica el númeroresultante. Si el
dado esequilibrado, P(X = 1) = ... = P(X = 6) = 1/6,entonces su
función de probabilidad será:
P(X = x) = 1/6 para x = 1,2,3,...,6
Definicion
El valor esperado (o esperanzamatemática) esuna medida de lo que
ocurre con másfrecuencia o en promedio.
¿Cuálesel valoresperado?
Ejemplo
X =cantidad de autos que compra una familia en el lapso de 5 años.
Supongamos que conocemos la probabilidad asociada a cadax :
Propiedades de la esperanza
Ahora, supongamos que todos los jefes de hogar reciben un incremento del
20% en su salario, mientras que sus cónyuges una suma fija de $2000.
¿Cuálesel valor esperado del nuevo ingreso mensual del hogar (jefe +
cónyuge)?
Σ
σ2 = V (X ) = E[(X − µ)2] = i (x − µ)2p(x )
Es mayor cuanto más lejos estén los x de la media, y cuanto mayor sea
el peso (probabilidad de ocurrencia) de esosvalores.
Entonces, σ2 = 2, 02 y σ = 1,42.
Propiedades de la varianza - Creer o reventar
Ahora, supongamos que todos los jefes de hogar reciben un incremento del
20% en su salario, mientras que sus cónyuges una suma fija de $2000.
¿Cuálesel el desvío estándar del nuevo ingreso mensual del hogar (jefe +
cónyuge)? Asuma que el ingreso del jefe de hogar esindependiente del de su
cónyuge
Cov(X, Y )
ρX,Y =
σXσY
Definiendo probabilidades.
Arboles de decisión.
Variables aliatorias.
Distribución Binomial y Distribución Normal.
Distribuciones
Definicion
Una distribución de probabilidad esuna función que asigna una
probabilidad a cada posible valor de una variable aleatoria.
Ejemplo
Se lanzaráuna moneda tres veces, ¿cuál esla probabilidad de sacar
exactamente una cara?
(a)0.125
(b)0.250
(c)0.333
(d)0.375
(e)0.500
Probabilidades Binomiales
Llamemos H al evento de sacar cara y T al evento de sacar ceca. Vimos
que hay 8 resultados posibles: HHH, HHT, HTH, THH, HTT, THT,
TTH, TTT.
Hay 3 resultados con exactamente una cara: HTT, THT y TTH.
P(sólo 1 cara)=3/8=0.375
Definicion
Si Z esuna variable aleatoria normal con media 0 y varianza 1; esto es, Z
∼ N(0, 1). Entonces Z sedice que sigue una distribución normal
estándar.
Esta tabla nos arroja las probabilidades de que Z sea menor o igual
a un valor dado z : P(Z ≤ z ) = F (z ).
P(X <?) = p
Soluci´on:
Tipo 1: P(X < 75) =? ← =DISTR.NORM(75,100,25,VERDADERO)
Tipo 2: P(X <?) = 0, 95 ← =+DISTR.NORM.INV(0.95,100,25)
Valor en Riesgo (Value at Risk) - VaR
Ejemplo
Las ventas diarias de mi empresa siguen una distribución normal con una
media de 234 millones de pesos y un desvío de 128 millones de pesos.
Calcular el VaR al 5%. ¿Cómoseinterpreta?
Distribuciones muestrales.
Intervalos de confianza.
Pruebas de hipótesis.
Regresión Simple.
Estimadores puntuales
Definicion
Un estadístico esuna función de la información muestral. La elección del
estadísticoadecuadodependeráencuál esel parámetro poblacional de interés.
Estimadores puntuales
Parámetro Estimador
Σ
Xi
µ X = i
n
Muestral Poblacional
Frecuencia Probabilidad
Histograma Distribución deprobabilidades
Media muestral (X ) Media poblacional (µ)
Varianza muestral (S 2 ) Varianza poblacional (σ2)
Proporción muestral (pˆ) Proporción poblacional (p)
Covarianza muestral (S XY ) Covarianza (COV(X,Y) o σXY )
Coeficiente de correlación (rXY ) Coeficiente de correlación (ρXY )
Distribuciones muestrales
Definicion
Una distribución muestral esla distribución de probabilidad de un estadístico.
muestral (X )...
Media muestral (X )
. Σi Xi 1 1
E (X ) = E = Σ X i = nµ = µ
E
n n n
.i Σ
Xi 1 1
V (X ) = V . Σ i = 2 V Σ X i = 2 nσ2= σ 2/n
n n i n
Entonces, X tiene:
E (X ) = µ
σ2
V (X ) =
n
El desvío estándar será:
σ
σX = √
n
que en algunas ocasiones recibe el nombre de error estándar de la media
(porque esun estimador).
El “n” importa
A medida que n aumenta, σX disminuye:
Distribución muestral de lamedia
Un famoso teorema matemático (el teorema central del límite) mostró que
si el tamaño de la muestra esconsiderablemente grande, entonces la
distribución de la media muestral (de n variables aleatorias IID) se aproxima
a una distribución normal, aunque la población no fuera normal.
Ley de los Grandes Números: Si X1, X2, ... son variables aleatorias
independientes idénticamente distribuidas (IID), cada una con media E
(X ) = µ. Entonces,
Σ
Xi
X = i
n → µ cuando n → ∞
La ley de los grandesnúmeros
Ejemplo
Simulamos un experimento en el que arrojamos una moneda.
Sabemos que la probabilidad de que salga cara o ceca es1/2, la siguiente
tabla muestra c´omola probabilidad se acerca a 0.5 a medida que
aumentamos la cantidad de repeticiones del experimento:
X
pˆ=
n
Al igual que con la media muestral, la proporción muestral esun
estadísticoy por lo tanto tendrá asociado una distribución.
Distribución muestral de la proporción muestral
E (X ) = np V (X ) = np(1 −p)
Entonces:
X X p(1 −p)
E (pˆ) = E = p V (pˆ) = V =
n n n
Distribuciones muestrales.
Intervalos de confianza.
Pruebas de hipótesis.
Regresión Simple.
Precisión del estimador puntual
Prácticamente ¡CERO!
¿Puedo saber “más o menos” en quérango seencontraría el
verdadero valor de la media?
Sí a través de la construcción de intervalos de confianza.
Motivacion
Definicion
Un intervalo de confianza esun rango de valores que se determina en
base a información muestral, en el cual esprobable que el parámetro
poblacional esté contenido.
Estructura de los intervalos de confianza
La proporción poblacional(p):
pˆ±margen deerror
Intervalos de confianza para la media (µ)
X ±zα/2σ/√ n
t = X −µ
S /√ n
X ± tn−1,α/2S/√ n
Distribución t de Student
Caso 1 (Z): con varianza poblacional conocida
Ejemplo
Se conoce, de estudios anteriores, que el costo variable de construcción de
determinado tipo de vivienda prefabricada, por metro cuadrado, se distribuye
normalmente con un desvío estándarde $135. Setomóuna muestra aleatoria
de 12 viviendas con las que se calculó un costo variable promedio de $1440.
Soluci´on:
Sabemos que σ = 135, n = 12, X = 1440 y 1 − α = 0.95. Entonces,
X ± zα/2σ/ √ n
1440 ± 1.96 × 135/ √ 12
Aplicaci´on en Excel:
Vuelva a trabajar sobre la base de datos de Excel que se utilizó en el
Módulo 1 en la cual calculó el retorno diario de IBM entre el 4 de
enerode2016 y 22 de julio de 2016.
Utilice nuevamente el complemento de Excel “Herramientas para
análisis”, pero esta vez calcule el intervalo de confianza al 95% del
retorno medio diario de IBM.
¿Y cuál esel intervalo de confianza al 99%?
Intervalos de confianza para la proporción (p)
p^(1 − p^)
p^±z α/2 √
n
Ejemplo
Una encuesta realizada a cabo en el mes pasado en una ciudad, se entrevistóa
871 adultos. Con respecto a una pregunta dada, sedeterminó que 53% de los
entrevistados tiene una imagen positiva del gobierno de turno. Calcular el
intervalo de confianza al 95% para la proporción de todos los adultos de la
ciudad que tienen una imagen positiva del gobierno actual.
Solución
tomo otra muestra de igual tamaño, pero con mayor dispersión (S)?
Distribuciones muestrales.
Intervalos de confianza.
Pruebas de hipótesis.
Regresión Simple.
Motivacion
HipótesisNula: H0
HipótesisAlternativa: H1
Posibles decisiones que pueden tomarse respecto a la hipótesis nula:
Decisión respecto a la H0
Rechazar No rechazar
α decisión correcta
verdadera
Error de Tipo I 1 −α
decisión correcta β
falsa
potencia = 1 −β Error de Tipo II
Definicion
Una prueba de hipótesis con respecto a una característica desconocida de
cualquier población esuna regla para decidir si serechaza o no la hipótesis
nula.
(4)Regla de decisión.
(5)Conclusión
Regiones críticas
Si la hipótesis nula sobre el parámetro de interés θ(p. ej., µ o p) es:
H0 : θ = θ0
H1 : θ> θ0 o H1 : θ < θ0
H1 : θ ƒ= θ0
1900 −1780
Z= = 6.899
110/√ 40
zα = 1.645.
Definicion
El p-valor es el nivel de significatividad más pequeño a partir del cual la
hipótesis nula puede ser rechazada. En otras palabras, es la zona crítica que
correspondería al valor del estadístico.
X −µ
El estadístico es: Z= √0
σ/ n
= 1.52
Aplicación en Excel:
Vuelva a trabajar sobre la base de datos de Excel que utilizó en el
Módulo 1 en la cual calculó el retorno diario de IBM entre el 4 de
enerode2016 y 22 de julio de 2016.
Utilice nuevamente el complemento de Excel “Herramientas para
análisis”, pero esta vez se le pide que evalúe la validez empírica de la
siguiente hipótesis:
“El retorno medio diaria de IBM esde al menos 1%.”
En este caso, la hipótesis a contrastares:
H0 : µ ≥1%
H1 : µ < 1%
Prueba de Hipótesis para la Proporción (p)
H0: p = p0
H1: p =ƒ p0
P^ −p 0
Z = . ∼ N(0, 1)
^ (1−P^ )
P
n
H0 : p ≤ 0.5
H1 : p > 0.5 (apoyo decidido al gobierno)
0.53 −0.5
Z = . = 1.77
0.53×0.47
871
zα = z0.05 = 1.645
Entonces, con un nivel de confianza del 95% se rechaza la hipótesis nula. Es
decir, hay evidencia estadísticaa favor de un apoyo decidido del gobierno.
CONTENIDO
Distribuciones muestrales.
Intervalos de confianza.
Pruebas de hipótesis.
Regresión Simple.
Análisis de Correlación
Asume:
yi = β0 + β1X i + εi
Σ (X −X )(Y −Y ) S XY
β^1= Σ =
( X −X )2 S X2
β^0= Y − β^1.X
Interpretación de las estimaciones
En nuestro ejemplo:
yˆi= 79,324 + 102,59x
Bondad del Ajuste
Σ (y^i − y) 2 Σ ei2
R2 = = 1−
Σ (yi − y ) 2
Σ
(yi − y ) 2
2 Σ ε2
Sε =
n −2
Inferencia estadística
H0 : β1 = 0
H1 : β1 ƒ= 0
Estadı́stico:
βˆ1
t= ∼t n− 2
ˆ 1)
SE (β