Documente Academic
Documente Profesional
Documente Cultură
Conceptos Preliminares
Universidad de Córdoba
Montería
Agosto de 2020
Introducción
Introducción
I Estadísticas descriptivas:
Organización de datos
I Estadísticas descriptivas:
I Los conjuntos de datos generalmente son voluminosos.
Organización de datos
I Estadísticas descriptivas:
I Los conjuntos de datos generalmente son voluminosos.
I Esto es un serio obstáculo para extraer información
relevante visualmente.
Organización de datos
I Estadísticas descriptivas:
I Los conjuntos de datos generalmente son voluminosos.
I Esto es un serio obstáculo para extraer información
relevante visualmente.
I Mucha de la información contenida en X puede ser evaluada
por medio de medidas que describen cuantitativamente
ciertas características de los datos: localización, dispersión,
correlación, simetría, curtosis.
Estadísticas descriptivas
Interpretación:
Estadísticas descriptivas
Interpretación:
I sik > 0 indica una asociación lineal positiva entre las
variables xi y xk .
Estadísticas descriptivas
Interpretación:
I sik > 0 indica una asociación lineal positiva entre las
variables xi y xk .
I sik < 0 indica una asociación lineal negativa entre las
variables xi y xk .
Estadísticas descriptivas
Interpretación:
I sik > 0 indica una asociación lineal positiva entre las
variables xi y xk .
I sik < 0 indica una asociación lineal negativa entre las
variables xi y xk .
I sik = 0 indica que no hay asociación lineal entre las
variables xi y xk .
Estadísticas descriptivas
I Correlación muestral: Es otra medida de asociación
lineal.
Estadísticas descriptivas
I Correlación muestral: Es otra medida de asociación
lineal.
sik
rik = √ √ .
sii skk
Estadísticas descriptivas
I Correlación muestral: Es otra medida de asociación
lineal.
sik
rik = √ √ .
sii skk
Propiedades
Estadísticas descriptivas
I Correlación muestral: Es otra medida de asociación
lineal.
sik
rik = √ √ .
sii skk
Propiedades
1. −1 ≤ rik ≤ 1
Estadísticas descriptivas
I Correlación muestral: Es otra medida de asociación
lineal.
sik
rik = √ √ .
sii skk
Propiedades
1. −1 ≤ rik ≤ 1
2. Considere las versiones estandarizadas de las variables xi y
xk
xji − xi x − xk
zji = √ y zjk = jk
√ ,
sii skk
entonces rik es la covarianza muestral entre zik y zjk .
Estadísticas descriptivas
I Correlación muestral: Es otra medida de asociación
lineal.
sik
rik = √ √ .
sii skk
Propiedades
1. −1 ≤ rik ≤ 1
2. Considere las versiones estandarizadas de las variables xi y
xk
xji − xi x − xk
zji = √ y zjk = jk
√ ,
sii skk
entonces rik es la covarianza muestral entre zik y zjk .
3. sik y rik solo informan sobre la existencia o no de una
asociación lineal.
Estadísticas descriptivas
I Correlación muestral: Es otra medida de asociación
lineal.
sik
rik = √ √ .
sii skk
Propiedades
1. −1 ≤ rik ≤ 1
2. Considere las versiones estandarizadas de las variables xi y
xk
xji − xi x − xk
zji = √ y zjk = jk
√ ,
sii skk
entonces rik es la covarianza muestral entre zik y zjk .
3. sik y rik solo informan sobre la existencia o no de una
asociación lineal.
4. sik y rik son sensibles a la existencia de datos atípicos
(outliers).
Arreglos basados en estadísticas descriptivas
Arreglos basados en estadísticas descriptivas
rp1 rp2 . . . 1
Arreglos basados en estadísticas descriptivas
rp1 rp2 . . . 1
R también es una matriz simétrica
Ejemplo 1
Variable 1 42 52 48 58
Variable 2 4 5 4 3
Solución
s11 s21
S=
s12 s22
Ejemplo 1
n
1X
s11 = (xj1 − x1 )2
4
j=1
1h i
= (42 − 50)2 + (52 − 50)2 + (48 − 50)2 + (50 − 50)2 = 34
4
n
1X
s22 = (xj2 − x2 )2
4
j=1
1h i
= (4 − 4)2 + (5 − 4)2 + (4 − 4)2 + (3 − 4)2 = 0,5
4
n
1X
s12 = (xj1 − x1 ) (xj2 − x2 )
4
j=1
1
= [(42 − 50) (4 − 4) + (52 − 50)
4
+ (48 − 50) (4 − 4) + (50 − 50) (3 − 4)] = −1, 5
s21 = s12
Ejemplo 1