Documente Academic
Documente Profesional
Documente Cultură
Distancia Estadstica.
La nocin de distancia estadstica junto con sus propiedades constituyen una
importante herramienta, tanto en la estadstica matemtica como en el anlisis de
datos. En el primer caso porque mediante una distancia se pueden construir
contrastes de hiptesis, estudiar propiedades asintticas de estimadores,
comparar parmetros, etc. En el segundo caso, porque fa distancia es un
concepto muy intuitivo, que permite obtener representaciones geomtricas, fciles
de entender, ofreciendo al investigador una importante ayuda para interpretar la
estructura de los datos.
Consideramos dos clases de distancias estadsticas entre individuos y
poblaciones:
1.- Los n individuos de una poblacin quedan descritos por una Matriz de datos
X(n x p), donde p es el nmero de variables estadsticas (cuantitativas,
cualitativas, binarias o categricas. EI nmero n suele ser el tamao de una
muestra de la poblacin (ejemplo: n= 75 estudiantes universitarios}, pero puede
darse el caso de que Sl sea una poblacin finita de n elementos
2.- Los individuos de cada poblacin estn caracterizados por un vector aleatorio
X=(X,, ..., XP}, que sigue una distribucin de probabilidad . La distancia entre dos
individuos i,j, caracterizados por los puntos x;,xj de Rp, es una medida simtrica
no negativa. Anlogamente la distancia entre dos poblaciones ser una medida de
divergencia entre los parmetros que las caracterizan. Tambin puede ser
conveniente introducir una distancia entre un individuo i y las parmetros.
Se pueden definir tambin distancias no paramtricas que miden la divergencia
funcional entre funciones de densidad. En .algunos casos estn relacionadas con
medidas de entropa.
Entropa: mide la incertidumbre de una informacin. La entropa tambin se puede
considerar como la cantidad de informacin promedio que contienen los smbolos usados.
La distancia de Minkowski
Distancia de Mahalanobis:
y la distancia de Balakrishnan-Sanghvi: