Sunteți pe pagina 1din 9

Diagramas Estadisticos

Correlograma
En el anlisis de los datos, un correlograma es una imagen de la correlacin de estadsticas. Por ejemplo, en
el anlisis de series temporales, el correlograma, tambin conocido como un grfico de autocorrelacin, es
una representacin grfica de las autocorrelaciones de la muestra rh versus h (El tiempo).

Si la Correlacin cruzada se utiliza, el resultado se llama una correlograma cruzado. El correlograma es una
herramienta comnmente usada para el control de aleatoriedad en un conjunto de datos . Esta aleatoriedad
se determina calculando autocorrelaciones para los valores de datos en diferentes lapsos de tiempo. Si es al
azar, tales autocorrelaciones deben estar cerca de cero para todos y todas las separaciones de rezago de
tiempo. Si no es aleatoria, una o ms de las autocorrelaciones seguidas sern significativamente diferente de
cero.

Adems, los correlogramas se utilizan en la etapa de identificacin de la metodologa de Box-Jenkins en


modelos autorregresivos de media mvil de series temporales. La s autocorrelaciones deben estar al azar y
cerca de cero, si el analista no comprueba la aleatoriedad, la validez de muchas de las conclusiones
estadsticas se vuelven sospechosas. La autocorrelacin es una excelente manera de comprobar tal
aleatoriedad.

Aplicaciones

El correlograma puede ayudar a proporcionar respuestas a las siguientes preguntas:

Es el azar de datos?

Es una observacin relacionada con una observacin al lado?

Es una observacin relacionada con una observacin dos veces eliminado? (Etc.)

Ejemplo de un correlograma:

Curva de la baera
La curva de la baera es un grfica que representa los fallos durante el perodo de vida til de un sistema
o mquina. Se llama as porque tiene la forma una baera cortada a lo largo.

En ella se pueden apreciar tres etapas:

Fallos iniciales: esta etapa se caracteriza por tener una elevada tasa de fallos que desciende
rpidamente con el tiempo. Estos fallos pueden deberse a diferentes razones como equipos defectuosos,
instalaciones incorrectas, errores de diseo del equipo, desconocimiento del equipo por parte de los
operarios o desconocimiento del procedimiento adecuado.

Fallos normales: etapa con una tasa de errores menor y constante. Los fallos no se producen debido a
causas inherentes al equipo, sino por causas aleatorias externas. Estas causas pueden ser accidentes
fortuitos, mala operacin, condiciones inadecuadas u otros.

Fallos de desgaste: etapa caracterizada por una tasa de errores rpidamente creciente. Los fallos se
producen por desgaste natural del equipo debido al transcurso del tiempo.

sta es una de doce formas que se han tipificado sobre los modos de fallas de equipos, sistemas y dispositivos.

Diagrama de caja
Un Diagrama de caja es un grfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos.
Est compuesto por un rectngulo, la "caja", y dos brazos, los "bigotes".

Es un grfico que suministra informacin sobre los valores mnimo y mximo, los cuartiles Q1, Q2 o mediana y
Q3, y sobre la existencia de valores atpicos y la simetra de la distribucin. Primero es necesario encontrar la
mediana para luego encontrar los 2 cuartiles restantes

Cmo expresarlo grficamente

+-----+-+

* o |-----------| | |---|
+-----+-+

+---+---+---+---+---+---+---+---+---+---+---+---+

0 5 10 12

Ordenar los datos y obtener el valor mnimo, el mximo, los cuartiles Q1, Q2 y Q3 y el Rango Inter Cuartilico
(RIC)

En el ejemplo, para trazar la caja:

Valor 7: es el Q1 (25% de los datos)

Valor 8.5: es el Q2 o mediana (el 50% de los datos)

Valor 9: es el Q3 (75% de los datos)

Rango Inter Cuartilico RIC (Q3-Q1)

Los bigotes, las lneas que se extienden desde la caja, se extienden hasta los valores mximo y mnimo de la
la serie o hasta 1.5 veces el RIC.

Cuando los datos se extienden ms all de esto, significa que hay valores atpicos en la serie y entonces hay
que calcular los lmites superior e inferior, Li y Ls.

Para ello, se consideran atpicos los valores son aquellos inferiores a Q1-1.5*RIC o superiores a Q3+1.5*RIC.

En el ejemplo:

inferior: 7-1.5*2=4

superior: 9+1.5*2=12

Ahora se buscan los ltimos valores que NO son atpicos, que sern los extremos de los bigotes.

En el ejemplo: 4 y 10

Marcar como atpicos todos los datos que estn fuera del intervalo (Li, Ls).

En el ejemplo: 0.5 y 2.5

Adems, se pueden considerar valores extremadamente atpicos aquellos que exceden Q1-3*RIC o
Q3+3*RIC.

De modo que, en el ejemplo:

inferior: 7-3*2=1

superior: 9+3*2=15

Utilidad

Proporcionan una visin general de la simetra de la distribucin de los datos; si la mediana no est en el
centro del rectngulo, la distribucin no es simtrica.

Son tiles para ver la presencia de valores atpicos tambin llamados outliers.
Pertenece a las herramientas de las estadstica descriptiva. Permite ver como es la dispersin de los puntos
con la mediana, los percentiles 25 y 75 y los valores mximos y mnimos.

Diagrama de rbol
Un diagrama de rbol es una herramienta que se utiliza para determinar todos los posibles resultados de un
experimento aleatorio. En el clculo de la probabilidad se requiere conocer el nmero de objetos que forman
parte del espacio muestral, estos se pueden determinar con la construccin de un diagrama de rbol.

El diagrama de rbol es una representacin grfica de los posibles resultados del experimento, el cual consta
una serie de pasos, donde cada uno de los pasos tiene un nmero finito de maneras de ser llevado a cabo. Se
utiliza en los problemas de conteo y probabilidad.

Para la construccin de un diagrama en rbol se partir poniendo una rama para cada una de las
posibilidades, acompaada de su probabilidad. Cada una de estas ramas se conoce como rama de primera
generacin.

En el final de cada rama de primera generacin se constituye a su vez, un nudo del cual parten nuevas ramas
conocidas como ramas de segunda generacin, segn las posibilidades del siguiente paso, salvo si el nudo
representa un posible final del experimento (nudo final).

Hay que tener en cuenta que la construccin de un rbol no depende de tener el mismo nmero de ramas de
segunda generacin que salen de cada rama de primera generacin y que la suma de probabilidades de las
ramas de cada nudo ha de dar 1.

Existe un principio sencillo de los diagramas de rbol que hace que stos sean mucho ms tiles para los
clculos rpidos de probabilidad: multiplicamos las probabilidades si se trata de ramas adyacentes
(contiguas), el ejemplo de alumna de la primera facultad, o bien las sumamos si se trata de ramas separadas
que emergen de un mismo punto, el ejemplo de encontrar un alumno.

Ejemplos

Una universidad est formada por tres facultades:

La 1 con el 50% de estudiantes.

La 2 con el 25% de estudiantes.

La 3 con el 25% de estudiantes.

Las mujeres estn repartidas uniformemente, siendo un 60% del total en cada facultad.
Probabilidad de encontrar una alumna de la primera facultad?

Probabilidad de encontrar un alumno varn?

pero tambin podra ser lo


contrario.

Valor atpico
En estadstica, tales como muestras estratificadas, un valor atpico (en ingls outlier) es una observacin que
es numricamente distante del resto de los datos. Las estadsticas derivadas de los conjuntos de datos que
incluyen valores atpicos sern frecuentemente engaosas. Por ejemplo, en el clculo de la temperatura
media de 10 objetos en una habitacin, si la mayora tienen entre 20 y 25 C, pero hay un horno a 350 C, la
mediana de los datos puede ser 23, pero la temperatura media ser 55. En este caso, la mediana refleja
mejor la temperatura de la muestra al azar de un objeto que la media. Los valores atpicos pueden ser
indicativos de datos que pertenecen a una poblacin diferente del resto de la muestra establecida.

Tomando como referencia la diferencia entre el primer cuartil ( ) y el tercer cuartil , o valor intercuartil, en
un diagrama de caja se considera un valor atpico el que se encuentra 1,5 veces esa distancia de uno de esos
cuartiles (atpico leve) o a 3 veces esa distancia (atpico extremo).

Valor atpico leve

Siendo y el primer y tercer cuartil, y el rango intercuartil ( ), un valor atpico leve ser
aquel que:

y determinan, pues, los llamados limites interiores, a partir de los cuales la observacin se considera
un atpico leve.

Valor atpico extremo

Los atpicos extremos son observaciones ms all de los lmites externos:

Cuarteto de Anscombe

El cuarteto de Anscombe comprende cuatro conjuntos de datos que tienen las mismas
propiedades estadsticas, pero que evidentemente son distintas al inspeccionar sus grficos
respectivos.

Cada conjunto consiste de once puntos (x, y) y fueron construidos por el estadstico F. J. Anscombe.
El cuarteto es una demostracin de la importancia de mirar grficamente un conjunto de datos antes
de analizarlos.

Para los cuatro conjuntos de datos:

Propiedad Valor

Media de cada una de las variables x 9.0


Varianza de cada una de las variables x 11.0

Media de cada una de las variables y 7.5

Varianza de cada una de las variables y 4.12

Correlacin entre cada una de las variables x e y 0.816

Recta de regresin

El primer grfico (arriba a la izquierda) muestra lo que parece una relacin lineal simple,
correspondiente a dos variables correlacionadas cumpliendo con la suposicin de normalidad. El
segundo grfico (arriba a la derecha) no est distribuido normalmente, aunque se observa relacin
entre los datos, esta no es lineal y el coeficiente de correlacin de Pearson no es relevante. En la
tercera grfica (abajo a la izquierda) la distribucin es lineal pero con una lnea de regresin diferente
de la que se sale el dato extremo que influye lo suficiente como para alterar la lnea de regresin y
disminuir el coeficiente de correlacin de 1 a 0.816. Por ltimo, la cuarta grfica (abajo a la derecha)
es un ejemplo de muestra en la que un valor atpico es suficiente para producir un coeficiente de
correlacin alto incluso cuando la relacin entre las dos variables no es lineal.

Cuarteto de Anscombe

I II III IV

x y x y x y x y

10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58

8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76

13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71

9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84

11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47

14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04

6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25

4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50

12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56

7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91

5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89

Edward Tufte us el cuarteto en la primera pgina del primer captulo de su libro The Visual Display
of Quantitative Information, para enfatizar la importancia de mirar los datos antes de analizarlos.
Pirmide de poblacin
La pirmide de poblacin o pirmide demogrfica es un histograma que est hecho a base de
barras cuya altura es proporcional a la cantidad que representa la estructura de la poblacin por sexo
y edad que se llaman cohortes.

Pirmide de poblacin de Chile 2008.

Grficamente se trata de un doble histograma de frecuencias. Las barras del doble histograma se
disponen en forma horizontal, es decir, sobre la lnea de las abscisas, y convencionalmente se
indican los grupos de edad de la poblacin masculina a la izquierda y los que representan la
poblacin femenina a la derecha. A su vez, en el eje de las ordenadas se disponen e identifican los
grupos de edad, por lo general, de cuatro en cuatro aos (0 a 4, 5 a 9, 10 a 14, etc.), colocando las
barras de menor edad en la parte inferior del grfico y aumentando progresivamente hacia la
cspide las edades de cada intervalo.

Cuando existe una informacin detallada (nacimientos y defunciones anuales) podemos elaborar una
pirmide de poblacin tambi n con esa informacin detallada (barras de ao en ao). La escala de
las abscisas puede representar valores absolutos (es decir, nmero de habitantes de cada grupo de
edad y sexo), como sucede en la que corresponde a los datos de Angola, o relativos, es decir,
porcentajes de cada grupo de edad y sexo con relacin a la poblacin total, como en la pirmide de
poblacin de Francia.

La ventaja de mostrar los datos relativamente es que podramos comparar dos pirmides de
poblacin diferentes, ya que se basan en porcentajes o valores relativos.

Este tipo de grfico toma su nombre de la forma que adopta en las sociedades que tienen una
poblacin con una amplia base debido al gran nmero de nacimientos y que se estrecha
paulatinamente por la mortalidad creciente y acumulativa a medida que aumenta la edad de la
poblacin.

S-ar putea să vă placă și