Sunteți pe pagina 1din 8

Diagrama de Caja y Bigotes

Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin visual que describe varias caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra. Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los datos, sobre un rectngulo, alineado horizontal o verticalmente.

Construccin: Comparar distribuciones Diagrama de Caja a travs de Excel

Construccin:
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran elrecorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen tienen un lmite de prolongacin, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente

EJEMPLO DISTRIBUCIN DE EDADES


Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas. 36 39 25 24 37 29 24 23 39 41 20 40 36 33 45 24 31 34 31 40

ORDENAR LOS DATOS

Para calcular los parmetros estadstico, lo primero es ordenar la distribucin 20 23 24 40 41 45 24 24 25 29 31 31 33 34 36 36 37 39 39

40

CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente: Q1=(24 + 25) / 2 = 24,5 Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente: me= Q2 = (33 + 34)/ 2 =33,5 Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta Q2=(39 + 39) / 2 = 39

DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1) La primera parte de la caja a (Q1, Q2), La segunda parte de la caja a (Q2, Q3) El bigote de la derecha viene dado por (Q3, Xmx).

INFORMACIN DEL DIAGRAMA


Podemos obtener abundante informacin de una distribucin a partir de estas representaciones. Veamos alguna:

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre el 50% y el 75%. El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los ms jvenes estn ms concentrados que el 25% de los mayores. El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en 14,5 aos.

Seguro que t podrs obtener ms informacin (Utiliza la mediana!)

Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o ms conjuntos de datos.

Comparacin distribucin de edades Comparacin entrenamientos de un corredor Comparacin clasificacin liga

COMPARACIN DISTRIBUCIN DE EDADES


Anlogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos diagramas, esta distribucin con la del otro ejemplo de distribucin de edades. 35 39 38 24 32 24 28 34 30 26 29 41 27 29 19 48 48 28 40 22

A partir de dicha comparacin puede obtenerse bastante informacin de ambas distribuciones.

COMPARACIN ENTRENAMIENTOS DE UN CORREDOR


Un corredor entrena para una determinada carrera y se toman los tiempos que necesita para recorrer los 200 m, durante 10 das consecutivos (cada da se toman varios tiempos y se calculan mediana, cuartiles, valores mnimo y mximo)

Observamos que el desplazamiento de las grficas de caja hacia la izquierda indica que el entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma distancia, siendo la diferencia entre el mximo y el mnimo menor, como as tambin la diferencia intercuartlica.

COMPARACIN CLASIFICACIN LIGA

Las puntuacin de los equipos de la liga de futbol BBVA de las temporadas 10/110 y 11/12 se pueden comparar con un diagrama caja y bigotes, como aparece aqu,

Comparacin de tres ligas europeas de futbol de la temporada 11/12

Diagrama de Caja a travs de Excel


Diagrama de Caja realizado con la hoja de calculo EXCEL para una, dos o tres variables
DESCARGA EL ARCHIVO EN EXCEL DESCARGA EL ARCHIVO EN CALC

CONTRUCCIN DIAGRAMA DE CAJA Y BIGOTES. Los siguientes datos representan el tiempo que ha estado ingresado cada paciente (en das) para recuperarse de una determinada enfermedad. 8, 20, 27, 30, 32, 35, 36, 40, 40, 40, 40, 41, 42, 45, 47, 50, 52, 61, 89, 108. Lo primero es calcular los cuartiles, por ejemplo, con Statgraphics obtenemos Q1 = 33,5, Q2=mediana=40, Q3=48,5. Con ellos podemos situar las esquinas de la caja y la lnea divisoria. Adems, la media es 44,15 y la representamos con una cruz roja. A continuacin, para marcar los bigotes, calculamos 1,5*recorrido intercuartlico (1,5*RI). Es decir, 1,5*(48,5-33,5)=1,5*15=22,5. El bigote izquierdo parte del lado izquierdo de la caja y llega hasta el menor valor de la variable que es mayor o igual que Q1-1,5*RI=33,5-22,5 = 11. Es decir, 22,5 es la longitud mxima del bigote, pero slo lo extendemos hasta el valor de la variable que dista 22,5 unidades o menos de Q1. Dicho de otro modo, llega hasta el primer valor que est por encima de 11; es decir, hasta 20. Adems, hay otro dato, el 8, a la izquierda de 20. Como dista menos de 3*RI, lo consideramos moderadamente alejado. Lo marcamos como un cuadradito con el interior vaco. Vamos ahora a por el bigote de la derecha. De forma anloga a como procedimos antes, el extremo superior del bigote el mayor de los valores de la variable que es ms pequeo o igual que Q3+1,5*RI = 48,5 + 22,5 = 71; es decir, 61. Quedan dos valores por encima del extremo del bigote superior, que son 89 y 108. Para decidir lo alejados que estn de la mayora (lo atpicos que son), tomamos como medida que estn alejados ms o menos que 3*RI. Es decir, estn en el intervalo (Q3+1,5*RI; Q3+3*RI) son moderadamente atpicos (y marcamos como un cuadradito con el interior vaco) y si estn ms all de Q3+3*RI son fuertemente atpicos (y marcamos como un cuadradito con el interior en rojo)

Ejercicio 12

Hallar la media, mediana y moda de la siguiente serie de nmeros: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6.

2, 2, 3, 5, 5, 5, 6, 6, 8, 9.
Moda

Mo = 5
Mediana

10/2 = 5
Media

S-ar putea să vă placă și