Documente Academic
Documente Profesional
Documente Cultură
Clase04.04.12
1
DIAGRAMA DE TALLOS Y HOJAS
2
La siguiente tabla representa el porcentaje de algodón
en un material utilizado para la fabricación de camisas
para caballeros.
porcentaje de algodón
32 5891 76
36 3288 84
37 6319 8
4
tallo hojas
6
32 1567 89
12
33 1145 6666 6688
21
34 0111 2235 5666 6677 7777 9
14 35 0011 1234 4567 89
6 36 2348 88
5 37 1368 9
Los siguientes son los pasos para construir un diagrama
de tallos y hojas:
Tallos Hojas
1 32 1
Una variación 6 32 56789
interesante 9 33 114
18 33 566666688
25 34 0111223
(14) 34 55666667777779
25 35 001112344
16 35 56789
11 36 234
8 36 888
5 37 13
3 37 689
http://www.estadisticaparatodos.es/taller/graficas/cajas.html
El diagrama "tallo y hojas" (Stem-and-Leaf
Diagram) permite obtener simultáneamente una
distribución de frecuencias de la variable y su
representación gráfica. Para construirlo basta
separar en cada dato el último dígito de la derecha
(que constituye la hoja) del bloque de cifras
restantes (que formará el tallo).
Esta representación de los datos es semejante a la
de un histograma pero además de ser fáciles de
elaborar, presentan más información que estos.
Ejemplos
Horarios de trenes
Edad de 20 personas
Comparar dos distribuciones
9
Basándome en un articulo de Juan C. Dürsteler en InfoVis.net,
tomamos como ejemplo un horario de trenes confeccionado a
partir de un díptico de la línea Castelldefels-Barcelona/Sants
recogido en la estación de Renfe. Originalmente el horario ocupa
una tabla de 10 filas y 9 columnas más una columna "viuda" con
el tren de las 22:38. Un total de 91 campos con formato hh.mm
cada uno, 455 caracteres.
5.03 7.32 9.02 11.07 13.32 15.07 16.50 18.32 20.07 22.38
6.02 7.37 9.07 11.32 13.37 15.20 17.02 18.37 20.20 6.18
7.50 9.24 11.37 13.50 15.32 17.07 18.50 20.32 6.37 8.02
9.32 12.02 14.02 15.37 17.20 19.02 20.37 6.48 8.05
9.37 12.07 14.07 15.50 17.32 19.07 20.50 6.55 8.20 10.02
12.32 14.20 16.02 17.37 19.20 21.02 7.02 8.24 10.07 12.37
14.32 16.07 17.50 19.32 21.07 7.07 8.32 10.32 13.02 14.37
16.20 18.02 19.37 21.20 7.20 8.37 10.37 13.07 14.50 16.32
18.07 19.50 21.32 7.25 8.51 11.02 13.20 15.02 16.37 18.20
20.02 21.37
En el diagrama Stem & Leaf
05 | 03
se representa la hora a la
06 | 02 18 37 48 55
izquierda de la barra de
07 | 02 07 20 25 32 37 50
separación | y los minutos de
08 | 02 05 20 24 32 37 51
la salida de cada tren a la
09 | 02 07 24 32 37
derecha. La frecuencia de
10 | 02 07 32 37
los trenes se deduce
11 | 02 07 32 37
fácilmente de la longitud de
12 | 02 07 32 37
las filas y es, además, muy
13 | 02 07 20 32 37 50
fácil ver en que minutos de
14 | 02 07 20 32 37 50
cada hora pasan típicamente
15 | 02 07 20 32 37 50
los mismos.
16 | 02 07 20 32 37 50
17 | 02 07 20 32 37 50
18 | 02 07 20 32 37 50
19 | 02 07 20 32 37 50
20 | 02 07 20 32 37 50
21 | 02 07 20 32 37
22 | 38
Por otra parte, dado que a algunas horas se repite
exactamente el horario de los trenes se puede
reducir aún más el tamaño del gráfico, sin perder
información y ganando en claridad.
05 | 03
06 | 02 18 37 48 55
07 | 02 07 20 25 32 37 50
08 | 02 05 20 24 32 37 51
09 | 02 07 24 32 37
10 11 12 | 02 07 32 37
13 14 15 16 17 18 19 20 | 02 07 20 32 37 50
21 | 02 07 20 32 37
22 | 38
Al final tenemos 59 campos de 2 dígitos, 118 caracteres más los separadores,
es decir 4 veces menos dígitos que con el horario original, menos espacio y
más claridad.
Esto nos da idea de que una disposición apropiada de los datos puede ser
doblemente informativa y que la representación gráfica puede contribuir
enormemente a la percepción de patrones y a la comprensión de la
naturaleza de los fenómenos.
Edad de 20 personas
Supongamos la siguiente distribución de frecuencias
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de
decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.
A continuación efectuamos un recuento y vamos «añadiendo» cada hoja
a su tallo
13
Por último reordenamos las hojas y hemos terminado el
diagrama
Comparar dos distribuciones
Podemos comparar, mediante estos diagramas, dos
distribuciones.
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22
De ella podemos elaborar sus diagrama de Tallos y
Hojas y compararla con la anterior.
HISTOGRAMA
Frecuencia Proporción
Causas subyacentes Frecuencia
relativa Acumulat.
Incompetencia 698 0.477 0.477
Experiencia desequilibrada 314 0.215 0.692
Falta de experiencia
236 0.161 0.853
gerencial
Falta de experiencia de
111 0.076 0.929
línea
Causa desconocida 83 0.057 0.986
Otras causas 21 0.014 1.000
TOTALES 1463 1.000
Diagrama de Pareto
28
En las organizaciones de manufactura o
servicios, por ejemplo el problema de áreas o
tipos de defectos siguen de distribuciones
similares.
De todos los problemas que ocurren, solamente
unos pocos son realmente frecuentes, los otros
raramente ocurren.
Así, agrupando las áreas de esos problemas en
dos categorías, ellas son denominadas como la
poco vital y la muy trivial.
El principio de Pareto también imparte soporte
para la regla de80 20
, que dice que el 80% de los
problemas (inconformidad o defectos) son
ocasionados por el 20% de las causas.
Los diagramas de Pareto ayudan a identificar rápidamente las
áreas críticas (aquellas que causan más problemas) que
merecen inmediata atención.
32
DIAGRAMA DE CAJAS
38
Tomemos la edad de 20 personas
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Cálculo de Cuartiles
n 20
n Q1
24 25 24.5
5
4 2
n Q2 me
33 34 33.5
2 10 2
4
n Q3
39 39
39
3 15
4 2
La parte izquierda de la caja es mayor que la de la derecha;
ello quiere decir que las edades comprendidas entre el 25% y
el 50% de la población está más dispersa que entre el 50% y
el 75%.
36 25 37 24 39 20 36 45 31 31 35 38 32 28 30 29 27 19 48 40
39 24 29 23 41 40 33 24 34 40 39 24 24 34 26 41 29 48 28 22
DATOS PARA DOS VARIABLES .-
42
En las distribuciones bidimensionales a cada
individuo le corresponden los valores de dos
variables, las representamos por el par (xi, yi).
M 2 3 4 4 5 6 6 7 7 8 9 10
F 1 3 2 4 4 4 6 4 6 7 9 10
15
notas fisica
10
Serie1
5
0
0 5 10 15
notas matematicas
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo
mejor posible