Sunteți pe pagina 1din 32

Mdulo: II Unidad: II Semana: 04

ESTADSTICA PARA NEGOCIOS I

Lic. SEGUNDO A. GARCIA FLORES


CONTENIDOS TEMTICOS

Diagrama de Tallos y Hojas


Diagrama de cajas
DESARROLLO DE CONTENIDOS - SUBTTULOS
DEL TEMA
Diagrama de tallos y hojas

El diagrama "tallo y hojas" o como se le conoce en ingls


Stem-and-Leaf Diagram permite obtener simultneamente
una distribucin de frecuencias de la variable y su
representacin grfica.

Estas representaciones son idneas para aplicarse en el


uso de la computadora. Muy fcil de obtener y utilizar,
dicha tcnica es una combinacin de dos procedimientos:
uno grfico y otro de ordenacin. (Ordenar datos, es
formar una lista de ellos en un orden dado de acuerdo con
su valor numrico).
Diagrama de tallos y hojas
Este tipo de representacin es similar a un histograma debido a
que los valores de los datos se presentan en intervalos y
despliegan en barras. Sin embargo, de un diagrama de tallo y
hoja se puede recobrar ms informacin de los dgitos de cada
uno de los nmeros y tambin se puede ver si algn valor es
identificado como atpico.

(Un valor atpico es una observacin que es numricamente


distante del resto de los datos.)
Diagrama de tallos y hojas
Los diagramas de tallos y hojas se utilizan para
describir variables cuantitativas.
Permiten visualizar globalmente la distribucin de los
datos manteniendo su individualidad.
Esta tcnica funciona bien para los conjuntos de
datos que no tienen una dispersin muy grande.
Implica separar cada dato en dos partes:
El primer o primeros dgitos (Tallo)
El dgito o dgitos restantes (Hojas)
Diagrama de tallos y hojas
Construccin:

Cada valor de datos es dividido en una "hoja" (normalmente


el ltimo dgito) y un "tallo" (los otros dgitos).
Por ejemplo "32" sera dividido en "3" (tallo) y "2" (hoja).
Los valores del "tallo" se escriben hacia abajo y los valores
"hoja" van a la derecha (o izquierda) de los valores del tallo.

El "tallo" es usado para agrupar los valores y cada "hoja" indica


los valores individuales dentro de cada grupo.

Ejemplo, para el dgito 458:

Datos iniciales Dgitos sucesivos


45 8
Utilizados en la Mostrados en la
ordenacin representacin
Ejemplo:
Construir una representacin tallo-hoja para el siguiente
conjunto de 20 calificaciones.
Calificaciones (0-100)
82 74 88 66 58 74 78 84 52 76
96 76 62 68 72 92 86 76 86 78

En una inspeccin rpida se ve que hay valores en los grupos del


50, 60, 70, 80 y 90. El primer digito de cada valor debe utilizarse
como tallo, y el segundo como hoja.
TALLOS HOJAS
5 2 8
6 2 6 8
7 2 4 4 6 6 6 8 8
8 2 4 6 6 8
9 2 6
Ejemplo:
Supongamos la siguiente distribucin de frecuencias que
representan la edad de un colectivo de n = 20.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Solucin:
Nuestros datos estn en el orden de las categoras: 20, 30 y 40.

TALLOS HOJAS Frecuencias


2 0 3 4 4 4 5 9 7
3 1 1 3 4 6 6 7 9 9 9
4 0 0 1 5 4
Ejemplo:
Supongamos la siguiente Datos ordenados
distribucin de datos con 8,1 8,4 8,6 8,7 8,9 9,2
8,2 8,5 8,6 8,7 8,9 9,2
valores decimales. A partir de
8,2 8,5 8,6 8,7 8,9 9,2
all, elaborar el diagrama de 8,2 8,5 8,6 8,7 9 9,2
tallos y hojas. 8,3 8,5 8,6 8,7 9 9,3
8,3 8,5 8,6 8,8 9 9,3
8,3 8,5 8,6 8,8 9 9,4
8,3 8,5 8,7 8,8 9 9,5
Diagrama de Tallos y Hojas 8,4 8,5 8,7 8,8 9,1 9,6
8,4 8,5 8,7 8,9 9,1 9,8
TALLOS HOJAS
8 1,2,2,2,3,3,3,3,4,4,4,5,5,5,5,5,5,5,5,5,6,6,6,6,6,6,6,7,7,7,7,7,7,7,7,8,8,8,8,9,9,9,9
9 0,0,0,0,0,1,1,2,2,2,2,3,3,4,5,6,8
Diagrama de cajas
Grfico de cajas (Box-Plot)
El diagrama de cajas es una representacin
grfica que se construye en base a la mediana
y los cuartiles Q1 y Q3.
Se traza un rectngulo con los extremos
correspondientes al primer y tercer cuartil.
Dentro de la caja se traza una lnea horizontal
en el lugar de la mediana.
Se ubican los lmites mediante el rango
intercuartil.
Grfico de cajas (Box-Plot)
RI = Q3 Q1
Lmite inferior : ISI = Q1 1.5 RI
Lmite superior: ISS = Q3 + 1.5 RI
Se trazan lneas verticales desde los extremos
de la caja hasta el valor mximo y mnimo
dentro de los lmites (bigotes de la caja).
Se marcan con asterisco (*) las localizaciones
de los valores atpicos (outliers).
Grfico de cajas (Box-Plot)
Grfico de cajas (Box-Plot)
Uso de la grfica box-plot

Representar la distribucin de una variable


contnua
Mediana
Percentiles
Valores extremos
Dispersin
Comparar grficamente el comportamiento
de una variable en distintos grupos
Diagrama de cajas

11,0
Mximo

10,5
Percentil 75%

Mediana
Percentil 50% 10,0

Percentil 25%
9,5
Mnimo
CONC

121

9,0
N= 92 108

1,00 2,00

SEXO
Distribucin de la concentracin en el grupo control
y tratamiento al inicio del estudio

Las dos distribuciones 56


son similares. 61

El grupo control 54

presenta algo ms de
dispersin.
52

En el grupo control se 50

observa un valor
extremo (caso 61). 48

Se deben verificar los


46
casos extremos.
44
N= 46 41

Control Tratamiento

TRATA
Distribucin de la concentracin en el grupo control y
tratamiento al inicio del estudio (en funcin del sexo)

Podemos efectuar una


56
descriptiva de la
concentracin al inicio 84
54 52
del estudio en funcin
del sexo y del grupo 52
experimental.
En el grupo control, 50

las mujeres presentan


una dispersin mayor. 48

Identificamos tres SEXO

casos extremos. 46 79
Hombre

44 Mujer
N= 21 25 25 16

Control Tratamiento

TRATA
Interpretacin de los diagramas de cajas

Pueden ser indicativos de diferencias entre


distintas situaciones.
Por si solos, los diagramas de cajas no
demuestran dichas diferencias. Debemos utilizar
mtodos estadsticos para establecer la
significacin de las diferencias obervadas.
Descriptiva del efecto del tratamiento
Representaremos los diagramas de cajas de las
variables inicial y final en funcin del tratamiento
Exploraremos si el sexo determina una respuesta
distinta al tratamiento
De manera alternativa, podemos calcular la
variable diferencia
final-inicial y estudiar su distribucin
Representar distinas variables en la misma grfica

El grupo control 65

presenta una
evolucin en la
30
concentracin
Parece que esta
evolucin es superior 55 61

en el grupo de
tratamiento 21

INICIAL

45 FINAL
N= 46 46 41 41

Control Tratamiento

TRATA
Clculo de la variable
dif=final-inicial

20

7
En el grupo control, los valores
10
40
despues del tratamiento son
ligeramente superiores a los del
inicio.
El tratamiento incrementa la
0 20 diferencia entre el estado incial y el
SEXO final
Hombre No se observan diferencias
atribuibles al sexo
DIF

-10 Mujer
N= 21 25 25 16

Control Tratamiento

TRATA
DIAGRAMA DE CAJA (con bigotes)
Es un tipo de grfico que nos permite interpretar los datos
para las variables, a travs de cul podemos observar
cuartiles, valores mnimo y mximo y los valores atpicos.
Realizacin: distribucin de edades.
Conjunto de 20 elementos.

36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40

Ordenemos el conjunto.

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Clculo de cuartiles.
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de
la distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es
la media aritmtica de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5

Segundo Cuartil es la mediana de la distribucin, es el valor de la


variable que ocupa el lugar central en un conjunto de datos
ordenados. Como N/2 =10 ; la mediana es la media aritmtica de
dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Clculo de cuartiles.

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores


de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
DIBUJO DE DIAGRAMA.

El bigote de la izquierda representa al colectivo de


edades ( Xmn, Q1)

La primera parte de la caja a (Q1, Q2),


La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmx).
INFORMACIN

La parte izquierda de la caja es mayor que la de la


derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la poblacin
est ms dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmm, Q1) es ms corto
que el de la derecha; por ello el 25% de los ms
jvenes estn ms concentrados que el 25% de los
mayores.
El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el
50% de la poblacin est comprendido en 14,5 aos.
CONCLUSIONES Y/O ACTIVIDADES DE
INVESTIGACIN SUGERIDAS

SE RECOMIENDA COMPLEMENTAR LO EXPUESTO


CON LA REVISIN Y ANLISIS DEL MATERIAL
BIBLIOGRFICO CONTENIDO EN LOS SIGUIENTES
ENLACES:
GRACIAS