Sunteți pe pagina 1din 58

captulo

~.1

,..0.:

. ~ - ~~~;
d. ;' ,.n.~t. a , :n1 'd ~.; \e~~ . t -o-; -
.S
_a.
.
~

t
b
.u" mer~.. c-.-~ 1e.~ ;:n,. a. :- ;~:- I \y
- - . . . . .. o ~ - . . . . _

....

--=

- ...

:.

(.~~

o o

J1 ~,_

.... '~

~. --..=-~-~.

''<;;: ..

~
. ~s-

1.

. 1.~g.il'ta-

,~: :D

,~.~~;...

'.:m,: :~ .~ -,~

OBJETIVO DEL
CAPTULO

Mostrar cmo organizar y presentar


de manera ms eficaz datos
numricos reunidos en tablas y
diagramas.

181

Introduccin

En el captulo anterior aprendimos cmo recolectar datos mediante una investigacin de. encuestas. Como se seal en la seccin 2.5, puesto que el muestreo
abona tiempo, dinero y mano de obra, generalmente tratamos~'?n nforrnacn
de muestras 'antes que con datos de toda una poblacin. No obstante, snmportar
si tratamos C()Il.1Jna muestra o con una poblacin, como regla general, cuando una
serie de datos que hemos reunido contiene aproximadamente 20 o ms observaciones, la mejor forma de examinar tales datos masivos es presentarlos en forma
de resumen construyendo tablas y dagramas apropiados. Entonces podemos
extraer las caractersticasimportantesde los datos de estas tablas y diagramas.
Por lo tanto, este captulo trata sobre la presentacin de .datos. En particular,
mostraremos cmo grandes series de datos numricos pueden organizarse y presentarse de manera ms eficaz en forma de tablas y diagramas con el fin de intensificar el anlisis e interpretacin de datos, aspectos clave del proceso de toma de
decisiones. Para motivar nuestro anlisis sobre la presentacin tabular y de diagrama de los datos numricos, podemos ver en el diagrama de resumen del captulo de la pgina 94 que las observaciones en nuestra serie de datos .son de dos
tpos, de orden de tiempo o independientes. Las observaciones de orden de tiempo
pueden controlarse sobre una grfica digipunto, mientras que las observaciones
independientes pueden organizarse en una clasificacin ordenada o diagrama de
tallo y hojas y luego presentarse en forma tabular como una distribucin de frecuencia o en forma grfica como un histograma, polgono u ojiva.
Despus de terminar este captulo, debe poder:
l. Organizar una serie de datos numricos en una clasificacin ordenada
o diagrama de tallo y hojas.
2. Comprender cmo y cundo construir y usar distribuciones de frecuencia y distribuciones de porcentaje.
3. Saber cmo y cundo construir y usar distribuciones acumulativas.
4. Comprendercmo y cundo construir y usar distribuciones acumulativas.
S. Saber cmo y cundo construiry usar ojivas (es decir, polgonos de

frecuencia acumulativa y polgonos de frecuencia relativa acumulativa).


6. Saber cmo y cundo construir y usar la grfica digipunto.
7. Apreciar el valor de usar paquetesestadsticos o de hoja de trabajo
para presentar datos numricos en la forma de tablas y diagramas.
8. Comprender cmo distinguir entre una presentacin buena y otra
mala de datos numricos y las cuestiones ticas involucradas.

l!j

Organizacin

de

datos

numricos:
la clasificacin ordenada
y el diagrama de tallo y hojas
Con el fin de Introducir las ideas relevantes para los captulos 3 y 4, supongamos
que una compaa que brinda servicios de asesora universitaria a estudiantes por
todo Estados Unidos ha contratado a un analista investigador para comparar las
colegiaturas cobradas a residentes de fuera del estado por colegios y universidades en distintas regiones del pas. La tabla 3.1 muestra las colegiaturas cobradas
a residentes de fuera del estado por cada uno de !os 60 colegios y universidades
del estado de Texas (vase en particular el Conjunto de datos especiales del
apndice D, pginas Dl-D2). Cuando se recolecta una serie de datos como sta,
54

Capitule 3

Presentacin de datos numricos en tablas y diagramas

generalmente se hace en forma sin procesar; es decir, las observaciones numricas


no se disponen en ningn orden o secuencia particular. Corno se deduce de la tabla
3.1, al crecer el. nmero de observaciones, se hace ms dificil centrarse en las principales caractersticas de un conjunto de datos y se necesitan mtodos para ayudamos
a organizar las observaciones de tal manera que entendamos mejor la informacin
que transmite la serie de datos. Dos mtodos comnmente usados para lograr esto
son la clasificacin ordenada y el diagrama de tallo y hojas:
~
.
-- -. -
:

-------------

Tabla 3.1

Datos sin procesar referentes a colegiaturas (en $000) para residentes


fuera del estado en 60 colegios y universidades de Texas.

7.2

4.9
4.7
2.4
4.9
4.9
3.5

4.8

3.6
11.0
7.9
8.0

10.7
8.3
8.5
3.9
5.8
4.9

10.4
3.8
8.8
4.9
3.9
5.8.

6.4

4.8

7.7

4.9

4.8

8.3

4.9
10.3
3.9

4.4

11.6
4.1

4.7
6.4
8.6
4.9
3.4
3.5

4.6
6.6
12.0
8.0
3.9
4.8

6.0
4.5

4.9
3.6

s.o

5.9

5.4
8.. 0
7.0
7.4
3.9
3.6

Fuente: Vase Conjunto de datos especiales l, apndice D, pginas Dl-D2, tomadolle "Amerlca's Best
Colleges,
1994 College Gude", U.S. News& WorldReport, resumido de College Counsel 1993 de Natick, Mm.
Relmpresn con permiso especial, U.S. News & World Report; 1993.por U.S. News & WorlclReport y por
College Counsel.

a.z,

La clasificacin ordenada

Si ordenamos los datos sin procesar de la observacin ms pequea a la ms


grande, la secuencia ordenada obtenida se denomina clasificacin ordenada.
Cuando los datos se disponen en una clasificacin ordenada, como en la tabla
3,2, se facilita nuestra evaluacin de sus principales caractersticas. Se hace ms
fcil seleccionar los extremos, los valores tpicos y las concentraciones de valores.
Tabla 3.:2
2.4
3.9

3.4
3.9

4.9
6.6
8.3

4.9
7.0
8.5

4.8

Clasiiicacin ordenada
sidades de Texas.
3.S
3.9
4.8
5.0

4.8

7.2

8.6

3.5.
4.1
4.9
S.4
7.4
8.8

de colegiaturas
3.6
4.4
4.9

S.8
7.7

10.3

3.6
4.S
4.9
5.8

7.9

10.4

(en $000) de 60 colegios y univer3.6


4.6
4.9

3.8

3.9

4.9
6.0

4.9

8.0
10.7

8.0

5.9

4.7

11.0

4.7

6.4

8.0

11.6 .

3.9
4.8
4.9
6.4
8.3
12.0

Fuente: Tabla 3.1.

Aun cuando resulta til colocar los datos sin procesar en una clasificacin
ordenada antes de desarrollar tablas de resumen o de calcular mediciones de
resumen descriptivas (vase el captulo 4), mientras mayor sea el nmero de observaciones presentes en una serie de datos, ms pesado es formar la clasificacin
ordenada. En tales situaciones se hace particularmente til organizar la serie de
datos en un diagrama de tallo y hojas con el fin de estudiar sus caractersticas (referencias 1, 13 y 14).

3 .2.2

El diagrama de tallo y hojas

Un diagrama de tallo y hojas separaIas ..e.n:trq<li.S._d~_q<!!_gs en "dgitos gua" o "taIlcs". y... "dgitos rastrerqs:'._u~:hojas". Por ejemplo, puesto que Iascoleg'icrrmasten
$000) en la serie de datos de Texas todas tienen nmeros enteros de dos dgitos, la
columna de los unos o la de los dieces seria el dgito gua y la columna restante

Organizacin de datos numricos; la claslicacin ordenada y el dlagrarna de callo y hojas

sera el dgito rastrero. Por lo tanto, una entrada de 7.2 (correspondiente a $7,200)
tiene un dgito gua de 7 y un dgito rastrero de Z.
La figura 3.1 describe el diagrama de tallo y hojas de las colegiaturas de los 60
colegios y universidades de Texas, La columna de nmeros a la izquierda de la linea
vertical se denomina el "tallo". Estos nmeros corresponden a los dgitos gua de
los datos. En cada fila las "hojas" se bifurcan a la derecha de la lnea vertical, y estas
entradas corresponden a dgitos rastreros .

. :.::.?:

.. . .
11 .06 ; : .

Figura 3.1

Diagrama de tallo y hojas de


colegiaturas de residentes fuera del
estado en 6 colegios y
universldades de Texas.

. ......

. .:/.~ :-,.: : : .:.::;~:.:;:"::./.

~~::. .:;:. ;;.:.:~-(~_::;.;:;~t~~-z;~t;;.'.,. >.rk~~!~ti_:

Fuente: Tabla 3.1.

e Construccin del diagrama de tallo y hojas Usando los datos de la tabla


3.1, se construye fcilmente el diagrama de tallo y hojas. Observe que la primera
institucin, la Universidad Ablene Christian, tiene una colegiatura de 7,200
dlares. Por lo tanto, el dgito rastrero de 2 se enumera como el primer valor.de
hoja junto al valor de tallo de 7 (el dgito gua). La segunda institucin, la
Universidad Angelo State, tiene una colegiatura de 4,900 dlares. Aqu el dgito rastrero de 9 se enumera corno el primer valor de hoja junto al valor de tallo de 4.
Continuando, la tercera institucin, el Austin College, tiene una colegiatura de
10,700 dlares, por lo que el dgito rastrero de 7 se enumera como el primer valor
de hoja junto al valor de-tallo de 10. La cuarta institucin, la Universidad Baylor,
tiene una colegiatura de 10 400 dlares, por lo que el dgito rastrero de 4 se enumera como el segundo valor de hoja junto al valor de tallo de 10.
En este punto de su construccin, nuestro diagrama de tallo y hojas tiene la
siguiente forma:

.:::. ~ ~~::.

...

.\

. . :

.~'.!_'; , . >r'f
J

......

s .:

t :f.':;:: ::.;: .
.6 .

. 9' '
:]: '6 ; 74 .:;:.;: -.

1i .:.
56

Captulo 3

Presentacin de datos numricos en tablas y diagramas

Observe que dos de las cuatro escuelas tienen el mismo tallo. Al incluirse ms y

ms escuelas, se observarn aqullas que tienen los mismos tallos y, tal vez,
incluso las mismas hojas pertenecientes a los tallos (es decir, las mismas
colegiaturas). Tales valores de hojas se registrarn adyacentes a las hojas
previamente registradas, opuestas al tallo apropiado, dando como resultado la
figura 3.1.
Para ayudamos a seguir examinando los datos, tal vez deseemos volver a
arreglar las hojas de cada uno de los tallos, colocando los dgitos en orden ascendente, fila por fila. El diagrama de tallo y hojas revisado se presenta en la
figura 3.2.

Figura 3.l

Diagrama de tallo y ho;as revisado de


ecleglaturas de resldenees fuera del estado
en 60 colegios y universidades de Texas.

Tambin es til otro tipo de nuevo arreglo. Si deseamos alterar el tamao del
diagrama de tallo y hojas, ste es lo bastante flexible para tal ajuste. Suponga, por
ejemplo, que deseamos incrementar el nmero de tallos para que podamos
obtener una menor concentracin de hojas en los tallos restantes. Esto se hace en
el diagrama de tallo y hojas presentado en la figura 3.3.
2L 4

iH ..'
3~ 4

. :::.

.3H 55~6~99999
~L. 14
. ~.'tJ. ~~??88.88999999,~~,9 .

:sL:. 04 : : ' .

.sa

'889 .'

:6a

6i. 4~{'

.::

!;.

.. ... '"~
.:;;,;.,:>

:. ..

:r;;; .~~~:'.:::\;d>_. ,. ,. ).<:>:.~: / 3;.


};r};;:;.;/:
8L 00033
~H 568

gt

..9fi

101

.. ...,

.i'o'tt>1

liH 6
.1'2L 'o
~.-. !

:,.., : .

Figura

34 .

.\1L Ei':-: -'~.)=:

...

:.

.r

. '

-: :::~:e:~--,::.::',.::=

...:.:.. .:

3.3

Diagrama de tallo y hojas revisado de


colegiaturas de residentes fuera del estado en
60 colegios y universidades de Texas usando
ms tallos.
Fuente: Figura 3.2.

Organlzacln de datos numricos: la clasificacin ordenada y el diagrama de tallo y hojas

Observe que cada tallo de la: fig. 3.2 ha sido dividido en dos nuevos tallos: uno
para los dgitos O, 1, 2, 3 6 4..de la unidad inferior, y otro para los dgitos 5, 6, 7, 8
9 de la unidad superior. stos.estn representados por L y JI respectivamente,
.como se
indica en las listas de tallos de la fig.
3.3.
Sin embargo, algunos investigadores
han argumentado
que los datos
mostra- dos en la figura 3.3 no estn resumidos. Esto es; no logramos captar la
forma en que los datos se aglutinan realmente dentro de varios agrupamientos.
As pues, en vez de ampliar el diagrama, como en la figura 3.3, tal vez deseemos
condensar los datos, como en la figura 3.4.

;.:f;

:!:

~~

;~

1~

* ~
:~::~
~f

::~.:.
.t~

:."

:~f.~
;-)~

s:

.: ~~
.~

~f I

Figura
3.4

Diagr.ima de tallo y
hojas
revisado de colegiaturas
de
residentes fuera del estado
en
60 colegios y universidades
de
Texas despus de
condensar tallos,
Fuente: Figura
3.2.

:?;.
-~:

..:.. '.
.~~

.t;

.:1:'4.
:.~:

.:j

'~

Observe que las parejas consecutivas de tallos de la figura 3.2 forman el


con- junto reducido de tallos de la figura 3.4 y las bojas correspondientes
al
miembro superior d cada pareja estn en negritas.
El diagrama de tallo y hojas (revisado) es, tal vez, Ja tcnica ms verstil de
la
estadstica descriptiva. Organiza simultneamente los datos para posteriores
anli- sis descrptvos (como veremos en el captulo 4) y prepara los datos
tanto para forma tabular como de diagrama.

Problemas

de

la

seccin

Dado el siguiente diagrama de talloy9


714
10
82230
11

561776735
12
394282
13

20

3.2

,]
/

.~

3.2

"
O
3.1
hoias:

~;
;~

(a) Vuelva a arreglar las hojas y forme el diagrama de tallo y hojas


revisado. (b) Disponga los datos en una clasificacin ordenada.
.
(e) Cul de estos dos mecanismos parece dar ms informacin?
Analice.

Despus de examinar los registros de facturacin mensuales de una


compaa de libros por correo, el auditor toma una muestra de 20 de sus
cuentas pagadas. Las cantidades adeudadas a la compaa fueron
$4,

$18,

$11,

$7,

$7,

$10,

$5,

$33,

$9,

S12

$3,

$11,

$10,

$6;

$26,

$37,

$15,

$18,

$10,

$21

no:

'i

~1

3.3

sa

Cap~ulo

(a} Desarrolle la clascacn ordenada.


(b) Forme el diagrama de tallo y hojas.
Los siguientes datos representan la tasa de flujo mxima (en galones por
minuto) de una muestra aleatoria de 34 regaderas probadas a 80 libras
por pulgada cuadrada de presin:

Presentacin de datos numricos en cabras y diagramas

-r:

Marca y modelo

~.
I
.'

,
<

1
i'
1

t!!;".~

:~l

'Iasade flujo mxmo

'. ~~ .

(en 80lb/pulg2)
2.9
2.8
2.0

Sears Energy-SavingShower Head 20170


Thermo Saver DynaJet CFOl
Resources Conservaton The Incredble Head ES-181
Zn-Plas Brass Showerhead 14-9601-F
Zin-PlasWater Plncher.14-9550
Whedon Saver Shower SS2C
Great Vbratons Water Saver MassageB28400 -American Standard Shower Head Chrome 10509.QOZOA
TeledyneWater Pik Shower Massage 5 SM-2U.
Chatham Solid Brass Shower Head 44-3S.

TeledyneWater Pik Shower Massage 8 SM-4


Melard Wa,tei-saving Adjustable 3610
Pollenex Dial Massage DMlSO
Nova B6402
Speakman Anystream _52253-J\F
Kohler City Club Z-7351
NY-Del 550-11
Ondne Water Saver'28446
Kohler Trend 11740
Alsons Somerset 673
Speakman CosmopolitanS2270-AF
Polenex Dial Massage DM109
Alsons Alspray Massag Action 690C
Moen Pulsation 3935
Sears Personal Hand Shower 20173
Teledyne Water Pik Shower Massage 5 SM-3U
Alsons Hand Shower 462PB
Alsons Massage Action Pulsatng 4SC
Moen Pulsation 3981 : Teledyne
Water Plk Super Saver SS-3
Pollenex Dial Massage DM209
Pollenex Dial Massage/Steamy Mist DM230
Pryde Splash 2461
TeledyneWater Pik Shwer Massage 8 SM-5

3.6
2.7
2.5
2.6
2.9

2.7

2.8
2.5
2.8
2.2
2.5
2.5

2.8

1.8
2.7
2.7

4.7
2.8
Z.7
3.1
2.9

3.4

2.6
2.6

2.7

2.4
2.5
5.4
4.9

2.8
2.5

Fuente: Copyrtght 1990 por Consumers unten of Unlted States, Inc., Yonkers, N. Y.

1070\. Adaptado fon permiso de Cansumer Rtpolts, julio 1990, pp. 472-473.

3.4

(a) Desarrolle la dasificaci6n ordenada.


(b) Forme el diagrama de tallo y hojas.
Los siguientes datos representan el precio al menudeo de una muestra de 39
diferentesmarcas de accesoriosde bao:

so

79
65
25

so

50
20
22

50

22
14
60

28
20
25
30

65

35

Z4

12

40
24
48
30

50
25
15
10

zz

120
10

12

32
35

17
20

30

35

so

Fuente: Copyright 1993 por Consumera Unlon of Unlted State.s, Inc., Yonke.rs, N. Y. 10703-.
Adaptado con permiso de Consuma Reports, enero 1993, pp. 3.4-35.

:~~:: ..
:t~ .. ..

l..
.

(a) Desarrolle la clasificacin ordenada.


(b) Forme el diagrama de tallo y hojas.

Organizacin de datos numricos: la clasificacin .ordenada y el diagrama de tallo y hojas

3.5

Los siguientes datos son los valores en libros (el capital contable dividido entre
el nmero de acciones pendientes) de una muestra aleatoria de so acciones de
la bolsa 'de valores .de Nueva York: .
. .. '::
. . .
.
.. . . ,
7

8
10
10
7

3.6

9
5

6
8
8

14

16
8
15

6
8
5

10

2.3

12
7

10

18

13

6
6

10

10

12

lS

8.
10.

11
9

9
11

15

16
4
7

13

10

(a) Desarrolle Ja clasificacin ordenada,


(b) Forme el diagrama de tallo y bojas:
Un mdico entrevistado en un programa de televisin nocturno conjetura que
"el cncer parece ser ms frecuente en estados con grandes poblaciones
urbanas y en estados ele la parte este de Estados Unidos". Los siguientes datos
representan la tasa de incidencia de cncer (incidencia reportada para una
poblacin de 100 000) en los 50 estados durante un afio reciente:

Incidencia de cncer
en una poblacin de
100,000

Estado

433
442

Alabarna
Alas ka
Atizona
Arkansas
California
Colorado
Connecticut
Delaware
florida

360

383
366
28'2
434
500

367
406
371
307
402
438
377

Georgia

Hawali
Idaho
Illinols
Indiana
lowa

Kansas

345

Kentucky

Lousana
Maine
Maryland
Massachusetts
Michigari
Minnesota
Misslsspp
Missour

414
422.
391
491
443
454

366
438
390

Estado

Incldnca de cncer
en una poblacin de
100,000

Montana
Nebraska
Nevada
New Harnpshre
NewJersey
New Mexlco
NewYork
North Carolina
North Dakota
Oho
Oklahoma
Oregon
Pennsylvana
Rhode Island
South Carolina
South Dakota

3n.
336
422
403

Texas
Utah
Vermont
Virginia
Washington
West Virginia
Wisconsln
Wyoming

313

Tennessee

464

375
329
355

408
463

326

396
442

445
418
348
408
229

376

440

364
409
398

2.38

Fuents: National Cancer !nstitute.

3.7

60.

C.apitutc

(a) Desarrolle Ja clasificacin ordenada.


{b) Forme el diagrama de tallo y hojas.
Los siguientes datos representan el tipo (cremosa frente a espesa), calificacin
(O"" mala, 100 =excelente), costo (en centavos) y cantidad de sodio (en mg) de
una muestra de 37 marcas de mantequilla de cacahuate:

Presentacin de datos numricos en tablas y diagramas


Producto
Jlf

Smucker's Natural
Deaf Smith Arrowhead Mills
Adams 100% Natural
Adarns
Skippy
Laura Scudder's Ali Natural

Kroger

Country Pure Brand (Safeway)


NuMade (Safeway)
Peter Pan
Peter Pan
A&l'

.ff

Hollywood Natural
FoodClub
Pathmark
Lady Lee (Lucky Stores)
Albertsons
Shur Fine (Shurfne Central Corp.)
Smucker's Natural
Jif
Skippy
Adams 100% Natural
Deaf Smi.th AtrowheadMilis
Country Pure Brand (Safeway)
Laura Scudder's All Natural
Smucker's Natural
FoodClub
Kroger
A&P
Peter Pan
NuMade (Safeway)
Health Valley 100% Natural
Lady Lee (Lucky Stores)
Albertsons
Pathmark
Shur Fine (Shurfine Central Corp.)

Costo
(e)

Sodio
(mg)

68

22

220

65
62
56
56
56

27
32

Tipo

Calificacin

Cremosa
.Crernosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa

53

so

168
225
165
240
225

21
20
21
22

45

44
41
40

187

225
3
225
15
225
255
225
225
225
15
162
211

12

40
39
36
30
30
22
80
75
75
62
62

Cremosa

oo

26
26
19
26
.. 14

so

Cremosa
Cremosa
Cremosa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa

lS

32
17
9

16
17
16
27
23
21

26

32

62

195
165
188
195
255
225
180
208
3
225
225
210
195

21

24

56
53
52
50
47

26

17

14
11

47

22
21

42

42

34
16
17
9
16

40
36
34

34

Fuente: Copyright 1990 por Consumers Un!on of Unlted States, Inc., Yonkers, N.Y. 10703. Adaptado con permsode ConsumerReports, Septiembre de 1990. p. 590.
Para cada una de las tres variables (calificacin, costo y sodio)
(a) Desarrolle la clasificacin ordenada.
(b) Forme el dlagrama de tallo y hojas.
3.8 Los siguientes datos representan la cantidad de tiempo {en segundos) para
llegar de O a 60 mph durante una prueba de caminos para una muestra de 22
modelos de automviles alemanes y una muestra de 30 modelos de
automviles japoneses:

Automviles japoneses

Automviles alemanes
10.0
6.4
8.5

s.s

s.i
10.9

7.9
6.9

6.4

6.0
4.9
8.9

7.1

8.7
7.5
S.4
8.5

S.6
S.3
6.7
6.9
8.8

9.4
8.9

6.7
7.2

8.5
9.,S

7.7
9.3
9.1
6.8
7.1
10.S

5.7
8.3
9.5
8.0
6.5
12.5

8.2
9.7
11.7
6.3
12.0
6.2

9.3

8.6
10.0
8.8
9.2
6.6

/:ue11te: Datos extrados de Road Q Track, octubre de 1990, vol. 42, nrn. 2, pg. 4i.

Organizacin de dalos numricos: la dasicacin

ordenada

y el diagrama de tallo y. hojas

3.9

(a) Desarrolle la clasificacin ordenada.


(b) Forme el diagrama de tallo y hojas.
Los siguientes datos corresponden al costo por onza (en centavos) de muestras
aleatorias de 31 champs convencionales etiquetados para cabello "normal" y
29 champs convencionales etiquetados para cabello "delgado":

Cabello fino

Cabello normal

79
49

23
13

28
47
9

63

20
14
16
18

so

19
16
239
32
8

ss

87
20
81

13

37
69
44
64

85
21

69

9
32

19
85
23
14

63
44

12

so

20

23

12

49
87

65
28

22

18.
37
17
Sl
8

74
SS

11

35

Fuente; Copyright 1992 por Consumen Union of United States, !ne., Yonkers, N. Y. 10703.
Adaptado con permiso de Consumet Reports, junio de 1992, pp. 400401.
(a) Desarrolle la clasificacin ordenada para cada serie de datos.
(b) Forme el diagrama de tallo y hojas para cada serie de datos.

Dj

Tabulacin de datos numricos:


La distribucin de frecuencia

Usando ya sea los datos sin procesar, la clasificacin ordenada o el diagrama de


tallo y hojas revisado de las colegiaturas de residentes fuera del estado de 60 cole- ~
gios y universidades de Texas (vanse Las tablas 3.1 y 3.2 de la pgina SS y de la
figura 3.1 de la pgina 56), el analista nvestgador desea construir las tablas y diagramas apropiados que amplen el informe que est preparando para el gerente de
mercadotecnia de la compaa de servicios de asesora colegial.
Sin importar si se selecciona una clasificacin ordenada o un diagrama de tallo
y hojas para organizar los datos, al crecer el nmero de observaciones se hace necesario condensar an ms los datos en tablas de resumen apropiadas. As pues, tal
vez deseemos acomodar los datos en agrupamientos de clase (por ejemplo, categoras) de acuerdo con divisiones establecidas convenientemente del alcance de las
observaciones. Tal acomodo de los datos en forma tabular se denomina una distribucin de frecuencia.
Una distribucin de frecuencia es una tabla de resumen en la que
los datos se disponen en agrupamientos o categoras convenientemente
establecidas de clases ordenadas numricamente.
Cuando las observaciones se agrupan o condensan en tablas de distribucin de
frecuencia, el proceso del anlisis e interpretacin de los datos se hace mucho ms
manejable y significativo. En esta forma resumida las caractersticas ms importantes de los datos se aproximan muy fcilmente, compensando ast el hecho de
que cuando los datos se agrupan de ese modo, la informacin inicial referente a las
observaciones individuales de que antes se dispona se pierde a travs del proceso
de agrupamiento o condensacin.

62

Captulo 3

Presentacin de datos numricos en tablas y diagramas

Al construir la tabla
debe ponerse
atencin . a
.
.
. . . .
. de frecuenca-dstrbucn,
.
~
l. Seleccionar el nmero apropiado de agrupamientos de clase para la

tabla.

2. Obtener un intervalo o ancho de clase de cada agrupamiento de clase.


3. Establecer los lmites de cada agrupamiento de clase para evitar los
traslapes.

3. 3.

Seleccin del nmero de clases

El nmero de agrupamientos de clase por utili~ar depende princlpalmente del


nmero de observaciones en los datos. Estoes, un nniero mayor de observaciones
requiere un nmero mayor de grupos 'de clase. En. general, sin embargo, la dstribucin de frecuencia debe tener al menos cinco agrupamientos de clase, pero no
ms de 15. Si no hay suficientes agrupamientos de clase o si hay demasiados, se
obtendr poca informacin. Como ejemplo, una distribucin de frecuencia que
slo tiene un agrupamiento de clase que abarca todo el alcance de colegiaturas se
podra formar de la siguiente manera:
.
.
Colegiaturas
(en $000)

Nmero de
escuelas

2.0-13.0
Total

60.
60

Sin embargo, de esta tabla de resumen no se obtiene informacin adicional


que no se conociera ya al examinados datos sin procesar o la clasificacin ordenada. Una tabla con demasiada concentracin de datos .no es significativa. Lo
mismo seria cierto en el otro extremo, si una tabla tuviera demasiados agrupamientos de clase, habra una subconcentracin de datos! ~se sabra muy poco.

3. 3.2. Obtencin de los intervalos de clase


Al desarrollar la tabla de distribucn de frecuencia es deseable que el ancho de
cada agrupamiento de clase sea igual. Para determinar el ancho de cada clase, el
alcance de los datos se divide entre el nmero de agrupamientos de clase deseado:

L.:'.. .

....

Puesto que slo hay 60 observaciones en nuestros datos de colegiaturas, decidimos que seis agrupamientos de clase sern suficientes. De la Clasificacin orde-

r :

J....

nada de la tabla 3.2 (pgina 55), el alcance se calcula como 12.0- 2.4 = 9.6 miles
de dlares y, usando la ecuacin (3.1), el ancho del intervalo de clase se aproxima
mediante

~ .

t.=.

~:.: :,: .

Ancho de intervalo

::

96
6

= 1.6 miles

de dlares

Por conveniencia y facilidad de lectura, el intervalo seleccionado o ancho de cada

agrupamiento de clase se redondea a 2.0 miles de dlares .

:.-:..

64

Capitulo 3

Tabolacin de datos numricos: la distribucin de frecuencia


Presentacin de datos numricos en tablas y diagramas

3. 3. 3 Establecimiento de los lmites de las clases


Para construir la tabla de distribucin de frecuencia, es necesario establecer claramente lmites de clase definidos para cada agrupamiento de clase de manera que
las observaciones, ya sea en formasin procesar o en una clasificacin ordenada, se
registren apropiadamente. Debe evitarse el traslape de clases.
Puesto que el ancho de cada intervalo de clase para los datos de colegiatura se
estableci en 2.0 dlares, los lmites de los diversos agrupamentos de clase deben
establecerse de manera que incluyan todo el alcance de observaciones. Siempre
que sea posible, estos lmites deben elegirse para que faciliten la lectura e interpretacin de los datos. De esta forma, el primer intervalo de clase establece desde
2.0 hasta abajo de 4.0, el segundo de 4.0 a abajo de 6.0, etc. Los datos sin procesar
(tabla 3.1) o de la clasificacin ordenada (tabla 3.2) se registran entonces encada
clase segn se muestra:

se

Colegiaturas
(en $000)
6.0 pero menor que 8.0
que 10.0
8.0 pero

menor

Registros

2.0 pero menor que


4.0 pero menor que

4.0
6.0

10.0 pero menor que 12.0


12.0 pero menor que 14.0
Total

Frecuencia

HH#ff/11
l+I+ H+f. ...... .... /111
HHl/11

#1+1!1

13
24
9

l+I+
/

60

Estableciendo los lmites de cada clase de esta manera, las 60 observaciones se han
registrado en seis clases; cada una con un ancho de intervalo de 2.0 miles de dlares,
sin traslape. De esta "hoja de trabajo" La distribucin de frecuencia se presenta en
la tabla 3.3.
Tabla

3.3

Distribucin de frecuencia
de colegiaturas. de
60 escuelas de Texas.

Nmero de
escuelas

Colegiaturas
(en $000)
2.0 pero menor
4.0 pero menor
6:0 pero menor
8.0 pero menor
10.0 pero menor
12.0 pero menor
Total

que
que
que
que
que
que

4.0
6.0
8.0
10.0
12.0
14.0

13

24
9
8
5
1

60

Fuente: Los datos fueron tomados de la tabla 3.1 de!


la pgina 55.

La principal ventaja de usar una de estas tablas de resumen es que las principales caractersticas de los datos se hacen evidentes inmediatamente para el lector.
Por ejemplo, de la tabla 3.3 vemos que el alcance aproximado de las 60 colegiaturas
va de 2.0 a 14.0 miles de dlares, en la enseanza fuera del estado, en la mayora
de las escuelas de Texas tendiendo a agruparse entre 4.0 y 6.0 miles de dlares.

Otras mediciones descriptivas que se obtienen de los datos agrupados se presentarn en la seccin 4.9.
Por otra parte, la principal desventaja de tal tabla de resumen es que no podemos saber cmo se distribuyen los valores individuales dentro de un intervalo
de.clase particular sin tener acceso a los datos originales. Por lo tanto, para las cinco
escuelas con colegiaturas para residentes fuera del estado de entre 10.0 y 12.0 miles
de dlares, no reslta claro de la tabla 3.3 si los valores se distribuyen a lo largo de
todo el intervalo, si estn cerca
los 10.0 miles de miles de dlares o si estn cerca
de los 12.0 mil dlares. El punto medio de la clase, sin embargo, es el valor usado
para representar todos los datos resumidos en
intervalo particular.
El punto medio de una clase (o marca de clase} es el punto a la mitad
de los limites de cada clase y es representativo de los datos de esa clase.

de

un

El punto medio de la clase para el intervalo "2.0 pero menor que 4:0" es 3.0 miles
de dlares. (Los otros punto medios son, respectivamente, 5.0, 7.0, 9.0, 11.0 y 13.0
miles de dlares).

3.3.4

Subjetividad en la seleccin de lmites de clase

La seleccin de lmites de clase para tablas de distribucin de frecuencia es altamente subjetiva. De esta forma, para series de datos que no contienen muchas
observaciones, la opcin de un conjunto particular-de lmites de ciase sobre otro
puede producir una imagen completamente distinta para el lector. Por ejemplo,
para los datos de colegiaturas, si se usa un ancho de intervalo de clase de 2.5 miles
de dlares en vez de 2.0 (como se us en la tabla 3.3) se pueden ocasionar cambios
en la forma en que se distribuyen las observaciones entre las clases. Esto es particularmente cierto si el nmero de observaciones en la serie no es muy grande .
.Sin embargo, tales cambios en la concentracin de datos no ocurren slo
porque el ancho del intervalo de clase se altere. Podemos mantener el ancho del
intervalo en 2.0 miles de dlares pero elegir distintos lmites de clase inferiores y
superiores. Tal manipulacin tambin puede ocasionar cambios en la forma en que
los datos se distribuyen, especialmente si el tamao de la. serie no es muy grande.
Afortunadamente, al incrementarse el nmero de observaciones en una serie, las
alteraciones en la seleccin de los lmites de clase afectan la concentracin de los
datos cada vez menos.

Problemas de la seccin 3.3


3.10

3.11

Una muestra aleatoria de SO vicepresidentes ejecutivos se seleccion de entre


las diversas compaas de relaciones pblicas de Estados Unidos, y se
obtuvieron los sueldos anuales de los funcionarios de estas compaas. Los
sueldos variarn de $52,000 a $137,000. Establezca los lmites de clase para
una distribucin de frecuencia
(a) si se desean 5 intervalos de clase.
(b) si se desean 6 intervalos de clase.
(e} si se desean 7 intervalos de clase.
(d) si se desean 8 intervalos de clase.
Si el precio inicial de apartamentos en cooperativa y en condominio de
una recmara en Queens, un barrio de Nueva York, vara entre $103,000 y
$295,000
{a) indique los lmites de clase de 10 clases en las que estos valores pueden
agruparse.
(b) Qu ancho de intervalo de clase elg?
(e) Cules son los 10 puntos medios de clase?

Tabulacin

Captulo
3

de datos numricos; La distribucin

Presentacin de datos numricos en tablas '/ diagramas

de frecuencia

3.12

Los datos sin procesar mostrados a continuacin son los cobros por electricidad
y gas.durante el mes de julio de 1993 para una muestra aleatoria de 50
apartamentos de tres recmaras en Manbattan: .
....

Datos sin-procesa de cobros de servidos pocos ($)


96

157
141

171

202.

119

90
206
150
183

185
149
163

95
108

178
116
175
154
151

147
172
123
130
114

153 . .. 197

102

148
144

.111

128

187
191

143

135

213
168
166

127
130
109
139

.' '137

129.

82
165
167

149

158

(a) Forme una distribucin de frecuencia


(1) con 5 intervalos de clase.
(2} con 6 Intervalos de clase.
(3) con 7 intervalos de clase.
[Sugerendq: Como ayuda para decidir cmo establecer mejor los lmites de
clase, primero debe disponer los datos sin procesar en un diagrama de
tallo y hojas (haciendo que las hojas sean los dgitos rastreros) o en una
clasificacin ordenada.]
(b) Forme una distribucin de frecuencia con siete Intervalos de clase con los siguientes limites de ciase: $80 pero menos de
SlOO, $100 pero menos de Sl20, etctera.
3.13

3.14

Construya una distribucin de frecuencia de los datos de las regaderas del


problema 3.3 de las pginas 58-59.
Construya una distribucin de frecuencia de los datos de valores en libros del
problema 3.5 de la pgina 60.

3.15

cncer
Construya
del problema
una distribucin
3.6 de la
depgna
frecuencia
60. de los datos de la incidencia de

3.16

Construya distribuciones de frecuencia separadas para cada una de las tres


variables numricas (calicacn, costo y sodio) de los datos de la mantequilla
de cacahuate del problema 3.7 de las pginas 60-61.
Construya d.lstribuciones de frecuencia separadas para los tiempos de
aceleracin de los automviles alemanes frente a los japoneses del problema
3.8 de la pgina 61.
Dadas las clasificaciones ordenadas de la sguente tabla que tiene que ver con
la duracin (en horas) de una muestra de cuarenta focos de 100 watts
producidos por el fabricante A y una muestra de cuarenta focos de 100 watts
elaborados por el fabricante B:

3.17

3.18

Clasificac.iones ordenadas de la. duracin de dos marcas


de focos de lOOwa:tts (e1:1 horas)
Fabricante A

684
831

720

773

848
868

852

852

859

697
835
860

870

893

899

905

909

876
911

922

924
943

926

926

938

946

971

972

977

984

954
1005

1016

1041

1052

1080

939

.821

1014
1093

"

.
819
907

952

836
912
959
1004

888
918

B
897

942 ..

962

986

1018

1005
1020

1007
1022

1038

1072

1077

1077

1096

1100
1154

1113

1113
1188

994
1016

1153

1174

903
943
992
1015
1034
108~
1116
1230

(a) Forme Ja distribucin de frecuencia para cada marca. (Sugerencia: para


propsitos de comparacin, elija anchos de intervalos de clase de SlOO
para cada distribucln.)
(b) Con el fin de responder los problemas 3.2.5, 3.32 y 3.40, forme la
distribucin de frecuencia para cada marca de acuerdo con el siguiente
esquema [si no lo ha hecho ya en la parte (a) de este problema):
Fabricante A: 650 pero menos que 750, 750 pero menos que 850,
etctera

Fabricante B: 750 pero menos que ~SO, 850 pero menos que 950,
etctera.

Fabricante

..

111
/:

..

Tabulacin de datos numricos:


la distribucin de frecuencia relativa
distribucin del porcentaje

La distribucin de frecuencia es una tabla de resumen en la que los datos originales


se condensan o agrupan para facilitar el anlisis de datos. Sin embargo, para
ampliar el anlisis, casi siempre es deseable formar la distribucin de frecuencia relativa o la distribucin de porcentaje, dependiendo de si preferimos proporciones
o porcentajes. Estas dos dstrbucones equivalentes se muestran en las tabla 3.4 y
3.5, respectivamente,

Tabla 3.4

Distribucin de frecuencia relativa


de colegiaturas a residentes fuera
de! estado en 60 escuelas de Texas.

Colegiaturas
(en $000)
2.0 pero menos
4.0 pero menos
6.0 pero menos
8.0 pero menos
l.pero menos
12.0 pero menos
Total

que 4.0
que 6.0
que 8.0
que 10.0
que 12.0
que 14.0

Proporcin
de escuelas
.217
.400
.150
.133
.083

.017
1.000

Fuente: Los datos fueron tomados de la.tabla 3.3


de la pgina 64.

Tabu!adn dt: <lates numricos: la distribucin de frecuencia relativa y distribucin del porcentaje
68

Captulo 3

Presentacin de datos numricos en tablas y diagramas

Tabla 3.5

Distribucin de porcentaje de
colegiaturas a residentes fuera
del estado en 60 escuelas de
Texas.

Colegiaturas
(en $000)
2.0 pero menor
4.0 pero menor
6.0 pero menor
8.0 pero menor
10.0 peromenor
12.0 pero menor

Total

que
que
que
que
que
que

Porcentaje de

escuelas

4.0
6.0
8.0

10.0
12.0
14.0

21.7
40.0
15.0
13.3
8.3
1.7

100.0

Fuente: Losdatos fueron tomados ele la tabla 3.3 de la


pglna 64.

La distl'ibucin .de frecuencia relativa descrita en la tabla 3.4 de la pgina


67 se forma dividiendo las frecuencias de cada clase de distribucin de frecuencia
(tabla 3.3 en la pgina 64) entre el nmero total de observaciones. Entonces puede
formarse una distribucin de porcentaje (tabla 3.5) multiplicando cada frecuenda relativa o proporcin entre 100.0. Por lo tanto, de la tabla 3.4 resulta claro
que la proporcin de escuelas en Texas con colegiaturas de residentes fuera del
estado de 12.0 pero menos que 14.0 miles de dlares es .017, mientras que en la
tabla 3.5 se ve que 1.7% de las escuelas tiene tales colegiaturas.
Generalmente es ms significativo trabajar con una base de 1 para. proporciones o de 100.0 para porcentajes que usar las frecuencias mismas. De hecho, el
uso de la distribucin de frecuencia relativa o de la distribucin de porcentaje Sf
vuelve esencial siempre que una serie de datos se compara con otras series de datos,
especalmente si difiere el nmero de observaciones en cada serie de datos.
Como ejemplo, supongamos que un psiclogo industrial deseaba comparar el
ausentismo diario entre los empleados de oficina de dos tiendas departamentales.
Si, en un da dado, seis empleados de SO de la tienda A se ausentan y tres empleados de 10 de la tienda B se ausentan, qu conclusiones podemos sacar? Es
inapropiado decir que ocurri mcs ausentismo en la tienda A. Aunque hemos
observado que en la tienda A hubo el doble de ausencias.que en la tienda B, tambin haba cinco veces ms empleados que en Ja tienda A. Por lo tanto, en estos
tipos de comparaciones, debemos formular nuestras conclusiones a partir de los
cocientes relativos de ausentsmo, no de los conteos reales. As pues, puede establecerse que el cociente de ausentsmo es dos veces y media mayor en la tienda B
(30.0%) que en la tienda A (12.00A>).
.
Ahora suponga, al desarrollar su informe para el gerente de mercadeo de la
compaa de servicios de consultora colegial, que el analista investigador deseaba
comparar las colegiaturas de residentes fuera del estado de las 60 escuelas de Texas
con las reportadas de 45 instituciones de educacin superior del estado de
Carolina del Norte. La tabla 3.6 muestra nformacn sobre la colegiatura de residentes fuera del estado por cada uno de los 45 colegios y universidades de Carolina
del Norte (vase el Conjunto de datos especiales l del apndice P de la pgina
D3).
Para comparar las colegiaturas de las 60 Instituciones de Texas con las de las 4.5
escuelas de Carolina del Norte, desarrollamos una distribucin de porcentaje para
este ltimo grupo. Esta nueva tabla se comparar entonces con la tabla 3.5.

Tabla 3.6
6.S
6.4
9.7
7.9
7.9

Datos sin procesar referentes a colegiaturas (en $000) para residentes


fuera del estado en 45 colegios y universidades de Carolina del Norte.
7.1
8.S
7.0
8.2
7.4

4.0

s.o
4.4
6.0
6.4

8.3
5.7
6.3
10.4
7.0

S.4
7.7
8.3
9.9

13.o

7.6
7.2
6.9
3.9
8;7

9.0
12.4
5.7
9.8
6.4

15.7
7.1
7.6

8.2
6.7

16.7
5.5
7.9
5.6
7.4

Fuer.iu: Vase Conjunto de datos especiales 1, apndice D, pgina D3, tomado de "Amerca's Best Colleges,
1994 CollegeGude", U.S. News & World Report, resumido de College Counse\ 1993 de Natlck, Mass.
Reimpresin con permiso especial, U.S. News & W.orld Repo.rt, O 1993 por U.S. News & World R~rt

y poi; College Counsel.

La tabla 3.7 describe tanto la distribucin de frecuencia como la distribucin


de porcentaje de las colegiaturas cobradas a residentes fuera del estado por las 45
escuelas de Carolina del Norte. Esta tabla se ha construido en lugar de Ias dos tablas
separadas para ahorrar espacio. Observe que los agrupamientos de clase seleccionados en la tabla 3. 7 concuerdan, donde es posible, con aquellos seleccionados en la
tabla 3.3 para las escuelas de Texas. Los lmites de las clases deberan concordar o
ser mltiplos entre s con el fin de facilitar las comparaciones.
Tabla 3.1

Distribucin de frecuencia y distribucin de


porcentaje de las colegiaturas para
residentes fuera del estado en 45 escuelas
de Carolina del Norte.

Colegiaturas

Nmero de

escuelas

(en $000)

2.0 pero menor


4.0 pero menor
6.0 pero menor
8.0 pero menor
10.0 pero menor
12.0 pero menor
14.0 pero menor
16.0 pero menor
Total

que
que
que
que
que
que
que
que

4:0

6.0
8.0
10.0
12.0
14.0
16.0
18.0

8
21
10
1
2

1
1
45

Porcentaje de
escuelas
2.2
17.8
46.7
22.Z
.2.2
4.4
2.2
2.2
99.9*

Error debido a redondeo.


Fuente: Losdatos fueron tomados de la tabla 3.6.

Usando las distribuciones de porcentaje de las tablas 3.5 y 3.7, ahora resulta stgncatvo comparar las escuelas de los dos estados en trmnos de las colegiaturas
cobradas a residentes fuera del estado. De las dos tablas resulta evidente que las colegiaturas generalmente son menores en Texas. que en Carolina del Norte. Por ejemplo,
en Texas las colegiaturas por lo general se agrupan entre 4.0 y 6.0 miles de dlares
(es decir, 40.0% de las escuelas), mientras que en Carolna del Norte las colegiaturas por lo general se agrupan entre 6.0 y 8.0 miles de dlares (es decir, 46.7% de las
escuelas). Adems, podemos observar que los alcances en las colegiaturas pueden
aproximarse fcilmente a partir de las tablas. En Carolina del Norte, el alcance en las
colegiaturas es aproximadamente 16.0 miles de dlares (es decir, la diferencia entre
18.0, l limite superior de la ltima clase, y 2.0, el lmite inferior de la primera clase),
mientras que en Texas el alcance es aproximadamente 12.0 miles de dlares (es decir,
14.0 - 2.0). En el captulo 4 se analizarn otras mediciones de resumen que ampliarnun anlisis comparativo de las colegiaturas entre los dos estados.

Tabulacin de datos numricos: la distribucin de frecuencia relativa y distribucin del porcentaje


70

Capitulo

Presentacin da datos numricos en tablas y dagramas

Problemasde la seccin .3.4


o

3.19

3.20

3.2!
3.22.

3.23

3.24
3.25

ID

Forme la distribucin de porcentaje


desarrollada en el problema 3.12(b)
servicios pblicos.
Forme la distribucin de porcentaje
desarrollada en el problema 3.13 de

de la distribucin de frecuencia
de la pgina 6 respecto a los cobros de
de la distribucin de frecuencia
la pgina 66 respecto a las regaderas.

Pormela dstrfbucn de porcentaje de la distribucin-de frecuencia desarrollada eh el problema 3.14 de la pgina 66 respecto a los valores en libros de
compaas enumeradas en el NYSE..
Forme la distribucin de porcentaje de la distribucin de frecuencia
desarrollada en el problema 3.15 de la pgina 66 respecto a la Incdenca de
cncer.
Forme las dtstrtbudones de porcentaje correspondiente a las distribuciones de
frecuencia para cada una de las tres variables numricas (calificacin, costo y
sodio) desarrolladas en el problema 3.16 de la pgina 66 respecto a las
caractersticas de Ja mantequilla de cacahuate.
Forme las distribuciones de porcentaje de las distribuciones de frecuencia
desarrolladas en el problema 3.17 de la pgina 66 respecto a los tiempos de
aceleracin de los automviles alemanes y japoneses.
Forme las distribuciones de porcentaje de las distribuciones de frecuencia
desarrolladas en el problema 3.18 de la pgina 66 respecto a la duracin de los
focos fabricados por las dos compaas competidoras A y B.

Graficacin

de datos numricos:

el histograma

e1 polgono

A menudo se dice que "una imagen vale ms que mil palabras". De hecho, les
estadsticos han empleado las tcnicas grficas para describir de manera ms vvida
series de datos. En particular, los histogramas y los polgonos se usan para describir
datos numricos que han sido agrupados en distribuciones de frecuencia, de frecuencia relativa o . de porcentaje.

3.5.1

Histogramas

Los histogramas son diagramas de barras verticales en los que se construyen barras rectangulares en los lmites de cada clase.
Al graficar histogramas, la variable aleatoria o fenmeno de inters se despliega a
lo largo del eje horizontal; el' eje vertical representa el nmero, proporcin o porcentaje de observaciones por intervalo de clase; dependiendo de si el histograma
particular es, respectivamente, un histograma de frecuencia, un histograma de frecuencia relativa o un histograma de porcentaje.

-E-->

Tipo de diagrama

Nmero de observaciones
Porporcn de observaciones

<

Porcentaje <le observaciones

~>

Histograma o polgono de frecuencia


Histograma o polgono de frecuencia
relativa
Histograma o polgono de porcentaje

Etiqueta del eje vertical

<

;;..

Figura 3.5

Histograma de porcentaje de
colegiaturas de residentes fuera del
estado en 60 escuelas de Texas.
Fuente: Los datos fueron tomados de la
tabla 3.5.

( .
.

f.
tf.f.
~:

Un histograma de frecuencia se describe

en la figura 3.5 para las colede

glaturas a residentes fuera del estado en los 60 colegios y universidades


Texas.

Es.nteresante observar la estrecha relacin visual retratada por el diagrama de


tallo y hojas y el histograma. Observe la figura 3.4 de la pgina 58 y nuestro histograma de la figura 3.5. Si tuviramos que rotar el diagrama de tallo y hojas 90
(es decir, sostener nuestro libro de costado) se descrbra un histograma de frecuencia de manera tal que sus agrupamientos de clase estaran representados por
los tallos y sus barras verticales estaran representadas por las hojas individuales de
cada tallo.
Al comparar dos o ms series de datos, ni los diagramas de tallo y hojas ni los
histogramas puede construirse en la misma grfica. Con respecto a estos ltimos,
la sobreposicin de las barras verticales de uno en el otro ocasionara dificultades
de interpretacin. En tales casos es necesario construir polgonos de frecuencia relativa o de porcentaje.

3.5.2

Polgonos

Al gualque.con

los histogramas, al gracar polgonos el fenmenode inters se


despliega a lo largo del eje horizontal y el eje vertical representa el nmero, proporcin o porcentaje de observaciones por intervalo de clase.
El polgono <le porcentaje se forma permitiendo que el punto medio
de cada ciase represente los datos de esa clase y luego conectando la
sucesin de puntos medios con sus respectivos porcentajes de clase.
,

Debido a que los puntos medios consecutivos son conectados por una serie de

lineas rectas, el polgono algunas veces est dentado en apariencia. Sin embargo,

al ..tr.atar con una serie de datos muy grande, si tuviramos que crear los lmites de
las clases en su distribucin de frecuencia ms juntos {incrementando as el
_:>;(une:o de clases en esa distribucin), las lneas dentadas del polgono se
.uavr.zaran".

Graflcacin de datos numricos: el histograma y el pollgono

::-::
.

... ....

"!; ..

:
. . .. i.::
Figura 3.6

Polgono de porcentaje de colaglaturas


de residentes fuera del estado en 6~
escuelas de Texas,
Puente: Los datos fueron tomados de la
tabla 3.5.

9: .:/:;
.

o . o

Q.:.:: . ~ ..
... ~:

:4 . ;.t.

6 :'. :. 8 :-. :. 10 ..::: 12,.:


. ;. ... : .. : : . .. : . ~.. .. :

. :' Colegl?turs (e.~$000} :

14 ~.: 16
. :(_. ~ - . .
. .....

Figura 3.7

Polgonos de porcentaje de colegiaturas de residentes fuera del estado


en 60 escuelas de Texas y 45 escuelas de Carolina del Norte.
Fuente: Los datos fueron tomados de las tablas 3.5 y 3:7.

La figura 3.6 muestra el polgono de porcentaje para. las colegiaturas a residentes fuera del estado de las 60 escuelas de Texasy la figura 3.7 compara los polgonos de porcentaje para las colegiaturas de las 60 escuelas de Texas con las 45
escuelas de Carolina del Norte. Las diferencias en la estructura de las dos dstrbu-

Graflcacin de datos numricos: el histograma y el polgono

72

CaptuJo 3

Presentacin de datos numricos en tablas y diagramas

cons, anteriormente
mente aqu.

analizada al comparar las fablas 3.S y 3.7, sendcan clara": :'. ..



, .-.:

..

Construccin
del polgono
Observe que el .Polgono es una representacin de la forma de la dstrbucln partcular, Puestoque eJ rea _bjo la dstnbucn de porcentaje . (curva entera). debe ser ) 00%, ;, es necesario conectar el
primero y el ltimo puntos. con el eje horzontalpara rodearel rea de la dstrbucin observada. En la figura 3 .6 esto se hace conectando' el' primer punt mqo
observado con el punto medio de una clase "precedente ficticia" (esto es, 1.0 in.Hes
de dlares) teniendo 0.0% observaciones y conectandoel ltimo punto medio
observado con el punto medio de una clase "sucesora ficticia" (esto es, 15.0 miles
dlares) teniendo o.0% .observacones.
. . <. .
. . . .

: :.
Observe tambin que cuando se construyen los polgonos (figura 3.6) olos hstogramas (figura 3.5), el eje vertical debe mostrar el verdaderocero u "origen" para
no distorsionar o malinterpretar el carcterde los datos. Sin embargo, el eje horizontal no necesita especificar el punto cero para el fenmeno de inters. Por
razones estticas, el alcance de la variable aleatoria debe constituir la principal por-:
cin del diagrama y, cuando no se incluye el cero, son apropiadas las "rupturas"
en el eje.

de

-v:

Problemas de la .secci!J .3.5


3.26

3.27

3.28

3.29

3.30

3.31

3.32

De la dstrbucn.de porcentaje desarrollada en el problema 3.19 de la pgina


70 respecto a los cobros de servicios pbltcos
{a) graque el hstograrna de porcentaje:
(b) graque el polgono de porcentaje.
De la distribucin de porcentaje desarroilda en el problema 3.20 de la pgina
70 respecto a las regaderas
(a) graque el histograma de porcentaje.
(b) grafique el polgono de porcentaje.
De Ja distribucin de porcentaje desarrollada en el problema 3.21 de la pgina
70 respecto a los valores en libros de compaas enumeradas en el NYSE
(a) grafique el histograma de porcentaje,
{b) graque el polgono de porcentaje.
De la distribucin de porcentaje desarrollada en el problema 3.22 de Ja pgina
70 respecto a la incidencia de cncer
(a) graque el histograma de porcentaje respectivo.
(b) grafique el polgono de porcentaje respectivo.
De las distribuciones de potcentaje_desa'rrolladas'en el problema 3.23 de la
pgina 70 para cada una de las tr_es variables numricas (calcacn, costo y
sodio) respecto a las caractersticas de la mantequilla de cacahuate
(a) graque el histograma de porcentaje respectivo.

(b) grafique el polgono de porcentaje respectivo.


De las distribuciones de porcentaje desarrolladas en el problema 3.24 de la
pgina 70 para cada una de las tres variables numricas (calificacin, costo y
sodio) respecto a los tiempos de aceleracin de los automviles alemanes y
japoneses
(a) graque los histogramas de porcentaje en grficas separadas.
{b) graque los polfgonos de porcentaje en una grfica.
De las dlstribucones de porcentaje desarrolladas en el problema 3.25 de la
pgina 70 respecto a la duracin <le focos

(a) Grafique los histogramas de porcentaje en grficas separadas.


(b) Graque los polgonos de porcentaje en una grfica.

11.1

Distribuciones acumulativas
y polgonos acumulativos

Los otros dos mtodos tiles de representacin de datos que facltan el anlisis y
la interpretacin son las tablas ~e distribucin acumulativa y los diagramas de poligonos acumulativos. stos 'pueden desarrollarse a partir de la tabla de distribucin
de frecuencia, de. la. tabla de distribucin de frecuencia relativa y de la. tabla de distri~ucin de porcentaje.

3 .6. 1

la distribucin de porcentaje acumulativa

Dependiendo de nuestra preferencia individual por proporciones o porcentajes, al


comparar dos o ms series de datos de distinto tamao, seleccionamos ya sea la distribucin de frecuencia relativa o la distribucin de porcentaje. Puesto que ya tenemos las distribuciones de porcentaje de las colegiaturas a residentes fuera del
estado de las 60 escuelas de Texas y de las 45 de Carolina del Norte en las tablas 3.5
y 3.7 (pginas 68 y 69), podemos usar estas tablas para construir las distribuciones
de porcentaje acumulativas respectivas. Vanse las tablas 3.8 y 3.9.

Tabla 3.8

Distribucin de porcentaje acumulativo


de las colegiaturas para residentes
fuera del estado en 60 escuelas de
Texas.

Colegiaturas
(en $000)

Porcentaje de escuelas
"menor que" valor indicado

o.o

2.0
4.0
6.0
8.0
10.0
12.0
14.0

21.7
61.7
76.7
90.0
98.3
100.0

Fuente: Los datos fueron tomados de la tabla 3.S.

Tabla 3.9

Distribucin de porcentaje acumulativo


. de Ias coleglaturas para residentes
fuera del estado er\ 45 escuelas de
Carolina del Norte.

Colegiaturas
(en $000)

Porcentaje de. escuelas


"menor que" valor ndcado

2.0
4.0.
6.0
8.0
10.0
12.0
14.0
16.0
18.0

o.o

2.2

zo.o

66.7
88.9
91.l
95.6
97.8
100.0

Fuente: Los daros fueron tomados de Ja tabla 3.7.

74

Captulo 3

Presentacin de datos numricos en tablas y diagramas

"

Una tabla de distribucin de porcentaje acumulativo se construye


registrando primero los lmites inferiores de cada clase a partir de la .dstrbucin
de porcentaje y luego insertando un lmite extra al final. Calculamos los porcentajes acumulativos en la colurnna'vmenor que" determinando el porcentaje de
observaciones menores que de cada uno de los valores de los lmites establecidos.
As, en la tabla 3 ..5 vemos que 0.0% de las colegiaturas a residentes fuera .del estado
de las instituciones de Texas son inferiores a 2.0 miles de dlares: 2i'7% de las
colegiaturas son inferiores a 4.0 miles de dlares. 61.7% de las colegiaturas. son
inferiores a 6.0 miles de dlares, y as sucesivamente basta que todas (100.0%) las
colegiaturas son inferiores a 14.0 miles de dlares. Este proceso acumulativo se
observa fcilmente en la tabla 3.10.

Tabla 3.1 O

Formadn de la distribucin de porcentaje acumulativo.

De la tabla 3.5

De la tabla 3.8
Porcentaje de
escuelas en
intervalo de clase

Colegiaturas
(en $000)

2.0 pero menor


4.0 pero menor
6.0 pero menor
8.0 pero menor
10.0
pero menor
menor
14.0 pero
12.0 pero menor

3 .6.2.

\':

~.

,;.
~~~ ..
rfif.

f\,~f~:.
.

~i. ..

).'.t
~~ :...

f~'.a : .
< .

\'i'. .:

~~'..

21.7
40.0
15.0
13.3
o.o
8.3
1.7

Polgono de porcentaje

o.o

21.7
61.7 = 21.7 + 40.0
76] = 21.? + 40.0 + 15.0
90.0"'
40.0 +
15.0 + 13.3
13-3+ 8.3 + 1.7
100.0 = 21.7
21.7 +
+ 40.0
+ 15.0+
983 = 21.7 + 40.0+15.0+13.3 + 8.3

acumulativo

La figura
las colegiaturas a residentes fuera del estado de las 60 escuelas de Texas. La. principal ventaja de la ojiva sobre otros diagramas es la facilidad con que podemos interpolar entre los puntos gracados.

~s~~ .

a
if<":t:

4.0
6.0
8.0
10.0
12.0
16.0
14.0

Para construir un polgono de porcentaje acumulativo (tambin conocido


como ojiva), observamos que el fenmeno de Inters, las colegiaturas, nuevamente se graca en el eje horizontal, mientras que los porcentajes acumulativos
(de la columna "menor que") se gracan en el eje vertica1.'En cada lrnte inferior,
gracamos el valor de porcentaje (acumulativo) correspondiente del listado de la
distribucin de porcentaje acumulativo. Entonces conectamos estos puntos con
una serie de segmentos de lneas rectas.
3.8 de la pgina 76 ilustra el polgono de porcentaje acumulativo de

s.:

que
que
que
que
que
que
que

Porcentaje de escuelas
de limite nferortmenor que"
de intervalo de clase

e Apro:ximadn de porcentajes Como un ejemplo, el analista investigador de la compaa de servicios de asesora colegial podra desear aproximar el
porcentaje de colegios y universidades que cobran una colegiatura por debajo' de
una cantidad especificada, digamos 7 .O miles de dlares. Para hacer esto, se proyecta una lnea vertical hacia arriba en 7 .O hasta que interseca la curva "menor
que". El porcentaje deseado se aproxima entonces leyendo horizontalmente
desde el punto de interseccin hasta el porcentaje indicado en el eje vertical. En
este caso, aproxrnadamente 69.2% de las escuelas de Texas tienen colegiaturas
por debajo de 7.0 miles de dlares. (Esto, claro est, implica que aprcxmadamente 30.8% de las escuelas tienen colegiaturas de al menos 7 .O .rnlles de
dlares.)

e Aproximacin de valores An ms importante, al preparar su informe


para el gerente de mercadeo de la compaa de servicios de asesora colegial, el
Dlstrtbucicnes acumularvas y polgonos acumulativos

.:::.::.:~>.':J.:.-

..

:.~~: .. ":..~

,,....;:

: ._~.:. ...: -, ~4' ':

. .1 .

..

.> .

~.;::: .,,::,'..;:

;s: * -r~r:::.S-;. j.'.,~~'.+. . . ,.:~_,,~.fa~#;l~5ii,fa._; ~:i."?E


.\;:

;,,'.\?6:
...

Figura 3,8

. :.~. ~.~>::-~:;:!:

:, -: ~ j ....: '
\.

':: :. : .-::":

Polgono de porcentaje acumulativo de colegiaturas d!!


residentes fuera del estado en O escuelas de Texas,
Fuente: Los datos fue.ron tomados de Ja tabla 3.8

analista investigador tal. vez desee tambin aproximar diversas colegiaturas que
correspondan a porcentajes acumulativos particulares. Por ejemplo, 25% de
todas. las escuelas de Texas. tienen colegiaturas por debajo de esa cantidad? Par!
determinar esto, se dibuja una lnea horizontal desde el punto de porcentaje acumulativo especificado (25.0) hasta que nterseca la curva "menor que,". La colegiatura deseada se aproxima entonces bajando una perpendicular (una lnea. vertical)
en el punto de interseccin hacia el eje horizontal. De. la figura 3.8, observamos
que esta colegiatura es aproximadamente 4.2 miles de dlares. Otros puntos de
porcentaje comrunente considerados para tal anlisis (vase el captulo 4) son el
valor de 50.0% y el de 75.0%.

Comparacin de dos o ms distribuciones acumulativas


Aproximaciones como stas son extremadamente tiles al comparar dos
ms series de
datos. La figura 3.9 de la pgina 77 describe los polgonos de porcentaje acumulativo de las colegiaturas a residentes fuera del estado tanto para las 6.0 escuelas de
Texas como para las 1:5 de Carolna del Norte .
. De la figura 3.9 observamos que en general la ojiva de Texas se traza a la
izquierda de la ojiva de Carolina del Norte .. Por ejemplo, en Texas 25% de todas las
colegiaturas son inferiores a 4.3 miles de dlares, mientras que en Carolina del
Norte vemos que 25% de todas las colegiaturas son inferiores a 6.1 miles de dlares.
Adems, en Texas 50% de todas las colegiaturas son inferiores a 5.4 miles de
dlares, mientras que en Carolina del Norte SO% de todas las colegiaturas son inferiores a 7.2 miles de dlares. Adicionalmente, en Texas 75% de todas las colegiaturas
son inferiores a 7.7 miles de dlares, mientras que en Carolina del Norte vemos que
75% de todas las colegiaturas son inferiores a 8.7 miles de dlares. Estas comparaciones nos permiten confirman nuestra anterior impresin de que las colegiaturas
son menores en Texas que en Carolina del Norte.

70

Captulo 3

Presentacin de datos numricos en tablas y diagramas

.f

f:

: 20
10

...

0'----.-41.,.._.,~

.o

...... ,......_.

~--'.

. :::. :.'. f:\';,;

-'-_,.'----."--'--~-'-....._--'_,... _,._,..._~

4
:s . .:a::, 10 -, :i2 14:.
'.:'.' ::.~'.~~-'' '.' . ;;:.co181t1t~~:~ri':ib&> ,'''=

-:

1e .: : .: i
:~,.

>

to

Flgur3 3.9
Polgonos de porcentaje acumulativo de colegiatura.S de residentes (uera del estado en 60 escuelas
de Texas y 45 escuelas de Carolina del Norte.
Fuente. Los datos fueron tomados de las tablas 3.~ y.3.7.

Problemcs de lo seccin 3.6


3.33

~.

3.34

).

.e
3.S

1e
a<IS

3.35

Examine la figura 3.9.


(a) 10.0% de las colegiaturas a residentes fuera del estado en cada estado
estn por debajo de qu cantidades?

(b) 40.0% de las colegiaturas a residentes fuera del estado en cada estado
estn por debajo de qu cantidades?
(c) 60.0% de las colegiaturas a residentes fuera del estado en cada estado
estn por debajo de qu cantidades?
(d) 90.0% de las colegiaturas a residentes fuera del estado en cada estado
estn por debajo de qu cantidades?

(e) Qu porcentaje de las colegiaturas a resdentes fuera del estado en cada


estado estn por debajo de 5.0 dlares?
(f) Qu porcentaje de las colegiaturas a residentes fuera del estado en cada
estado estn por debajo de 11.0 dlares?
(g) Discuta sus hallazgos.
.
.
(h) Cmo podra ser 'de utilidad su informacin para el analista investigador
de la compaa de servicios de asesora colegial? Analice.
De la distribucin de frecuencia desarrollada en ~l problema 3. lZ{b) de la
pgina 66 referente a los cobros de servicios pblicos
(a) Forme la distribucin de frecuencia acumulativa .
(b) Forme Ja distribucin de porcentaje acumulativo.
(c) Grafique la ojiva (polgono de porcentaje acumulativo).
De la distribucin de frecuencia desarrollada en el problema 3.13 de la pgina
66 referente a las regaderas
(a) forme Ja distribucin de frecuencia acumulativa.
(b) Forme la distribucin de porcentaje acumulativo.
(c) Graque la ojiva (polgono de porcentaje acumulativo).

Distribuciones acumulativas y polgonos acumulatvos

3.36

3.37

3.38

3.39

3.40

De la distribucin de frecuencia desarrollada en el problema 3.14 de la


pgina 66 referente a los valores en libros de compaas enumeradas en el
NYSE
(a) Forme la distribucin de frecuencia acumulativa.
(b) Forme la distribucin de porcentaje acumulativo.
(e) Graflque la ojiva (polgono de porcentaje acumulativo).
De la distribucin de frecuencia desarrollada en el problema 3.15 de la pagina
66 referente a la incidencia de cncer
-.
(a) Forme la distribucin de frecuencia acumulativa.
(b) Forme la distribucin de porcentaje acumulativo.
(e) Graque la ojiva (polgono de porcentaje acumulativo).
De las distribuciones de frecuencia desarrolladas en el problema 3.16 de la
pgina 66 para cada una de las tres variables numricas (calificacin, costo y
sodio) referente a las caractersticas de la mantequilla de cacahuate
(a) Forme las distribuciones de frecuencia acumulativa respectivas.
(b) Forme las distribuciones de porcentaje acumulativo respectivas.
(c) Grafque las ojivas (polgonos de porcentaje acumulativo).
De las distribuciones de frecuencia desarrolladas en el problema 3.17 de la
pgina 66 referente a a los tiempos de aceleracin de los automviles alemanes
y japoneses
(a) Forme las distribuciones de frecuencia acumulativa.
(b) Forme las distribuciones de porcentaje acumulativo.
(e) Grafique las ojivas (polgonos de porcentaje acumulativo) en una grfica.
De las distribuciones de frecuencia desarrolladas en el problema 3.17 de la
pgina 66 referentes a la duracin de focos de dos fabricantes
(a) Forme las distribuciones de frecuencia acumulativa.
(b) Forme las distribuciones de porcentaje acumulativo.
(e) Grafque las ojivas (polgonos de porcentaje acumulativo) en una grfica.

Graficacin de datos en secuencia:


la grfica digipunto .
Hasta ahora en este captulo, en nuestro anlisis de los mtodos grficos, no
hemos tomado en cuenta de ninguna manera el orden secuencial en que se han
recolectado los datos. En muchas situaciones, particularmente en contabilidad,
economa y finanzas, nos interesa estudiar un conjunto de datos recolectados regularmente, diario, semanal, mensual, trimestral.o anual, de manera tal que resultara natural gracar los resultados (sean stos, ndices de precios de acciones,
ingresos por ventas industriales, ganancias corporativas, etc.) en una grfica en la
que el eje X (horizontal) representa un periodo dado. Esta materia de anlisis de
series de tiempo se presenta en el captulo 19. En otras circunstancias, particularmente en la administracin del proceso y la calidad de los productos, tambin
estamos interesados en estudiar los resultados en un conjunto de datos recolectados en orden secuencial (sean el nmero de clientes por minuto que llegan a una
sucursal de un banco de Manhattan durante el periodo de la comida de medioda
a la 1 PM, el porcentaje de bateras defectuosas en muestras consecutivas de 50,
la cantidad de llenado en botellas de jugo de manzana de un lltro, etc.). El tema
del control estadstico del proceso y la calidad de productos se analiza en el captulo 16
y se presenta una diversidad ele diagramas de control. En esta seccin, como introduccin a estos importantes temas, usamos el tiempo de procesamiento (en minutos) ocupado por un pagador que maneja 24 clientes consecutivos en un banco
de Manhattan durante el periodo de almuerzo de medioda a la 1 PM (figura 3.10).
Ilustraremos que gracar los datos en orden secuencial puede ampliar un anlisis.

78

Captulc 3

Presentacin da datos nUmricos en tablas y diagramas

Figura 3.10
Datos sin procesar referentes al tiempo de procesamiento
clientes consecutivos en un banco de Manhattan.

....

del pagador (en minutos) para 24

Los datos enumerados en la figura 3.10 aparecen en forma sin procesar. Aun
s datos fueron registrados cronol6gicamente, no deberamos esperar que
cuando lo
los tiempos de procesamiento (en minutos) relativos a los 24 clientes consecutivos
siguieran ningn patrn ordenado observable. (De hecho, una importante suposicin en los procedimientos inferenciales que analizaremos de los captulos 10 all S
ser que nuestras observaciones de muestra recolectadas se extraen aleatoria e
independientemente.) Aqu, entonces, sera de inters evaluar grficamente si los
datos estn realmente en forma sin procesar o si existe alguna relacin nsospe-

chada.

3.7.1

Representacin de la grfica digipunto de Hunter

La grfica digipnnto presenta simultneamente un diagrama de tallo y hojas y

r..

una grfica de las observaciones en el orden secuencal.en que se obtienen.~-~horizontal gracada sobre la secuencia por lo general denota la mediana o el
valor medio de la clas1ficacTnorCfeada. (La meofaase estudiar en la seccin
_j.4.2.) Esta lnea horizontal permite una fcil referencia para observar cualquier
patrn. Por ejemplo, como se indica en la figura 3.11, si hubiera una tendencia
positiva en las observaciones de la secuencia ordenada en que se recolectaron, la
porcin de la grfica dgpunto indicara un incremento de izquierda a derecha.
Para una tendencia negativa, la 'grca se invertira. As pues, en estas stuacones

.... ::

.. ;'~

f.'f-;.,,,.,..;..,..,.,.~...,_ .:.~,...,.._,....._..:._. Mediana


. .: ''

' :: : : -'-.. , :- .;,:

:::.

..

._:_.T.n....;..:::'_ed:~:.:~-...~.'n1~.;=.:~ec..: "; :
~

~;;;;L.<~Jt(ir.i l.

11

~:\.:.
('['.(\/':Tit:tdenC:las observadas

.- ; : ; ~ ~~:':. : -~_. . . . ':_:~ . ,

: .., ... i. _.._: ._ ., . ..< _;_ _ ; _ .

'..)i ~ . ' .{ : ! ~ :,~ :i~ ~ r i ~ f i t i ~ ~


.,_.
.
::/}..:-.:.. :. . . . .
f l

.:

-::nA_~.:-_.:,'.t.:~::. _~t.:_:,~~:..',.:.v:._a,~.~'_
~.T.I:.._'-_:._~ '...:
. ~::_. ;_... ~1.';:...~:~.,~ ..'.._.:~.:_..- ;. ~:_:, :__

11

. ~

11

..


en datos graflcados en orden secuencial.

Graficacln

de datos en secuencia: la grfica digipuncc

observaramos largas secuencias de valores en un lado de la lnea horizontal seguidas


de largas secuencias de valores en el otro lado de la lnea.'

Para desarrollarestas ideas, 'los datos del tiempo de procesamento.del pagador


del banco de la figura 3.10 se han organizado primero enun dagrarn d tallo y
hojas, se han tabulado en unadistrlbucin de frecuencia y se han ilustrado grficamente como un polgono de frecuencia [vanse los grupos (a), (b) y (e), respectivamente, en la figura: 3.12].
. :. :.

.es

o.

. ,5

.~

....

Figura
12

-:

. , . ., . . /g<g:~~ :~;gg~-

~~~'>1:.~~;,>:.~:~:f~i~~~~;.;~:;} ; ~

...

....

1 ...

;:~'-.::: ,_,.,_.,'.. '.

:_.::c:_'.;_:.,.;_:n

}A<r2;~~~~~~i.".:. :_

, :~. ~ -~~~-~;:;:~-~; ~:et:\: . :-.


2 .. 5038.0 .:- .::
3

.r~-{~i.~.~e.~~,.

. r

. . ~:g.,. g:f,~.;g;;:~ -tj~= : t~.: , :_:,~.~:.:.-?.~~-'t . :

....

. ){;.

:'

4.p pero menor que. 5.Q. . . : . : T .


5.Q .. pero m~~5:irqu~.:... s~o.~~~ ,: .:'..: 1 ..
6.0 pero menor que 7.0: ,.. . : , t

. -, i Tot~Y> ... :;::.-< . ~ :.; .: '24 ::

. ..

-3

'

Organizacin y presentacin

Fuente: fjgura 3.10,

de datos de tiempo de procesamiento "da un pagador de banco.


Aunque se observa que los datos tienden a agruparse en el intervalo de 1.0 a


2.0 minutos, no puede obtenerse ninguna informacin referente a los patrones
potenciales en el orden secuencial de los tiempos de procesamiento delpagador
de banco de estos diagramas de resumen. Para remediar esto, la figura 3.13 'descrbe
una grfica dlgpunto, un til dispositivo grfico desarrollado por I-Iunter (referencia 5).

Inspeccionando la figura 3.13, encontramos, como se podra suponer, que no


existe evidencia de ningn patrn en la grfica. No existe ninguna relacin (y
tampoco debiera haberla) entre el orden cronolgico y el tiempo de procesamiento (en minutos). La ms larga secuencia consecutiva de observaciones por encima
de la lnea del centro es 3 (observaciones. 5, 6 y 7) y la secuencia consecutiva ms
larga por debajo de la lnea del centro tambin es 3 (observaciones 11, 12 y 13).

Capftulc 3

Presentacin de datos numricos en tablas y diagramas

l.

!,{.

..
..

~~

f~
l;I
"~{

.
J~I~
,: 1

. ..

~~ ~

f~

i.;:
ff.t,.

Figura 3.13

.'~?.

:??~. .
Grfica digipunto de Hunter del tiempo de procesamiento (en minutos) de 24 clientes
consecutivos en un banco de Manhattan.

~~tt

Por

:~~: .
if!,/:.

otra parte, las mayo~es oscilaciones de la grfica por encima de la lnea del cen-

tro comparadas ton. las distancias por debajo de sta demuestran

~-i--..

simetra en esta serie de datos.

la falta de

.ji ... :

.I>::

1--.>-.<:
:I .:

-3.-7.2

}; ~-.:_.
l~

Comparando el diagrama de tallo y hojas del grupo (a) de la gura 3.12 con el
mostrado en nuestra grfica digpunto (figura 3.13), 'Observarnos que seran
Idritcos si volteramos de cabeza uno de ellos! Por lo tanto, al 'construr la porcin de tallo y hojas de la grfica digipunto observamos que las hojas se bifurcan
hacia la izquierda de los tallos o hacia la derecha. Adems, observe que los tallos
se enumeran de alto a bajo, de arriba a abajo, en vez de bajo _a alto como en la
figura 3.12. Esto se hace por conveniencia grfica, puesto que el eje Y (vertical)
. de una grfica va de alto a bajo, de arriba hacia abajo. A la izquierda del eje verJic~l indicamos los tallos junto con "marcas de tictac" para los tiempos de proce. sarnento (en minutos) sobre la escala vertical. A la izquierda de los tallos
'.trazamos otra lnea vertical para permitir la colocacin de las hojas. Despus cons.-ttuimos simultneamente la porcin tallo y hoja y grafcamos los tiempos de
'i}~p~esam..iento (en minutos)
el orden que se enumeran en la figura 3~10. Estos
'Y~~otes
gracan de izquierda a derecha, con distancias iguales de por medio.
.qs puntos consecutivos se conectan entonces y la lnea del centro se traza a travs
d(l~ secuencia ordenada. En la figura 3.13, la lnea del centro se grafica desde el

se

fi

'i r .:.:_~ .
?
1:,,:\;/ :.;~.
~
~ >

Construccin de la grfica digipunto de Hunter

ej~ vertical en el valor de 1.6 minutos. Esta lnea representa el tiempo de proce-

l~ u~r:;~~;~i~nl~

=~=st~o~~r;;7a~~~~;fa~~~~ ~:~~~~~~ 5
l~n~ac~~~:~:l~~~~
parque se intentaba verflcar una suposicron en una sene de datos ya obtenida.
f. \': (:,:;:..5prltrola
:=fof;Rtra.
procesos de servicios
cuyo
produccin
u otros
(es parte,
decir, para
las grficas
se hacen
interactivamente)
la lnea
delprogreso
centro se

-!~://.:.>.

- ~f

en

1 ~< : ;,:.-: .

f~::;}~;}L;::>:::-~~_p~rada (el objetivo) se gracara inicialmente de manera que proporcionara

\~f:fH:':'." ;\.fYla:1nterpretacin

visual ele patrones en el tiempo.

111,.

Graficacin de datos en secuencia: la grfica digipur.co

Problemas de la seccin 3.1


3.41

Un fabricante de pantalones de mezclilla de hombre utiliza una mquina que


puede ajustarse paza variar el largo del material producido. Suponga que el
plan de produccin es producir pantalones que se pretende tengan un largo de
34 pulgadas. La mquina
ajusta entonces para producir pantalones cuyo
.
largo se espera que sea de 34 pulgadas. Se selecciona una muestra de 30 paiejas
consecutivas de pantalones del proceso de produccin y sus largos se registran
a continuacin en secuencia de fila (de tzquerda a derecha):

se

34.02
33.89
33.9
33.74
34.02

3.42

Semana 1
Semana 2
Semana 3
Sernana d

Semana
Semana
Semana
Semana

1:
2:
3:
4:

Lunes

Martes

3.3
3.9
7.2
3.1

3.7

3.8

4.3
3.3

34.05
33.88
34.05
33.94
33.9"6

34.01
33.96
34.00
33.99
34.01

33.91
33.85
33.97
34.03
33.93

33.76
33.94
33.84
34.10.
33.82

(a) Forme una grfica dgpunto para estos datos.


(b) A qu conclusiones puede llegar respecto a s el proceso de fabricacin
est controlado?
Victor Stemberg estaba entrenando para una carrera de 5 km. Como parte de
su entrenamiento, corri un Intervalo de un cuarto de milla para rapidez de
pista durante 27 das consecutivos antes de la carrera y llev un registro de sus
ensayos de tiempos. Los datos que vienen a continuacin son sus tiempos de
cuarto de milla (en segundos):

Dom.

3.43

34.06
33.98
34.03
33.85
33.95

90

85

80
79

Lun.

Mar.

Mir,

jue,

Vie ..

Sb.

89

88
84
79
74

88

86

84-

79
73

78

91
84

81
78

83

81
75

83

82
72

80

76

canera

(a) Forme una grfica digipunto para estos ensayos de tiempos usando la
lnea del centro de 81 segundos para este periodo de 27 das,
(b) Qu puede concluirse de esta grfica? Analice.
Los recibos de ventas totales (en miles de dlares) se registran dariamente en
Ethel's, una boutique de vestidos en la ciudad de Nueva York, durante el
periodo de 28 das de 1de"febreroa28 de febrero de 1993:

Mircoles
3.0
3.6
3.8
3.2

jueves

Viernes

Sbado

3.5
3.9
4.5
4.2

3.4

5.7
6.8
6.6
6.2

5.6

3.2

3.7

Domingo
5.0

~.!i
Sj

S.4

(Observe que las vacaciones federalesy estatalesestn dentro de un cuadro.)

(a) Analice los datos construyendo una grfica digipunto en donde la lnea
del centro sea de 3.9 miles de dlares. Describa cualquier cosa inusual.
(b) Parece haber algn patrn en los recibos de ventas totales con el
tiempo?

82

Captulo

Presentacin de datos numricos en tablas y diagramas

!!Jt'e l ,

.~ , ~

J!,i.
~

..;.~w!.:

:-~
:~~ ~ : ~ .
~ ~.

..
. .

"

'; :,fi t .
~&-: ..

lti
i':'
:~il

~~.:-. ..

_,I=: _ _.;_

~I~: :. .... .

i(.J~

'1~!?.",_{.; " .
t_~:-.

':

a4Y~~.::.

. :" .

. ' ;: : / ;'.i(}

?~r'::l.fso de pquetes esfa:dsti.~os


'', ',

. ..

. .

. . ..

para datos
. ..

' ; ,

n.rp~rfc;~.f :-~_:._
. .. ,,: : . '

::i.

f:
;~ ~
tWi"f . . ~{~.:.~~li~~~~%,~~;;;~'fk~~';hb l/;~~~ ~ I'
fa~~~;3.14;;;:.:d:;~~~~:t~_:;~1~: ~:.I~~o.r::~~!p;e~~~~:i
;~f.-}'{:}i;:::;.:
j~~-f~:}}:'. : ..;,....." _,,. -~ ~f~. ~:;figura
describe diagrama pe talio_y hojas de SPSS, la figura 3.1 S

do,-la

$..~.

{W;~:

el

.~~:~~.:....

Uso de la computadora para cabras y diag~mas con datos numricos

m11estta1as dfstfitio.e-.s de

I'

f>:ecencra -:-de~ oi::ce.ta:e 1r-:srA.T1sroc-~ras'autas

z~~'~Nt$~~~~tt1ft~t~~~~,~l~ir~1~~~
1;~~i1:1l.. ~.,;i~,;1
.d,c9m~iitidora l)uede~rsg::i:rru(iesI:iesfa~~la

~,

. . : A partir.' de:vatios:.~eswtads

:lndtcn
'.Prifil.era::P. .r~.i4il~t&.
~1\.F.~:~fn.*-af~g~:1Wf.&~~~r~1~!.-~t.~i~~9i~i~1~.t.~;:fM~Si~m~.~
ue: 1a ofstrniutff.cte':'lin" 'e%oS:i ~nhles''~ii~'lS~~:effitQ~aao.s:~~utietpiof

dnae iaS: aifetenCias: a:: tiel:o~~f-ros.:fh.'.'sbs~'

ersnlfefil.terrfteados~cte

~~af:cturjo~?~~~1W~~~~t~~~~~k~f
l~t\~~~:i~~ls~~a:~
lfpq'i,i~tes
Urfa've1/tjtie'.se1ogr~l's.tOJser~c~sifo(h
accsos

esf~dSh('.bs:

(l~

~tA\t.Ji~~~t:t~~g;i~t;;~~!!i~~~~t::;f1~;~:~r.~&~~~J.~%9tf~~fk.1!
TI.a~mas~.~~::.dE!'taUo;:.:.fj'as-tes
ress' ersonales'H'efri:'}eados''.~fo

~f~!~!ilW.f~ttqi{5i~f~~~li.ffil :f~;
'd;iV.os af:losAri

. : :.( ..... ~.

"

.:'.'.'::.i.

8.-0,0 Ex;t.i;::em~s-

..

(~7};

::p6):,.-.:p.6)~:.:(78').;<{f!~)./>~.2J,

~l~4
:::.

,~~:~"!:::~'.0r:~:';1:~:!~~:~:~:!'M,~;t~:t1:,~1;; ,~~t~~~!':, ;;:;f

?F~~)

_11
. &l

figura 3. 14
Diagrama de tallo y-hojas para salida de SPSS.
Nota: Debe sealarse que en algunas situaciones, un tallo de longitud 1'0 puede dividirse en cinco tallos
basndose en los dos d!g!tos m~s bajos (;), doses y rreses (T), cuatros y cincos (F), seises y setes (SJ, y eri !os
dos dgito! ms altos (.} o un tallo de longitud 10 puede dvdtrse en dos tallos basndose en dgitos bajos (Lo
)y altos (lfo .). Como se ve en la figura 3.14, SPSS utiliza los smbolos <v . para divisiones en dos drecones
de los tallos. Adems, como se observa en la figura 3.H, con una muestra de un tamao de 400, no hay
suficiente espacio en la pgina para.imprimir todas las hojas (por ejemplo, las observadones)que se bifurcan de
algunos
tallos. rara compensar esto, SPSS determin que cada hoja representara dos observaciones y utiliz el smbolo &
para denotar el valor de hoja que se repite un nmero impar de veces.

84
3

Capitulo

Presentacin de datos numricos en tablas y dlagrarnas

r1

'.

'

Ji

1
W

1
I. '
g.

60< :.

:<.. .::10:.

.\e.--:.::..

9 0

. t~,;;:,~;~QTAL .

:. :.

Wl:

Ji.

. ... ";

..

Figure 3.15

:. -.

sJida de STATISTIX de distribuci6n de frecuencia y porcentaje

::.:: ..; .:-,: .,. --~~:_, ~.:..'.':."....:.t.. :

, ..

~1~~!~rn

:'90

100.

. RINCOME'~

.10

~}f;~f:~,:<:"~ogram;i de frecuencia de salida de STATISTIX.


.
.Flgul'35 3.15, 3.16 y 3.17
),,.:~; ':':-.- ::: :. (J.lmo ilnal!znmos en la seccin 3.3.4 de la pgina 65, existe mucha subjetividad al seleccionar limites de clase
>;.;:.< :;: . _.en l;u dlstribucion\'~ de frecuencia. AqLI! observamos que los lmites de clase en las distribuciones d.e
~i;~B.~:::.: .. :fl:~enc!a >' poteenra;e obtenidos por STATISTIX en la figura 3.15 concden con aqullos para el histograma y
".{i:::::;.: . !:l.of.l~; obtenidos por STt\TISTJX en las figuras 3.16 y 3.17. Puesto que cada paquete estadstco se programa
rnanera diferente para establecer los limites de las clases en una distribucin de frecuencia, otros paquetes
~:i:.'.'\i>~)~n,e~nPTCducir r~sultac:l~ d!ercntes. Sin embargo, podramos controlar esto ejerciendo ciertas opciones.
'-/~~i;{am~s entonces establecer los limites inferiores y superiores de Las clases segn lo deseemos y nuestra
.::/"'1~dasena C(msst;ncr. sin importar el paquete que elijamos.

<~'.">'::.:,1'.-..

'.:":'.<>::-..:de

Uso di3 la computadora para tablas y diagramas con datos numricos

.;::.</:;~~::.\: .
: .:+-v:>'>
: -::_{(L{f:,:
.:.:-.

. " ::~ ....

Figura

:.

-".'

.. :.

s.t 7

Ojiva d porcentaje de salida de STATISTJX.

lo

dlares ypor
general se agrupan.en los veirltes pajos; para las mtijer~~1-lo ingr~s.s
varan entre 1O.1 y. 62,8 mles de dlares y se agrupan abrumadoramente ei} lp.S_:_die-

._, ce~ ~~~~Qs_. ~~-c~{>l9 ~9i::~~~aJ'.lX~P~n.qfr.~F~:~g~.)psJngr~(O.~.J?.~~s?ri?l~s.Je1:1~~9~:.e~


los'dces ltos.Jas 'dos dlstrbucions son.razoablemehte'sfmllars eniomu.L'."\. :

; :_) :~H~-G?-~~-~Y. _t~~l)-~~#}~s~~pk~tete~~d<ti#_ey~i.ya{tr~.$_:~H_f~~~~~i~#~~g~-~~!9

::potenciales respecto -ali,.oras Wlba1~d~s.~ 9u~;~:gq9}:i~I eqip1~-n1un;i.~~(,r4~l)!O,~.cr.


~ ;~i9n~s;. Un .h~isi.5.';~s~~dsti~~ (le~cr1p_t_ivq_ b~sd.q:eif fasf~wue.~a~ 3,":.$$.$.'.,Yotj-~~
. preguntas -referentes a:1_a:s. :V~r!abls: niirii#.~as :~ t(r'.hcu~sJ~ -sobre)~ .~fJc<:i_n

-~n.?:1~~-t~tF.~~Y~~t.c?>..~ b~~~-_de~,~?l,().(lt9spe
.A me..~.l!~.R~.cornp~e11s10J:l
"~1?.P!M?.?~-~~~-de~s~.lfl:Fon:ipps~c:;ioI1''de-l~:fett,~fde,.~~
<!_f,l1.4~~a..s,o~pleto
a;t:~~~r
~~
-d~.~11i!!Jpo
: de l\alosha Inqtisti'..iesY-.Jo .&sistir~ 'en sus delberacoeston .1a!-S~i:CO:rporatin

"respecto al ct.s~riclltle {in:paqute.&:be~~do#,:a: ~iti~l~a~~s:::~/ r:.: .:_:/:}fe:: =:-<.~ .:


Encuesta/Proyecto

de la seccin 1.8

Los siguientes problemas se refieren a los datos de muestra obtenidos del


cuestio- natio de la figura 2.6 de las pginas 28-29 y presentados en la tabla
2.3 de las pginas 33-40. Deben resolversecon la ayuda de un paquete de
computadora disponible.
Suponga que fue contratado como asistente de Investigacin de Bud
Conley, vicepresidente de recursos humanos de Ka1osha Industries. l le ha
dado una lista de preguntas (vanse los problemas 3.44 a 3.59) que
necesita responder antes de su encuentro con representantes de B&L
Corporatlon, la compaia consultora de beneficios a empleados que
contrat.
Para cada uno de los siguientes problemas (3.44 a 3.59) referentes a la
Encuesta sobre la satisfaccin de los empleados:
(a) Forme el diagrama de tallo y hojas.
(b) Forme las distribuciones de frecuencia y de porcentaje.
(e) Graflque el histograma.
86

Captulo

Presentacin de daros numricos en tablas y diagramas

. . : :::. .

.. ..

. -."':, .. .
:

.. .. ';: .. -'.

:-~

/..f.':L:~~;(: ni.t .: :;>


-r ,

of RINCOME
l

: .

:f2)"

._5:.

';

.....

:~:

....

. : 7: :.:

:::

: : . : ... :...

i ssssssssssssss6666666667n7111?1777

:~mmmii~:7,7777~~..~

2 :.OOOOOOOH.lHZ22.2233'.323J33~.444

;\::;,,,.u;, .~
-; :10 :,:

..: .. :

ti'> i: oooo111233333J444.i4.

1...: ..

4 '00134
4

... ;'..r:.rra :>. not~ SEX'

Ei88sss8s9999999

..

.:, ,: (; :-;:''.:.<:

....-,

i:::i: .: '5.:,, . .: ss.. a1.


.:.f':. t5 ).2
::!~:.:~:-:.: ...,::

:.:

......

Stem-andleaf

. :.:r

. :';

.":

.. . . :\:
.. :::

=. l

is for Mi:i.le and

.: r:
1

SEX ;::: .2.

.: ... :

is far Female

Figura 3.18

~iagratnas de tallo y hoja de M1NITAB de ingresos personales de empleados de tiempo


complete mujeres y hombres.
Nota: i un diagrama de tallo y hojas de M!NlTAB, los nmeros de la primera columna son conteos
acumulados de las observacioneshasta llegar a la clase que contiene el valor mediano o medio. En el grupo
i.upcri.orel (29) significa que hay 29 observaciones en la clase que contiene el valor medio. Los nmeros
escritos debajo de (29) son los conteos acumulados, comenzando desde los Ingresos ms grandes y
r~ocediendohasta la clase que contiene el valor medio. Ademas, en estos diagramas de tallo y hojas de
MINITAS, los tallos se han diVldido en d!gitos bajos (L) y altos (H), pero estas Ietras no aparecen en la
Impresin:

:.J.:-: .: .:
.: '.

.3.45
3.46

(d) Grafique el polgono de porcentaje.


(e) Forme la distribucin de porcentaje acumulativo.
(f) .Grafique la ojiva.
(g) r.t:;Mlf.!> Escriba un memorndum a Bud Conley analizando sus
hallazgos.
Existen diferencias en los ingresos personales de los empleados de
tiempo completo de Kalosha Industries basndose en la participacin
de un individuo en las decisiones presupuestarias (vanse las preguntas
? y 22)?
Cules son las diferencias en los ingresos personales de los empleados de
tiempo completo de Kalosha Industres basndose en un agrupamiento ocupacional (vanse las preguntas 7 y 2)?
Cules son las caractersticas de la distribucin del nmero de horas
tipicamente trabajadas por semana por todos los empleados de tiempo
completo de Kalosha Industries (pregunta 1)?

cJ

{'r\

Uso de la computadora para tablas y diagramas con datos numricos

3.47

.3.48

3.49
3.50

3.51
3.52
3.53
3.54

3.55
3.56

3.57

3.58

3.59

111

Existen diferencias de gnero en el nmero de horas tpicamente trabajadas


por semana por todos los empleados de tiempo completo de Kalosha
Industries (vanse preguntas 1 y 5)?
Existen diferencias en el nmero de horas tpcamente trabajadas por semana
por todos los empleados de ternpo completo de KaloshaIndustres basndose
en la part:ipaci~de un individuo en las decisiones presupuestarlas (vanse
preguntas 1 y 22)?
.
.
..
.
Existen diferencias en el nmero de horas tpicamente trabajadas por semana
por todos los empleados de tiempo completo de Kalosha Industries basndose
en un agrupamiento ocupacional (vanse preguntas 1 y Z)?
Cules son las caractersticas de la distribucin de duracin del empleo (en
aos) entre trabajadores de tiempo completo de Kalosha Industries (vase
pregunta 16)?
Existen dferenc,.s de gnero en la duracin del empleo (en aos) entre
trabajadores de tiempo completo de Kalosha Industries (vanse preguntas 5y16)?
Cules son las caractersticas de J~ distribucin de edad (en aos) entre
trabajadores de tiempo completo de Kalosha industries (vase pregunta 3)?
Existen diferencias de gnero en las edades de los trabajadores de tiempo
completo de Kalosha Industries (vanse preguntas 3 y 5)?
C1.1les son las caractersticas de la distribucin de educacin alcanzada (en
aos de enseanza formal) entre trabajadores de tiempo completo de Kalosha
Industries (vase pregunta 4)?
Existen diferencias de gnero en el nivel alcanzado de educacin entre
trabajadores de tiempo completo de Kalosha Industries (vanse preguntas 4 y 5}?
Cules son las caractersticas de la distribucin del nmero de promociones
recibidas al trabajar en Kalosha Industries por todos los trabajadores de tiempo
completo de Kalosha Industries (vase pregunta 17)?
Existen diferencias de gnero en el nmero de promociones recibidas al
trabajar en Kalosha Industries por todos los trabajadores de tiempo completo
de Kalosha Industries (vanse preguntas S y 17}?
Cules son las caractersticas de la distribucin de ingresos familiares totales ...
entre trabajadores de tiempo completo de Kalosha Industries {vase pregunta 8)?
Cules son las caractertstcas de la distribucin de aos de empleo de
tiempo completo desde la edad de 16 aos para todos los trabajadores
de tiempo completo de Kalosha Industries (vase pregunta 15}?

Reconocimiento y prctica de una adecuada


presentacin tabular y de diagramas y
exploracin de cuestiones ticas

Hasta este punto hemos estudiado cmo se prepara una serie de datos recolectados

y luego se presenta en forma tabular y diagramtica a fin de hacer los datos ms


manejables y significativos con propsitos de anlisis. Si nuestro anlisis debe
ampliarse mediante un despliegue visual de datos numricos, es esencial que las

tablas y diagramas se presenten clara y cuidadosamente. Los adornos tabulares y la


"basura dagramca" deben eliminarse para no oscurecer el mensaje dado por los
datos con adornos innecesarios (referencias 3, 11, 12, y 15). Adems, al presentar
los diagramas debemos evitar ciertos errores comunes que distorsionan la impresin visual (referencias 2, 4 y 6). Tres de estos errores son:
1. No lograr comparar dos o ms series de datos sobre una base relativa.
2. Comprimir el eje vertical.
3~ No lograr Indicar el punto cero hasta abajo del eje vertical.
88

Captulo 3

Preseneacln de datos numricos en tablas y diagramas

~'

f;,

~ji

.9.1.

Eliminacin

de

la

basura

diagramtica

1
1

AJ hojear revistas y peridicos a menudo encontramos qu~ las tablas y diagramas

estn adornados con varios iconos y smbolos para haceflos atractivos a sus lectores. Desafortunadamente, avivar una tabla .o diagrama con frecuencia oculta o
distorsiona el pretendido mensaje transmitido por los datos. Por ejemplo, . algunas

~~

:J.fi.
;;

representaciones visuales que "atraen la vista" que tpicamente encontramos en


revistas y peridicos intentan errneamente mostrar "reas" de iconos representativos de informacin numrica. Puede alguien realmente leer e .nterpretar tales
reas bidimensionales con precisiri? La respuesta es no. Como se ve en la figura
3.19, estas grficas pueden ser atractivas, pero rara vez funcionan!

.~~

A Shrlnklrig Catch

Cap,ura armal, eJijmada, de

. otras en la Bahla de
. Ch~sapeakeespecificada en
. : mn!ontis.debU!l~ls ::'

..

. t.930~s: ......

..

.. ~Omitfona
debusMls
: r.

Figura

3.19

--' .

._19~i

..

. 1912
1982

4
,.

. lS92.

5
3.5
18.OOO
t>usho<s

Repre!lentacin "inadecuada" de la captura estlmada de ostras


(en mlllones de bushels) en la baha de Chesapeal<e durante
varios periodos,
Puente: TheNew York Times, 17 de octubre de 1993, pg. 26.

; ..

.
En la figura 3.19, el icono que representa los 20 millones de bushels est.fuados de ostras atrapadas en la dcada de 1890 es realmente cinco veces el
tamao del icono que representa los 4 millones de bushels estimados de
-ostras atrapadas en 1962? Esta ilustracin puede llamar la atencin, pero por
ro general no muestra nada que no pueda presentarse. mejor en una tabla de
resumen, una grfica digipunto o una grfica de los datos en el tiempo (vase
.:(:at1ftulo 19).

<:..
\Y{/:

}::}.=}>:>

f('!'i

,=.~"'-:j-:::.v-.-2--~0-rt-~-~o--rsm-~_-e_nel~-a-n~_-b_~l~a--acc-

_ei_o_n__d_de_d__as__et__ri_oe_s_s

~)!~,~~.#=>;~hfa seccin 3.4 demostramos por qu es necesario comparar dos o ms series de

\)(:>:. ~tos sobre una base relativa, y las figuras 3. 7 (pgina 72) y 3 .9 (pgina 77), respec t,:Xi{ .~:V~i;ne!lte, mostraban los polgonos de porcentaje y las ojivas de porcentaje ade'}V:> :$..i:tldos a~ comparar las colegiaturas P,econocimiento
a residentes fuera
del de
estado
de 60 escuelas
de tabular y de
y prctica
una adecuada
preso?ntacin
r:

90

captulo 3

Presentacin de datos numricos en tablas y diagramas

diagramas

;\=().;:j J~~ Y 45 de

Carolina del Norte. El uso de conteos de frecuencia en vez de por-

\)/{:; q:~t(lj~~9 proporciones sera engaoso. Para mostrar esto, en las figuras 3.20 y 3.21
':/iiiK\ :4.e)a pgina 90 se muestran los polgonos de frecuencia y .las ojivas de frecuencia
):~:.:./:: .:~J?,!:!etivos que "comparan" las colegiaturas a residentes fuera del estado de O

.;')<\-; ,_.e~uelas -, de Texas y 45 de Carolina del Norte. Adems, para acentuar la distors1n
:.:;;e;'.{;.;:. ~~l;.se incluyen las colegiaturas a residentes fuera del estado cobradas por los 90
;\t~};:r~::~o1eg't!;Wy universidades de Pennsylvania (vase el Conjunto de datos especiales 1
,:<~ apndjce D en las pginas D4-DS).

P,econocimiento y prctica de una adecuada preso?ntacin tabular y de diagramas


90

captulo 3

Presentacin de datos numricos en tablas y diagramas

25

..

y~c ,

.:.~:;.

".. .. :

.';,,,.:.'. ..

\/~~;:~L.;: ...~'..;:~:!

20
(/)

.!!!
(l)

~~,:.:). '..'...

15

::i

(1)
Q)

.,1 ~.. ~ . . . ,

Q)

"O

iO

CD

E
::J

'

........

\.,

.f .
:,:..

..:. .

',\ '

..,'

..

\ .,

)~~~;.

.:. .., ,
;:)

_ ;

v
~:

.\

:, ..:_;_. .

:::.x: .

o . .'......""'""-f-1..---'----'----'--'\~---,_~..-... _'il.-...,c-=-'-==- --=...'..\.f-~......

, .; ..;;9;;:~: .
o

:;-:. -:, ' ' .


4

10

12

14

.: 15

18

20

..

22

.. :24-..

26

Colegiaturas (en $000)

Figura 3.20

Polgonos de frecuencia "inadecuados" de las colegiaturas de residentes fuera del estado en 60


escuelas de Texas, 45 escuelas de Carolina del Norte y 90 escuelas de Pennsylvanla.
Fuente: Los datos fueron tomados de las tablas 3.3 y 3.7 y de "Amerlca's Best Co!leges, 1994 College Guide",
U.S. News & World Report, resumido de College Counsel 1993 de Natick, Mass. Reimpresin con permiso
especial, U.S. News & World Report, iC> 1993 por U.S. News Sr Worltl Report y por College Counsel.

90
80

70
en

~:>

50

" '

40

Q)

el)

"O

~
E

:>

. ....

60

,.

30
20
10

.: : ..

4 .

. 6

10

.11;:.. :11? ..
Colegi\!Uras (eh $0QOj
. ,'

J.?_,. .

18

..

..:

fig.ura 3 .21
Polgonos de frecuencin acurnulatlva "inadecuados" de las colegiaturas de resldentes fuera del
estado en 60 escuelas de Texas, IS escuelas de Carollna del Norte y 90 escuelas de Pennsylvania,
Fuent: Los datos fueron tomados de las tablas 3.3 y 3.7 y de "Amertca's Best Colleges, 1994 College Gulde",
U.S. News & World Report, resumtdo de College Counsel 1993 de Natick, Mass. Relrnpresn con penntso
espectal, U.S. Ncws & World lkport, 1993 por U.S. News & WarJ.1 Report y por College Counsel.

Como puede verse: de Ias fi~ra~ 3.20 y 3.21, los: polgonos de frecuencia y las
de las 45 de Carolina del Norte
son abrumados por aqullos de las 90 escuelas de Pennsylvania y no se pueden
hacer comparaciones significativas de tales diagramas dstorsonados,

"ojivas de frecuencia de las6deseuelas de

3 .9.3

::

Texas]'

Compresin de eje vertical

Es fcil alterar la impresin ~sual de un diagrriia -manpulando los puntos de


escala sobre el eje vertical o el horizontal. Para mostrar esto; .observe bien los polgonos correspondientes, gura 3.7 de la pgina ?'f. y-figura 3.20 de la pgina 90.
Ahora observe bien las ojivas correspondientes, figura .3.9 de la pgina 77 y figura
3.21 de la pgina 90. En nuestros dos. conjuntos 'de diagramas correspondientes
mantuvimos las dimensiones de puntos de escala iguales sobre el eje horizontal.
Para el eje vertical, sin embargo, tuvimos que tomar en cuenta que aadimos las
90 escuelas de Pennsylvana a las figuras 3.20 y 3.21 y, no obstante, para su ubicacin en su libro de texto, quisimos que los diagramas correspondientes ocuparan
la misma cantidad de espacio en las pginas respectivas. Por lo tanto, para justificar
las escuelas de Pennsylvania de la figura 3.20,. observe cmo cambia la "forma"
de las curvas al comparar los polgonos que representan las escuelas de Texas y
Carolina del Norte aqu y en la figura 3.7. De manera similar, para explicar las
escuelas de Pennsylvania de la figura 3.21, observe cmo cambia la "inclinacin"
o pendiente al comparar las ojivas que representan las escuelas de Texas y Carolina
del Norte aqu y en la figura 3.9.

Aun cuando ya sabamos de la seccin -3.9.2 que las figuras 3.W y 3.21 eran repre::

. . .

...

f.U{.::

sentaciones inadecuadas de sus polgonos y ojivas correspondientes (porque las


escalas verticales de las figuras 3.20 y 3.21 no usaban porcentajes o proporciones),
el punto importante aqu es que una compresin de la escala sobre el eje vertical
puede ocasionar una distorsin en la informacin visual que se est presentando .
Por ejemplo, si hubiramos construido nuestro histograma de porcentaje (vase la
figura 3.5 de la pgina 71) seleccionando marcas de tictac sobre la escala vertical
desde O hasta 100 en vez de desde O a 45, nuestro histograma se vera mucho ms
plano. Adems, se vera antiesttico en la mitad inferior del marco del recuadro,
dejando espacio de fondo innecesario en la mitad superior (vase el problema 3.60
de la pgina 93). Una buena regla general, entonces, es construir sus diagramas de
manera que utilicen todo el marco del recuadro.

3 .9.4

Fracaso al indicar el punto


cero sobre el eje vertical

El punto de inicio sobre el eje vertical debe indicarse con un cero para no distorsionar la impresin visual respecto a la magnitud de los cambios que ocurren en el
dagrama. Al tomar slo un pedazo del eje vertical, tales cambios pueden exagerarse. La figura 3.22 de la pgina 92 muestraesta distorsin visual.
Observe que en este diagrama el cero se omiti del eje vertical. Debido a esto,
el lector obtiene una visin distorsionada de la magnitud de las diferencias en las
transaccrones diarias. Por ejemplo, durante el periodo descrito, la sesin comercial ms activa ocurri el viernes 17 de septiembre, mientras que la sesin comercial
menos activa ocurri el lunes 12 de octubre (da de la Raza). Sin embargo, de la grfica mal trazada, la barra vertical que representa la sesin comercial ms activa es
tres veces ms larga que la barra vertical que representa la sesin comercial menos
activa, dando la impresin de que se triplic el nmero de acciones negociadas el
17 de septiembre respecto al 12 de octubre. Si el punto cero se hubiera represen-

Reconocimiento y prctica de una adecuada presentacin tabular y de diagramas

Captulo 3

Presentacin d~ datos numricos en tablas y diagramas

..

Figura

3.21.

Representacin "inadecuada" del


volumen de ventas (en millones de
acciones negociadas) de la Bolsa de
Vnlores de NuevaYor-k en el tiempo.
Fuente: The Nt!W Yori: Times, 20 de octubre de
1993, pg. 07.

' .:!1 ::
~

1:1

il

!J It1j ; }I i t 1 l] , .,
~

tado adecuadamente sobre el eje vertical, la grfica hubiera reflejado con precisin
que slo se duplic el nmero de acciones negociadas el 17 de septiembre respecto
al 12 de octubre.

3.9 . .S Uso de software de computadora


para tablas y diagramas

En la seccin 3.8 demostramos cmo un software de computadora apropiado puede ayudamos en un anlisis descriptivo de nuestros datos. La computadora es una
herramienta extremadamente til que puede almacenar, organizar y procesar informacin fcil y rpida y puede proporcionamos resultados, tablas y diagramas de"
resumen. No obstante, debemos tener en mente que la computadora slo es una
herramienta.
Veremos
a lo largo de este
texto, al demostrar
interpretar
variedad d las salidas
de computadora
correspondientes
a los etemas
que se estudiarn
en los captulos siguientes, que es esencial usar la computadora de una manera consistente con una metodologa estadstica correcta. Acurdese de. GIGO. La salida de
computadora que obtengamos depender de cuatro cosas: la capacidad del hardware utilizado, la calidad de la impresora elegida, la capacidad del software estadstico seleccionado, as como de su habilidad para elegir apropiadamente y usar el
software provechosamente. Y cuando se le presente informacin tabular y_ dagramtca proveniente de la salida de algn paquete de .software estadstico, tenga
cuidado con los adornos extra que puedan estar ocultando lo que los datos tratan
de transmitir.

una

3 .9.6

Cuestiones

ticas
Las consideraciones ticas surgen cuando estamos decidiendo qu datos presentar
en formato tabular y dagramtco y cules no presentar. Es de vital importancia,
.al conducir una investigacin, documentar tanto los buenos como los malos resultados, de forma tal que aquellos que.contnen tal investigacin no tengan que
"volver a inventar la rueda". Adems, al hacer presentaciones orales y presentar
informes escrttos sobre la investigacin, es esencial que lbs resultados se den de
una manera equitativa, objetiva y neutral. As pues, debemos tratar ele distinguir
entre una mala presentacin de datos y una presentacin no tica. Nuevamente,
como en nuestro anlisis de las consideraciones ticas en la recoleccin de datos

~.

::G:~1

{seccin 2.11.6), la clave es la intencn. A menudo, cuando se presentan adornos


en tablas y dagramas o se omite informacin pertinente simplemente se hace por
1_gnorancia. Sin embargo, _un compo rtamiento no tico ocurre cuando un investgador desea ocultar los hechos a propsito y distorsiona una tabla o diagrama o no
informa hallazgos pertinentes.

w~
}}i
-~

JJ

Problemas de Ja secci6n 3.9


. . 3.60

3.61

Segn lo enunciado en el ltimo prrafo. de la seccin 3.9 .3 de la pgina 91,


vuelva a trazar el histograma de porcentaje (figura 3.5 de la pgina 71)
seleccionando marcas de tictac sobre el eje vertical de O a 100 y luego comente
la esttica de su diagrama.
(P1oyecto del estudiante) Traga, a la clase un diagrama de peridico o
revista que considere que es una representacin mal trazada de alguna variable
numrica. Est preparado para presentar el diagrama al instructor con

1j~>~i(,]
~:::::::~::~:~~:~::~::;:d:::~ado
> .. ..

r\.

;-'):XJ({~t~

un repaso

y una revisin preliminar

se ve en el diagrama de resumen de la pgina 94, este 'captulo trat sobre la


datos. En la pg~a '54 de la s~ccin 3.1 se.ie prpor?on una.
. ~/' que poma enfasis en los puntos unportantes a estudiarse en el capitulo. Revise la
:;;)i: .'. : :)_ts~irpara ver si cree que ha comprendido estos puntos clave. Pai:a estar seguro, debe
/.('.j . :;oder responder las sguente preguntas conceptuales:

"'{;;i_L:~~:P'.~Z:~~n~a?_nd.e

lista

~9:~(-::/::: 1. Por qu es necesario

.
r

e
u
.e
ir

e,
)S

organizar una serte de datos numricos que


recolectamos?
. 2. Cules son las principales diferencias entre una clasificacin ordenada
y un diagrama de tallo y hojas?
. 3. Bajo qu condiciones es ms apropiado construir y usar distribuciones
de frecuencia y distribuciones de porcentaje?
4. Cmo difieren los histogramas y los polgonos con respecto a su
construccin y uso?
S. Cundo debe construirse y cmo debe usarse una ojiva de porcentaje
/~re . . (es decir, un polgono de porcentaje acumulativo)? .
;.:/l~i/\: ., ~- Por qu es la ojiva de porcentaje una herramienta tan til?
/)',:
. 7. c;::ul es el propsito de una grfica digipunto y cmo se construye?
;i:\~~:.> 8. Cules son algunas de las cuestiones ticas que hay que considerar al
.(':'
presentar datos numricos en formato tabular o diagramtco?

. ~\'.;iJ.~=,'?{:._:- ~eVise la lista de preguntas para ver si realmente sabe las respuestas y.p~ede (1)
/'.<":-!. . ~hcar sus respuestas a alguien que no ley este captulo y (2) dar referencias de

.~~'0;A:L.:)~uras o ejemplos especficos

que respalden su respuesta. Asimismo, vuelva a leer


{ij~)i[J:,?t,~q_u.lerade las secciones que pudieron parecerle no muy claras para ver si ahora
}~~;,};:,f~~en sentido.

$~F;;_,r,;'.fUna vez q~le los datos numricos recolectados han sido presentados en formaWf\7.::::!9.Jb.ular .Y dagramtco, como se hizo para Bud Conley de Kalosna Industries,

.'~!>/}~amos listos para hacer varios anlisis. En el siguiente captulo, se desarrollar


- .. . .,~i:}t~~ :variedad de mediciones .de resumen descriptivas tiles para el anlisis e nter':':'JP~.~tacin de datos.

.~h?.:

Presentacin de datos numricos: un repaso y una revisin preliminar

Diagrama de resumen del caplculo 3.

Juntando todo
TRMINOS CLAVE
agrupamientos de clase 62
ancho de intervalo de clase 63
88

clases 63
clasificacin ordenada

grfica digipunto
histograma
70

55

lmites ele clase

distribuc.in acumulativa

57

74

distrlbucin de frecuencia 62
distribucin ele frecuencia relativa

Captulo 3

forma sin procesar

"basura diagramtica"

diagrama ele tallo y hojas


SS
diagrama de tallo y hojas revisado

94

distribucin de porcentaje
79

64

polgono
71
punto medio de clase "o marca de
clase" 65
ojiva (polgono acumulativo)

68

Presentacin de datos numricos en tablas y dlagramas

68

54

75

~:

Problemas de revisin del captulo

3.67

f.tffo11lf.i~ Escriba una carta a un amigo subrayando lo que considera son.las


caractersticas ms interesantes o ms importantes de este captulo.
En sus propias palabras, explique la diferencia entre datos sin procesar y una
clasificacin ordenada.
Por qu es ventajoso usar un diagrama de tallo y hojas en vez de una
clasificacin ordenada?
Explique las diferencias entre distribuciones de frecuencia, distribuciones de
frecuencia relativa y distribuciones de porcentaje.
Al comparar dos o ms conjuntos de datos con diferentes tamaos de muestra,
por qu es necesario comparar sus distribuciones de frecuencia o de
porcentaje relativas?
Explique las diferencias entre histogramas, polgonos y ojivas (polgonos

3.68

acumulativos).
Explique las diferencias entre diagramas de tallo y hojas y grficas

3.62

3.63
3.64

3.65
3.66

3.69

dgpunto.
Los datos sin procesar mostrados a continuacin son los sueldos de inicio
de una muestra aleatoria de 100 estudiantes de computacin o de sistemas
de cmputo que recibieron sus grados de bachillerato durante 1993:
Sueldos de inicio ($000)

24.2

29.9

23.4

23.0

25.5

22.0

33.9

20.4

26.6

24.0

23.9
18.6
19.7
25.2
22.1
29.9
32.3
32.3
31.4

22.5
18.S
25.3
25.7
27.S
23.2
20.l
28.1
27.4

18.7

32.6

19.6

24.4
34.2
28.8
25.2
20.8
25.4
25.3
20.6

28.2
32.2
25.8
19.8
26.8
27.S
27.3

26.l
24.8
32.5
24.7
25.6
29.S
26.3
19.3
31.8

26.2
27.8
30.8
18.7
25.2
27.6
21.2
27.4
25.8

26.7
27.6
26.8
20.S
25.2
21.2
19.5
26.4
25.2

24.7
22.1
20.7
25.5
37.3
24.8
25.3
25.9.
26.5

22.Z
20.8
21.2
19.1
18.9
21.3
21.7

20.4
27.2
20.6
25.S
27.9
38.7
22.8
20.9
21.9

34.5
26.8

(a) Acomode los datos sin procesar en un diagrama de tallo y hojas.


(Sugerencia: haga que las hojas sean los dgitos deces.)
(b) Acomode los datos en una clasificacin ordenada.

3.70

!.50

l.00
2.00

(e) Forme la distribucin de frecuencia y la distribucin de porcentaje.


(d) Grafique el histograma de porcentaje.
(e) Grafique el polgono de porcentaje.
(f) Forme la distribucin de porcentaje acumulativo.
(g) Grafique la ojiva (polgono de porcentaje acumulativo).
(h) r.r;a11,,z.1.> Escribaun breve reporte a su decano describiendo los sueldos
de inicio de estos graduados recientes.
Los siguientes datos son los precios al detalle de una muestra aleatoria de 30
modelos de manmetros manuales de llantas:

6.50
7.50
3.00

2.00
3.00
3.50

2.50
2.00
3.50

4.00
3.00
3.00

3.50
3.50
3.00

S.00
3.50
4.00

3.00
S.00
1.50

S.00
6.00
1.SO

5.50
4.50
2.50

Fnerite: Copyright 1993 por Consumen Union of Unted States, tnc., Yonkers, N.Y. 10703. Adaptado con permiso de Cons11mer Reports, febrero de 1993, pp. 98-99.

Problemas de revisin del capitulo

3.71

{a) Acomode los datos sin procesar en un diagrama de tallo y hojas.


(Sugerencia: haga que las hojas sean los dgitos deces.)
(b) Acomode los datos en una clasificacin ordenada,
(c) Forme la distribucin de frecuencia y la distribucin de porcentaje.
(d) Graflque el histograma de porcentaje.
(e) Grafique el polgono de porcentaje.
(f) Forme la distribucin de porcentaje acumulativo.
(g) Grafique la ojiva (polgono de porcentaje acumulatvo).
(h) f.t;MMI> Si estuviera considerando comprar un manmetro manual de
llantas, qu ms deseara saber? Escriba una lista de preguntas que
formulara en una tienda de refacciones de automviles.
Los datossguentes representan el costo por mes de uso (en dlares) y la
calificacin de prueba de limpieza (O a 100} de una muestra aleatoria de 39
marcas de pasta de dientes en tubo.

Pasta de dientes

Costo por mes

Calificacin

.SS
.66
1.02
.53
.57
.53
.52
.71

86

Ultra brite Original


Gleem
Caffree Regular
Crest Tartar Control Fresn Mi.nt Gel
Colgare Tartar Control Gel
Crest Tartar Control Original
Ultra brtte Gel Cool Mlnt
Colgate Clear Blue Gel
Ctest Cool Mint Gel
Crest Regular
Crest Sparkle
Close-Up Tartar Control Gel
Close-Up Anti-Plaque
Colgate Tartar Control Paste
Toni'sof Maine Cinnamint
Aquafresh Tartar Control
Am Ant-Tartar Gel
Aim Extra-Strength Gel
Sllmer Gel
Mm & Hammer Baking Soda Fresh Mint Gel
Aquafresh
Aquafresh Extra Fresh
Close-Up Paste
TopolSpearment Gel
Topol Spearment
Close-Up Mint Gel
Alm Regular-Strength Gel
Pepsodent
Colgate Baklng Soda
Colgare Regular
ColgateJunior Gel
Colgare Peak
Arm & Hammer Bakng Soda Presh Mint
Rembrandt
Sensodyne Original
Sensodyne Gel
Viadent Original Anti-Plaque
Denquel
Butler Protect Gel

.SS

.59
.Sl
.67
.62
.66
1.07
.80
.79
.44
1.04
1.12
.79
.81
.64
1.77 .
1.32
.64
.55
.3.9
1.22
.74
.4~
.97
1.26
4.73
1.29
1.34
1.40
1.77
1.11

79
77

75
74
72
72
71
70
69
64
63
62
62
62
60
58
57
57
SS

56
53
85
82
76
72

70
58

Sl

50

39

29
28
53
80
48
53
37
20

Fuente: CQpyright 1992 por Consumers Union of United States, Inc., Yonkers,N. Y, 10703.
Adaptado con permiso de Consurner Reports, septiembre 1992, pp. 604-605.

96

Captulo
3

Presentacin de datos numricos en tablas y diagramas

f,:..:.:

}...

~.. ...

~
~

I'

3.72

Bolsa norteamericana

...

(ZS artculos)

l'~i:

s 6.88

~.),,, ..

1~~11
~~ .

Para cada una de las dos variables numricas:


(a) Forme el diagrama de tallo y bojas.
(b) Forme una tabla combinada de distribuciones de frecuencia y de
porcentaje.
(e) Grafque el polgono de porcentaje.
(d) Forme la distribucin de porcentaje acumulativo.
(e) Grafique la ojiva de porcentaje.
(f) rt;MlM> Escriba un reporte para su profesor de mercadeo resumiendo
sus hallazgos y caracterizando este producto.
Dadas las series de datos basadas en el precio de cierre de acciones de muestras
aleatorias de 25 artculos negociados en la Bolsa Norteamericana
y SO artculos negociados en la Bolsa de Nueva York:

. . : .:
... . ..

.
,.

4;,i~:;
3.73

.75
3.88
4.12
11.88
15.88
16.SO
8.75
9.25
7.50
S.38
14.38
2.50
4.88
6.38
33.62
4.88
9.00
2.0Q
20.00
14.25
4.00
15.25
2.38
49.50

Bolsa de Nueva York


(SO artculos)
$36.50
23.50
8.25
57.SO
27.12
3.75
25.00
15.SO
36.12
6.00
9.12
33.38
.22.50.
8.75
8.62
5.75
21.88
6.12
25.00

15.88
24.00
10.88
18.75
53.88
20.38

.$26.00
19.00
46.00
23.SO
22.62
12.88
5.50
37.50
9.88
59.12
35.25
20.62
24.00

so.so

29.38
3.75
64.75
14.25
46.38
4.75
25.00
35.00
9.00
12.38
31.00

(a) Usando anchos de intervalo de S 10, forme la distribucin de frecuenciay


la distribucinde pojcentale para cada serie.
(b) Graque el histogramade frecuencia para cada serie.
(e) En una grfica, graque el polgono de porcentaje para cada serie.
(d) Forme la distribucin de porcentaje acumulativo para cada serie.
(e) En una grfica, graflque la ojiva ((polgonode porcentaje acumulativo)
para cada serie.
.
(f) fMMHt> Escriba un breve reporte a su profesor de finanzas
comparando y contrastando las dos series.
Una compaia distribuidora de aparatos al por mayor.deseaba estudiar sus
cuentas por cobrar de dos meses sucesivos. Se seleccionaron dos muestras
independientes de 50 cuentas para cada mes. Los resultados se resumen en Ja
tabla siguiente:

Froblemas de revisin del captulo

Distribucin

de frecuencia para cuentas por pagar

Cantidad
$0
$2,000
$4,000
$6,000
SS,000
$10,000
Totales

3.74

hasta menos de
hasta menos de
hasta menos de
hasta menos de
hasta menos de
hasta menos de

Frecuencia
de marzo
$2,000
$4,000
$6,000
$8,000.
$10,000
$12,000

Frecuencia
de abril

:.6
.13
17
10
4

-10
14
13

10

-
so

50

(a) Grafique el histograma de frecuencia para cada mes.


(b) En una grfica, grafique el polgono de porcentaje para cada mes.
(e) Forme la distribucin de porcentaje acumulativo para cada mes.
(d) En una grfica, graque la ojiva ((polgono de porcentaje acumulativo)
para cada mes.
(e) f.r;rnm.r;,;. Escriba un breve reporte a su profesor de contabilidad
comparando y contrastando las cuentas por cobrar de los dos meses.
Usted trabaja como ingeniero de control de calidad en Chrysler Corporation y,
en un esfuerzo por mejorar la calidad de los productos de su compaa, desea
comparar varias caractersticas de diseo de modelos de automviles

estadounidensesy extranjeros,
La siguiente tabla contiene las distribuciones acumulativas y las distribuciones
de porcentaje acumulativo de la distancia de frenado (en pies) a 80 mph para
una muestra de 25 modelos de automviles de fabricacin estadounidenses y
para una muestra de 72 modelos de automviles de fabricacin extranjera
obtenidas en un afio reciente.

Distribuciones de frecuencia y de porcentaje acumulativas para la distancia de frenado


(en pies) a 80 mph para modelos de automviles estadounidenses y extranjeros

Distancia

de frenado

(en pies)

Modelos de automviles
estadounidenses
Valores indicados "menores que"
Nmero

<t

Modelos de automviles
extranjeros
Valores indicados (menores que)

Porcentaje

Nmero

210
220

o.o

4.0

230

8.0

12.0
16.0

4
19
32

240
250

260

4
8

32.0

270

11

44.0

280

17

68.0

290
300
310

21
23

320

25

84.0
92.0
100.0
100.0

zs

54
61
68
68
70
71
72

Porcentaj e

o.o
1.4
S.6

26.4
44.4
75.0
84.7
94.4
94.4
97.2
98.6
100.0

Fuente:Los datos fueron extrados de Rolltf & Track, vol. 42, nm. 2 (octubre de 1990), pg. 47.

Basndose en estos datos, responda las siguientes preguntas:


(a) Cuntos modelos de automviles de fabcacin estadounidense tienen
distancias de frenado de 240 pies o ms?
(b) Cul es el porcentaje de automviles de fabricacin estadounidense con
distancias de frenado de menos de 260 pies?
(c) Qu grupos de modelos de carros, de fabricacin estadounidense o
extranjera, tienen el alcance ms amplio de dstanca de frenado?

98

Captulo

Presentacin ele datos numricos en tablas y diagramas

3.75

(d) Cuntos modelos de automviles de fabricacin extranjera tienen


distancias de frenado de entre 260 pies y 269.9 pesdnclusve)?
(e) Use las distribuciones acumulativas para construir las distribuciones de
frecuencia y las distribuciones de porcentaje para cada grupo de modelos
de automviles. .
(f) En una grfica, grafque Ias dos ojivas de porcentaje.
(g) rt!it_l'ilfI> Escriba un breve reporte comparando y contrastando la
informacin de distancia de frenado para los dos grupos de modelos de
automviles. . .
Usted est empleado como analista de una importante compaa de
construccin de edtficios que est interesado en construir un centro
comercial ya sea en Centerport o Northport, dos comunidades adyacentes
en la costa norte de Long Island en el condado de Suffolk, Nueva York.
La siguiente figura contiene los polgonos de frecuencia relativa acumulativa
(ojivas) de ingresos familiares de dos muestras aleatorias de ;wo familias
extradas de las dos comunidades .

.;:.

.
.:

Polgonos de frecuencia

. :. .-:.~: .

60
90
120 .'
' 1gresos'famniires (n$~00)

150

relativa acumulativa de
ingress familiares para
dos comunidades.

Con base en estos datos, responda las siguientes preguntas:


(a Cuntas de las familias de Centerport tienen ingresos de $120,000 o
ms?
(b) Cul es el porcentaje de familias de Centerport que tienen ingresos de
menos de $90,000?
(e) Qu muestra tiene un mayor alcance de ingresos?
(d) Cuntas de las familias de Northport tienen un ingreso ele al menos
$90,000 pero menos de $105,000?
(e) Tiene Centerport Q Northport ms ingresos familiares de $60,000 o
ms?
(f) l Qu porcentaje de familias de. Centerport tienen un ingreso menor de
$60,000?
(g) Qu porcentaje de famlias de Centerport tienen un ingreso mayor de
$~.0,000o ms?
(h) Qu comunidad tiene ms ingresos por debajo de $120,000?
(i) Use las ojivas para construir la distribucin de frecuencia relativa y la
distribucin de frecuencia para cada comunidad.

Problemas de revisin del captulo

(j) En una grfica, graque los dos polgonos de frecuencia relativa.


(k) PJ;il'l!z.t~ Escriba un breve reporte comparando y contrastando las dos
distribuciones de ingresos.
3.76

Usted trabaja para una agencia consultora independiente contratada por una
conocida compaa de bienes races especializada en la venta de casas en las Po
cono Mountains en el noreste de Pennsylvana, Sii. tarea es evaluar las tasas
de hipotecas de los propietarios de casas en dos populares comuntdades.
La figura siguiente contiene las ojivas de porcentaje de las hipotecas de 100
propietarios de casas muestreados en Penn Estates y 200 propietarios
muestreados en Hemlock Farros, dos comunidades de Pocono .

.90 ...;...-....;._f-:-'--.,..~.,.,...,...~ ~,..,.,.,,,..,,.,;,,.;JF;': =""""-"+'.-M-~ ;--1


soi----+----+----tt-"--~-i-.----+----~-1
701--~--1---.+-----14---..:.-

Ojivas de porcentaje de tasas


de hipotecas de 100
propietarios de casas de
Penn Estates y 200 de

,_...;,..-"'-4---'--1

\\.

Hemlock Farms.

'

"

Basndose en estos datos, responda las sguientespreguntas:


(a) Cul es el alcance de las tasas de hipotecas de los propietarios de casas de
Penn Estates?
(b) Cul es el alcance de las tasas de hipotecas de los propietarios de casas de
Hemlock Farms?
(e) Cincuenta por ciento de los propetarlos de casas de Penn Estates tena
hipotecas con tasas menores a qu cantidad?
(d) Cincuenta por ciento de los propietarios de casas de Hemlock Farms
tena hipotecas con tasas menores a qu cantidad?
(e) Qu porcentaje de los propietarios de Penn Estates tenia hipotecas con
tasas de al menos 7.5% pero menos de 8%?
(f) Qu porcentaje de los propietarios de Hemlock Parrns tena hipotecas
con tasas de menos de 8%?
(g) Cuntos de los propietarios de Penn Estates tenan hipotecas con tasas de
8.5% o ms?
(h) Qu comunidad contiene el mayor porcentaje de propietarios que tenan
hipotecas con tasas menores de 7 .25%?
(i) Use las ojivas para construir la distribucin de porcentaje y la distribucin
de frecuencia para cada una de las muestras.
(j) Grafique los dos polgonos de porcentaje en una grfica.
(k) N!iililiI> Escriba un breve reporte comparando y contrastando sus dos
distribuciones. Qu parece ser evidente respecto a las tasas de hipotecas
en estas dos comunidades? Qu razn(es) puede(n) atribuirse a esto?
(Sugerencia: Una de estas comunidades ha tenido un crecimiento estable
durante 20 aos: la otra ha crecido rpidamente durante 10 aos.)

100

CapituSo
3

Presentacin de datos numricos en tablas y diagramas

3.77

(Proyecto del estudiante) Elija una accin enumerada en la NYSE y,


comenzando en un lunes, registre su precio de cierre diario durante un
perodo 'de cuatro semanas completas (20 das) en el que est abierto el
mercado de valores. Tambin registre los cambios en el precio de cierre de la
sesin de negocios precedente durante este periodo de cuatro semanas.
(a) Analice cada serie de datos.
(b) Parece haber un patrn en los precios
cierre de la accin durante este
perodo?
.
(e) Parece haber un patrn en los cambios de los precios de cierre con el
tiempo?

(d) H!iillJlZI> Escriba un memorndum a su profesor de finanzas basndose


en sus hallazgos en (b) y (e).

de

..

. . ..

Proyectos de minicasos de aprendizaje


colaborativo
Nota: La clase debe dividirse en grupos de tres o cuatro estudiantes. Inicialmente se

selecciona un estudiante pata que sea coordinador del proyecto, otro estudiante es el

que registra el proyecto y un tercero es el cronometrador del proyecto. Para que cada
estudiantegane experiencia en el desarrollo del trabajo de equipo y en las habilidades
(le liderazgo) despus de cada proyecto debe haber una rotacin de posiciones. Al prindpio de cada proyecto, los estudiantes deben trabajr silenciosa e individualmente
durante n corto periodo espectficado. Una vez que cada estudiante ha tenido la oportunidad de estudiar los asuntos y refteiar sus posibles respuestas, el grupo se rene y
se: sigue con una discusin de grupo. Si todos los miembros de un grupo estn de
acuerdo con las sotudones, el coordinador es responsable de presentar la solucin del
proyecto del equipo nl instructor con las firmas de los estudiantes indicando tal
acuerdo. Por otra parte, si uno o ms miembros del equipo no estn de acuerdo con la
'solucum ofrecida por la mayora del equipo) una opinin ele minorapuede anexarse
al proyecto presentado, con fitmats),
CL 3.1

CL 3.2

El analista investigador de la compaa de servicios .de asesora colegial se hiri


levemente en un accidente automovlstco y requiere ayuda para terminar su
informe respecto a las colegiaturas cobradas a residentes fuera del estado por
colegios y universidades en diferentes regiones del pas. Con el fin de cumplir
con la fecha lmite para una presentacin a la junta de directores, el gerente de
cornercalzacn decide contratar a su grupo, la Corporacin
, para
ayudar al analista investigador en sus esfuerzos. Dado el Conjunto de datos
especiales 1 del apndice D de las pginas D4-DS respecto a las colegiaturas
cobradas a residentes fuera del estado en los 90 colegios y universidades del
estado de Pennsylvana, la Corporacin
est preparada para:
(a) Delinear cmo procedern los miembros del grupo con sus tareas.
(b) Formar la distribucin de frecuencia y de porcentaje en la misma tabla.
(c) Graflcar el polgono de porcentaje.
(d) Formar la distribucin de porcentaje acumulativo.
(e) Grafcar la ojiva de porcentaje.
(f) Realizar un anlisis descriptivo comparando las colegiaturas de
Pennsylvana con las de Texas y Carolina del Norte.
(g) Escribir y presentar un resumen ejecutivo, anexando todas las tablas
y diagramas.
(h) Preparar y ofrecer una presentacin oral de diez minutos al gerente de
comercializacin.
Una popular revista familiar interesada en publcar un artculo sobre las
virtudes dietticas (o falta de stas) de cereales listos para comerse contrata a
su grupo, la Corporacln
, para estudiar su costo y caractersticas
nutrlconales, El tema que el artculo trata de presentar es que Jos "cereales
listos pata comerse son una forma rpida y eficiente de que la familia
comience el da". Contando con el Conjunto de datos especiales 2 del

Problemas de revisin del capitulo

CL 3.3

CL 3.4

apndice D de las pginas 06-07 que muestra Informacln til sobre 84 de


estos cereales, la Corporacin
est preparada para:
{a) Delinear cmo procedern los miembros del grupo con sus tareas.
(b) Realizar un anlisis descrptvo.
(c) Escribir y presentar un resumen ej.ecutivo, anexando todas las tablas
y diagramas.
.
.
(d) Preparar y ofrecer una presentacin oral de diez minutos al editor de
comida de la revista.

El fabricante de conocidas fragancias de hombres y mujeres est planeando
desarrollar una nueva lnea de productos a comercializarse para la siguiente
temporada vacacional. El director de comercializacin contrata a su grupo, la
Corporacin
, para estudiar las caractersticas de fragancias actualmente,
disponibles de manera tal que el fabricante est en mejor posicin de poner
precio a su lnea de productos recin desarrollada. Contando con el Conjunto
de datos especiales 3 del apndice D de las pginas D8-D9 que muestra
informacin til sobre 83 de estas fragancias, la Corporacin
est
preparada para:

.
{a) Delinear cmo procedern los miembros del grupo consus tareas.
(b) Realizar un anlisis descriptivo.
(c) Escribir y presentar un resumen. ejecutivo, anexando todas Ias tablas y diagramas.
(d) Preparar y ofrecer una presentacn oral de diez minutos al director de
comercializacin.
Un conocido peridico desea presentar un artculo especial sobre cmaras
compactas de 35 mm en su seccin dominical de viajes y contrata a su grupo,
la Corporacin
, para realizar un anlisis descriptivo respecto a las caracterstlcas de equipos importantes. El tema del artculo que el edtor de viajes
desea que se escriba se refiere al "importante valor de las cmaras de 35 mm
para los viajes familiares". Contando con el Conjunto de datos especiales 4 del
apndice O de las pginas 010-Dll que muestra informacin til sobre 59 de
estas cmaras, la Corporacin
est preparada para:
(a) Delinear cmo procedern los miembros del grupo con sus tareas.
(b) Realizar un anlisis descriptivo.
(e) Escribir y presentar un resumen ejecutivo, anexando todas las tablas y diagramas.
(d) Preparar. y ofrecer una presentacin oral de diez minutos al editor de viajes. .,

Nota Final

tanto, el diagrama de tallo y hojas {revisado) es,


esencialmente, una claslcacn ordenada, una distribucin
de frecuencia y un hlstogtama de frecuencia, todos en uno,
sln sacrificar la informacin original relativa a las mismas
observaciones individuales.

l. Al final de la seccin 3.2 comentamos que el diagrama de


tallo y hojas (revisado) es, tal vez, la tcnica ms verstil en
estadstica descriptiva porque simultneamente organiza
los datos para anlisis descriptivos posteriores y los
presenta tanto en forma tabular como diagramtica. Por lo

Referencias

l. Charnbers.}. M., W. S. Cleveland, Il. I<leinec, y P. A.

Tukey, Graphical Methods for Data Analysis (Boston, MA:

Duxbury Press, 1983).


2. Croxton, F., D. Cowden, y S. Kleln, Applied General Statislics,
3d ed. (Englewood Cliffs, NJ: Prentce-Hall, 1967).

3. Ehrenberg, A. S. C., "Rudments of Numeracy", [oumal of


the Royal Statistlcel Socety, Series A, vol. 140 (1977), pp.
277-297.
4. Huff, D., How to Lie with Statistics (Nueva York: W.W.
Norton, 1954).
S. Hunter, J. S., "The Digidot Plot", The American Statistician,
vol. 42 (Febrero. de 1988), p. 54.
6. Kmblc, G. A., How to Use (and Misuse) Statlsucs.
(Englewood Cliffs, NJ, Prentce-Hall,

1978).

7. MlN!TAB ReferenceManual Release 8 (State College, PA:

9. SAS Users Guide Yerslon 6 (Ralegh, NC: SAS Institute,


1988).

10. STATISTIX Version 4.0 (Tallahassee, FL: Analytcal


11.

Software, Inc., 1992.).


Tufte, E. R., The Visual Display of QuantittiveInformation
(Cheshire, CT: Graphics Press, 1983).

12. Tufte, E. R., Envisoning Information (Cheshre, CT:

Graphlcs Press, 1990).


13. Tukey, J., Exploratory DataAnalysls (Rcadng, MA:

Addlson-Wesley, 1977).
14. Vellernan, P. F., and D. C. Hoaglin, Applications, Bastes,
and Computing o( Exploratory Data Analysis (Boston, MA:
Duxbury Press, 1981).
15. Wainer, H., "How to Display Data Badly," The American
Statstidan, vol. 3g (mayo 1984), pp. 137-147.

Mlnitab, Inc., 1992).

8. Norusls, M., SPSS Guide to Data Anulysis [or SPSS-X with


Addittona! Instructions for SPSS/PC+ (Chicago, ll.: SPSS Inc.,
1986).

102

captulo 3

Presentacin de datos numricos en tablas y diagramas

:~.

S-ar putea să vă placă și