Documente Academic
Documente Profesional
Documente Cultură
~.1
,..0.:
. ~ - ~~~;
d. ;' ,.n.~t. a , :n1 'd ~.; \e~~ . t -o-; -
.S
_a.
.
~
t
b
.u" mer~.. c-.-~ 1e.~ ;:n,. a. :- ;~:- I \y
- - . . . . .. o ~ - . . . . _
....
--=
- ...
:.
(.~~
o o
J1 ~,_
.... '~
~. --..=-~-~.
''<;;: ..
~
. ~s-
1.
. 1.~g.il'ta-
,~: :D
,~.~~;...
'.:m,: :~ .~ -,~
OBJETIVO DEL
CAPTULO
181
Introduccin
En el captulo anterior aprendimos cmo recolectar datos mediante una investigacin de. encuestas. Como se seal en la seccin 2.5, puesto que el muestreo
abona tiempo, dinero y mano de obra, generalmente tratamos~'?n nforrnacn
de muestras 'antes que con datos de toda una poblacin. No obstante, snmportar
si tratamos C()Il.1Jna muestra o con una poblacin, como regla general, cuando una
serie de datos que hemos reunido contiene aproximadamente 20 o ms observaciones, la mejor forma de examinar tales datos masivos es presentarlos en forma
de resumen construyendo tablas y dagramas apropiados. Entonces podemos
extraer las caractersticasimportantesde los datos de estas tablas y diagramas.
Por lo tanto, este captulo trata sobre la presentacin de .datos. En particular,
mostraremos cmo grandes series de datos numricos pueden organizarse y presentarse de manera ms eficaz en forma de tablas y diagramas con el fin de intensificar el anlisis e interpretacin de datos, aspectos clave del proceso de toma de
decisiones. Para motivar nuestro anlisis sobre la presentacin tabular y de diagrama de los datos numricos, podemos ver en el diagrama de resumen del captulo de la pgina 94 que las observaciones en nuestra serie de datos .son de dos
tpos, de orden de tiempo o independientes. Las observaciones de orden de tiempo
pueden controlarse sobre una grfica digipunto, mientras que las observaciones
independientes pueden organizarse en una clasificacin ordenada o diagrama de
tallo y hojas y luego presentarse en forma tabular como una distribucin de frecuencia o en forma grfica como un histograma, polgono u ojiva.
Despus de terminar este captulo, debe poder:
l. Organizar una serie de datos numricos en una clasificacin ordenada
o diagrama de tallo y hojas.
2. Comprender cmo y cundo construir y usar distribuciones de frecuencia y distribuciones de porcentaje.
3. Saber cmo y cundo construir y usar distribuciones acumulativas.
4. Comprendercmo y cundo construir y usar distribuciones acumulativas.
S. Saber cmo y cundo construiry usar ojivas (es decir, polgonos de
l!j
Organizacin
de
datos
numricos:
la clasificacin ordenada
y el diagrama de tallo y hojas
Con el fin de Introducir las ideas relevantes para los captulos 3 y 4, supongamos
que una compaa que brinda servicios de asesora universitaria a estudiantes por
todo Estados Unidos ha contratado a un analista investigador para comparar las
colegiaturas cobradas a residentes de fuera del estado por colegios y universidades en distintas regiones del pas. La tabla 3.1 muestra las colegiaturas cobradas
a residentes de fuera del estado por cada uno de !os 60 colegios y universidades
del estado de Texas (vase en particular el Conjunto de datos especiales del
apndice D, pginas Dl-D2). Cuando se recolecta una serie de datos como sta,
54
Capitule 3
-------------
Tabla 3.1
7.2
4.9
4.7
2.4
4.9
4.9
3.5
4.8
3.6
11.0
7.9
8.0
10.7
8.3
8.5
3.9
5.8
4.9
10.4
3.8
8.8
4.9
3.9
5.8.
6.4
4.8
7.7
4.9
4.8
8.3
4.9
10.3
3.9
4.4
11.6
4.1
4.7
6.4
8.6
4.9
3.4
3.5
4.6
6.6
12.0
8.0
3.9
4.8
6.0
4.5
4.9
3.6
s.o
5.9
5.4
8.. 0
7.0
7.4
3.9
3.6
Fuente: Vase Conjunto de datos especiales l, apndice D, pginas Dl-D2, tomadolle "Amerlca's Best
Colleges,
1994 College Gude", U.S. News& WorldReport, resumido de College Counsel 1993 de Natick, Mm.
Relmpresn con permiso especial, U.S. News & World Report; 1993.por U.S. News & WorlclReport y por
College Counsel.
a.z,
La clasificacin ordenada
3.4
3.9
4.9
6.6
8.3
4.9
7.0
8.5
4.8
Clasiiicacin ordenada
sidades de Texas.
3.S
3.9
4.8
5.0
4.8
7.2
8.6
3.5.
4.1
4.9
S.4
7.4
8.8
de colegiaturas
3.6
4.4
4.9
S.8
7.7
10.3
3.6
4.S
4.9
5.8
7.9
10.4
3.8
3.9
4.9
6.0
4.9
8.0
10.7
8.0
5.9
4.7
11.0
4.7
6.4
8.0
11.6 .
3.9
4.8
4.9
6.4
8.3
12.0
Aun cuando resulta til colocar los datos sin procesar en una clasificacin
ordenada antes de desarrollar tablas de resumen o de calcular mediciones de
resumen descriptivas (vase el captulo 4), mientras mayor sea el nmero de observaciones presentes en una serie de datos, ms pesado es formar la clasificacin
ordenada. En tales situaciones se hace particularmente til organizar la serie de
datos en un diagrama de tallo y hojas con el fin de estudiar sus caractersticas (referencias 1, 13 y 14).
3 .2.2
Un diagrama de tallo y hojas separaIas ..e.n:trq<li.S._d~_q<!!_gs en "dgitos gua" o "taIlcs". y... "dgitos rastrerqs:'._u~:hojas". Por ejemplo, puesto que Iascoleg'icrrmasten
$000) en la serie de datos de Texas todas tienen nmeros enteros de dos dgitos, la
columna de los unos o la de los dieces seria el dgito gua y la columna restante
sera el dgito rastrero. Por lo tanto, una entrada de 7.2 (correspondiente a $7,200)
tiene un dgito gua de 7 y un dgito rastrero de Z.
La figura 3.1 describe el diagrama de tallo y hojas de las colegiaturas de los 60
colegios y universidades de Texas, La columna de nmeros a la izquierda de la linea
vertical se denomina el "tallo". Estos nmeros corresponden a los dgitos gua de
los datos. En cada fila las "hojas" se bifurcan a la derecha de la lnea vertical, y estas
entradas corresponden a dgitos rastreros .
. :.::.?:
.. . .
11 .06 ; : .
Figura 3.1
. ......
.:::. ~ ~~::.
...
.\
. . :
.~'.!_'; , . >r'f
J
......
s .:
t :f.':;:: ::.;: .
.6 .
. 9' '
:]: '6 ; 74 .:;:.;: -.
1i .:.
56
Captulo 3
Observe que dos de las cuatro escuelas tienen el mismo tallo. Al incluirse ms y
ms escuelas, se observarn aqullas que tienen los mismos tallos y, tal vez,
incluso las mismas hojas pertenecientes a los tallos (es decir, las mismas
colegiaturas). Tales valores de hojas se registrarn adyacentes a las hojas
previamente registradas, opuestas al tallo apropiado, dando como resultado la
figura 3.1.
Para ayudamos a seguir examinando los datos, tal vez deseemos volver a
arreglar las hojas de cada uno de los tallos, colocando los dgitos en orden ascendente, fila por fila. El diagrama de tallo y hojas revisado se presenta en la
figura 3.2.
Figura 3.l
Tambin es til otro tipo de nuevo arreglo. Si deseamos alterar el tamao del
diagrama de tallo y hojas, ste es lo bastante flexible para tal ajuste. Suponga, por
ejemplo, que deseamos incrementar el nmero de tallos para que podamos
obtener una menor concentracin de hojas en los tallos restantes. Esto se hace en
el diagrama de tallo y hojas presentado en la figura 3.3.
2L 4
iH ..'
3~ 4
. :::.
.3H 55~6~99999
~L. 14
. ~.'tJ. ~~??88.88999999,~~,9 .
:sL:. 04 : : ' .
.sa
'889 .'
:6a
6i. 4~{'
.::
!;.
.. ... '"~
.:;;,;.,:>
:. ..
gt
..9fi
101
.. ...,
.i'o'tt>1
liH 6
.1'2L 'o
~.-. !
:,.., : .
Figura
34 .
...
:.
.r
. '
-: :::~:e:~--,::.::',.::=
...:.:.. .:
3.3
Observe que cada tallo de la: fig. 3.2 ha sido dividido en dos nuevos tallos: uno
para los dgitos O, 1, 2, 3 6 4..de la unidad inferior, y otro para los dgitos 5, 6, 7, 8
9 de la unidad superior. stos.estn representados por L y JI respectivamente,
.como se
indica en las listas de tallos de la fig.
3.3.
Sin embargo, algunos investigadores
han argumentado
que los datos
mostra- dos en la figura 3.3 no estn resumidos. Esto es; no logramos captar la
forma en que los datos se aglutinan realmente dentro de varios agrupamientos.
As pues, en vez de ampliar el diagrama, como en la figura 3.3, tal vez deseemos
condensar los datos, como en la figura 3.4.
;.:f;
:!:
~~
;~
1~
* ~
:~::~
~f
::~.:.
.t~
:."
:~f.~
;-)~
s:
.: ~~
.~
~f I
Figura
3.4
Diagr.ima de tallo y
hojas
revisado de colegiaturas
de
residentes fuera del estado
en
60 colegios y universidades
de
Texas despus de
condensar tallos,
Fuente: Figura
3.2.
:?;.
-~:
..:.. '.
.~~
.t;
.:1:'4.
:.~:
.:j
'~
Problemas
de
la
seccin
561776735
12
394282
13
20
3.2
,]
/
.~
3.2
"
O
3.1
hoias:
~;
;~
$18,
$11,
$7,
$7,
$10,
$5,
$33,
$9,
S12
$3,
$11,
$10,
$6;
$26,
$37,
$15,
$18,
$10,
$21
no:
'i
~1
3.3
sa
Cap~ulo
-r:
Marca y modelo
~.
I
.'
,
<
1
i'
1
t!!;".~
:~l
'. ~~ .
(en 80lb/pulg2)
2.9
2.8
2.0
3.6
2.7
2.5
2.6
2.9
2.7
2.8
2.5
2.8
2.2
2.5
2.5
2.8
1.8
2.7
2.7
4.7
2.8
Z.7
3.1
2.9
3.4
2.6
2.6
2.7
2.4
2.5
5.4
4.9
2.8
2.5
Fuente: Copyrtght 1990 por Consumers unten of Unlted States, Inc., Yonkers, N. Y.
1070\. Adaptado fon permiso de Cansumer Rtpolts, julio 1990, pp. 472-473.
3.4
so
79
65
25
so
50
20
22
50
22
14
60
28
20
25
30
65
35
Z4
12
40
24
48
30
50
25
15
10
zz
120
10
12
32
35
17
20
30
35
so
Fuente: Copyright 1993 por Consumera Unlon of Unlted State.s, Inc., Yonke.rs, N. Y. 10703-.
Adaptado con permiso de Consuma Reports, enero 1993, pp. 3.4-35.
:~~:: ..
:t~ .. ..
l..
.
3.5
Los siguientes datos son los valores en libros (el capital contable dividido entre
el nmero de acciones pendientes) de una muestra aleatoria de so acciones de
la bolsa 'de valores .de Nueva York: .
. .. '::
. . .
.
.. . . ,
7
8
10
10
7
3.6
9
5
6
8
8
14
16
8
15
6
8
5
10
2.3
12
7
10
18
13
6
6
10
10
12
lS
8.
10.
11
9
9
11
15
16
4
7
13
10
Incidencia de cncer
en una poblacin de
100,000
Estado
433
442
Alabarna
Alas ka
Atizona
Arkansas
California
Colorado
Connecticut
Delaware
florida
360
383
366
28'2
434
500
367
406
371
307
402
438
377
Georgia
Hawali
Idaho
Illinols
Indiana
lowa
Kansas
345
Kentucky
Lousana
Maine
Maryland
Massachusetts
Michigari
Minnesota
Misslsspp
Missour
414
422.
391
491
443
454
366
438
390
Estado
Incldnca de cncer
en una poblacin de
100,000
Montana
Nebraska
Nevada
New Harnpshre
NewJersey
New Mexlco
NewYork
North Carolina
North Dakota
Oho
Oklahoma
Oregon
Pennsylvana
Rhode Island
South Carolina
South Dakota
3n.
336
422
403
Texas
Utah
Vermont
Virginia
Washington
West Virginia
Wisconsln
Wyoming
313
Tennessee
464
375
329
355
408
463
326
396
442
445
418
348
408
229
376
440
364
409
398
2.38
3.7
60.
C.apitutc
Producto
Jlf
Smucker's Natural
Deaf Smith Arrowhead Mills
Adams 100% Natural
Adarns
Skippy
Laura Scudder's Ali Natural
Kroger
.ff
Hollywood Natural
FoodClub
Pathmark
Lady Lee (Lucky Stores)
Albertsons
Shur Fine (Shurfne Central Corp.)
Smucker's Natural
Jif
Skippy
Adams 100% Natural
Deaf Smi.th AtrowheadMilis
Country Pure Brand (Safeway)
Laura Scudder's All Natural
Smucker's Natural
FoodClub
Kroger
A&P
Peter Pan
NuMade (Safeway)
Health Valley 100% Natural
Lady Lee (Lucky Stores)
Albertsons
Pathmark
Shur Fine (Shurfine Central Corp.)
Costo
(e)
Sodio
(mg)
68
22
220
65
62
56
56
56
27
32
Tipo
Calificacin
Cremosa
.Crernosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
Cremosa
53
so
168
225
165
240
225
21
20
21
22
45
44
41
40
187
225
3
225
15
225
255
225
225
225
15
162
211
12
40
39
36
30
30
22
80
75
75
62
62
Cremosa
oo
26
26
19
26
.. 14
so
Cremosa
Cremosa
Cremosa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
Espesa
lS
32
17
9
16
17
16
27
23
21
26
32
62
195
165
188
195
255
225
180
208
3
225
225
210
195
21
24
56
53
52
50
47
26
17
14
11
47
22
21
42
42
34
16
17
9
16
40
36
34
34
Fuente: Copyright 1990 por Consumers Un!on of Unlted States, Inc., Yonkers, N.Y. 10703. Adaptado con permsode ConsumerReports, Septiembre de 1990. p. 590.
Para cada una de las tres variables (calificacin, costo y sodio)
(a) Desarrolle la clasificacin ordenada.
(b) Forme el dlagrama de tallo y hojas.
3.8 Los siguientes datos representan la cantidad de tiempo {en segundos) para
llegar de O a 60 mph durante una prueba de caminos para una muestra de 22
modelos de automviles alemanes y una muestra de 30 modelos de
automviles japoneses:
Automviles japoneses
Automviles alemanes
10.0
6.4
8.5
s.s
s.i
10.9
7.9
6.9
6.4
6.0
4.9
8.9
7.1
8.7
7.5
S.4
8.5
S.6
S.3
6.7
6.9
8.8
9.4
8.9
6.7
7.2
8.5
9.,S
7.7
9.3
9.1
6.8
7.1
10.S
5.7
8.3
9.5
8.0
6.5
12.5
8.2
9.7
11.7
6.3
12.0
6.2
9.3
8.6
10.0
8.8
9.2
6.6
/:ue11te: Datos extrados de Road Q Track, octubre de 1990, vol. 42, nrn. 2, pg. 4i.
ordenada
3.9
Cabello fino
Cabello normal
79
49
23
13
28
47
9
63
20
14
16
18
so
19
16
239
32
8
ss
87
20
81
13
37
69
44
64
85
21
69
9
32
19
85
23
14
63
44
12
so
20
23
12
49
87
65
28
22
18.
37
17
Sl
8
74
SS
11
35
Fuente; Copyright 1992 por Consumen Union of United States, !ne., Yonkers, N. Y. 10703.
Adaptado con permiso de Consumet Reports, junio de 1992, pp. 400401.
(a) Desarrolle la clasificacin ordenada para cada serie de datos.
(b) Forme el diagrama de tallo y hojas para cada serie de datos.
Dj
62
Captulo 3
Al construir la tabla
debe ponerse
atencin . a
.
.
. . . .
. de frecuenca-dstrbucn,
.
~
l. Seleccionar el nmero apropiado de agrupamientos de clase para la
tabla.
3. 3.
Nmero de
escuelas
2.0-13.0
Total
60.
60
L.:'.. .
....
Puesto que slo hay 60 observaciones en nuestros datos de colegiaturas, decidimos que seis agrupamientos de clase sern suficientes. De la Clasificacin orde-
r :
J....
nada de la tabla 3.2 (pgina 55), el alcance se calcula como 12.0- 2.4 = 9.6 miles
de dlares y, usando la ecuacin (3.1), el ancho del intervalo de clase se aproxima
mediante
~ .
t.=.
~:.: :,: .
Ancho de intervalo
::
96
6
= 1.6 miles
de dlares
:.-:..
64
Capitulo 3
se
Colegiaturas
(en $000)
6.0 pero menor que 8.0
que 10.0
8.0 pero
menor
Registros
4.0
6.0
Frecuencia
HH#ff/11
l+I+ H+f. ...... .... /111
HHl/11
#1+1!1
13
24
9
l+I+
/
60
Estableciendo los lmites de cada clase de esta manera, las 60 observaciones se han
registrado en seis clases; cada una con un ancho de intervalo de 2.0 miles de dlares,
sin traslape. De esta "hoja de trabajo" La distribucin de frecuencia se presenta en
la tabla 3.3.
Tabla
3.3
Distribucin de frecuencia
de colegiaturas. de
60 escuelas de Texas.
Nmero de
escuelas
Colegiaturas
(en $000)
2.0 pero menor
4.0 pero menor
6:0 pero menor
8.0 pero menor
10.0 pero menor
12.0 pero menor
Total
que
que
que
que
que
que
4.0
6.0
8.0
10.0
12.0
14.0
13
24
9
8
5
1
60
La principal ventaja de usar una de estas tablas de resumen es que las principales caractersticas de los datos se hacen evidentes inmediatamente para el lector.
Por ejemplo, de la tabla 3.3 vemos que el alcance aproximado de las 60 colegiaturas
va de 2.0 a 14.0 miles de dlares, en la enseanza fuera del estado, en la mayora
de las escuelas de Texas tendiendo a agruparse entre 4.0 y 6.0 miles de dlares.
Otras mediciones descriptivas que se obtienen de los datos agrupados se presentarn en la seccin 4.9.
Por otra parte, la principal desventaja de tal tabla de resumen es que no podemos saber cmo se distribuyen los valores individuales dentro de un intervalo
de.clase particular sin tener acceso a los datos originales. Por lo tanto, para las cinco
escuelas con colegiaturas para residentes fuera del estado de entre 10.0 y 12.0 miles
de dlares, no reslta claro de la tabla 3.3 si los valores se distribuyen a lo largo de
todo el intervalo, si estn cerca
los 10.0 miles de miles de dlares o si estn cerca
de los 12.0 mil dlares. El punto medio de la clase, sin embargo, es el valor usado
para representar todos los datos resumidos en
intervalo particular.
El punto medio de una clase (o marca de clase} es el punto a la mitad
de los limites de cada clase y es representativo de los datos de esa clase.
de
un
El punto medio de la clase para el intervalo "2.0 pero menor que 4:0" es 3.0 miles
de dlares. (Los otros punto medios son, respectivamente, 5.0, 7.0, 9.0, 11.0 y 13.0
miles de dlares).
3.3.4
La seleccin de lmites de clase para tablas de distribucin de frecuencia es altamente subjetiva. De esta forma, para series de datos que no contienen muchas
observaciones, la opcin de un conjunto particular-de lmites de ciase sobre otro
puede producir una imagen completamente distinta para el lector. Por ejemplo,
para los datos de colegiaturas, si se usa un ancho de intervalo de clase de 2.5 miles
de dlares en vez de 2.0 (como se us en la tabla 3.3) se pueden ocasionar cambios
en la forma en que se distribuyen las observaciones entre las clases. Esto es particularmente cierto si el nmero de observaciones en la serie no es muy grande .
.Sin embargo, tales cambios en la concentracin de datos no ocurren slo
porque el ancho del intervalo de clase se altere. Podemos mantener el ancho del
intervalo en 2.0 miles de dlares pero elegir distintos lmites de clase inferiores y
superiores. Tal manipulacin tambin puede ocasionar cambios en la forma en que
los datos se distribuyen, especialmente si el tamao de la. serie no es muy grande.
Afortunadamente, al incrementarse el nmero de observaciones en una serie, las
alteraciones en la seleccin de los lmites de clase afectan la concentracin de los
datos cada vez menos.
3.11
Tabulacin
Captulo
3
de frecuencia
3.12
Los datos sin procesar mostrados a continuacin son los cobros por electricidad
y gas.durante el mes de julio de 1993 para una muestra aleatoria de 50
apartamentos de tres recmaras en Manbattan: .
....
157
141
171
202.
119
90
206
150
183
185
149
163
95
108
178
116
175
154
151
147
172
123
130
114
153 . .. 197
102
148
144
.111
128
187
191
143
135
213
168
166
127
130
109
139
.' '137
129.
82
165
167
149
158
3.14
3.15
cncer
Construya
del problema
una distribucin
3.6 de la
depgna
frecuencia
60. de los datos de la incidencia de
3.16
3.17
3.18
684
831
720
773
848
868
852
852
859
697
835
860
870
893
899
905
909
876
911
922
924
943
926
926
938
946
971
972
977
984
954
1005
1016
1041
1052
1080
939
.821
1014
1093
"
.
819
907
952
836
912
959
1004
888
918
B
897
942 ..
962
986
1018
1005
1020
1007
1022
1038
1072
1077
1077
1096
1100
1154
1113
1113
1188
994
1016
1153
1174
903
943
992
1015
1034
108~
1116
1230
Fabricante B: 750 pero menos que ~SO, 850 pero menos que 950,
etctera.
Fabricante
..
111
/:
..
Tabla 3.4
Colegiaturas
(en $000)
2.0 pero menos
4.0 pero menos
6.0 pero menos
8.0 pero menos
l.pero menos
12.0 pero menos
Total
que 4.0
que 6.0
que 8.0
que 10.0
que 12.0
que 14.0
Proporcin
de escuelas
.217
.400
.150
.133
.083
.017
1.000
Tabu!adn dt: <lates numricos: la distribucin de frecuencia relativa y distribucin del porcentaje
68
Captulo 3
Tabla 3.5
Distribucin de porcentaje de
colegiaturas a residentes fuera
del estado en 60 escuelas de
Texas.
Colegiaturas
(en $000)
2.0 pero menor
4.0 pero menor
6.0 pero menor
8.0 pero menor
10.0 peromenor
12.0 pero menor
Total
que
que
que
que
que
que
Porcentaje de
escuelas
4.0
6.0
8.0
10.0
12.0
14.0
21.7
40.0
15.0
13.3
8.3
1.7
100.0
Tabla 3.6
6.S
6.4
9.7
7.9
7.9
4.0
s.o
4.4
6.0
6.4
8.3
5.7
6.3
10.4
7.0
S.4
7.7
8.3
9.9
13.o
7.6
7.2
6.9
3.9
8;7
9.0
12.4
5.7
9.8
6.4
15.7
7.1
7.6
8.2
6.7
16.7
5.5
7.9
5.6
7.4
Fuer.iu: Vase Conjunto de datos especiales 1, apndice D, pgina D3, tomado de "Amerca's Best Colleges,
1994 CollegeGude", U.S. News & World Report, resumido de College Counse\ 1993 de Natlck, Mass.
Reimpresin con permiso especial, U.S. News & W.orld Repo.rt, O 1993 por U.S. News & World R~rt
Colegiaturas
Nmero de
escuelas
(en $000)
que
que
que
que
que
que
que
que
4:0
6.0
8.0
10.0
12.0
14.0
16.0
18.0
8
21
10
1
2
1
1
45
Porcentaje de
escuelas
2.2
17.8
46.7
22.Z
.2.2
4.4
2.2
2.2
99.9*
Usando las distribuciones de porcentaje de las tablas 3.5 y 3.7, ahora resulta stgncatvo comparar las escuelas de los dos estados en trmnos de las colegiaturas
cobradas a residentes fuera del estado. De las dos tablas resulta evidente que las colegiaturas generalmente son menores en Texas. que en Carolina del Norte. Por ejemplo,
en Texas las colegiaturas por lo general se agrupan entre 4.0 y 6.0 miles de dlares
(es decir, 40.0% de las escuelas), mientras que en Carolna del Norte las colegiaturas por lo general se agrupan entre 6.0 y 8.0 miles de dlares (es decir, 46.7% de las
escuelas). Adems, podemos observar que los alcances en las colegiaturas pueden
aproximarse fcilmente a partir de las tablas. En Carolina del Norte, el alcance en las
colegiaturas es aproximadamente 16.0 miles de dlares (es decir, la diferencia entre
18.0, l limite superior de la ltima clase, y 2.0, el lmite inferior de la primera clase),
mientras que en Texas el alcance es aproximadamente 12.0 miles de dlares (es decir,
14.0 - 2.0). En el captulo 4 se analizarn otras mediciones de resumen que ampliarnun anlisis comparativo de las colegiaturas entre los dos estados.
Capitulo
3.19
3.20
3.2!
3.22.
3.23
3.24
3.25
ID
de la distribucin de frecuencia
de la pgina 6 respecto a los cobros de
de la distribucin de frecuencia
la pgina 66 respecto a las regaderas.
Pormela dstrfbucn de porcentaje de la distribucin-de frecuencia desarrollada eh el problema 3.14 de la pgina 66 respecto a los valores en libros de
compaas enumeradas en el NYSE..
Forme la distribucin de porcentaje de la distribucin de frecuencia
desarrollada en el problema 3.15 de la pgina 66 respecto a la Incdenca de
cncer.
Forme las dtstrtbudones de porcentaje correspondiente a las distribuciones de
frecuencia para cada una de las tres variables numricas (calificacin, costo y
sodio) desarrolladas en el problema 3.16 de la pgina 66 respecto a las
caractersticas de Ja mantequilla de cacahuate.
Forme las distribuciones de porcentaje de las distribuciones de frecuencia
desarrolladas en el problema 3.17 de la pgina 66 respecto a los tiempos de
aceleracin de los automviles alemanes y japoneses.
Forme las distribuciones de porcentaje de las distribuciones de frecuencia
desarrolladas en el problema 3.18 de la pgina 66 respecto a la duracin de los
focos fabricados por las dos compaas competidoras A y B.
Graficacin
de datos numricos:
el histograma
e1 polgono
A menudo se dice que "una imagen vale ms que mil palabras". De hecho, les
estadsticos han empleado las tcnicas grficas para describir de manera ms vvida
series de datos. En particular, los histogramas y los polgonos se usan para describir
datos numricos que han sido agrupados en distribuciones de frecuencia, de frecuencia relativa o . de porcentaje.
3.5.1
Histogramas
Los histogramas son diagramas de barras verticales en los que se construyen barras rectangulares en los lmites de cada clase.
Al graficar histogramas, la variable aleatoria o fenmeno de inters se despliega a
lo largo del eje horizontal; el' eje vertical representa el nmero, proporcin o porcentaje de observaciones por intervalo de clase; dependiendo de si el histograma
particular es, respectivamente, un histograma de frecuencia, un histograma de frecuencia relativa o un histograma de porcentaje.
-E-->
Tipo de diagrama
Nmero de observaciones
Porporcn de observaciones
<
~>
<
;;..
Figura 3.5
Histograma de porcentaje de
colegiaturas de residentes fuera del
estado en 60 escuelas de Texas.
Fuente: Los datos fueron tomados de la
tabla 3.5.
( .
.
f.
tf.f.
~:
3.5.2
Polgonos
Al gualque.con
Debido a que los puntos medios consecutivos son conectados por una serie de
lineas rectas, el polgono algunas veces est dentado en apariencia. Sin embargo,
al ..tr.atar con una serie de datos muy grande, si tuviramos que crear los lmites de
las clases en su distribucin de frecuencia ms juntos {incrementando as el
_:>;(une:o de clases en esa distribucin), las lneas dentadas del polgono se
.uavr.zaran".
::-::
.
... ....
"!; ..
:
. . .. i.::
Figura 3.6
9: .:/:;
.
o . o
Q.:.:: . ~ ..
... ~:
:4 . ;.t.
14 ~.: 16
. :(_. ~ - . .
. .....
Figura 3.7
La figura 3.6 muestra el polgono de porcentaje para. las colegiaturas a residentes fuera del estado de las 60 escuelas de Texasy la figura 3.7 compara los polgonos de porcentaje para las colegiaturas de las 60 escuelas de Texas con las 45
escuelas de Carolina del Norte. Las diferencias en la estructura de las dos dstrbu-
72
CaptuJo 3
cons, anteriormente
mente aqu.
..
Construccin
del polgono
Observe que el .Polgono es una representacin de la forma de la dstrbucln partcular, Puestoque eJ rea _bjo la dstnbucn de porcentaje . (curva entera). debe ser ) 00%, ;, es necesario conectar el
primero y el ltimo puntos. con el eje horzontalpara rodearel rea de la dstrbucin observada. En la figura 3 .6 esto se hace conectando' el' primer punt mqo
observado con el punto medio de una clase "precedente ficticia" (esto es, 1.0 in.Hes
de dlares) teniendo 0.0% observaciones y conectandoel ltimo punto medio
observado con el punto medio de una clase "sucesora ficticia" (esto es, 15.0 miles
dlares) teniendo o.0% .observacones.
. . <. .
. . . .
: :.
Observe tambin que cuando se construyen los polgonos (figura 3.6) olos hstogramas (figura 3.5), el eje vertical debe mostrar el verdaderocero u "origen" para
no distorsionar o malinterpretar el carcterde los datos. Sin embargo, el eje horizontal no necesita especificar el punto cero para el fenmeno de inters. Por
razones estticas, el alcance de la variable aleatoria debe constituir la principal por-:
cin del diagrama y, cuando no se incluye el cero, son apropiadas las "rupturas"
en el eje.
de
-v:
3.27
3.28
3.29
3.30
3.31
3.32
11.1
Distribuciones acumulativas
y polgonos acumulativos
Los otros dos mtodos tiles de representacin de datos que facltan el anlisis y
la interpretacin son las tablas ~e distribucin acumulativa y los diagramas de poligonos acumulativos. stos 'pueden desarrollarse a partir de la tabla de distribucin
de frecuencia, de. la. tabla de distribucin de frecuencia relativa y de la. tabla de distri~ucin de porcentaje.
3 .6. 1
Tabla 3.8
Colegiaturas
(en $000)
Porcentaje de escuelas
"menor que" valor indicado
o.o
2.0
4.0
6.0
8.0
10.0
12.0
14.0
21.7
61.7
76.7
90.0
98.3
100.0
Tabla 3.9
Colegiaturas
(en $000)
2.0
4.0.
6.0
8.0
10.0
12.0
14.0
16.0
18.0
o.o
2.2
zo.o
66.7
88.9
91.l
95.6
97.8
100.0
74
Captulo 3
"
Tabla 3.1 O
De la tabla 3.5
De la tabla 3.8
Porcentaje de
escuelas en
intervalo de clase
Colegiaturas
(en $000)
3 .6.2.
\':
~.
,;.
~~~ ..
rfif.
f\,~f~:.
.
~i. ..
).'.t
~~ :...
f~'.a : .
< .
\'i'. .:
~~'..
21.7
40.0
15.0
13.3
o.o
8.3
1.7
Polgono de porcentaje
o.o
21.7
61.7 = 21.7 + 40.0
76] = 21.? + 40.0 + 15.0
90.0"'
40.0 +
15.0 + 13.3
13-3+ 8.3 + 1.7
100.0 = 21.7
21.7 +
+ 40.0
+ 15.0+
983 = 21.7 + 40.0+15.0+13.3 + 8.3
acumulativo
La figura
las colegiaturas a residentes fuera del estado de las 60 escuelas de Texas. La. principal ventaja de la ojiva sobre otros diagramas es la facilidad con que podemos interpolar entre los puntos gracados.
~s~~ .
a
if<":t:
4.0
6.0
8.0
10.0
12.0
16.0
14.0
s.:
que
que
que
que
que
que
que
Porcentaje de escuelas
de limite nferortmenor que"
de intervalo de clase
e Apro:ximadn de porcentajes Como un ejemplo, el analista investigador de la compaa de servicios de asesora colegial podra desear aproximar el
porcentaje de colegios y universidades que cobran una colegiatura por debajo' de
una cantidad especificada, digamos 7 .O miles de dlares. Para hacer esto, se proyecta una lnea vertical hacia arriba en 7 .O hasta que interseca la curva "menor
que". El porcentaje deseado se aproxima entonces leyendo horizontalmente
desde el punto de interseccin hasta el porcentaje indicado en el eje vertical. En
este caso, aproxrnadamente 69.2% de las escuelas de Texas tienen colegiaturas
por debajo de 7.0 miles de dlares. (Esto, claro est, implica que aprcxmadamente 30.8% de las escuelas tienen colegiaturas de al menos 7 .O .rnlles de
dlares.)
.:::.::.:~>.':J.:.-
..
:.~~: .. ":..~
,,....;:
. .1 .
..
.> .
~.;::: .,,::,'..;:
;,,'.\?6:
...
Figura 3,8
. :.~. ~.~>::-~:;:!:
:, -: ~ j ....: '
\.
':: :. : .-::":
analista investigador tal. vez desee tambin aproximar diversas colegiaturas que
correspondan a porcentajes acumulativos particulares. Por ejemplo, 25% de
todas. las escuelas de Texas. tienen colegiaturas por debajo de esa cantidad? Par!
determinar esto, se dibuja una lnea horizontal desde el punto de porcentaje acumulativo especificado (25.0) hasta que nterseca la curva "menor que,". La colegiatura deseada se aproxima entonces bajando una perpendicular (una lnea. vertical)
en el punto de interseccin hacia el eje horizontal. De. la figura 3.8, observamos
que esta colegiatura es aproximadamente 4.2 miles de dlares. Otros puntos de
porcentaje comrunente considerados para tal anlisis (vase el captulo 4) son el
valor de 50.0% y el de 75.0%.
70
Captulo 3
.f
f:
: 20
10
...
0'----.-41.,.._.,~
.o
...... ,......_.
~--'.
-'-_,.'----."--'--~-'-....._--'_,... _,._,..._~
4
:s . .:a::, 10 -, :i2 14:.
'.:'.' ::.~'.~~-'' '.' . ;;:.co181t1t~~:~ri':ib&> ,'''=
-:
1e .: : .: i
:~,.
>
to
Flgur3 3.9
Polgonos de porcentaje acumulativo de colegiatura.S de residentes (uera del estado en 60 escuelas
de Texas y 45 escuelas de Carolina del Norte.
Fuente. Los datos fueron tomados de las tablas 3.~ y.3.7.
~.
3.34
).
.e
3.S
1e
a<IS
3.35
(b) 40.0% de las colegiaturas a residentes fuera del estado en cada estado
estn por debajo de qu cantidades?
(c) 60.0% de las colegiaturas a residentes fuera del estado en cada estado
estn por debajo de qu cantidades?
(d) 90.0% de las colegiaturas a residentes fuera del estado en cada estado
estn por debajo de qu cantidades?
3.36
3.37
3.38
3.39
3.40
78
Captulc 3
Figura 3.10
Datos sin procesar referentes al tiempo de procesamiento
clientes consecutivos en un banco de Manhattan.
....
Los datos enumerados en la figura 3.10 aparecen en forma sin procesar. Aun
s datos fueron registrados cronol6gicamente, no deberamos esperar que
cuando lo
los tiempos de procesamiento (en minutos) relativos a los 24 clientes consecutivos
siguieran ningn patrn ordenado observable. (De hecho, una importante suposicin en los procedimientos inferenciales que analizaremos de los captulos 10 all S
ser que nuestras observaciones de muestra recolectadas se extraen aleatoria e
independientemente.) Aqu, entonces, sera de inters evaluar grficamente si los
datos estn realmente en forma sin procesar o si existe alguna relacin nsospe-
chada.
3.7.1
r..
una grfica de las observaciones en el orden secuencal.en que se obtienen.~-~horizontal gracada sobre la secuencia por lo general denota la mediana o el
valor medio de la clas1ficacTnorCfeada. (La meofaase estudiar en la seccin
_j.4.2.) Esta lnea horizontal permite una fcil referencia para observar cualquier
patrn. Por ejemplo, como se indica en la figura 3.11, si hubiera una tendencia
positiva en las observaciones de la secuencia ordenada en que se recolectaron, la
porcin de la grfica dgpunto indicara un incremento de izquierda a derecha.
Para una tendencia negativa, la 'grca se invertira. As pues, en estas stuacones
.... ::
.. ;'~
:::.
..
._:_.T.n....;..:::'_ed:~:.:~-...~.'n1~.;=.:~ec..: "; :
~
~;;;;L.<~Jt(ir.i l.
11
~:\.:.
('['.(\/':Tit:tdenC:las observadas
.:
-::nA_~.:-_.:,'.t.:~::. _~t.:_:,~~:..',.:.v:._a,~.~'_
~.T.I:.._'-_:._~ '...:
. ~::_. ;_... ~1.';:...~:~.,~ ..'.._.:~.:_..- ;. ~:_:, :__
11
. ~
11
..
en datos graflcados en orden secuencial.
Graficacln
.es
o.
. ,5
.~
....
Figura
12
-:
. , . ., . . /g<g:~~ :~;gg~-
~~~'>1:.~~;,>:.~:~:f~i~~~~;.;~:;} ; ~
...
....
1 ...
:_.::c:_'.;_:.,.;_:n
}A<r2;~~~~~~i.".:. :_
.r~-{~i.~.~e.~~,.
. r
....
. ){;.
:'
. ..
-3
'
Organizacin y presentacin
Capftulc 3
l.
!,{.
..
..
~~
f~
l;I
"~{
.
J~I~
,: 1
. ..
~~ ~
f~
i.;:
ff.t,.
Figura 3.13
.'~?.
:??~. .
Grfica digipunto de Hunter del tiempo de procesamiento (en minutos) de 24 clientes
consecutivos en un banco de Manhattan.
~~tt
Por
:~~: .
if!,/:.
otra parte, las mayo~es oscilaciones de la grfica por encima de la lnea del cen-
~-i--..
la falta de
.ji ... :
.I>::
1--.>-.<:
:I .:
-3.-7.2
}; ~-.:_.
l~
Comparando el diagrama de tallo y hojas del grupo (a) de la gura 3.12 con el
mostrado en nuestra grfica digpunto (figura 3.13), 'Observarnos que seran
Idritcos si volteramos de cabeza uno de ellos! Por lo tanto, al 'construr la porcin de tallo y hojas de la grfica digipunto observamos que las hojas se bifurcan
hacia la izquierda de los tallos o hacia la derecha. Adems, observe que los tallos
se enumeran de alto a bajo, de arriba a abajo, en vez de bajo _a alto como en la
figura 3.12. Esto se hace por conveniencia grfica, puesto que el eje Y (vertical)
. de una grfica va de alto a bajo, de arriba hacia abajo. A la izquierda del eje verJic~l indicamos los tallos junto con "marcas de tictac" para los tiempos de proce. sarnento (en minutos) sobre la escala vertical. A la izquierda de los tallos
'.trazamos otra lnea vertical para permitir la colocacin de las hojas. Despus cons.-ttuimos simultneamente la porcin tallo y hoja y grafcamos los tiempos de
'i}~p~esam..iento (en minutos)
el orden que se enumeran en la figura 3~10. Estos
'Y~~otes
gracan de izquierda a derecha, con distancias iguales de por medio.
.qs puntos consecutivos se conectan entonces y la lnea del centro se traza a travs
d(l~ secuencia ordenada. En la figura 3.13, la lnea del centro se grafica desde el
se
fi
'i r .:.:_~ .
?
1:,,:\;/ :.;~.
~
~ >
ej~ vertical en el valor de 1.6 minutos. Esta lnea representa el tiempo de proce-
l~ u~r:;~~;~i~nl~
=~=st~o~~r;;7a~~~~;fa~~~~ ~:~~~~~~ 5
l~n~ac~~~:~:l~~~~
parque se intentaba verflcar una suposicron en una sene de datos ya obtenida.
f. \': (:,:;:..5prltrola
:=fof;Rtra.
procesos de servicios
cuyo
produccin
u otros
(es parte,
decir, para
las grficas
se hacen
interactivamente)
la lnea
delprogreso
centro se
-!~://.:.>.
- ~f
en
1 ~< : ;,:.-: .
\~f:fH:':'." ;\.fYla:1nterpretacin
111,.
se
34.02
33.89
33.9
33.74
34.02
3.42
Semana 1
Semana 2
Semana 3
Sernana d
Semana
Semana
Semana
Semana
1:
2:
3:
4:
Lunes
Martes
3.3
3.9
7.2
3.1
3.7
3.8
4.3
3.3
34.05
33.88
34.05
33.94
33.9"6
34.01
33.96
34.00
33.99
34.01
33.91
33.85
33.97
34.03
33.93
33.76
33.94
33.84
34.10.
33.82
Dom.
3.43
34.06
33.98
34.03
33.85
33.95
90
85
80
79
Lun.
Mar.
Mir,
jue,
Vie ..
Sb.
89
88
84
79
74
88
86
84-
79
73
78
91
84
81
78
83
81
75
83
82
72
80
76
canera
(a) Forme una grfica digipunto para estos ensayos de tiempos usando la
lnea del centro de 81 segundos para este periodo de 27 das,
(b) Qu puede concluirse de esta grfica? Analice.
Los recibos de ventas totales (en miles de dlares) se registran dariamente en
Ethel's, una boutique de vestidos en la ciudad de Nueva York, durante el
periodo de 28 das de 1de"febreroa28 de febrero de 1993:
Mircoles
3.0
3.6
3.8
3.2
jueves
Viernes
Sbado
3.5
3.9
4.5
4.2
3.4
5.7
6.8
6.6
6.2
5.6
3.2
3.7
Domingo
5.0
~.!i
Sj
S.4
(a) Analice los datos construyendo una grfica digipunto en donde la lnea
del centro sea de 3.9 miles de dlares. Describa cualquier cosa inusual.
(b) Parece haber algn patrn en los recibos de ventas totales con el
tiempo?
82
Captulo
!!Jt'e l ,
.~ , ~
J!,i.
~
..;.~w!.:
:-~
:~~ ~ : ~ .
~ ~.
..
. .
"
'; :,fi t .
~&-: ..
lti
i':'
:~il
~~.:-. ..
_,I=: _ _.;_
~I~: :. .... .
i(.J~
'1~!?.",_{.; " .
t_~:-.
':
a4Y~~.::.
. :" .
. ' ;: : / ;'.i(}
. ..
. .
. . ..
para datos
. ..
' ; ,
n.rp~rfc;~.f :-~_:._
. .. ,,: : . '
::i.
f:
;~ ~
tWi"f . . ~{~.:.~~li~~~~%,~~;;;~'fk~~';hb l/;~~~ ~ I'
fa~~~;3.14;;;:.:d:;~~~~:t~_:;~1~: ~:.I~~o.r::~~!p;e~~~~:i
;~f.-}'{:}i;:::;.:
j~~-f~:}}:'. : ..;,....." _,,. -~ ~f~. ~:;figura
describe diagrama pe talio_y hojas de SPSS, la figura 3.1 S
do,-la
$..~.
{W;~:
el
.~~:~~.:....
m11estta1as dfstfitio.e-.s de
I'
z~~'~Nt$~~~~tt1ft~t~~~~,~l~ir~1~~~
1;~~i1:1l.. ~.,;i~,;1
.d,c9m~iitidora l)uede~rsg::i:rru(iesI:iesfa~~la
~,
. . : A partir.' de:vatios:.~eswtads
:lndtcn
'.Prifil.era::P. .r~.i4il~t&.
~1\.F.~:~fn.*-af~g~:1Wf.&~~~r~1~!.-~t.~i~~9i~i~1~.t.~;:fM~Si~m~.~
ue: 1a ofstrniutff.cte':'lin" 'e%oS:i ~nhles''~ii~'lS~~:effitQ~aao.s:~~utietpiof
ersnlfefil.terrfteados~cte
~~af:cturjo~?~~~1W~~~~t~~~~~k~f
l~t\~~~:i~~ls~~a:~
lfpq'i,i~tes
Urfa've1/tjtie'.se1ogr~l's.tOJser~c~sifo(h
accsos
esf~dSh('.bs:
(l~
~tA\t.Ji~~~t:t~~g;i~t;;~~!!i~~~~t::;f1~;~:~r.~&~~~J.~%9tf~~fk.1!
TI.a~mas~.~~::.dE!'taUo;:.:.fj'as-tes
ress' ersonales'H'efri:'}eados''.~fo
~f~!~!ilW.f~ttqi{5i~f~~~li.ffil :f~;
'd;iV.os af:losAri
. : :.( ..... ~.
"
.:'.'.'::.i.
8.-0,0 Ex;t.i;::em~s-
..
(~7};
::p6):,.-.:p.6)~:.:(78').;<{f!~)./>~.2J,
~l~4
:::.
?F~~)
_11
. &l
figura 3. 14
Diagrama de tallo y-hojas para salida de SPSS.
Nota: Debe sealarse que en algunas situaciones, un tallo de longitud 1'0 puede dividirse en cinco tallos
basndose en los dos d!g!tos m~s bajos (;), doses y rreses (T), cuatros y cincos (F), seises y setes (SJ, y eri !os
dos dgito! ms altos (.} o un tallo de longitud 10 puede dvdtrse en dos tallos basndose en dgitos bajos (Lo
)y altos (lfo .). Como se ve en la figura 3.14, SPSS utiliza los smbolos <v . para divisiones en dos drecones
de los tallos. Adems, como se observa en la figura 3.H, con una muestra de un tamao de 400, no hay
suficiente espacio en la pgina para.imprimir todas las hojas (por ejemplo, las observadones)que se bifurcan de
algunos
tallos. rara compensar esto, SPSS determin que cada hoja representara dos observaciones y utiliz el smbolo &
para denotar el valor de hoja que se repite un nmero impar de veces.
84
3
Capitulo
r1
'.
'
Ji
1
W
1
I. '
g.
60< :.
:<.. .::10:.
.\e.--:.::..
9 0
. t~,;;:,~;~QTAL .
:. :.
Wl:
Ji.
. ... ";
..
Figure 3.15
:. -.
, ..
~1~~!~rn
:'90
100.
. RINCOME'~
.10
<~'.">'::.:,1'.-..
'.:":'.<>::-..:de
.;::.</:;~~::.\: .
: .:+-v:>'>
: -::_{(L{f:,:
.:.:-.
Figura
:.
-".'
.. :.
s.t 7
lo
dlares ypor
general se agrupan.en los veirltes pajos; para las mtijer~~1-lo ingr~s.s
varan entre 1O.1 y. 62,8 mles de dlares y se agrupan abrumadoramente ei} lp.S_:_die-
-~n.?:1~~-t~tF.~~Y~~t.c?>..~ b~~~-_de~,~?l,().(lt9spe
.A me..~.l!~.R~.cornp~e11s10J:l
"~1?.P!M?.?~-~~~-de~s~.lfl:Fon:ipps~c:;ioI1''de-l~:fett,~fde,.~~
<!_f,l1.4~~a..s,o~pleto
a;t:~~~r
~~
-d~.~11i!!Jpo
: de l\alosha Inqtisti'..iesY-.Jo .&sistir~ 'en sus delberacoeston .1a!-S~i:CO:rporatin
de la seccin 1.8
Captulo
. . : :::. .
.. ..
. -."':, .. .
:
.. .. ';: .. -'.
:-~
of RINCOME
l
: .
:f2)"
._5:.
';
.....
:~:
....
. : 7: :.:
:::
: : . : ... :...
i ssssssssssssss6666666667n7111?1777
:~mmmii~:7,7777~~..~
2 :.OOOOOOOH.lHZ22.2233'.323J33~.444
;\::;,,,.u;, .~
-; :10 :,:
..: .. :
ti'> i: oooo111233333J444.i4.
1...: ..
4 '00134
4
Ei88sss8s9999999
..
.:, ,: (; :-;:''.:.<:
....-,
:.:
......
Stem-andleaf
. :.:r
. :';
.":
.. . . :\:
.. :::
=. l
.: r:
1
.: ... :
is far Female
Figura 3.18
:.J.:-: .: .:
.: '.
.3.45
3.46
cJ
{'r\
3.47
.3.48
3.49
3.50
3.51
3.52
3.53
3.54
3.55
3.56
3.57
3.58
3.59
111
Hasta este punto hemos estudiado cmo se prepara una serie de datos recolectados
Captulo 3
~'
f;,
~ji
.9.1.
Eliminacin
de
la
basura
diagramtica
1
1
estn adornados con varios iconos y smbolos para haceflos atractivos a sus lectores. Desafortunadamente, avivar una tabla .o diagrama con frecuencia oculta o
distorsiona el pretendido mensaje transmitido por los datos. Por ejemplo, . algunas
~~
:J.fi.
;;
.~~
A Shrlnklrig Catch
. otras en la Bahla de
. Ch~sapeakeespecificada en
. : mn!ontis.debU!l~ls ::'
..
. t.930~s: ......
..
.. ~Omitfona
debusMls
: r.
Figura
3.19
--' .
._19~i
..
. 1912
1982
4
,.
. lS92.
5
3.5
18.OOO
t>usho<s
; ..
.
En la figura 3.19, el icono que representa los 20 millones de bushels est.fuados de ostras atrapadas en la dcada de 1890 es realmente cinco veces el
tamao del icono que representa los 4 millones de bushels estimados de
-ostras atrapadas en 1962? Esta ilustracin puede llamar la atencin, pero por
ro general no muestra nada que no pueda presentarse. mejor en una tabla de
resumen, una grfica digipunto o una grfica de los datos en el tiempo (vase
.:(:at1ftulo 19).
<:..
\Y{/:
}::}.=}>:>
f('!'i
,=.~"'-:j-:::.v-.-2--~0-rt-~-~o--rsm-~_-e_nel~-a-n~_-b_~l~a--acc-
_ei_o_n__d_de_d__as__et__ri_oe_s_s
\)(:>:. ~tos sobre una base relativa, y las figuras 3. 7 (pgina 72) y 3 .9 (pgina 77), respec t,:Xi{ .~:V~i;ne!lte, mostraban los polgonos de porcentaje y las ojivas de porcentaje ade'}V:> :$..i:tldos a~ comparar las colegiaturas P,econocimiento
a residentes fuera
del de
estado
de 60 escuelas
de tabular y de
y prctica
una adecuada
preso?ntacin
r:
90
captulo 3
diagramas
;\=().;:j J~~ Y 45 de
\)/{:; q:~t(lj~~9 proporciones sera engaoso. Para mostrar esto, en las figuras 3.20 y 3.21
':/iiiK\ :4.e)a pgina 90 se muestran los polgonos de frecuencia y .las ojivas de frecuencia
):~:.:./:: .:~J?,!:!etivos que "comparan" las colegiaturas a residentes fuera del estado de O
.;')<\-; ,_.e~uelas -, de Texas y 45 de Carolina del Norte. Adems, para acentuar la distors1n
:.:;;e;'.{;.;:. ~~l;.se incluyen las colegiaturas a residentes fuera del estado cobradas por los 90
;\t~};:r~::~o1eg't!;Wy universidades de Pennsylvania (vase el Conjunto de datos especiales 1
,:<~ apndjce D en las pginas D4-DS).
captulo 3
25
..
y~c ,
.:.~:;.
".. .. :
.';,,,.:.'. ..
\/~~;:~L.;: ...~'..;:~:!
20
(/)
.!!!
(l)
~~,:.:). '..'...
15
::i
(1)
Q)
.,1 ~.. ~ . . . ,
Q)
"O
iO
CD
E
::J
'
........
\.,
.f .
:,:..
..:. .
',\ '
..,'
..
\ .,
)~~~;.
.:. .., ,
;:)
_ ;
v
~:
.\
:, ..:_;_. .
:::.x: .
, .; ..;;9;;:~: .
o
10
12
14
.: 15
18
20
..
22
.. :24-..
26
Figura 3.20
90
80
70
en
~:>
50
" '
40
Q)
el)
"O
~
E
:>
. ....
60
,.
30
20
10
.: : ..
4 .
. 6
10
.11;:.. :11? ..
Colegi\!Uras (eh $0QOj
. ,'
J.?_,. .
18
..
..:
fig.ura 3 .21
Polgonos de frecuencin acurnulatlva "inadecuados" de las colegiaturas de resldentes fuera del
estado en 60 escuelas de Texas, IS escuelas de Carollna del Norte y 90 escuelas de Pennsylvania,
Fuent: Los datos fueron tomados de las tablas 3.3 y 3.7 y de "Amertca's Best Colleges, 1994 College Gulde",
U.S. News & World Report, resumtdo de College Counsel 1993 de Natick, Mass. Relrnpresn con penntso
espectal, U.S. Ncws & World lkport, 1993 por U.S. News & WarJ.1 Report y por College Counsel.
Como puede verse: de Ias fi~ra~ 3.20 y 3.21, los: polgonos de frecuencia y las
de las 45 de Carolina del Norte
son abrumados por aqullos de las 90 escuelas de Pennsylvania y no se pueden
hacer comparaciones significativas de tales diagramas dstorsonados,
3 .9.3
::
Texas]'
Aun cuando ya sabamos de la seccin -3.9.2 que las figuras 3.W y 3.21 eran repre::
. . .
...
f.U{.::
3 .9.4
El punto de inicio sobre el eje vertical debe indicarse con un cero para no distorsionar la impresin visual respecto a la magnitud de los cambios que ocurren en el
dagrama. Al tomar slo un pedazo del eje vertical, tales cambios pueden exagerarse. La figura 3.22 de la pgina 92 muestraesta distorsin visual.
Observe que en este diagrama el cero se omiti del eje vertical. Debido a esto,
el lector obtiene una visin distorsionada de la magnitud de las diferencias en las
transaccrones diarias. Por ejemplo, durante el periodo descrito, la sesin comercial ms activa ocurri el viernes 17 de septiembre, mientras que la sesin comercial
menos activa ocurri el lunes 12 de octubre (da de la Raza). Sin embargo, de la grfica mal trazada, la barra vertical que representa la sesin comercial ms activa es
tres veces ms larga que la barra vertical que representa la sesin comercial menos
activa, dando la impresin de que se triplic el nmero de acciones negociadas el
17 de septiembre respecto al 12 de octubre. Si el punto cero se hubiera represen-
Captulo 3
..
Figura
3.21.
' .:!1 ::
~
1:1
il
!J It1j ; }I i t 1 l] , .,
~
tado adecuadamente sobre el eje vertical, la grfica hubiera reflejado con precisin
que slo se duplic el nmero de acciones negociadas el 17 de septiembre respecto
al 12 de octubre.
En la seccin 3.8 demostramos cmo un software de computadora apropiado puede ayudamos en un anlisis descriptivo de nuestros datos. La computadora es una
herramienta extremadamente til que puede almacenar, organizar y procesar informacin fcil y rpida y puede proporcionamos resultados, tablas y diagramas de"
resumen. No obstante, debemos tener en mente que la computadora slo es una
herramienta.
Veremos
a lo largo de este
texto, al demostrar
interpretar
variedad d las salidas
de computadora
correspondientes
a los etemas
que se estudiarn
en los captulos siguientes, que es esencial usar la computadora de una manera consistente con una metodologa estadstica correcta. Acurdese de. GIGO. La salida de
computadora que obtengamos depender de cuatro cosas: la capacidad del hardware utilizado, la calidad de la impresora elegida, la capacidad del software estadstico seleccionado, as como de su habilidad para elegir apropiadamente y usar el
software provechosamente. Y cuando se le presente informacin tabular y_ dagramtca proveniente de la salida de algn paquete de .software estadstico, tenga
cuidado con los adornos extra que puedan estar ocultando lo que los datos tratan
de transmitir.
una
3 .9.6
Cuestiones
ticas
Las consideraciones ticas surgen cuando estamos decidiendo qu datos presentar
en formato tabular y dagramtco y cules no presentar. Es de vital importancia,
.al conducir una investigacin, documentar tanto los buenos como los malos resultados, de forma tal que aquellos que.contnen tal investigacin no tengan que
"volver a inventar la rueda". Adems, al hacer presentaciones orales y presentar
informes escrttos sobre la investigacin, es esencial que lbs resultados se den de
una manera equitativa, objetiva y neutral. As pues, debemos tratar ele distinguir
entre una mala presentacin de datos y una presentacin no tica. Nuevamente,
como en nuestro anlisis de las consideraciones ticas en la recoleccin de datos
~.
::G:~1
w~
}}i
-~
JJ
3.61
1j~>~i(,]
~:::::::~::~:~~:~::~::;:d:::~ado
> .. ..
r\.
;-'):XJ({~t~
un repaso
"'{;;i_L:~~:P'.~Z:~~n~a?_nd.e
lista
.
r
e
u
.e
ir
e,
)S
. ~\'.;iJ.~=,'?{:._:- ~eVise la lista de preguntas para ver si realmente sabe las respuestas y.p~ede (1)
/'.<":-!. . ~hcar sus respuestas a alguien que no ley este captulo y (2) dar referencias de
$~F;;_,r,;'.fUna vez q~le los datos numricos recolectados han sido presentados en formaWf\7.::::!9.Jb.ular .Y dagramtco, como se hizo para Bud Conley de Kalosna Industries,
.~h?.:
Juntando todo
TRMINOS CLAVE
agrupamientos de clase 62
ancho de intervalo de clase 63
88
clases 63
clasificacin ordenada
grfica digipunto
histograma
70
55
distribuc.in acumulativa
57
74
distrlbucin de frecuencia 62
distribucin ele frecuencia relativa
Captulo 3
"basura diagramtica"
94
distribucin de porcentaje
79
64
polgono
71
punto medio de clase "o marca de
clase" 65
ojiva (polgono acumulativo)
68
68
54
75
~:
3.67
3.68
acumulativos).
Explique las diferencias entre diagramas de tallo y hojas y grficas
3.62
3.63
3.64
3.65
3.66
3.69
dgpunto.
Los datos sin procesar mostrados a continuacin son los sueldos de inicio
de una muestra aleatoria de 100 estudiantes de computacin o de sistemas
de cmputo que recibieron sus grados de bachillerato durante 1993:
Sueldos de inicio ($000)
24.2
29.9
23.4
23.0
25.5
22.0
33.9
20.4
26.6
24.0
23.9
18.6
19.7
25.2
22.1
29.9
32.3
32.3
31.4
22.5
18.S
25.3
25.7
27.S
23.2
20.l
28.1
27.4
18.7
32.6
19.6
24.4
34.2
28.8
25.2
20.8
25.4
25.3
20.6
28.2
32.2
25.8
19.8
26.8
27.S
27.3
26.l
24.8
32.5
24.7
25.6
29.S
26.3
19.3
31.8
26.2
27.8
30.8
18.7
25.2
27.6
21.2
27.4
25.8
26.7
27.6
26.8
20.S
25.2
21.2
19.5
26.4
25.2
24.7
22.1
20.7
25.5
37.3
24.8
25.3
25.9.
26.5
22.Z
20.8
21.2
19.1
18.9
21.3
21.7
20.4
27.2
20.6
25.S
27.9
38.7
22.8
20.9
21.9
34.5
26.8
3.70
!.50
l.00
2.00
6.50
7.50
3.00
2.00
3.00
3.50
2.50
2.00
3.50
4.00
3.00
3.00
3.50
3.50
3.00
S.00
3.50
4.00
3.00
S.00
1.50
S.00
6.00
1.SO
5.50
4.50
2.50
Fnerite: Copyright 1993 por Consumen Union of Unted States, tnc., Yonkers, N.Y. 10703. Adaptado con permiso de Cons11mer Reports, febrero de 1993, pp. 98-99.
3.71
Pasta de dientes
Calificacin
.SS
.66
1.02
.53
.57
.53
.52
.71
86
.SS
.59
.Sl
.67
.62
.66
1.07
.80
.79
.44
1.04
1.12
.79
.81
.64
1.77 .
1.32
.64
.55
.3.9
1.22
.74
.4~
.97
1.26
4.73
1.29
1.34
1.40
1.77
1.11
79
77
75
74
72
72
71
70
69
64
63
62
62
62
60
58
57
57
SS
56
53
85
82
76
72
70
58
Sl
50
39
29
28
53
80
48
53
37
20
Fuente: CQpyright 1992 por Consumers Union of United States, Inc., Yonkers,N. Y, 10703.
Adaptado con permiso de Consurner Reports, septiembre 1992, pp. 604-605.
96
Captulo
3
f,:..:.:
}...
~.. ...
~
~
I'
3.72
Bolsa norteamericana
...
(ZS artculos)
l'~i:
s 6.88
~.),,, ..
1~~11
~~ .
. . : .:
... . ..
.
,.
4;,i~:;
3.73
.75
3.88
4.12
11.88
15.88
16.SO
8.75
9.25
7.50
S.38
14.38
2.50
4.88
6.38
33.62
4.88
9.00
2.0Q
20.00
14.25
4.00
15.25
2.38
49.50
15.88
24.00
10.88
18.75
53.88
20.38
.$26.00
19.00
46.00
23.SO
22.62
12.88
5.50
37.50
9.88
59.12
35.25
20.62
24.00
so.so
29.38
3.75
64.75
14.25
46.38
4.75
25.00
35.00
9.00
12.38
31.00
Distribucin
Cantidad
$0
$2,000
$4,000
$6,000
SS,000
$10,000
Totales
3.74
hasta menos de
hasta menos de
hasta menos de
hasta menos de
hasta menos de
hasta menos de
Frecuencia
de marzo
$2,000
$4,000
$6,000
$8,000.
$10,000
$12,000
Frecuencia
de abril
:.6
.13
17
10
4
-10
14
13
10
-
so
50
estadounidensesy extranjeros,
La siguiente tabla contiene las distribuciones acumulativas y las distribuciones
de porcentaje acumulativo de la distancia de frenado (en pies) a 80 mph para
una muestra de 25 modelos de automviles de fabricacin estadounidenses y
para una muestra de 72 modelos de automviles de fabricacin extranjera
obtenidas en un afio reciente.
Distancia
de frenado
(en pies)
Modelos de automviles
estadounidenses
Valores indicados "menores que"
Nmero
<t
Modelos de automviles
extranjeros
Valores indicados (menores que)
Porcentaje
Nmero
210
220
o.o
4.0
230
8.0
12.0
16.0
4
19
32
240
250
260
4
8
32.0
270
11
44.0
280
17
68.0
290
300
310
21
23
320
25
84.0
92.0
100.0
100.0
zs
54
61
68
68
70
71
72
Porcentaj e
o.o
1.4
S.6
26.4
44.4
75.0
84.7
94.4
94.4
97.2
98.6
100.0
Fuente:Los datos fueron extrados de Rolltf & Track, vol. 42, nm. 2 (octubre de 1990), pg. 47.
98
Captulo
3.75
.;:.
.
.:
Polgonos de frecuencia
. :. .-:.~: .
60
90
120 .'
' 1gresos'famniires (n$~00)
150
relativa acumulativa de
ingress familiares para
dos comunidades.
Usted trabaja para una agencia consultora independiente contratada por una
conocida compaa de bienes races especializada en la venta de casas en las Po
cono Mountains en el noreste de Pennsylvana, Sii. tarea es evaluar las tasas
de hipotecas de los propietarios de casas en dos populares comuntdades.
La figura siguiente contiene las ojivas de porcentaje de las hipotecas de 100
propietarios de casas muestreados en Penn Estates y 200 propietarios
muestreados en Hemlock Farros, dos comunidades de Pocono .
,_...;,..-"'-4---'--1
\\.
Hemlock Farms.
'
"
100
CapituSo
3
3.77
de
..
. . ..
selecciona un estudiante pata que sea coordinador del proyecto, otro estudiante es el
que registra el proyecto y un tercero es el cronometrador del proyecto. Para que cada
estudiantegane experiencia en el desarrollo del trabajo de equipo y en las habilidades
(le liderazgo) despus de cada proyecto debe haber una rotacin de posiciones. Al prindpio de cada proyecto, los estudiantes deben trabajr silenciosa e individualmente
durante n corto periodo espectficado. Una vez que cada estudiante ha tenido la oportunidad de estudiar los asuntos y refteiar sus posibles respuestas, el grupo se rene y
se: sigue con una discusin de grupo. Si todos los miembros de un grupo estn de
acuerdo con las sotudones, el coordinador es responsable de presentar la solucin del
proyecto del equipo nl instructor con las firmas de los estudiantes indicando tal
acuerdo. Por otra parte, si uno o ms miembros del equipo no estn de acuerdo con la
'solucum ofrecida por la mayora del equipo) una opinin ele minorapuede anexarse
al proyecto presentado, con fitmats),
CL 3.1
CL 3.2
CL 3.3
CL 3.4
.
{a) Delinear cmo procedern los miembros del grupo consus tareas.
(b) Realizar un anlisis descriptivo.
(c) Escribir y presentar un resumen. ejecutivo, anexando todas Ias tablas y diagramas.
(d) Preparar y ofrecer una presentacn oral de diez minutos al director de
comercializacin.
Un conocido peridico desea presentar un artculo especial sobre cmaras
compactas de 35 mm en su seccin dominical de viajes y contrata a su grupo,
la Corporacin
, para realizar un anlisis descriptivo respecto a las caracterstlcas de equipos importantes. El tema del artculo que el edtor de viajes
desea que se escriba se refiere al "importante valor de las cmaras de 35 mm
para los viajes familiares". Contando con el Conjunto de datos especiales 4 del
apndice O de las pginas 010-Dll que muestra informacin til sobre 59 de
estas cmaras, la Corporacin
est preparada para:
(a) Delinear cmo procedern los miembros del grupo con sus tareas.
(b) Realizar un anlisis descriptivo.
(e) Escribir y presentar un resumen ejecutivo, anexando todas las tablas y diagramas.
(d) Preparar. y ofrecer una presentacin oral de diez minutos al editor de viajes. .,
Nota Final
Referencias
1978).
Addlson-Wesley, 1977).
14. Vellernan, P. F., and D. C. Hoaglin, Applications, Bastes,
and Computing o( Exploratory Data Analysis (Boston, MA:
Duxbury Press, 1981).
15. Wainer, H., "How to Display Data Badly," The American
Statstidan, vol. 3g (mayo 1984), pp. 137-147.
102
captulo 3
:~.