Sunteți pe pagina 1din 10

NOTAS BREVES SOBRE ESTADISTICA DESCRIPTIVA

Ren Iral Palomino


Escuela de Estadstica
Por qu estudiar Estadstica
El estudio de la Estadstica !ermite" entre otras cosas
A!render las re#las $ mtodos usados en el tratamiento de in%ormaci&n
E'aluar $ cuanti%icar la im!ortancia de los resultados estadsticos o(tenidos
Entender me)or al#unos %en&menos de inters *Sociales" Econ&micos" Biol&#icos"
Educacionales" etc+,
Dar una 'isi&n m-s clara acerca de la in%ormaci&n !ro'eniente de di'ersas %uentes+
Al#unos as!ectos estadsticos mane)ados en la in%ormaci&n o(tenida de la radio" la tele'isi&n u otro
medio" in%luencian %uertemente a #ran cantidad de !ersonas !ero a 'eces no !ro!orcionan una
descri!ci&n ca(al de los que !retenden mostrar+
Como una de las tareas de la Estadstica es el estudio de %en&menos aleatorios" esto .ace mu$
!ertinente el tratar de e/!licar la manera como se com!ortan *Varia(ilidad,+
Entre otras cosas la Estadstica se ocu!a del mane)o de la in%ormaci&n que !ueda ser cuanti%icada+
Im!lica esto la descri!ci&n de con)untos de datos $ la in%erencia a !artir de la in%ormaci&n recolectada
de un %en&meno de inters+ 0a %unci&n !rinci!al de la estadstica a(arca1
Resumir" Sim!li%icar" Com!arar" Relacionar" Pro$ectar+
Entre las tareas que de(e en%rentar un estudio estadstico est-n1
2+ Delimitar con !recisi&n la !o(laci&n de re%erencia o el con)unto de datos en estudio" las unidades
que de(en ser o(ser'adas" las caractersticas o 'aria(les que ser-n medidas u o(ser'adas+
3+ Estrate#ias de O(ser'aci&n1 Censo" 4uestreo" Dise5o de E/!erimental+
6+ Recolecci&n $ Re#istro de la in%ormaci&n+
7+ De!uraci&n de la in%ormaci&n+
8+ Construcci&n de Ta(las+
9+ An-lisis Estadstico1
: Producci&n de res;menes #r-%icos $ numricos+
: Inter!retaci&n de resultados+
Cuando los datos com!renden toda la !o(laci&n de re%erencia" .a(lamos de un Censo $ cuando solo
com!rometen una !arte de ella" .a(lamos de una muestra+ En am(os casos es !ertinente un an-lisis
Descriptivo+ En el se#undo caso un an-lisis Inferencial+
A #randes ras#os !odemos decir que una Po(laci&n es el con)unto de toda !osi(le in%ormaci&n" o de los
o()etos" que !ermite estudiar un %en&meno de inters+
E)em!lo+ En el caso de medir la cali%icaci&n !romedio o(tenida !or los estudiantes de Estadstica I de la
<ni'ersidad Nacional de Colom(ia Sede 4edelln" en el semestre =3>3==6+ 0a !o(laci&n !uede ser el
con)unto de todas las notas !osi(les o(tenidas !or los estudiantes o el con)unto de todos los
estudiantes re#istrados en el curso en dic.o semestre+ 0a caracterstica de inters que de(e ser
estimada es la Nota Promedio del curso en dic.o semestre+
<na muestra es un su(con)unto de in%ormaci&n re!resentati'a de una !o(laci&n+
E)em!lo+ En el caso de determinar la nota !romedio" !odramos o!tar !or seleccionar de manera
aleatoria un #ru!o de estudiantes de la !o(laci&n $ o(ser'ar de ellos la nota !romedio o(tenida al %inal
del semestre+ Con estos datos !odemos estimar la nota !romedio #lo(al de todos los estudiantes en
dic.a !o(laci&n *Todos los estudiantes de estadstica I,+ El #ru!o de estudiantes seleccionados
constitu$e una Muestra+
0as Variables resultan ser aquellas caractersticas de inters que desean ser medidas so(re los
o()etos o indi'iduos seleccionados+
En la ma$ora de los casos lo que se !retende es estimar" a !artir de la in%ormaci&n recolectada de una
muestra" caractersticas desconocidas de los o()etos en dic.a !o(laci&n de inters+
Por e)em!lo" estimar el costo de 'ida !romedio en cierta comunidad" requiere de un des!lie#ue mu$
#rande de recursos" !ersonal ca!acitado" dise5o de encuestas o cuestionarios" e)ecuci&n de la misma"
tiem!o em!leado" etc+ Sin em(ar#o una muestra re!resentati'a de los o()etos de inters en dic.a
comunidad *!osi(lemente .o#ares," !ermite re#istrar las caractersticas de los o()etos seleccionados
que !ermitir-n dar una a!ro/imaci&n del costo de 'ida real en la comunidad+ El costo !romedio de 'ida
en esta comunidad *costo real, constitu$e un Parmetro %i)o que ata5e a la !o(laci&n $ el costo de 'ida
o(tenido a !artir de la muestra constitu$e una Estadstica o a!ro/imaci&n al 'alor real del !ar-metro+
0os !ar-metros son %i)os" !ues no de!enden de nin#una muestra? los estadsticos de!enden siem!re de
la muestra seleccionada+
0as caractersticas desconocidas de una !o(laci&n ser-n llamadas !ar-metros+ 0as caractersticas
calculadas a !artir de una muestra son llamadas estadsticas+ <na Inferencia es una #enerali@aci&n
o(tenida a !artir de una muestra aleatoria+
0a Estadstica !uede di'idirse en dos #randes ramas1 Estadstica Descri!ti'a $ Estadstica In%erencial+
Estadstica Descriptiva
Es el con)unto de mtodos usados !ara la or#ani@aci&n $ !resentaci&n *descri!ci&n, de la in%ormaci&n
recolectada+ 0a in%ormaci&n recolectada !uede ser catalo#ada de dos maneras1 Datos Cualitativos $
Cuantitativos+ 0os !rimeros se re%ieren a cate#oras o atri(utos que !ueden clasi%icarse se#;n un
criterio o cualidad+ E)em!lo1 Se/o" Color de Auto" Ti!o de San#re" Estado ci'il" cate#ora de un !ro%esor"
etc+ 0os se#undos se re%ieren a in%ormaci&n numrica" como cuanto o cuantos+ E)em!lo1 4asa"
estatura" Presi&n San#unea" duraci&n de un es!cimen" etc+
Al#unos datos numricos !ueden ser clasi%icados como cuantitati'os o cualitati'os se#;n su uso+ Por
e)em!lo" la estatura de una !ersona se mide en centmetros" !ies" metros $ es entonces una medida
cuantitati'a+ Pero si se mide como Ba)o" 4edio $ Alto" se con'ierte en una medida cualitati'a+
0os datos cuantitati'os !ueden ser clasi%icados como Discretos $ Continuos+
0os datos Discretos est-n relacionados !rinci!almente con conteos" 0os datos Continuos se o(tienen
!rinci!almente de mediciones+ En el !rimer caso los resultados con%orman un con)unto discreto *%inito o
numera(le," en el se#undo caso el con)unto de !osi(les resultados est- con%ormado !or un inter'alo
real+
E)em!lo1 El n;mero de ni5os en una %amilia" n;mero de accidentes !or .ora en un cruce" n;mero de
.oras dedicadas a estudiar semanalmente" !ulsaciones !or minuto" n;mero de tiendas !or man@ana"
son datos de ti!o discreto+ 0a 'elocidad de un autom&'il en AmB." la masa de una !ersona en A#r" la
estatura de cierto ti!o de -r(oles en !ul#adas" tiem!o de duraci&n de una (atera en das" distancia de
%renado en metros" edad de un indi'iduo" son datos de ti!o continuo+
0os datos cualitati'os a su 'e@ !ueden ser clasi%icados como Nominales $ Ordinales+
0os !rimeros son o(tenidos !or medio de a#ru!amientos no ordenados de datos en cate#oras
discretas" usados !rinci!almente en clasi%icaci&n o identi%icaci&n+ 0os se#undos son o(tenidos o
medidos en una escala nominal ordenados de al#una manera+ <na escala ordinal coloca las medidas
en cate#oras" cada una de las cuales indica un ni'el distinto res!ecto a un atri(uto que se est-
midiendo+
E)em!lo1 0a ra@a" Estado ci'il" Se/o *4 o C," Reli#i&n" Ti!o de san#re" constitu$en datos nominales+ 0as
cate#oras A" B" C" D" E como cali%icaci&n o ni'eles de !er%eccionamiento" cate#ora de un !ro%esor
*Instructor asistente" Instructor asociado" Pro%esor asistente" Pro%esor asociado $ Pro%esor titular," son
datos ordinales+
Organizacin de datos por medio de tablas de recuencia!
0a idea !rimordial de este !roceso es sim!li%icar la %orma como se re!resenta la in%ormaci&n+ 0a
in%ormaci&n !uede mostrarse de dos maneras1 "o:agrupada $ #grupada+
En aquellos casos donde la cantidad de 'alores de una o 'arias 'aria(les es mu$ #rande" se .ace
necesario resumirlos !ara una !resentaci&n m-s adecuada $ en al#unos casos a#ru!arlos en clases"
ran#os o inter'alos !ara %acilitar su inter!retaci&n+
0a %recuencia de una medida o de una cate#ora es el n;mero de 'eces que esta a!arece en una
colecci&n de datos+ <sualmente denotada f+ 0a in%ormaci&n que contiene los 'alores de dic.as medidas
$ sus res!ecti'as %recuencias se llamar- $abla de recuencias+
E)em!lo1 Se tienen los datos res!ecto al n;mero de %altas a clase durante cierto !erodo !ara los
estudiantes de un curso de Estadstica1 D E F E 7 6 3 2 = 8 6 3 2 2 F 6 3 E F 9 9 7 6 3 3 = D 7 9 D 9 D 76
8 F 6 3 2 7 7 3+ Constru$a una ta(la de %recuencias adecuada !ara estos datos+
G Caltas = 2 3 6 7 8 9 F E D
Crecuencia 3 7 F 9 9 3 7 7 6 7
<na a#ru!aci&n de estos datos !uede reducir m-s la !resentaci&n1
G Caltas = 2 : 3 6 : 7 8 : 9 F : E H D
Crecuencia 3 22 23 9 F 7
E)em!lo1 En cierto .os!ital se tiene in%ormaci&n acerca del n;mero de !ersonas que ocu!an la sala de
emer#encias cada da en un !erodo de 23 das+ 0os resultados o(ser'ados son1
Da 2 3 6 7 8 9 F E D 2= 22 23
G Pacientes F 76 E 33 26 3E 69 2E 36 32 28 83
<na a#ru!aci&n de esta in%ormaci&n !uede ser1
Clase 2 I 2= 22 I 3= 32 I 6= 62 : 7= 72 : 8= H 8=
Crecuencia 3 6 7 2 2 2
0a manera como se a#ru!a la in%ormaci&n de(e corres!onder a al#;n !ro!&sito !articular de quien
anali@a la in%ormaci&n o requerimiento del in'esti#ador conocedor de la in%ormaci&n+
Medidas de %ocalizacin o de $endencia Central!
Su!on#a que se tiene un con)unto de datos numricos de la %orma
1 2 n
X , X , , X L
" donde cada
i
X

corres!onde al i:simo 'alor de la 'aria(le de inters+ 0as medidas de locali@aci&n !ermiten tener un
!anorama #eneral de aquella o aquellas caractersticas de inters en una !o(laci&n $ al mismo tiem!o
sir'en como re!resentaci&n del con)unto de datos+
Media Muestral+ 0a media de un con)unto de o(ser'aciones
1 2 n
X , X , , X L
" se denotar-
X
$ est-
dada !or1
n
1 2 n
i
i 1
X X X
1
X X
n n
=
+ + +
= =

L
+
En trminos %sicos la media re!resenta el Centro de #ra'edad de un con)unto de datos+
E)em!lo1 Se re#istra el n;mero de ta@as de ca% consumidas !or un em!leado de o%icina en un !erodo
de 3= das+ 0os datos son1 7 8 6 9 F 2 3 6 = 8 9 8 E 7 = 3 6 F 8 9+ De aqu tenemos que1
20
i
i 1
1 82
X X 4.1
20 20
=
= = =

+ En !romedio este em!leado consume 7+2 ta@as de ca% diarias+ El si#uiente


#r-%ico de !untos ilustra esta a%irmaci&n+
E)em!lo1 Se re#istran las edades *en a5os, de 28 !ersonas en un #ru!o+ 0os datos son1 2E 3= 2D 2D 32
33 3= 36 32 37 2D 3= 33 32 37+ 0a edad !romedio de este #ru!o es1 9 20 86 20
15
313
X + + J J +
Si resumimos esta in%ormaci&n en una ta(la de %recuencias de la %orma1
Edad 2E 2D 3= 32 33 36 37
Crecuencia 2 6 6 6 3 2 3
Podemos calcular la media muestral como1 9 20
f
f X
15
f X
X
i
i i i i


+ J J +
0a media muestral es sensi(le a datos e/tremos+ Para los datos de edades" su!on#a que otrta !ersona
in#resa al #ru!o $ su edad es 68 a5os+ As" 8 21 75 21
16
35 313
X + + J
K
J + Si la edad %uera 78 a5os"
entonces" 4 22 375 22
16
45 313
X + + J
K
J + Si la edad es 9= a5os" 3 23 31 23
16
60 313
X + + J
K
J +
Mediana+ Si las o(ser'aciones se ordenan de menor a ma$or" n 2 1
X X X L
+la mediana
re!resenta aquel 'alor que di'ide los datos en dos !artes !orcentual mente i#uales+ De esta manera al
menos el 8=L de los datos son in%eriores o i#uales a la mediana+ Si denotamos !or
M
X
o !or 4e" la
mediana" tenemos que1
E)em!lo+ Considerando las edades del e)em!lo anterior" ordenamos la in%ormaci&n en %orma
ascendente1 2E 2D 2D 2D 3= 3= 3= 32 32 32 33 33 36 37 37+ En este caso" como nJ28" entonces
21 X X Me
8
2
1 15
J J J
K
+ Al menos el 8=L de las !ersonas en el #ru!o en cuesti&n tienen 32 a5os o
menos+ 0a mediana a di%erencia de la media muestral no es tan sensi(le a datos e/tremos+ Por e)em!lo
si otra !ersona de 2= a5os .ace !arte del #ru!o" tenemos nJ29+ As1
5 20
2
21 20
2
X X
Me
9 8
+ J
K
J
K
J
+ 0a
inter!retaci&n es i#ual+ Si 0a !ersona tiene 68 a5os" entonces
21
2
21 21
2
X X
Me
9 8
J
K
J
K
J
+ Si la edad es
88 a5os" 21 Me J + Como se !odr- o(ser'ar" la mediana di'ide la in%ormaci&n en dos !artes
!orcentualmente i#uales+ Si queremos di'idir la in%ormaci&n en cuatro !artes !orcentualmente i#uales"
cada !arte re!resentar- el 38L de la in%ormaci&n+ 0os 'alores reales que di'iden la in%ormaci&n en
cuartos son llamadas Cuartiles $ se denotan &'" &( $ &)+
De esta manera N2 de)a al menos el 38L de la in%ormaci&n in%erior o i#ual e el" N3 de)a al menos el
8=L de la in%ormaci&n menor o i#ual a el *esta es la 4ediana, $ %inalmente N6 de)a al menos el F8L de
la in%ormaci&n in%erior o i#ual a el+
Si la di'isi&n se .ace en 2== !artes !orcentualmente i#uales" los 'alores reales que !ermiten esta
di'isi&n son llamados Percentiles+ <sualmente denotados con la letra P $ el res!ecti'o !ercentil+ Por
e)em!lo P2=" P38" PF=" etc+
E)em!lo+ Retomando las edades de las 28 !ersonas" calcule N2" P9= $ PD=+
N2 corres!onde al !ercentil 38" es decir" P38+ El 38L de 28 datos es1
75 3 15 25 0 + J O +
+ En este caso
esco#emos
19 X 1 Q
4
J J
+ Para el !ercentil 9=" tenemos que
9 15 60 0 J O +
+ As .a$ dos 'alores que
cum!le la condici&n de de)ar al menos D 'alores i#uales o in%eriores a ellos1 10 9
X y X
+ As"
21
2
X X
60 P
10 9
J
K
J
+ Para PD=" tenemos1
5 13 15 90 0 + J O +
+ As"
24 X 90 P
14
J J
+ Al menos el D=L de
las !ersonas tienen edades in%eriores o i#uales a 37 a5os+
Otras medidas de 0ocali@aci&n son la 4oda" la 4edia Recortada" la 4edia Peomtrica" entre otras+
Medidas de Variabilidad o de Dispersin+
0as medidas de 'aria(ilidad !ermiten esta(lecer que tan dis!ersos est-n entre si un con)unto de datos
o(ser'ados+ Al#unas de estas medidas se re%ieren a la Dis!ersi&n res!ecto a una medida !articular de
tendencia central+
El *ango es la di%erencia entre el m-/imo 'alor o(ser'ado $ el mnimo1 RJ4a/:4in+
El *ango Intercuartil" el cual denotaremos INR" es la di%erencia entre N6 $ N21 :
1 Q 3 Q IQR : J
+ El
Ran#o Intercuartil !ermite determinar que tan dis!erso est- el 8=L de la in%ormaci&n mas central+
Varianza Muestral+ Si
1 2 n
X , X , , X L
es un con)unto de o(ser'aciones" la Varian@a 4uestral" denotada
+" est- dada !or1
* ,
1 n
X X
S
2
i
2
:
:
J
Q
+ 0a Des'iaci&n Est-ndar ser- la ra@ cuadrada de la Varian@a+
E)em!lo1 <sando los datos de las edades" tenemos que1
* ,
41 3
1 15
X X
S
2
1
2
+ J
:
:
J
Q
$
85 1 S + J
+ Para
estos la des'iaci&n es casi 3 a5os" lo que indica una dis!ersi&n alta+ Otras medidas de 'aria(ilidad son1
Des'iaci&n 4ediana" Des'iaci&n a(soluta" etc+
Diagramas de ,arras e -istogramas!
0a in%ormaci&n es !resentada de manera #r-%ica de!endiendo del ti!o de datos que esta conten#a+ Si la
'aria(le re!resenta cate#oras o clasi%icaciones es usual usar una ta(la de %recuencias !ara resumir la
in%ormaci&n $ lue#o un dia#rama de (arras !ara 'isuali@arla? en este caso el e)e R estar- com!uesto
!or las cate#oras o ni'eles discretos de la 'aria(le $ en el e)e S la %recuencia o !orcenta)es que le
corres!onden a cata cate#ora o ni'el discreto+
E)em!lo1 se tiene in%ormaci&n resumida acerca del monto anual o(tenido !or donaciones en di%erentes
-reas+
Area 4onto Porcenta)e
Reli#i&n 62+= 7F+E
Artes $ Tumanidades 7+2 9+6
Ser'icios Sociales 9+D 2+=9
Educaci&n D+= 26+D
Salud D+3 27+3
Otros 7+F F+3
O si lo que se quiere una re!resentaci&n
usando los !orcenta)es o(tenemos un
dia#rama de este estilo1
El !ro#rama en SAS usado es1
data monto;
input area$ 1-19 total porc;
cards;
Religion 31.0 47.8
Artes y Humanidades 4.1 6.3
er!icios ociales 6." 10.6
#ducacion ".0 13."
alud ".$ 14.$
%tros 4.7 7.$
;
run;
Proc gchart data&monto;
!'ar area()re*&total space&10;
!'ar area()re*&porc space&10;
run;
E)em!lo+ Retomando los datos acerca del n;mero de %altas de un #ru!o de estudiantes en un curso de
Estadstica" la ta(la de %recuencias ela(orada al res!ecto muestra 2= cate#oras di%erentes+ Si el ran#o
del n;mero de %altas %uera muc.o ma$or" el dia#rama de (arras resultante no sera o!erati'o" en el
sentido en que muc.as (arras quedaran
sin %recuencia+ Se recomienda a#ru!ar !ara
lo#rar ca!tar me)or la in%ormaci&n+ 0a ta(la
de %recuencias $ el res!ecti'o dia#rama de
(arras se muestra a continuaci&n1
Ran#o o Clase Crecuencia
= I 2 9
3 I 6 26
7 I 8 E
9 I F E
E I D F
Cuando los datos son de ti!o continuo se .ace necesario a#ru!arlos en inter'alos dis)untos !ara tener
una me)or com!rensi&n #r-%ica de su com!ortamiento+
E)em!lo+ 0as estaturas en centmetros de 8= estudiantes mu)eres un #ru!o se re#istraron+ 0os datos
son1
28F 288 2F2 28= 296 28= 2F3 292 287 2F7 296 27E 283 296 27D 28E 2F9 297 28F 286 29D 292 29=
297 288 293 282 29F 29F 29F 2F= 28E 296 2F8 29D 29D 28E 28= 289 28F 2F7 293 28= 282 298 2F=
289 2F= 286 287+
A#ru!e adecuadamente los datos $ ela(ore la res!ecti'a ta(la de %recuencias $ el .isto#rama de
%recuencias relati'as+
El !ro(lema m-s im!ortante a resol'er aqu es En cu-ntas clases o inter'alos de(o a#ru!ar la
in%ormaci&n Es decir" cu-l es el n;mero m-s adecuado de inter'alos de a#ru!aci&n+ E/isten
di'ersas re#las em!ricas acerca de cual de(e ser un n;mero de inter'alos o #ru!os adecuados+ Sea n1
n;mero de o(ser'aciones" U1 n;mero de inter'alos o #ru!os" R1 Ran#o" A1 Am!litud del inter'alo+ Entre
las re#las m-s conocidas se tienen1
: K n =
: 5 K 25
:
10
K 1 3.33 log n = +
*Re#la de Stur#es,
Si usamos la !rimera re#la" corremos el ries#o de incrementar dr-sticamente el n;mero de inter'alos a
medida que aumenta el n;mero de datos+ Por e)em!lo con nJ2==" K 100 10 = = + Si nJ2==="
K 1000 10 10 31.62 = = + Se recomienda usar la ;ltima re#la !ues esta !ermite corre#ir el 'alor de U
aunque se incremente dram-ticamente el n;mero de datos+ <sando la re#la de Stur#es" un n;mero de
clases inicial es
10
K 1 3.33 log 50 6.66 = + =
+ As a!ro/imamos K 7 + 0a estatura mnima es 27E cms $ la
m-/ima estatura es 2F9+ As el ran#o ser- R 176 148 28 = = + 0a am!litud de estos ser-1
R 28
4
K 7
= = = +
0os inter'alos que se #eneren de(en ser dis)untos" de esta manera se !ro!onen inter'alos semi:
a(iertos a derec.a+ As los inter'alos de clases ser-n1 [ ) 148, 152
" [ ) 152, 156
" [ ) 156, 160
" [ ) 160, 164
"+
[ ) 164, 168
" [ ) 168, 172
" [ ) 172, 176
+ Es im!licara que el m-/imo 'alor no est incluido en el ;ltimo
inter'alo+ Es usual incrementar le'emente la am!litud de los inter'alos !ara #aranti@ar que nin#;n 'alor
quede !or %uera de la clasi%icaci&n+ En otros casos Taciendo
4. 2 =
" entonces el nue'o ran#o es1
R 4. 2 7 29. 4 = =
+ As" el ran#o se am!la en 2+7 unidades que !ueden ser re!artidas =+F a i@quierda $ a
derec.a+ En el si#uiente #r-%ico ilustra lo antes dic.o+
0os inter'alos de clase res!ecti'os son1 [ ) 147.3, 151.5
" [ ) 151.5, 155.7
" [ ) 155.7, 159.9
" [ ) 159.9, 164.1
"
[ ) 164.1, 168.3
" [ ) 168.3, 172.5
[ ) 172.5, 176.7
+
0a ta(la de %recuencias !ara estos inter'alos $ el res!ecti'o .isto#rama son1
Este #r-%ico es llamado -istograma de recuencias+ Se !uede o(ser'ar que las estaturas no est-n
mu$ a#ru!adas alrededor de un ran#o de 'alores es!ec%icos" de .ec.o" las !ersonas con estaturas
entre 27E $ 29= cms+ !resentan %recuencias mu$ similares+ Es mu$ %recuente encontrar !ersonas con
estaturas que oscilan entre los 29= $ 297 cms+ A!ro/imadamente+
Es usual #ra%icar las clases contra las %recuencias de manera que el -rea de cada rect-n#ulo sea i#ual
a la %recuencia+ El .isto#rama resultante se llama -istograma de Densidad+
Diagrama de Ca.as / ,igotes0 ,o12P%ot
0os dia#ramas de ca)a $ (i#otes son .erramientas #r-%icas mu$ ;tiles !ara descri(ir caractersticas
im!ortantes en un con)unto de datos" como son centro" simetra o asimetra" 'alores at!icos *raros,"
etc+ 0a construcci&n de este dia#rama em!lea medidas descri!ti'as que son !oco sensi(les a datos
e/tremos $ !or lo tanto !resentan una descri!ci&n m-s clara de la in%ormaci&n+ B-sicamente
em!leamos !ara su construcci&n los tres cuarteles" los 'alores mnimos $ m-/imos $ la media muestral
solo como medida de locali@aci&n en el #r-%ico+
<na o(ser'aci&n se dice #tpica o Inusual si est- a m-s de 2+8 'eces el ran#o intercualtil de al#uno de
los cuarteles N2 o N6+ <na o(ser'aci&n se dice At!ica E/trema si est- a m-s de 6 'eces el ran#o
Intercuartil de al#uno de los cuarteles N2 o N6+
El dia#rama est- con%ormado !or una ca)a la cual se constru$e con a$uda del !rimer $ tercer cuartil+ 0a
mediana es di(u)ada en el interior de la ca)a al i#ual que la media muestral+ 0os (i#otes se e/tienden
desde los cuartiles a la derec.a $ a la i@quierda+ Su lon#itud de!ende de si .a$ o no datos at!icos+
Sin 'alores At!icos ni E/tremos1
Con 'alores At!icos $Bo E/tremos1
En al#unos !aquetes com!utacionales" los (i#otes 'an siem!re .asta los 'alores mnimo $ m-/imo" sin
.acer distinci&n en los 'alores at!icos+
E)em!lo+ Para los datos de las estaturas tenemos1 148 Min J " 176 M!" J "
86 160 X + J 154 Q
1
J
"
161 Q
2
J
"
167 Q
3
J
+
E)em!lo+ En un estudio e!idemiol&#ico" el Or#anoc.lorine $ PCBVs totales %ueron re#istrados en 7=
'oluntarios en Colorado+ 0os datos son1 3F 76 83 86 86 86 92 96 96 98 9E F= F3 F8 E6 D8 D9 DF 2=2
2=8 22= 228 228 228 228 239 23F 267 278 283 286 2E3 2D= 2DF 2DF 3E3 633 633 673 832+
Al#unas medidas descri!ti'as (-sicas son1 27 Min J " 521 M!" J "
925 133 X + J
"
5 66 Q
1
+ J
"
5 107 Q
2
+ J
"
5 152 Q
3
+ J
+ El res!ecti'o Dia#rama de ca)as $ (i#otes se muestra a continuaci&n1

En este caso e/isten datos inusuales de los dos ti!os1 at!icos $ at!icos e/tremos+ 0o que nos muestra
una #ran dis!ersi&n de los datos de(ido a o(ser'aciones mu$ inusuales 3E3" 633"673 $ 832+ El
Tisto#rama de %recuencias e'idencia dic.o ses#o a la derec.a+ Esto indica que es mu$ inusual
encontrar ni'eles totales su!eriores a 3E=+

S-ar putea să vă placă și