Documente Academic
Documente Profesional
Documente Cultură
L
+
En trminos %sicos la media re!resenta el Centro de #ra'edad de un con)unto de datos+
E)em!lo1 Se re#istra el n;mero de ta@as de ca% consumidas !or un em!leado de o%icina en un !erodo
de 3= das+ 0os datos son1 7 8 6 9 F 2 3 6 = 8 9 8 E 7 = 3 6 F 8 9+ De aqu tenemos que1
20
i
i 1
1 82
X X 4.1
20 20
=
= = =
+ J J +
0a media muestral es sensi(le a datos e/tremos+ Para los datos de edades" su!on#a que otrta !ersona
in#resa al #ru!o $ su edad es 68 a5os+ As" 8 21 75 21
16
35 313
X + + J
K
J + Si la edad %uera 78 a5os"
entonces" 4 22 375 22
16
45 313
X + + J
K
J + Si la edad es 9= a5os" 3 23 31 23
16
60 313
X + + J
K
J +
Mediana+ Si las o(ser'aciones se ordenan de menor a ma$or" n 2 1
X X X L
+la mediana
re!resenta aquel 'alor que di'ide los datos en dos !artes !orcentual mente i#uales+ De esta manera al
menos el 8=L de los datos son in%eriores o i#uales a la mediana+ Si denotamos !or
M
X
o !or 4e" la
mediana" tenemos que1
E)em!lo+ Considerando las edades del e)em!lo anterior" ordenamos la in%ormaci&n en %orma
ascendente1 2E 2D 2D 2D 3= 3= 3= 32 32 32 33 33 36 37 37+ En este caso" como nJ28" entonces
21 X X Me
8
2
1 15
J J J
K
+ Al menos el 8=L de las !ersonas en el #ru!o en cuesti&n tienen 32 a5os o
menos+ 0a mediana a di%erencia de la media muestral no es tan sensi(le a datos e/tremos+ Por e)em!lo
si otra !ersona de 2= a5os .ace !arte del #ru!o" tenemos nJ29+ As1
5 20
2
21 20
2
X X
Me
9 8
+ J
K
J
K
J
+ 0a
inter!retaci&n es i#ual+ Si 0a !ersona tiene 68 a5os" entonces
21
2
21 21
2
X X
Me
9 8
J
K
J
K
J
+ Si la edad es
88 a5os" 21 Me J + Como se !odr- o(ser'ar" la mediana di'ide la in%ormaci&n en dos !artes
!orcentualmente i#uales+ Si queremos di'idir la in%ormaci&n en cuatro !artes !orcentualmente i#uales"
cada !arte re!resentar- el 38L de la in%ormaci&n+ 0os 'alores reales que di'iden la in%ormaci&n en
cuartos son llamadas Cuartiles $ se denotan &'" &( $ &)+
De esta manera N2 de)a al menos el 38L de la in%ormaci&n in%erior o i#ual e el" N3 de)a al menos el
8=L de la in%ormaci&n menor o i#ual a el *esta es la 4ediana, $ %inalmente N6 de)a al menos el F8L de
la in%ormaci&n in%erior o i#ual a el+
Si la di'isi&n se .ace en 2== !artes !orcentualmente i#uales" los 'alores reales que !ermiten esta
di'isi&n son llamados Percentiles+ <sualmente denotados con la letra P $ el res!ecti'o !ercentil+ Por
e)em!lo P2=" P38" PF=" etc+
E)em!lo+ Retomando las edades de las 28 !ersonas" calcule N2" P9= $ PD=+
N2 corres!onde al !ercentil 38" es decir" P38+ El 38L de 28 datos es1
75 3 15 25 0 + J O +
+ En este caso
esco#emos
19 X 1 Q
4
J J
+ Para el !ercentil 9=" tenemos que
9 15 60 0 J O +
+ As .a$ dos 'alores que
cum!le la condici&n de de)ar al menos D 'alores i#uales o in%eriores a ellos1 10 9
X y X
+ As"
21
2
X X
60 P
10 9
J
K
J
+ Para PD=" tenemos1
5 13 15 90 0 + J O +
+ As"
24 X 90 P
14
J J
+ Al menos el D=L de
las !ersonas tienen edades in%eriores o i#uales a 37 a5os+
Otras medidas de 0ocali@aci&n son la 4oda" la 4edia Recortada" la 4edia Peomtrica" entre otras+
Medidas de Variabilidad o de Dispersin+
0as medidas de 'aria(ilidad !ermiten esta(lecer que tan dis!ersos est-n entre si un con)unto de datos
o(ser'ados+ Al#unas de estas medidas se re%ieren a la Dis!ersi&n res!ecto a una medida !articular de
tendencia central+
El *ango es la di%erencia entre el m-/imo 'alor o(ser'ado $ el mnimo1 RJ4a/:4in+
El *ango Intercuartil" el cual denotaremos INR" es la di%erencia entre N6 $ N21 :
1 Q 3 Q IQR : J
+ El
Ran#o Intercuartil !ermite determinar que tan dis!erso est- el 8=L de la in%ormaci&n mas central+
Varianza Muestral+ Si
1 2 n
X , X , , X L
es un con)unto de o(ser'aciones" la Varian@a 4uestral" denotada
+" est- dada !or1
* ,
1 n
X X
S
2
i
2
:
:
J
Q
+ 0a Des'iaci&n Est-ndar ser- la ra@ cuadrada de la Varian@a+
E)em!lo1 <sando los datos de las edades" tenemos que1
* ,
41 3
1 15
X X
S
2
1
2
+ J
:
:
J
Q
$
85 1 S + J
+ Para
estos la des'iaci&n es casi 3 a5os" lo que indica una dis!ersi&n alta+ Otras medidas de 'aria(ilidad son1
Des'iaci&n 4ediana" Des'iaci&n a(soluta" etc+
Diagramas de ,arras e -istogramas!
0a in%ormaci&n es !resentada de manera #r-%ica de!endiendo del ti!o de datos que esta conten#a+ Si la
'aria(le re!resenta cate#oras o clasi%icaciones es usual usar una ta(la de %recuencias !ara resumir la
in%ormaci&n $ lue#o un dia#rama de (arras !ara 'isuali@arla? en este caso el e)e R estar- com!uesto
!or las cate#oras o ni'eles discretos de la 'aria(le $ en el e)e S la %recuencia o !orcenta)es que le
corres!onden a cata cate#ora o ni'el discreto+
E)em!lo1 se tiene in%ormaci&n resumida acerca del monto anual o(tenido !or donaciones en di%erentes
-reas+
Area 4onto Porcenta)e
Reli#i&n 62+= 7F+E
Artes $ Tumanidades 7+2 9+6
Ser'icios Sociales 9+D 2+=9
Educaci&n D+= 26+D
Salud D+3 27+3
Otros 7+F F+3
O si lo que se quiere una re!resentaci&n
usando los !orcenta)es o(tenemos un
dia#rama de este estilo1
El !ro#rama en SAS usado es1
data monto;
input area$ 1-19 total porc;
cards;
Religion 31.0 47.8
Artes y Humanidades 4.1 6.3
er!icios ociales 6." 10.6
#ducacion ".0 13."
alud ".$ 14.$
%tros 4.7 7.$
;
run;
Proc gchart data&monto;
!'ar area()re*&total space&10;
!'ar area()re*&porc space&10;
run;
E)em!lo+ Retomando los datos acerca del n;mero de %altas de un #ru!o de estudiantes en un curso de
Estadstica" la ta(la de %recuencias ela(orada al res!ecto muestra 2= cate#oras di%erentes+ Si el ran#o
del n;mero de %altas %uera muc.o ma$or" el dia#rama de (arras resultante no sera o!erati'o" en el
sentido en que muc.as (arras quedaran
sin %recuencia+ Se recomienda a#ru!ar !ara
lo#rar ca!tar me)or la in%ormaci&n+ 0a ta(la
de %recuencias $ el res!ecti'o dia#rama de
(arras se muestra a continuaci&n1
Ran#o o Clase Crecuencia
= I 2 9
3 I 6 26
7 I 8 E
9 I F E
E I D F
Cuando los datos son de ti!o continuo se .ace necesario a#ru!arlos en inter'alos dis)untos !ara tener
una me)or com!rensi&n #r-%ica de su com!ortamiento+
E)em!lo+ 0as estaturas en centmetros de 8= estudiantes mu)eres un #ru!o se re#istraron+ 0os datos
son1
28F 288 2F2 28= 296 28= 2F3 292 287 2F7 296 27E 283 296 27D 28E 2F9 297 28F 286 29D 292 29=
297 288 293 282 29F 29F 29F 2F= 28E 296 2F8 29D 29D 28E 28= 289 28F 2F7 293 28= 282 298 2F=
289 2F= 286 287+
A#ru!e adecuadamente los datos $ ela(ore la res!ecti'a ta(la de %recuencias $ el .isto#rama de
%recuencias relati'as+
El !ro(lema m-s im!ortante a resol'er aqu es En cu-ntas clases o inter'alos de(o a#ru!ar la
in%ormaci&n Es decir" cu-l es el n;mero m-s adecuado de inter'alos de a#ru!aci&n+ E/isten
di'ersas re#las em!ricas acerca de cual de(e ser un n;mero de inter'alos o #ru!os adecuados+ Sea n1
n;mero de o(ser'aciones" U1 n;mero de inter'alos o #ru!os" R1 Ran#o" A1 Am!litud del inter'alo+ Entre
las re#las m-s conocidas se tienen1
: K n =
: 5 K 25
:
10
K 1 3.33 log n = +
*Re#la de Stur#es,
Si usamos la !rimera re#la" corremos el ries#o de incrementar dr-sticamente el n;mero de inter'alos a
medida que aumenta el n;mero de datos+ Por e)em!lo con nJ2==" K 100 10 = = + Si nJ2==="
K 1000 10 10 31.62 = = + Se recomienda usar la ;ltima re#la !ues esta !ermite corre#ir el 'alor de U
aunque se incremente dram-ticamente el n;mero de datos+ <sando la re#la de Stur#es" un n;mero de
clases inicial es
10
K 1 3.33 log 50 6.66 = + =
+ As a!ro/imamos K 7 + 0a estatura mnima es 27E cms $ la
m-/ima estatura es 2F9+ As el ran#o ser- R 176 148 28 = = + 0a am!litud de estos ser-1
R 28
4
K 7
= = = +
0os inter'alos que se #eneren de(en ser dis)untos" de esta manera se !ro!onen inter'alos semi:
a(iertos a derec.a+ As los inter'alos de clases ser-n1 [ ) 148, 152
" [ ) 152, 156
" [ ) 156, 160
" [ ) 160, 164
"+
[ ) 164, 168
" [ ) 168, 172
" [ ) 172, 176
+ Es im!licara que el m-/imo 'alor no est incluido en el ;ltimo
inter'alo+ Es usual incrementar le'emente la am!litud de los inter'alos !ara #aranti@ar que nin#;n 'alor
quede !or %uera de la clasi%icaci&n+ En otros casos Taciendo
4. 2 =
" entonces el nue'o ran#o es1
R 4. 2 7 29. 4 = =
+ As" el ran#o se am!la en 2+7 unidades que !ueden ser re!artidas =+F a i@quierda $ a
derec.a+ En el si#uiente #r-%ico ilustra lo antes dic.o+
0os inter'alos de clase res!ecti'os son1 [ ) 147.3, 151.5
" [ ) 151.5, 155.7
" [ ) 155.7, 159.9
" [ ) 159.9, 164.1
"
[ ) 164.1, 168.3
" [ ) 168.3, 172.5
[ ) 172.5, 176.7
+
0a ta(la de %recuencias !ara estos inter'alos $ el res!ecti'o .isto#rama son1
Este #r-%ico es llamado -istograma de recuencias+ Se !uede o(ser'ar que las estaturas no est-n
mu$ a#ru!adas alrededor de un ran#o de 'alores es!ec%icos" de .ec.o" las !ersonas con estaturas
entre 27E $ 29= cms+ !resentan %recuencias mu$ similares+ Es mu$ %recuente encontrar !ersonas con
estaturas que oscilan entre los 29= $ 297 cms+ A!ro/imadamente+
Es usual #ra%icar las clases contra las %recuencias de manera que el -rea de cada rect-n#ulo sea i#ual
a la %recuencia+ El .isto#rama resultante se llama -istograma de Densidad+
Diagrama de Ca.as / ,igotes0 ,o12P%ot
0os dia#ramas de ca)a $ (i#otes son .erramientas #r-%icas mu$ ;tiles !ara descri(ir caractersticas
im!ortantes en un con)unto de datos" como son centro" simetra o asimetra" 'alores at!icos *raros,"
etc+ 0a construcci&n de este dia#rama em!lea medidas descri!ti'as que son !oco sensi(les a datos
e/tremos $ !or lo tanto !resentan una descri!ci&n m-s clara de la in%ormaci&n+ B-sicamente
em!leamos !ara su construcci&n los tres cuarteles" los 'alores mnimos $ m-/imos $ la media muestral
solo como medida de locali@aci&n en el #r-%ico+
<na o(ser'aci&n se dice #tpica o Inusual si est- a m-s de 2+8 'eces el ran#o intercualtil de al#uno de
los cuarteles N2 o N6+ <na o(ser'aci&n se dice At!ica E/trema si est- a m-s de 6 'eces el ran#o
Intercuartil de al#uno de los cuarteles N2 o N6+
El dia#rama est- con%ormado !or una ca)a la cual se constru$e con a$uda del !rimer $ tercer cuartil+ 0a
mediana es di(u)ada en el interior de la ca)a al i#ual que la media muestral+ 0os (i#otes se e/tienden
desde los cuartiles a la derec.a $ a la i@quierda+ Su lon#itud de!ende de si .a$ o no datos at!icos+
Sin 'alores At!icos ni E/tremos1
Con 'alores At!icos $Bo E/tremos1
En al#unos !aquetes com!utacionales" los (i#otes 'an siem!re .asta los 'alores mnimo $ m-/imo" sin
.acer distinci&n en los 'alores at!icos+
E)em!lo+ Para los datos de las estaturas tenemos1 148 Min J " 176 M!" J "
86 160 X + J 154 Q
1
J
"
161 Q
2
J
"
167 Q
3
J
+
E)em!lo+ En un estudio e!idemiol&#ico" el Or#anoc.lorine $ PCBVs totales %ueron re#istrados en 7=
'oluntarios en Colorado+ 0os datos son1 3F 76 83 86 86 86 92 96 96 98 9E F= F3 F8 E6 D8 D9 DF 2=2
2=8 22= 228 228 228 228 239 23F 267 278 283 286 2E3 2D= 2DF 2DF 3E3 633 633 673 832+
Al#unas medidas descri!ti'as (-sicas son1 27 Min J " 521 M!" J "
925 133 X + J
"
5 66 Q
1
+ J
"
5 107 Q
2
+ J
"
5 152 Q
3
+ J
+ El res!ecti'o Dia#rama de ca)as $ (i#otes se muestra a continuaci&n1
En este caso e/isten datos inusuales de los dos ti!os1 at!icos $ at!icos e/tremos+ 0o que nos muestra
una #ran dis!ersi&n de los datos de(ido a o(ser'aciones mu$ inusuales 3E3" 633"673 $ 832+ El
Tisto#rama de %recuencias e'idencia dic.o ses#o a la derec.a+ Esto indica que es mu$ inusual
encontrar ni'eles totales su!eriores a 3E=+