Sunteți pe pagina 1din 8

Est

4. hrt*tcd*s rl*Jrxr+*r*fr* ptrr*

ndar Pensam iento aleatorio

Ampliaciones

multimedia

[a c*racterieacic* de v&rlahtes

En los temas anteriores se describieron mtodos variados para resumir datos y caracterizar ua variable. Estos son una gran ayuda visual en presentaciones ante individuos o
grupos. En los temas siguientes, aprenders dos mtodos que proporcionan otras alternativas paraanalizar Ios datos: las medidas de localizacin y las medidas de variabilidad.

Recuerda qtte,.,
Si se calculan las medidas de localizacin Y de
variabilidad Partiendo de
los datos de una muestra,
estas se llaman estadsti-

4.L Medidas de locatizacin

cos de Ia muestra.

Las medidas de localizacin son cinco: la media, la mediana, la moda, los percentiles y

Si se calculan a Partir de

los cuartiles.

datos de una Poblacin


se denominan Parme-

Media

tros poblacionales.

La media es quiz la medida de localizacin ms usada, tambin es llamada promeo


y es una medida de localizacin central o tendencia central. Si los datos que se usan
para calculada proceden de una muestra, se representa con 7; si los datos son de una
poblacin, se utiliza la letra griega p.
Los valores para los diferentes datos se expresan as: x1,

x21 x31

...t x;

La media para una muestra con n datos se calcula aplicando la siguiente expre-

sin:

*Z, X;

,,:

J_::__L

n
La media es una medida que se ve afectada por el cambio drstico de uno de los datos.
Si hay un dato muy grande o un dato muy pequeo con respecto a los dems, la media
cambia signifi cativamente.

EJEMPLO
El diseador de la pgina web del colegio est lanzando una nueva estrategia para motivar a los estuantes a consultar
las actividades en Internet. Dla a dla cuenta el nmero de usuarios que han sitado la prgina.
Los resultados de los ltimos 15 das se muestran a continuacin:

150 300 265 r23


298 209 397 r99

32t
234

203

400

200

249

100

Las directivas del colegio plantean que si el promedio de usuarios es mayor que 300, entonces, mejorar la velocidad
del servicio adquiriendo un paquete de datos con velocidad de 20G.

Determinar cul ser la decisin de las directivas teniendo en cuenta los datos de los quince das de prueba del servicio.
Con base en los datos

x:

i :

150

203

se

calcula el promed.io as:

209

243,2. Luego la media

300
es

400

397

265

100
r5

+ t99 + t23 +

249

234

32t

298

200

243,2.

A partir del clculo de la media

no aumentarn la velocidad en el servicio


de Internet ya que el promedio de usuarios es mucho menor de lo propuesto para tal fin.
se puede determinar que las directivas

osarr*LANA

1303

--

-rl

Mediana

Fr

La mediana es otra medida de la localizacin central de datos. Es el valor interme;-:

cuando los valores de los datos han sido ordenados en forma ascendente. La mediana s:
representa.o-o 7 si es tomada de una muestra y como [, si es de la poblacin.

Maternticamente
Si el conjunto de datos
tiene valores extrennadamente pequeos o extremadamente grandes, qu
r"nedida de tendencia central es ms acertada en la
caracterizacin de la variable? Justifica

tu respuesta.

Cuando hay un nmero impar de datos, la mediana es exactamente el valor intermedio.


Cuando hay un nmero par de datos, la mediana es el promedio entre los dos
datos intermedios.

t
Pa

pe

tie
de
Par

mediana es una medida que no considera la magnitud de los datos, por ello no se \-e
afectada por el cambio significativo de uno de ellos. Sin embargo, al no considera la
magnitud no es una medida que describa las caractersticas de los datos cuando est
lejanos unos de otros.
Para el ejemplo anterior se tiene el conjunto ordenado de datos en forma ascendente.

como

se

A partir de la mediana

234

si
,

el que est ubicado en la posicin B, es decir, 234. As,

; - n4

usuarios

se

se

en

EJ
Una

puede afirmar que el 50olo de los das, la pgina del colegio fue
consultada por 234 usuarios o menos.

De la misma manera
234 usuarios o ms.

si

de

100 t23 150 1,gg 200 203 209


249 265 298 300 321 397 400
es

Fini
!$

muestra a continuacin:

En este caso, el d.ato central

nr

us

en Ia

puede afirmar que el 50% de los das, la pgina fue visitada por

Moda
Una tercera med.ida de localizacin es la moda, que se representa
tinuacin.

se define a con-

La moda de un conjunto de datos es aquel que tiene mayor frecuencia.


Para el caso citado del colegio, se tiene que no hay ningn valor con frecuencia mayor
a uno, as que se dice que no existe la moda.

En algunos casos, la mxima frecuencia

presenta en dos o ms datos diferentes, por


lo cual se dice que en ellos existe ms de una moda. Si los datos tienen exactamente
dos modas, se dice que son bimodales; si tienen ms de dos modas, son multimodales.

Calcul

se

Frimer

2.770

En los casos multimodales casi nunca se menciona la moda, pues no ayuda citar tres o
ms modas para describir lalocalizacin de los datos.

A la media, la mediana y la moda

llama tambin medidas de tendencia central


y"resultan ser una herramienta muy til en la interpretacin de datos.
se les

Se acostumbra calcular las tres medidas para

un mismo conjunto de datos y comparar-

las; si las tres resultan con valores muy cercanos, es posible hacer una caracterizacin

muy acertada de las variables estudiadas en dicho conjunto de datos.

31

louu*r,r-t^*A

entero I
la posic

As, Se I
caso, 9

3.130 d

Est

Percer*ttfies

fEI
LE

ndar Pensam iento aleatorio

necurso

imprimible

Un percentil se simboliza como p, presenta informacin sobre cmo se distribuyen los datos en 100 partes porcentualmente iguales.
Para un conjunto de datos en el cual no hay muchos valores repetidos, el p-simo
percentil vide los datos en dos partes. Ms o menos elp por ciento de las observaciones
tienen valores menores que elp-simo percentil y aproximadamente el 100-p por ciento
de las observaciones tienen valores mayores que elp-simo percentil.
Para calcular elp-simo percentil se utiliza el siguiente mtodo.

Prirnero,

se

ordenan los datos de manera ascendente.

Luego, se calcula el ndice


nmero de datos.
Finalmente,

se

i,l : (-Lr)2, en dondep es el percentil buscado y n es el

tienen en cuenta dos opciones a partir del resultado de l:

Si i no es entero, se redondea. El valor entero inmediato mayor que I indica la posicin


delsimo percentil.
Si I es entero, elp-simo percentil es el promedio de los valores de los datos ubicados

enloslugaresiei* l.

Una bolsa de t::rabajo universitaria pide a algunos de sus exalumnos informacin sobre
sus salarios inirciales luego de graduarse de su respectiva facultad. Los datos se registran
en la siguiente: hbla:

Egresado

Egresado

Salario en dlares

2.850

2.890

2.950

3.L30

3.050

2.940

2.880

10

3.325

2.755

11

2.920

2.7l0

t2

2.880

Salario en dlares

Calcular el percentil
perc
85.

i'

' se ordenan
,,.
ord

los datos en forma ascendente, as:

2.710
2.7t0 2.755 2.850 2.880 2.880 2.890 2.920 2940 2.950 3.050 3.130 3.32'
',u

'' ,.:.

S calcula
Clr
se
l.

,: (#)t2: to,2

'::

' r como i no es entero, se redondea. As, el lugar del percentil 85 es el siguiente


. :.
entero mayor que 10,2, es decir, 11. Al observar los datos, el percentil 85 es el valor en
la posicin 11, es decir, 3.L30.
As, se puede afirmar que el 85o/o de los egresados ganan 3.130 dlares o menos, para el
caso, 9 de ellos. De la misma manera se puede afirmar que un egresado (el l5o/o) gana
3.130 dlares o ms.

Matemticamente
Calcula el percentil 50 para

el ejemplo de los salarios


de los egresados universita rios.

c)sarruLANA

l3]1
l-

cuartites

I cua rtil correspon-

de la mediana? Explica tu
res

Actividad

4_2

Fs frecuente dividir el conjunto de datos en cuatro partes porcentualmente iguales, cada


una de las cuales contiene una cuarta parte de ellos (el 25o/o). A los puntos de divisin

ft4atemtisam ente
A cu

EB

se les
Se

llama cuartiles y

se

AI

an:

deterr

representan con Q.

Estas

definen as:

puesta.

Q:
Q:
Q:

primer cuartil

percentil 25

pu.

Rango

segundo cuartil : percentil 50 : pso,


tercer cuartil : percentil 75 = pts.

El ral

sin:
Ra

Los cuartiles son casos especiales de los percentiles.

ng

Donc

Para calcular los cuartiles se utiliza el mismo mtodo planteado en la pgina anterior.

Por ejemplo, para calcular


ss

Calculamos i:

Q,

lnvestiga qu nnedida es

ngo

intercua

rtlico

?ro es el promedio entre los valores dglas

Si se cal
represer

+ 2.920

2.890

La vari

Siguiendo un procedimiento similar se encuenrra que para Q,:

mente
ra

La vari
valor dt
un dato

:ffirz:o

Como i result ser entero, entonces, Q,


posiciones 6y7 delconjunto de datos.

el

Variaru

realizamos el siguiente procedimiento.

i- (#)tr:
y 4;

3, enronces, Q, es el promedio enrre los valores de las posiciones

Donce
nr"ne.,

es decir,

cmo se caicula.

Ahora,paraQ, r. tiene que i

+ 2.880

2.850

Q,

- (#)rr:

Q,-

2.950

esviaci
La desr

9. Es decir,

+ 3.050
2

Para u -

3.000

Los cuartiles han divido el conjunto de datos en cuatro partes, en cada una de las cuales
h^y vn 25o/o de ellos:
2.7

L0 2.7 55 2.850 2.890

3.L30

2.980

2.890 2.920 2.940 2.950

3 .0 5 0

EI emple;

3.325

Q, - 2.865

a,

- 2.905

at-

3.000

portar,

en

copias qur

que usa

Deciles

dos ultim

Corresponden a la divisin del grupo de datos en diez partes porcentuales iguales.


El clculo del ndice para el decil se puede realizar mediante la expresin:

son:
5

,: (*)" dondeT : r,...,e


Y

3l e

o=o*r,rLAl.rA

se

procede de forma anloga como se hace con los percentiles y los cuartiles.

15

I *.hzar lc

I medidas d

rst n a a r

pe n sa m

e.qs-qie.aterio

ffiIil

4.2 Medidas de variabitidad


N

analizar un conjunto de datos tambin es necesario establecer algunas medidas que


determinan la variabilidad o dispersin de los datos entre s.
Estas medidas son tres: el rango, lavarianzay la desviacin estndar.

Rango
El

rango es la medida de variabilidad ms sencilla y se define mediante ia expre-

sin:

Rango: Du- D.
Donde

Dz es

el dato mayor

y Dnes el dato menor.

Varianza
Lavarianza es una medida que emplea todos los datos y se basa en la diferencia entre el
valor de cada dato y la media del conjunto. A esta diferencia se le llama desviacin de
un dato con respecto a la media.
Si se calcula en una muestra, se representa como .9 y si se calcula en una poblacin,

se

Matemticam ente
Por qu al calcular la varianza es necesario elevar al

cuadrado las dsviaciones

representa con o2.

con respecto a la media?


La

varianza para una muestra

se calcula a partir

de la siguiente expresin:

-x)'
-5, :E8'n-1

Donde (x, r) es la desviacin de los datos con respecto a la media y n es el


nmero de datos.

Desviacin estndar
La desviacin estndar se define como la raz cuadrada positiva de la varianza.
Para una muestra se define como:

-h'
- ^F- 28,
n1

EJEMPLO ]
Recugrda qlle,,,'r'ii'

El empleado de la tienda escolar debe reporta, en una ptanilla, el nmero de fotocopias flue pide cadauno de los estudiantes
que usa el seryicio. Los resultados de las
dos ltimas semanas, sin incluir domingos,
son:

Si se calcula la varianza
para una poblacin, se
debe usar la exPresin

.,
U

(x

[r)

/V

donde N es la Poblacin'

5t2159201
1579212310
Analizar los datos teniendo en cuenta las
medidas de Yariabilidad.
osrur*LANA

l3.tr3

Para iniciar eI anlisis, se calcula la media del conjunto de datos. As:


20+ 1 + 15+ 7g+ 21,+
3+ 10
x- 5 + L2 + 15 +

2+

9+

t2

En este caso,

se

puede determinar que la media es

7:

16 fotocopias.

Para plantear conclusiones ms objetivas sobre el conjunto de datos se realiza el


de las medidas de variabilidad.

Primero,

Recuerda qlle...
El "glande"

o "Pequeo"

de la varianza dePende
especficamente del con-

junto de datos Y de

Rango

se

calcula el rango de la distribucin as:

:79 -

:78 copias

Luego, se calcula la varianza. Paratal fin es muy til plantear una tabla con las respecri'
variaciones de cada dato en relacin con la media y los respectivos cuadrados, as:

las

caractersticas esPecficas de la Poblacin Y la

muestra estudiada.
la interpretacin es

c.lc1

No. de
copia

As,
casi

exclusiva del investigador


que conoce su gruPo de

-11

12 i

-4

rl

L2L

t6

i nve stig a ci n .

Adems, un valor de la
varianza Puede resultar

t, zol

alto para un gruPo de datos, pero Puede resultar

LV

-7

q !
't

49

ro
IL)

t r I -15 t 225
L 15 I -1 I 1

pequeo Para otro gruPo.

,2L,5t25r
I

LL

{ s I -,, }

L)

ror

- 5,

Luego,

: z?,: r,)' :
n-l

;82a,
12-l

Lr
43g,54 fotocopias2

Ahora, si la varianza es grande, se puede afirmar que la media no es un buen represenrante


del grupo y que existen datos que estn muy dispersos, por tanro, la variabilidad de la
muestra es muy alta, como sucede en este caso.
El anlisis delavarianza est ligado a las unidades en las que la medida est al cuadrado,
lo cual hace complicada su interpretacin, por tal razn, se hace necesario calcula la
desviacin estndar.

iir.r;.,.', r.;:. se calcula la desviacin estndar para poder rener una medida lineal de
comparacin de los datos.
As,

S:

20,94 fotocopias.

Este yalor es muy alto para la muestra, por tanto, a partir de la media no se puede hacer
una caracterizacin adecuada de la variable estudiada.
3,l 4loto*t'LLANA

-I
{
Est

da r Pensam

A continuacin, se relaciona [a lista de los sitios de


Internet ms populares al navegar desde casa y el

LIna prestigiosa editoria-l ha hecho un estudio pa


determinar el nmero ,Ce iibros de literatura que leen
al ao los habitantes de Lln sector de la ciudad. Para
ello, encuest a 60 personas de dicho sector. Los
resultados fueron los siguientes:

nmero de visitantes, en miles:


Sitio

Visitantes

about.com

5.538

altavista.com

7.391

amazon.com

7.986

angelfire.com

8.917

aol.com

23.863

bluemountainarts.com

6.796

3 4 10 4 1 2 9 3 3
67126081517
g 12 4 7 0 11 6 9 1
10 11 I ? 4 2 6 B 0

ebay.com

9.296

'

exclte.com

1,0.479

geocites.com

15.32L

go.com

14.330

hotmail.com i

11.791

I
il*.*
i

lL
{

14.470

Passport.com

11,.2gg

.730
u1

y lamoda (si exisre)

o poca

variabilidad?

las afueras de una ciudad registrarori la cantidad

de automviles que pasan por 16 puntos diferentes


de un peaje, entre las 6:00 a. m. ylas 6:30 a. m. f ,os
datos se muestran a continuacin.

180 t70 2r0 190 195 200


200 \99 186 t97 20r 2t0
'''. Calcula Ia media

205
201

y la mediana del nmero

de

vehculos.

1 Calcula e interpreta

el percentil 65.

estndar de la muestra.

y lamediana.

62" Responde: Cul de las dos medidas es mejor


como tendencia central para estos datos? Explica

tu

Responde.

@En

yahoo.com tr 26.796 j
zdner.com i
.133 j

61. Calcutra Ia media

La media es un buen representante de la muestra?


Explica tu respuesta.

j
G.785
"* *//l
:

Justifica tu respuesta.

5i-*1

t_

, #ffi. La muestra tiene mucha

* ,^** _

tripod.com | 1.970
-

15.593

netscape.com

7
+

estndar de Ia muestra.

23.505

0
+

Determina el rango, la vari anza y la desviacin

9.950

mns.com

real.com I
snap.com I

Calcul aiamedia, Ia medim,

tooksmarr.com
I :.984
*****-t*-**
=* -* --

tycos.com i
microsoft.com i

912 20 i
3 8 10 7

Encuentra los percentiles 25 y 70, y elabora una


interpretacin de ellos.

5.052

I
I

5 B 6
l2L5
1

.7Go

rrorbor.com I

icq.com

L
t***-

Qtropongo . eRazena

Afianzo COMPETENCIAS

resPuesta.

63" Calcula los cuartiles 1,2 y 3.

ruj:

iento aleatorig

64. Calcula el percentil 85 y escribe una interpretacin del mismo.

eResponde.
l'-i=.

En este caso,

la media puede considerarse un


buen representante del conjunto de datos?

o 'r, Si la Secretara

de tnsito de dicha ciudad propone la creacin de un nuevo punto en el peaje,


y si la media supera los 200 vehculos y la desviacin estnd.ar es peque a, cul ser la decisin?

eAN*LLA*,A

ls.tr5

!r
j
I

L. Antisis de una variabte cuatitativa

Enlace web

es el anfisis de datos a partir de la recopilac-: .


organizacin de ellos. Esto permite tomar decisiones frente a diversos temas que req'; : ::
una empresa, compaa o entidad.

El objetivo central de la estadstica

Cuando en una poblacin se hace un estudio de gustos o preferencias se dice que se


analizando una variable cualitativa en dicha poblacin.
Para analizar una variable cualitativa se hace una caracterizacin de ella. Caracterizar una variable tiene como objetivo presentar tablas de frecuencias q-=
brinden informacin resumida; adems, presentar diagramas en los cuales .=
pueda interpretar dicha informacin y determinar de manera general el o :,
datos de mayor frecuencia.

As, el tipo de bebida hidratante que prefieren los deportistas que participan en las .-rreras 10K, la marca de harina que prefiere un fabricante de pastas, el gnero litera::
que prefiere un grupo de personas son, entre otras, variables cualitativas.

mente
Qu significa la palabra
variable en el contexto de
la estadstica?

Una variable se caracteriza a partir de una determinada base de datos. Una base de darces un conjunto de datos especfico, que ha sido recolectado en una poblacin y,que:.
organiza para su posterior anlisis.

Hay diferentes formas y modelos para conformar bases de datos, por ejemplo:
: Es posible adquirir una gran cantidad de datos comerciales y econmicos gracias a organizaciones especializadas en reunirlos y actualizar\os. As, las empresas tienen accesc
a esas fuentes mediante acuerdos de compra de dicha informacin.

ltimos aos, la Internet se ha convertido en una fuente importante de datos.


Casi todas las personas poseen un sitio de Inteinet al cual tiene acceso el pblico; Ia

!s En los

gran mayora de las personas poseen una cuenta de correo electrnico o pertenecen
una determinada comunidad virtual.

En una importante empresa exportadora de maquinaria se aplic un estudio para


determinar qu tipo de bebida consumlan sus empleados en las horas laborales. El ,objetivo d. di"ho
era determinar de qu bebidas deberla surtirse el dispenrrdo. '
"rtodio
automtico de tal forma que el aprovechamiento del espacio fuera mximo. A contiRecuerda qtte,,,
una muestra es un subrePresentativo
de la poblacin a Partir de
la cual se Pretende reali-

conjunto

zil

inferencias resPecto
a la poblacin de donde
procede. Los elementos

se

presentan los resultados obtenidos aI tomar una muestra de 50 empleados:

Jr'rgo

Jr'rgo

Malta

Agua

Malta

Jrlgo

Jr'rgo

Limonada
Malta

Malta

Jugo

Agua

Limon ada

J.rgo

J.rgo

Agua

Jtrgo

Malta

Jrlgo

Limon ada

Limon ada

Jr'rgo

Malta
Agua

x El ju

Malta

Con

entre

Uva

Jr.rgo

Uva

J.rgo

Malta
Limonada

Jr'rgo

Malta

Jugo

Limon ada

LJva

Agua

Malta

Uva

J.tgo

* Agu

presentativa, srgnifi cativa

Jttgo

Malta

Jugo

Malta

Uva

l* La

y confiable.

Limon ada

Jr'rgo

Malta

J.rgo

Limon ada

seleccionados con cierta


tcnica re nen caractersticas que la hacen ser re-

7.94

nuacin

,.S

srll-i"d{r*.

Caract erizar la variable tipo de bebida.

se

As qu<
la mar.

S-ar putea să vă placă și