Documente Academic
Documente Profesional
Documente Cultură
Ampliaciones
multimedia
[a c*racterieacic* de v&rlahtes
En los temas anteriores se describieron mtodos variados para resumir datos y caracterizar ua variable. Estos son una gran ayuda visual en presentaciones ante individuos o
grupos. En los temas siguientes, aprenders dos mtodos que proporcionan otras alternativas paraanalizar Ios datos: las medidas de localizacin y las medidas de variabilidad.
Recuerda qtte,.,
Si se calculan las medidas de localizacin Y de
variabilidad Partiendo de
los datos de una muestra,
estas se llaman estadsti-
cos de Ia muestra.
Las medidas de localizacin son cinco: la media, la mediana, la moda, los percentiles y
Si se calculan a Partir de
los cuartiles.
Media
tros poblacionales.
x21 x31
...t x;
La media para una muestra con n datos se calcula aplicando la siguiente expre-
sin:
*Z, X;
,,:
J_::__L
n
La media es una medida que se ve afectada por el cambio drstico de uno de los datos.
Si hay un dato muy grande o un dato muy pequeo con respecto a los dems, la media
cambia signifi cativamente.
EJEMPLO
El diseador de la pgina web del colegio est lanzando una nueva estrategia para motivar a los estuantes a consultar
las actividades en Internet. Dla a dla cuenta el nmero de usuarios que han sitado la prgina.
Los resultados de los ltimos 15 das se muestran a continuacin:
32t
234
203
400
200
249
100
Las directivas del colegio plantean que si el promedio de usuarios es mayor que 300, entonces, mejorar la velocidad
del servicio adquiriendo un paquete de datos con velocidad de 20G.
Determinar cul ser la decisin de las directivas teniendo en cuenta los datos de los quince das de prueba del servicio.
Con base en los datos
x:
i :
150
203
se
209
300
es
400
397
265
100
r5
+ t99 + t23 +
249
234
32t
298
200
243,2.
osarr*LANA
1303
--
-rl
Mediana
Fr
cuando los valores de los datos han sido ordenados en forma ascendente. La mediana s:
representa.o-o 7 si es tomada de una muestra y como [, si es de la poblacin.
Maternticamente
Si el conjunto de datos
tiene valores extrennadamente pequeos o extremadamente grandes, qu
r"nedida de tendencia central es ms acertada en la
caracterizacin de la variable? Justifica
tu respuesta.
t
Pa
pe
tie
de
Par
mediana es una medida que no considera la magnitud de los datos, por ello no se \-e
afectada por el cambio significativo de uno de ellos. Sin embargo, al no considera la
magnitud no es una medida que describa las caractersticas de los datos cuando est
lejanos unos de otros.
Para el ejemplo anterior se tiene el conjunto ordenado de datos en forma ascendente.
como
se
A partir de la mediana
234
si
,
; - n4
usuarios
se
se
en
EJ
Una
puede afirmar que el 50olo de los das, la pgina del colegio fue
consultada por 234 usuarios o menos.
De la misma manera
234 usuarios o ms.
si
de
Fini
!$
muestra a continuacin:
nr
us
en Ia
puede afirmar que el 50% de los das, la pgina fue visitada por
Moda
Una tercera med.ida de localizacin es la moda, que se representa
tinuacin.
se define a con-
Calcul
se
Frimer
2.770
En los casos multimodales casi nunca se menciona la moda, pues no ayuda citar tres o
ms modas para describir lalocalizacin de los datos.
las; si las tres resultan con valores muy cercanos, es posible hacer una caracterizacin
31
louu*r,r-t^*A
entero I
la posic
As, Se I
caso, 9
3.130 d
Est
Percer*ttfies
fEI
LE
necurso
imprimible
Un percentil se simboliza como p, presenta informacin sobre cmo se distribuyen los datos en 100 partes porcentualmente iguales.
Para un conjunto de datos en el cual no hay muchos valores repetidos, el p-simo
percentil vide los datos en dos partes. Ms o menos elp por ciento de las observaciones
tienen valores menores que elp-simo percentil y aproximadamente el 100-p por ciento
de las observaciones tienen valores mayores que elp-simo percentil.
Para calcular elp-simo percentil se utiliza el siguiente mtodo.
Prirnero,
se
se
enloslugaresiei* l.
Una bolsa de t::rabajo universitaria pide a algunos de sus exalumnos informacin sobre
sus salarios inirciales luego de graduarse de su respectiva facultad. Los datos se registran
en la siguiente: hbla:
Egresado
Egresado
Salario en dlares
2.850
2.890
2.950
3.L30
3.050
2.940
2.880
10
3.325
2.755
11
2.920
2.7l0
t2
2.880
Salario en dlares
Calcular el percentil
perc
85.
i'
' se ordenan
,,.
ord
2.710
2.7t0 2.755 2.850 2.880 2.880 2.890 2.920 2940 2.950 3.050 3.130 3.32'
',u
'' ,.:.
S calcula
Clr
se
l.
,: (#)t2: to,2
'::
Matemticamente
Calcula el percentil 50 para
c)sarruLANA
l3]1
l-
cuartites
de la mediana? Explica tu
res
Actividad
4_2
ft4atemtisam ente
A cu
EB
se les
Se
llama cuartiles y
se
AI
an:
deterr
representan con Q.
Estas
definen as:
puesta.
Q:
Q:
Q:
primer cuartil
percentil 25
pu.
Rango
El ral
sin:
Ra
ng
Donc
Para calcular los cuartiles se utiliza el mismo mtodo planteado en la pgina anterior.
Calculamos i:
Q,
lnvestiga qu nnedida es
ngo
intercua
rtlico
Si se cal
represer
+ 2.920
2.890
La vari
mente
ra
La vari
valor dt
un dato
:ffirz:o
el
Variaru
i- (#)tr:
y 4;
Donce
nr"ne.,
es decir,
cmo se caicula.
+ 2.880
2.850
Q,
- (#)rr:
Q,-
2.950
esviaci
La desr
9. Es decir,
+ 3.050
2
Para u -
3.000
Los cuartiles han divido el conjunto de datos en cuatro partes, en cada una de las cuales
h^y vn 25o/o de ellos:
2.7
3.L30
2.980
3 .0 5 0
EI emple;
3.325
Q, - 2.865
a,
- 2.905
at-
3.000
portar,
en
copias qur
que usa
Deciles
dos ultim
son:
5
3l e
o=o*r,rLAl.rA
se
procede de forma anloga como se hace con los percentiles y los cuartiles.
15
I *.hzar lc
I medidas d
rst n a a r
pe n sa m
e.qs-qie.aterio
ffiIil
Rango
El
sin:
Rango: Du- D.
Donde
Dz es
el dato mayor
Varianza
Lavarianza es una medida que emplea todos los datos y se basa en la diferencia entre el
valor de cada dato y la media del conjunto. A esta diferencia se le llama desviacin de
un dato con respecto a la media.
Si se calcula en una muestra, se representa como .9 y si se calcula en una poblacin,
se
Matemticam ente
Por qu al calcular la varianza es necesario elevar al
se calcula a partir
de la siguiente expresin:
-x)'
-5, :E8'n-1
Desviacin estndar
La desviacin estndar se define como la raz cuadrada positiva de la varianza.
Para una muestra se define como:
-h'
- ^F- 28,
n1
EJEMPLO ]
Recugrda qlle,,,'r'ii'
El empleado de la tienda escolar debe reporta, en una ptanilla, el nmero de fotocopias flue pide cadauno de los estudiantes
que usa el seryicio. Los resultados de las
dos ltimas semanas, sin incluir domingos,
son:
Si se calcula la varianza
para una poblacin, se
debe usar la exPresin
.,
U
(x
[r)
/V
donde N es la Poblacin'
5t2159201
1579212310
Analizar los datos teniendo en cuenta las
medidas de Yariabilidad.
osrur*LANA
l3.tr3
2+
9+
t2
En este caso,
se
7:
16 fotocopias.
Primero,
Recuerda qlle...
El "glande"
o "Pequeo"
de la varianza dePende
especficamente del con-
junto de datos Y de
Rango
se
:79 -
:78 copias
Luego, se calcula la varianza. Paratal fin es muy til plantear una tabla con las respecri'
variaciones de cada dato en relacin con la media y los respectivos cuadrados, as:
las
muestra estudiada.
la interpretacin es
c.lc1
No. de
copia
As,
casi
-11
12 i
-4
rl
L2L
t6
i nve stig a ci n .
Adems, un valor de la
varianza Puede resultar
t, zol
LV
-7
q !
't
49
ro
IL)
t r I -15 t 225
L 15 I -1 I 1
,2L,5t25r
I
LL
{ s I -,, }
L)
ror
- 5,
Luego,
: z?,: r,)' :
n-l
;82a,
12-l
Lr
43g,54 fotocopias2
iir.r;.,.', r.;:. se calcula la desviacin estndar para poder rener una medida lineal de
comparacin de los datos.
As,
S:
20,94 fotocopias.
Este yalor es muy alto para la muestra, por tanto, a partir de la media no se puede hacer
una caracterizacin adecuada de la variable estudiada.
3,l 4loto*t'LLANA
-I
{
Est
da r Pensam
Visitantes
about.com
5.538
altavista.com
7.391
amazon.com
7.986
angelfire.com
8.917
aol.com
23.863
bluemountainarts.com
6.796
3 4 10 4 1 2 9 3 3
67126081517
g 12 4 7 0 11 6 9 1
10 11 I ? 4 2 6 B 0
ebay.com
9.296
'
exclte.com
1,0.479
geocites.com
15.32L
go.com
14.330
hotmail.com i
11.791
I
il*.*
i
lL
{
14.470
Passport.com
11,.2gg
.730
u1
o poca
variabilidad?
205
201
de
vehculos.
1 Calcula e interpreta
el percentil 65.
estndar de la muestra.
y lamediana.
tu
Responde.
@En
yahoo.com tr 26.796 j
zdner.com i
.133 j
j
G.785
"* *//l
:
Justifica tu respuesta.
5i-*1
t_
* ,^** _
tripod.com | 1.970
-
15.593
netscape.com
7
+
estndar de Ia muestra.
23.505
0
+
9.950
mns.com
real.com I
snap.com I
tooksmarr.com
I :.984
*****-t*-**
=* -* --
tycos.com i
microsoft.com i
912 20 i
3 8 10 7
5.052
I
I
5 B 6
l2L5
1
.7Go
rrorbor.com I
icq.com
L
t***-
Qtropongo . eRazena
Afianzo COMPETENCIAS
resPuesta.
ruj:
iento aleatorig
eResponde.
l'-i=.
En este caso,
o 'r, Si la Secretara
eAN*LLA*,A
ls.tr5
!r
j
I
Enlace web
As, el tipo de bebida hidratante que prefieren los deportistas que participan en las .-rreras 10K, la marca de harina que prefiere un fabricante de pastas, el gnero litera::
que prefiere un grupo de personas son, entre otras, variables cualitativas.
mente
Qu significa la palabra
variable en el contexto de
la estadstica?
Una variable se caracteriza a partir de una determinada base de datos. Una base de darces un conjunto de datos especfico, que ha sido recolectado en una poblacin y,que:.
organiza para su posterior anlisis.
Hay diferentes formas y modelos para conformar bases de datos, por ejemplo:
: Es posible adquirir una gran cantidad de datos comerciales y econmicos gracias a organizaciones especializadas en reunirlos y actualizar\os. As, las empresas tienen accesc
a esas fuentes mediante acuerdos de compra de dicha informacin.
!s En los
gran mayora de las personas poseen una cuenta de correo electrnico o pertenecen
una determinada comunidad virtual.
conjunto
zil
inferencias resPecto
a la poblacin de donde
procede. Los elementos
se
Jr'rgo
Jr'rgo
Malta
Agua
Malta
Jrlgo
Jr'rgo
Limonada
Malta
Malta
Jugo
Agua
Limon ada
J.rgo
J.rgo
Agua
Jtrgo
Malta
Jrlgo
Limon ada
Limon ada
Jr'rgo
Malta
Agua
x El ju
Malta
Con
entre
Uva
Jr.rgo
Uva
J.rgo
Malta
Limonada
Jr'rgo
Malta
Jugo
Limon ada
LJva
Agua
Malta
Uva
J.tgo
* Agu
Jttgo
Malta
Jugo
Malta
Uva
l* La
y confiable.
Limon ada
Jr'rgo
Malta
J.rgo
Limon ada
7.94
nuacin
,.S
srll-i"d{r*.
se
As qu<
la mar.