Documente Academic
Documente Profesional
Documente Cultură
Muestra: subconjunto que seleccionamos de la poblacin. 3s!, si se estudia el precio de la vivienda de una ciudad, lo normal ser" no recoger in ormacin sobre todas las viviendas de la ciudad (ser!a una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es su icientemente representativo.
Distribucin de frecuencia
La distribucin de frecuencia es la representacin estructurada, en orma de tabla, de toda la in ormacin que se *a recogido sobre la variable que se estudia.
Variable (Valor) Frecuencias absolutas Simple Acumulada Frecuencias relativas Simple Acumulada
x
X1 X2
x n1 n2 ... nn-1 nn
x f1 f1 + f2 ... f1 + f2 +..+fn-1 f
...
Xn-1 Xn
Siendo X los distintos valores que puede tomar la variable. Siendo n el nmero de veces que se repite cada valor. Siendo f el porcentaje que la repetici n de cada valor supone sobre el total
6eamos un ejemplo: 7edimos la altura de los ni4os de una clase y obtenemos los siguientes resultados (cm):
Alumno x !lumno 1 !lumno 2 !lumno $ !lumno * !lumno # !lumno & !lumno ( !lumno % !lumno ' !lumno 1) Estatura x 1"2# 1"2% 1"2( 1"21 1"22 1"2' 1"$) 1"2* 1"2( 1"2' Alumno x !lumno 11 !lumno 12 !lumno 1$ !lumno 1* !lumno 1# !lumno 1& !lumno 1( !lumno 1% !lumno 1' !lumno 2) Estatura x 1"2$ 1"2& 1"$) 1"21 1"2% 1"$) 1"22 1"2# 1"2) 1"2% Alumno x !lumno 21 !lumno 22 !lumno 2$ !lumno 2* !lumno 2# !lumno 2& !lumno 2( !lumno 2% !lumno 2' !lumno $) Estatura x 1"21 1"2' 1"2& 1"22 1"2% 1"2( 1"2& 1"2$ 1"22 1"21
Variable (Valor) x 1"2) 1"21 1"22 1"2$ 1"2* 1"2# 1"2& 1"2( 1"2% 1"2' 1"$) x
Frecuencias relativas Simple Acumulada x $"$+ $"$+ 1$"$+ 1&"&+ 1$"$+ $)")+ &"&+ $&"&+ $"$+ *)")+ &"&+ *&"&+ 1)")+ #&"&+ 1)")+ &&"&+ 1$"$+ %)")+ 1)")+ ')")+ 1)")+ 1))")+
8i los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendr!amos una tabla de recuencia muy extensa que aportar!a muy poco valor a e ectos de s!ntesis. (tal como se ver" en la siguiente leccin).
8upongamos que medimos la estatura de los *abitantes de una vivienda y obtenemos los siguientes resultados (cm):
Habitante Estatura Habitante Estatura Habitante Estatura
x
,abitante 1 ,abitante 2 ,abitante $ ,abitante * ,abitante # ,abitante & ,abitante ( ,abitante % ,abitante ' ,abitante 1)
x
1"1# 1"*% 1"#( 1"(1 1"'2 1"$' 1"*) 1"&* 1"(( 1"*'
x
,abitante 11 ,abitante 12 ,abitante 1$ ,abitante 1* ,abitante 1# ,abitante 1& ,abitante 1( ,abitante 1% ,abitante 1' ,abitante 2)
x
1"#$ 1"1& 1"&) 1"%1 1"'% 1"2) 1"*2 1"*# 1"2) 1"'%
x
,abitante 21 ,abitante 22 ,abitante 2$ ,abitante 2* ,abitante 2# ,abitante 2& ,abitante 2( ,abitante 2% ,abitante 2' ,abitante $)
x
1"21 1"#' 1"%& 1"#2 1"*% 1"$( 1"1& 1"($ 1"&2 1")1
8i present"ramos esta in ormacin en una tabla de recuencia obtendriamos una tabla de +- l!neas (una para cada valor), cada uno de ellos con una recuencia absoluta de $ y con una recuencia relativa del +,+9. :sta tabla nos aportar!a escasa im ormacin :n lugar de ello, pre erimos agrupar los datos por intervalos, con lo que la in ormacin queda m"s resumida (se pierde, por tanto, algo de in ormacin), pero es m"s manejable e in ormativa:
Estatura Cm x 1")1 - 1"1) 1"11 - 1"2) 1"21 - 1"$) 1"$1 - 1"*) 1"*1 - 1"#) 1"#1 - 1"&) 1"&1 - 1"() 1"(1 - 1"%) 1"%1 - 1"') 1"'1 - 2"))
Frecuencias relativas Simple Acumulada x x $"$+ $"$+ 1)")+ 1$"$+ 1)")+ 2$"$+ &"&+ $)")+ 2)")+ #)")+ 1$"$+ &$"$+ 1)")+ ($"$+ 1)")+ %$"$+ &"&+ ')")+ 1)")+ 1))")+
:l n)mero de tramos en los que se agrupa la in ormacin es una decisin que debe tomar el analista: la regla es que mientras m"s tramos se utilicen menos in ormacin se pierde, pero puede que menos representativa e in ormativa sea la tabla.
Xm =
b) Media "eom!trica: se eleva cada valor al n)mero de veces que se *a repetido. 8e multiplican todo estos resultados y al producto iinal se le calcula la ra!z ;n; (siendo ;n; el total de datos de la muestra).
8eg)n el tipo de datos que se analice ser" m"s apropiado utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, in lacin, etc., donde el valor de cada a4o tiene un e ecto multiplicativo sobre el de los a4os anteriores. :n todo caso, la media aritmtica es la medida de posicin central m"s utilizada. Lo m"s positivo de la media es que en su c"lculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna in ormacin. 8in embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como geomtrica) se puede ver muy in luido por valores extremos, que se aparten en exceso del resto de la serie. :stos valores anmalos podr!an condicionar en gran medida el valor de la media, perdiendo sta representatividad. #. Mediana: es el valor de la serie de datos que se sit)a justamente en el centro de la muestra (un ,-9 de valores son in eriores y otro ,-9 son superiores). <o presentan el problema de estar in luido por los valores extremos, pero en cambio no utiliza en su c"lculo toda la in ormacin de la serie de datos (no pondera cada valor por el n)mero de veces que se *a repetido). $. Moda: es el valor que m"s se repite en la muestra. %jemplo: vamos a utilizar la tabla de distribucin de recuencias con los datos de la estatura de los alumnos que vimos en la leccin %=.
Frecuencias relativas Simple Acumulada x $"$+ $"$+ 1$"$+ 1&"&+ 1$"$+ $)")+ &"&+ $&"&+
1 2 $ $ * $ $
12 1* 1( 2) 2* 2( $)
6amos a calcular los valores de las distintas posiciones centrales: 1. Media aritm!tica:
-1"2).1/ + -1"21.*/ + -1"22 . */ + -1"2$ . 2/ + ......... + -1"2' . $/ + -1"$) . $/ Xm -------------------------------------------------------------------------------------------------= $)
Luego:
Xm = 1"2#$
#or lo tanto, la estatura media de este grupo de alumnos es de $,%,+ cm. #. Media "eom!trica:
X= --1"2)0 1/ . -1"210*/ . -1"220 */ . ...... -1"2'0$/. -1"$)0$// 0 -1/$)/
Luego:
Xm = 1"2#$
:n este ejemplo la media aritmtica y la media geomtrica coinciden, pero no tiene siempre por qu ser as!. $. Mediana: La mediana de esta muestra es $,%> cm, ya que por debajo est" el ,-9 de los valores y por arriba el otro ,-9. :sto se puede ver al analizar la columna de recuencias relativas acumuladas. :n este ejemplo, como el valor $,%> se repite en + ocasiones, la media se situar!a exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la divisin entre el ,-9 in erior y el ,-9 superior. &. Moda: ?ay + valores que se repiten en ( ocasiones: el $,%$, el $,%% y el $,%&, por lo tanto esta seria cuenta con + modas.
Medidas de dispersin
:studia la distribucin de los valores de la serie, analizando si estos se encuentran m"s o menos concentrados, o m"s o menos dispersos. :xisten diversas medidas de dispersin, entre las m"s utilizadas podemos destacar las siguientes: 1. 'an"o: mide la amplitud de los valores de la muestra y se calcula por di erencia entre el valor m"s elevado y el valor m"s bajo. #. Varian(a: 7ide la distancia existente entre los valores de la serie y la media. 8e calcula como sumatorio de las di rencias al cuadrado entre cada valor y la media, multiplicadas por el n)mero de veces que se *a repetido cada valor. :l sumatorio obtenido se divide por el tama4o de la muestra.
La varianza siempre ser" mayor que cero. 7ientras m"s se aproxima a cero, m"s concentrados est"n los valores de la serie alrededor de la media. #or el contrario, mientras mayor sea la varianza, m"s dispersos est"n. $. Desviacin tpica: 8e calcula como ra!z cuadrada de la varianza. &. Coeficiente de vari(acin de Pearson: se calcula como cociente entre la desviacin t!pica y la media. %jemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase (leccin %=) y vamos a calcular sus medidas de dispersin.
Frecuencias relativas Simple Acumulada x $"$+ $"$+ 1$"$+ 1&"&+ 1$"$+ $)")+ &"&+ $&"&+ $"$+ *)")+ &"&+ *&"&+ 1)")+ #&"&+
$ * $ $
2) 2* 2( $)
1. 'an"o: @i erencia entre el mayor valor de la muestra ($,+-) y el menor valor ($,%-). Luego el rango de esta muestra es $- cm. #. Varian(a: recordemos que la media de esta muestra es $,%,+. Luego, aplicamos la rmula:
Luego: