Sunteți pe pagina 1din 8

Guas de Estudio Introduccin a la Estadstica

Alumna: Anita Duran R. Curso: 2 medio A


La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales). Las variables tambin se pueden clasi icar en: Variables unidimensionales: slo recogen in ormacin sobre una caracter!stica (por ejemplo: edad de los alunmos de una clase). Variables bidimensionales: recogen in ormacin sobre dos caracter!sticas de la poblacin (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen in ormacin sobre tres o m"s caracter!sticas (por ejemplo: edad, altura y peso de los alumnos de una clase). #or su parte, las variables cuantitativas se pueden clasi icar en discretas y continuas: Discretas: slo pueden tomar valores enteros ($, %, &, '(, etc.). #or ejemplo: n)mero de *ermanos (puede ser $, %, +....,etc, pero, por ejemplo, nunca podr" ser +,(,). Continuas: pueden tomar cualquier valor real dentro de un intervalo. #or ejemplo, la velocidad de un ve*!culo puede ser &-,+ .m/*, 0(,,1 .m/*...etc. 2uando se estudia el comportamiento de una variable *ay que distinguir los siguientes conceptos: Individuo: cualquier elemento que porte in ormacin sobre el enmeno que se estudia. 3s!, si estudiamos la altura de los ni4os de una clase, cada alumno es un individuo5 si estudiamos el precio de la vivienda, cada vivienda es un individuo. Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten in ormacin sobre el enmeo que se estudia. #or ejemplo, si estudiamos el precio de la vivienda en una ciudad, la poblacin ser" el total de las viviendas de dic*a ciudad.

Muestra: subconjunto que seleccionamos de la poblacin. 3s!, si se estudia el precio de la vivienda de una ciudad, lo normal ser" no recoger in ormacin sobre todas las viviendas de la ciudad (ser!a una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es su icientemente representativo.

Distribucin de frecuencia
La distribucin de frecuencia es la representacin estructurada, en orma de tabla, de toda la in ormacin que se *a recogido sobre la variable que se estudia.
Variable (Valor) Frecuencias absolutas Simple Acumulada Frecuencias relativas Simple Acumulada

x
X1 X2

x n1 n2 ... nn-1 nn

x n1 n1 + n2 ... n1 + n2 +..+ nn-1 n

x f1 = n1 / n f2 = n2 / n ... fn-1 = nn-1 / n fn = nn / n

x f1 f1 + f2 ... f1 + f2 +..+fn-1 f

...
Xn-1 Xn

Siendo X los distintos valores que puede tomar la variable. Siendo n el nmero de veces que se repite cada valor. Siendo f el porcentaje que la repetici n de cada valor supone sobre el total

6eamos un ejemplo: 7edimos la altura de los ni4os de una clase y obtenemos los siguientes resultados (cm):
Alumno x !lumno 1 !lumno 2 !lumno $ !lumno * !lumno # !lumno & !lumno ( !lumno % !lumno ' !lumno 1) Estatura x 1"2# 1"2% 1"2( 1"21 1"22 1"2' 1"$) 1"2* 1"2( 1"2' Alumno x !lumno 11 !lumno 12 !lumno 1$ !lumno 1* !lumno 1# !lumno 1& !lumno 1( !lumno 1% !lumno 1' !lumno 2) Estatura x 1"2$ 1"2& 1"$) 1"21 1"2% 1"$) 1"22 1"2# 1"2) 1"2% Alumno x !lumno 21 !lumno 22 !lumno 2$ !lumno 2* !lumno 2# !lumno 2& !lumno 2( !lumno 2% !lumno 2' !lumno $) Estatura x 1"21 1"2' 1"2& 1"22 1"2% 1"2( 1"2& 1"2$ 1"22 1"21

8i presentamos esta in ormacin estructurada obtendr!amos la siguiente tabla de frecuencia:

Variable (Valor) x 1"2) 1"21 1"22 1"2$ 1"2* 1"2# 1"2& 1"2( 1"2% 1"2' 1"$) x

Frecuencias absolutas Simple Acumulada x 1 1 * # * ' 2 11 1 12 2 1* $ 1( $ 2) * 2* $ 2( $ $)

Frecuencias relativas Simple Acumulada x $"$+ $"$+ 1$"$+ 1&"&+ 1$"$+ $)")+ &"&+ $&"&+ $"$+ *)")+ &"&+ *&"&+ 1)")+ #&"&+ 1)")+ &&"&+ 1$"$+ %)")+ 1)")+ ')")+ 1)")+ 1))")+

8i los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendr!amos una tabla de recuencia muy extensa que aportar!a muy poco valor a e ectos de s!ntesis. (tal como se ver" en la siguiente leccin).

Distribuciones de frecuencia agrupada

8upongamos que medimos la estatura de los *abitantes de una vivienda y obtenemos los siguientes resultados (cm):
Habitante Estatura Habitante Estatura Habitante Estatura

x
,abitante 1 ,abitante 2 ,abitante $ ,abitante * ,abitante # ,abitante & ,abitante ( ,abitante % ,abitante ' ,abitante 1)

x
1"1# 1"*% 1"#( 1"(1 1"'2 1"$' 1"*) 1"&* 1"(( 1"*'

x
,abitante 11 ,abitante 12 ,abitante 1$ ,abitante 1* ,abitante 1# ,abitante 1& ,abitante 1( ,abitante 1% ,abitante 1' ,abitante 2)

x
1"#$ 1"1& 1"&) 1"%1 1"'% 1"2) 1"*2 1"*# 1"2) 1"'%

x
,abitante 21 ,abitante 22 ,abitante 2$ ,abitante 2* ,abitante 2# ,abitante 2& ,abitante 2( ,abitante 2% ,abitante 2' ,abitante $)

x
1"21 1"#' 1"%& 1"#2 1"*% 1"$( 1"1& 1"($ 1"&2 1")1

8i present"ramos esta in ormacin en una tabla de recuencia obtendriamos una tabla de +- l!neas (una para cada valor), cada uno de ellos con una recuencia absoluta de $ y con una recuencia relativa del +,+9. :sta tabla nos aportar!a escasa im ormacin :n lugar de ello, pre erimos agrupar los datos por intervalos, con lo que la in ormacin queda m"s resumida (se pierde, por tanto, algo de in ormacin), pero es m"s manejable e in ormativa:

Estatura Cm x 1")1 - 1"1) 1"11 - 1"2) 1"21 - 1"$) 1"$1 - 1"*) 1"*1 - 1"#) 1"#1 - 1"&) 1"&1 - 1"() 1"(1 - 1"%) 1"%1 - 1"') 1"'1 - 2"))

Frecuencias absolutas Simple Acumulada x x 1 1 $ * $ ( 2 ' & 1# * 1' $ 22 $ 2# 2 2( $ $)

Frecuencias relativas Simple Acumulada x x $"$+ $"$+ 1)")+ 1$"$+ 1)")+ 2$"$+ &"&+ $)")+ 2)")+ #)")+ 1$"$+ &$"$+ 1)")+ ($"$+ 1)")+ %$"$+ &"&+ ')")+ 1)")+ 1))")+

:l n)mero de tramos en los que se agrupa la in ormacin es una decisin que debe tomar el analista: la regla es que mientras m"s tramos se utilicen menos in ormacin se pierde, pero puede que menos representativa e in ormativa sea la tabla.

Medidas de posicin central


Las medidas de posicin nos acilitan in ormacin sobre la serie de datos que estamos analizando. :stas medidas permiten conocer diversas caracter!sticas de esta serie de datos. Las medidas de posicin son de dos tipos: a) Medidas de posicin central: in orman sobre los valores medios de la serie de datos. b) Medidas de posicin no centrales: in orman de como se distribuye el resto de los valores de la serie. a) Medidas de posicin central Las principales medidas de posicin central son las siguientes: 1. Media: es el valor medio ponderado de la serie de datos. 8e pueden calcular diversos tipos de media, siendo las m"s utilizadas: a) Media aritm!tica: se calcula multiplicando cada valor por el n)mero de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:
-X1 . n1/ + -X2 . n2/ + -X$ . n$/ + .....+ -Xn-1 . nn-1/ + -Xn . nn/ ---------------------------------------------------------------------------------------

Xm =

b) Media "eom!trica: se eleva cada valor al n)mero de veces que se *a repetido. 8e multiplican todo estos resultados y al producto iinal se le calcula la ra!z ;n; (siendo ;n; el total de datos de la muestra).

8eg)n el tipo de datos que se analice ser" m"s apropiado utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, in lacin, etc., donde el valor de cada a4o tiene un e ecto multiplicativo sobre el de los a4os anteriores. :n todo caso, la media aritmtica es la medida de posicin central m"s utilizada. Lo m"s positivo de la media es que en su c"lculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna in ormacin. 8in embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como geomtrica) se puede ver muy in luido por valores extremos, que se aparten en exceso del resto de la serie. :stos valores anmalos podr!an condicionar en gran medida el valor de la media, perdiendo sta representatividad. #. Mediana: es el valor de la serie de datos que se sit)a justamente en el centro de la muestra (un ,-9 de valores son in eriores y otro ,-9 son superiores). <o presentan el problema de estar in luido por los valores extremos, pero en cambio no utiliza en su c"lculo toda la in ormacin de la serie de datos (no pondera cada valor por el n)mero de veces que se *a repetido). $. Moda: es el valor que m"s se repite en la muestra. %jemplo: vamos a utilizar la tabla de distribucin de recuencias con los datos de la estatura de los alumnos que vimos en la leccin %=.

Variable (Valor) x 1"2) 1"21 1"22 1"2$ x

Frecuencias absolutas Simple Acumulada x 1 1 * # * ' 2 11

Frecuencias relativas Simple Acumulada x $"$+ $"$+ 1$"$+ 1&"&+ 1$"$+ $)")+ &"&+ $&"&+

1"2* 1"2# 1"2& 1"2( 1"2% 1"2' 1"$)

1 2 $ $ * $ $

12 1* 1( 2) 2* 2( $)

$"$+ &"&+ 1)")+ 1)")+ 1$"$+ 1)")+ 1)")+

*)")+ *&"&+ #&"&+ &&"&+ %)")+ ')")+ 1))")+

6amos a calcular los valores de las distintas posiciones centrales: 1. Media aritm!tica:
-1"2).1/ + -1"21.*/ + -1"22 . */ + -1"2$ . 2/ + ......... + -1"2' . $/ + -1"$) . $/ Xm -------------------------------------------------------------------------------------------------= $)

Luego:
Xm = 1"2#$

#or lo tanto, la estatura media de este grupo de alumnos es de $,%,+ cm. #. Media "eom!trica:
X= --1"2)0 1/ . -1"210*/ . -1"220 */ . ...... -1"2'0$/. -1"$)0$// 0 -1/$)/

Luego:
Xm = 1"2#$

:n este ejemplo la media aritmtica y la media geomtrica coinciden, pero no tiene siempre por qu ser as!. $. Mediana: La mediana de esta muestra es $,%> cm, ya que por debajo est" el ,-9 de los valores y por arriba el otro ,-9. :sto se puede ver al analizar la columna de recuencias relativas acumuladas. :n este ejemplo, como el valor $,%> se repite en + ocasiones, la media se situar!a exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la divisin entre el ,-9 in erior y el ,-9 superior. &. Moda: ?ay + valores que se repiten en ( ocasiones: el $,%$, el $,%% y el $,%&, por lo tanto esta seria cuenta con + modas.

Medidas de dispersin

:studia la distribucin de los valores de la serie, analizando si estos se encuentran m"s o menos concentrados, o m"s o menos dispersos. :xisten diversas medidas de dispersin, entre las m"s utilizadas podemos destacar las siguientes: 1. 'an"o: mide la amplitud de los valores de la muestra y se calcula por di erencia entre el valor m"s elevado y el valor m"s bajo. #. Varian(a: 7ide la distancia existente entre los valores de la serie y la media. 8e calcula como sumatorio de las di rencias al cuadrado entre cada valor y la media, multiplicadas por el n)mero de veces que se *a repetido cada valor. :l sumatorio obtenido se divide por el tama4o de la muestra.

La varianza siempre ser" mayor que cero. 7ientras m"s se aproxima a cero, m"s concentrados est"n los valores de la serie alrededor de la media. #or el contrario, mientras mayor sea la varianza, m"s dispersos est"n. $. Desviacin tpica: 8e calcula como ra!z cuadrada de la varianza. &. Coeficiente de vari(acin de Pearson: se calcula como cociente entre la desviacin t!pica y la media. %jemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase (leccin %=) y vamos a calcular sus medidas de dispersin.

Variable (Valor) x 1"2) 1"21 1"22 1"2$ 1"2* 1"2# 1"2& x

Frecuencias absolutas Simple Acumulada x 1 1 * # * ' 2 11 1 12 2 1* $ 1(

Frecuencias relativas Simple Acumulada x $"$+ $"$+ 1$"$+ 1&"&+ 1$"$+ $)")+ &"&+ $&"&+ $"$+ *)")+ &"&+ *&"&+ 1)")+ #&"&+

1"2( 1"2% 1"2' 1"$)

$ * $ $

2) 2* 2( $)

1)")+ 1$"$+ 1)")+ 1)")+

&&"&+ %)")+ ')")+ 1))")+

1. 'an"o: @i erencia entre el mayor valor de la muestra ($,+-) y el menor valor ($,%-). Luego el rango de esta muestra es $- cm. #. Varian(a: recordemos que la media de esta muestra es $,%,+. Luego, aplicamos la rmula:

#or lo tanto, la varianza es -,--$$. Desviacin tpica: es la ra!z cuadrada de la varianza.

Luego:

S-ar putea să vă placă și