Sunteți pe pagina 1din 18

2013

[RESUMEN DE EQUIPO]

INTEGRANTES Alejandra Hernndez Gmez Alejandro Ibarra Martnez

Gibran Andrade
Rodrigo Estrada Aremi Olivares Arcelia Cid

Estadstica Descriptiva. 1.1 Introduccin, notacin sumatoria Notacin sumatoria En primera instancia habr de entenderse: Notacin de ndices. Denotemos por X
j

(lase X sub j) cualquiera de los N valores X 1 , X 2 , X 3 ,..., X N que

toma una variable X. La letra j en X j , que puede valer 1, 2, 3, , N se llama subndice. Es claro que podamos haber empleado cualquier otra letra en vez de j, por ejemplo, i, k, p, q o s. Notacin de Suma. El smbolo

N j 1

X j denotar la suma de todos los X j desde j=1 a j=N; por definicin,

X
j 1

X 1 X 2 X 3 ... X N

Cuando no ocasione confusin, denotaremos esa suma simplemente por es la letra griega sigma mayscula, que denota suma. X , X j o j X j . El


X Y
j 1 j N j

Ejemplo 1.

X 1Y1 X 2Y2 X 3Y3 ... X N YN

Ejemplo 2.

aY j aX 1 aX 2 ... Z X N a X 1 X 2 ... X N a X j , donde a es una


j 1 j 1

constante. Ms sencillamente,

aX a X . aX bY cZ a X bY c Z.

Ejemplo 3. Si a, b, c son constantes, entonces

1.1.1

Datos no agrupados

1.- los datos son brutos( es decir, no se presentan clasificados) 2.- no es necesario clasificar ni generar una tabla de frecuentas, ya que no tiene mucho sentido. 3.- elementos que menor tamao (generalmente menor a 20 elementos).Esto no sucede as siempre. Aun que contemos con menos de 20 elementos, debe de verificarse que los datos no sean significativos, Esto es: que la informacin no sea repetitiva, de esta forma, sabremos que no se podr clasificar y por lo tanto ser resumida en una tabla de frecuencias. En caso de que una vez que hayamos ordenado los elementos, se cuente con datos significativos. Procedemos a clasificarlos (si es posible, ya que tambin debemos de buscar la lgica al clasificar los elementos) para convertirlos en datos agrupados. Por ejemplo: *si nos pidieran obtener la informacin del territorio de cada uno de los estados de Mxico. No tiene mucho sentido que que tratemos de agrupar, ya que solo nos pide el nombre del estado de la republica mexicana y la extensin territorial. Para que necesitaramos una tabla de frecuencia de 32 elementos, cuando estos se repiten solo 1 vez ?

4.- los datos no agrupados, tambin pueden ser ordenamos y de la misma forma, tambin se pueden obtener graficas, determinar media, desviacin estndar, etc. El hecho de que los datos no agrupados pueden ordenarse, no significa que se conviertan en datos agrupados. Ejemplos: Vas a investigar la edad a un grupo de 20 Nios en datos no agrupados (es decir, vienen los 20 nios y asi como te dan la edad asi la anotas 2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 nios) Estos son datos no agrupados por qu no los has clasificado y contado 1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Total 20 nios) Los datos no agrupados tambin los puedes ordenar, por ejemplo de la edad menor a la edad mayor, no estn contabilizados ni clasificados solamente estn ordenados Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuntos nios haba de cada ao. (y siguen siendo 20 nios)

1.1.2

Medidas de tendencia central

MEDIA: Media aritmtica, es la que se obtiene sumando los datos y dividindolos por el nmero de ellos. Se aplica por ejemplo para resumir el nmero de pacientes promedio que se atiende en un turno. Otro ejemplo, es el nmero promedio de controles prenatales que tiene una gestante. MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la poblacin exactamente en dos. Por ejemplo el nmero mediana de hijos en el centro de salud X es dos hijos. Otro ejemplo es el nmero mediana de atenciones por paciente en un consultorio. MODA: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribucin unimodal tiene una sola moda y una distribucin bimodal tiene dos. til como medida resumen para las variables nominales. Por ejemplo, el color del uniforme quirrgico en sala de operaciones es el verde; por lo tanto es la moda en colores del uniforme quirrgico. EJEMPLO 1 El nmero de das necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda, varianza y desviacin tpica. SOLUCIN: La media: suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que es el valor de la mediana. La moda: el valor de la variable que presenta una mayor frecuencia es 60 MEDIA : (media aritmtica o simplemente media). es el promedio aritmtico de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Si los datos estn agrupados utilizamos las marcas de clase, es decir ci en vez de xi.

u MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.

u MODA (M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica.

1.1.3

Medidas de posicin

Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. Las medidas de posicin son: CUARTILES Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q 2 coincide con la mediana. Para el clculo de los cuartiles se procede a dos pasos: 1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresin . Nmero impar de datos 2, 5, 3, 6, 7, 4, 9

Nmero par de datos 2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra la tabla de las frecuencias acumuladas.

, en

L i es el lmite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase mediana. a i es la amplitud de la clase.

DECILES Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D 5 coincide con la mediana. Clculo de los deciles

En primer lugar buscamos la clase donde se encuentra tabla de las frecuencias acumuladas.

, en la

L i es el lmite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase mediana. a i es la amplitud de la clase.

PERCENTILES Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P 5 0 coincide con la mediana. Clculo de los percentiles

En primer lugar buscamos la clase donde se encuentra en la tabla de las frecuencias acumuladas.

L i es el lmite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase mediana. a i es la amplitud de la clase.

1.1.4 Medidas de Dispercin


Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica. Di = x - x La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por

Ejemplo Calcular la desviacin media de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:

Ejemplo Calcular la desviacin media de la distribucin:


xi [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) 12.5 17.5 22.5 27.5 32.5 fi 3 5 7 4 2 21 xi f i 37.5 87.5 157.5 110 65 457.5 |x - x| 9.286 4.286 0.714 5.714 10.174 |x - x| f i 27.858 21.43 4.998 22.856 21.428 98.57

Varianza La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Propiedades de la varianza 1 La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un nmero la varianza no vara. 3 Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por el cuadrado de dichonmero.

4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza 1 La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas. 2 En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza. 3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn elevadas al cuadrado.

Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Ejercicios de desviacin tpica Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviacin tpica de la distribucin de la tabla:


xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60) [60,70) [70, 80) 15 25 35 45 55 65 75 fi 1 8 10 9 8 4 2 42 xi f i 15 200 350 405 440 260 150 1 820 xi 2 f i 225 5000 12 250 18 225 24 200 16 900 11 250 88 050

Propiedades de la desviacin tpica 1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara. 3 Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular ladesviacin tpica total. Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica 1 La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones extremas. 2 En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica. 3 Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media.

1.1.5 Medidas de forma

Para el coeficiente de asimetra

Para la curtosis

S-ar putea să vă placă și