Sunteți pe pagina 1din 31

Estadstica

COORDINACIN DE MATEMTICAS

ndice
UNIDAD TEMTICA 1 Mtodos de Representacin de Datos 1.1. Estadstica descriptiva 1.2. Grficas para datos categricos 1.3. Grficas de Datos Cuantitativos 1.4. Interpretacin de las grficas

UNIDAD TEMTICA 2 Representacin numrica para datos en una muestra y datos agrupados 2.1. Descripcin de un conjunto de datos mediante medidas numricas Introduccin 2.1.1.Medidas de posicin 2.1.2. La Media 2.1.3. La Mediana 2.1.4. La Moda 2.2 Medidas de Dispersin o Variacin 2.3.1. Rango, varianza y desviacin estndar para Datos Agrupados

Elabor: Julio Csar Rosas Cruz

Pgina 2

COORDINACIN DE MATEMTICAS

Unidad 1 Mtodos de representacin de datos

1.1.

ESTADSTICA DESCRIPTIVA

La estadstica expone una serie de pasos a seguir para llegar a resultados, primeramente recopila datos que necesita; esto se puede hacer mediante encuestas (as se hace en la investigacin de mercado) o recabndolos directamente de los archivos (as lo hacen los economistas que requieren datos histricos). Una vez recopilada la informacin, debe organizarse y ordenarse y para ello es recomendable elaborar cuadros estadsticos.

Despus de organizar la informacin, se procesan o calculan ciertos valores para obtener resultados, mismos que deben ser interpretados posteriormente. La interpretacin es muy importante, ya que de ella depende la toma de decisin posterior.

Resumiendo, se puede decir que la estadstica es una rama de las matemticas que recopila, organiza, analiza e interpreta los datos obtenidos, para tener conocimiento de los hechos pasados, para prever situaciones futuras y tomar decisiones en base a la experiencia.

La estadstica se divide en: 1. Estadstica descriptiva. Que se ocupa de examinar todos los elementos de un conjunto, describir la informacin disponible con la ayuda de tablas y grficos y de resumirla al mximo mediante los parmetros estadsticos, de manera especial con la media y la desviacin estndar.

2.

La Estadstica inferencial. Que trata de generalizar para todo conjunto (poblacin), los resultados obtenidos al estudiar una parte de la

misma (muestra).

Elabor: Julio Csar Rosas Cruz

Pgina 3

COORDINACIN DE MATEMTICAS
En esta parte se presentan algunas tcnicas bsicas de la estadstica descriptiva. Una vez que ha reunido un conjunto de datos especficos. Cmo los puede mostrar de una manera clara y comprensible?

Primero debe ser capaz de definir lo que se entiende por datos especficos y clasificar los tipos de datos que probablemente encontrar en la vida real.

Empezaremos por necesitarn conocer. Poblacin. estudiar. Muestra. muestras. Unidad experimental.

introducir algunas definiciones, trminos nuevos en el lenguaje estadstico que se

Es el conjunto de elementos que cumplen una determinada caracterstica que deseamos medir o

Es un subconjunto (parte) de la poblacin. La mayora de los trabajos estadsticos se hacen con

Es el individuo u objeto sobre el cul se mide la variable.

Medicin o dato.

Se obtiene cuando se mide en la realidad una variable sobre una unidad experimental.

Variable. se consideren.

Es una caracterstica que cambia o vara con el tiempo y/o para los diferentes individuos u objetos que

Las variables pueden ser continuas, discretas o cualitativas. Variable continua: es aquella que puede tomar cualquier valor ya sea entero o fraccionario, por ejemplo; el peso de un pollo, la distancia que puede recorrer un automvil por cada litro de gasolina. Variable discreta: es aquella que solo puede tomar valores unidades enteras, por ejemplo; el nmero de hijos que tiene una familia, el nmero de personas que se suben a un autobs. Variable cualitativa: es aquella que mide una cualidad o caracterstica en cada unidad experimental, ejemplo el color de una flor.

EJEMPLO 1.

Se elige un conjunto de cinco estudiantes de entre todos los que cursan la licenciatura en una

universidad, los datos especficos obtenidos se registraron en la tabla siguiente. Identifiquemos distintos elementos que se relacionan con este conjunto de datos.

N DE ESTUDIANTE CP GENERO ESPECIALIDAD MATERIAS INSCRITAS 1 2.0 F Psicologa 16

Elabor: Julio Csar Rosas Cruz

Pgina 4

COORDINACIN DE MATEMTICAS
2 3 4 5 2.3 2.9 2.7 2.6 F M M M Matemticas Ingls Francs Negocios 15 17 15 14

SOLUCIN.

En este conjunto existen algunas variables, calificaciones promedio (CP), si se consideran las

calificaciones promedio de todos los estudiantes de la universidad como la poblacin de inters, las cinco CP representan una muestra de esta poblacin. La unidad experimental sobre la cul se miden las variables es un estudiante en particular de la universidad. La segunda variable que se mide en los estudiantes es el gnero el cul puede caer en dos categoras M o F, la poblacin se pudiera enumerar consistira en un conjunto de hombres y mujeres, la tercera variable sera la especialidad tiene una categora para cada estudiante, la ltima variable el nmero de materias inscritas que es un valor numrico.

EJEMPLO 2. Identifique cada una de las siguientes variables como cualitativa o cuantitativa.

1.- El uso ms frecuente de su horno de microondas (recalentar, calentar, otro). 2.- El nmero de consumidores que se niegan a contestar una encuesta telefnica. 3.- La puerta que elige un ratn en un experimento de laboratorio (A, B, C). 4.- El tiempo ganador de un caballo que corre en un hipdromo. 5.- El nmero de nios en una clase de quinto grado. SOLUCIN. Las variables 1 y 3 son cualitativas porque solo mide una cualidad o caracterstica para cada individuo. Las categoras para estas variables se muestran entre parntesis, las otras tres son cuantitativas, la variable 2 es discreta solo puede tomar valores 0,1, 2,.. De manera similar la variable 5, la variable 4, el tiempo ganador para un caballo que corre es una variable continua.

1.2.

GRFICAS PARA DATOS CATEGRICOS.

Despus de reunir los datos, se pueden ordenar o resumir para mostrar la siguiente informacin.

a) b)

Cules valores de la variable se midieron. Con que frecuencia apareci cada valor.

Para este propsito se puede construir una tabla estadstica, con la cual se puede mostrar grficamente los datos como una distribucin de datos. El tipo de grfica que se elige depende del tipo de variable que se haya medido.

Cuando la variable de inters es cualitativa la tabla estadstica es una lista de categoras que se consideran junto con una medicin de la frecuencia con que aparece cada valor. Para este propsito se dispone de tres parmetros.

1.

La frecuencia o nmero de datos especficos en cada categora.

Elabor: Julio Csar Rosas Cruz

Pgina 5

COORDINACIN DE MATEMTICAS
2. 3. La frecuencia relativa o proporcin de datos especficos en cada categora. El porcentaje de datos especficos en cada categora.

Para determinar los dos ltimos designemos por n = el nmero total de datos en el conjunto luego:

Porcentaje = 100(frecuencia relativa).

Se encontrar siempre que la suma de frecuencias es n, la suma de frecuencias relativas es 1 y la suma de porcentajes es 100%.

Las categoras para una variable cualitativa se deben elegir de tal manera que cada medicin pertenezca a una y slo una categora y de tal forma que cada medicin tenga una categora asignada.

Un ejemplo, para clasificar productos crnicos de acuerdo al tipo de carne que se utiliza, podramos usar como categoras, res, pollo, pescado, cerdo, pavo y otros. Una vez que se han clasificado y resumido en un cuadro estadstico se pueden usar una grfica de sectores (a veces llamada de pastel) o una grfica de barras, para mostrar la distribucin de los datos.

Una grfica de sectores es la conocida grfica circular que muestra como se distribuyen los datos entre las categoras. En una grfica de barras se muestra la misma distribucin de las mediciones entre las categoras, en este caso la altura de la barra determina con que frecuencia se observa una categora particular. EJEMPLO 3. En una encuesta relacionada con la educacin pblica se pidi a 400 administradores escolares que

evaluaran la calidad de la educacin. Las respuestas se resumen en la tabla siguiente:

EVALUACIN CATEGORIA A B C D TOTAL

FRECUENCIA

35 260 93 12 400

Trace una grfica de sectores y una de barras para este conjunto de datos. SOLUCIN. Para trazar una grfica de sectores asignamos un sector del crculo a cada categora. El ngulo de

cada sector debe corresponder a la proporcin de datos especficos (frecuencia relativa) en esa categora, como un crculo contiene 360 grados se usa la siguiente ecuacin para calcular el ngulo:

Elabor: Julio Csar Rosas Cruz

Pgina 6

COORDINACIN DE MATEMTICAS

Angulo = (frecuencia relativa) (360 ).

En la tabla siguiente se muestra el cuadro estadstico que muestra evaluaciones (categoras), frecuencias, frecuencias relativas, porcentajes y los ngulos de sector necesarios para trazar la grfica.

Luego la grfica ser:

CATEGORIA

FRECUENCIA

FRECUENCIA RELATIVA

ANGULO

A B C D TOTAL

35 260 93 12 400

35/400 =.09 = 9% 260/400=.65=65% 93/400=.23 =23% 12/400 =.03 =3% 400/400=1= 100%

.09*360 = 32.4 .65*360 = 234 .23*360 = 82.8 .03*360 = 10.8 1*360 = 360

La grafica de sectores ser:

La grfica de barras por lo general se traza la frecuencia contra las categoras (en el eje horizontal las categoras y en el eje vertical las frecuencias). De acuerdo con los datos del cuadro la grfica ser:

Elabor: Julio Csar Rosas Cruz

Pgina 7

COORDINACIN DE MATEMTICAS

EJEMPLO 4.

Una caja contiene 21 dulces con los colores listados en la tabla siguiente.

Caf Rojo Amarillo Caf Naranja Amarillo

Verde Rojo Naranja Azul Azul

Caf Verde Verde Azul Caf

Azul Caf Azul Caf Naranja

HACER UNA GRAFICA DE SECTORES Y UNA DE BARRAS

1.3.

GRAFICAS DE DATOS CUANTITATIVOS.

Como ya se dijo las variables cuantitativas miden una cantidad en cada unidad experimental y stas pueden ser discretas o continuas.

La representacin grfica correspondiente de un cuadro estadstico puede hacerse de varias maneras: grficas circulares, histogramas de frecuencia, polgonos de frecuencias, (relativa o acumulada). 1.3.1. HISTOGRAMA.

Un histograma de frecuencias (absolutas o relativas) consiste en un diagrama de barras verticales, donde la altura de cada barra indica el nmero de observaciones de cada valor de la variable y la base es un intervalo de valores de datos llamados clases.

Para formar un cuadro estadstico necesitamos definir los conceptos siguientes:

1. 2. 3. 4. 5. 6.

Valor mayor de los datos: Mximo valor que toma la variable. Valor menor de los datos: Mnimo valor que toma la variable. Rango: Diferencia entre valor mayor y el valor menor. Intervalo o clase: cada una de las partes iguales en que se divide el rango. Amplitud o tamao del intervalo: Diferencia entre fronteras superior e inferior a cada intervalo. Frontera inferior: Valor de la variable con la que inicia el intervalo.

Elabor: Julio Csar Rosas Cruz

Pgina 8

COORDINACIN DE MATEMTICAS
7. 8. 9. Frontera superior: Valor de la variable con la cul termina el intervalo. Marca de clase: valor medio entre las fronteras superior e inferior de un intervalo. Frecuencia absoluta: Nmero de observaciones que corresponden a cada intervalo representado por su marca de clase. 10. Frecuencia relativa: Porcentaje de observaciones que corresponde a cada intervalo. 11. Frecuencia acumulada: Suma acumulativa de las frecuencias absolutas de cada una de las clases anteriores. 12. Frecuencia acumulada relativa: Porcentaje que expresa la frecuencia acumulada con respecto al total de datos proporcionados.

Para trazar las grficas consideremos el ejemplo siguiente:

EJEMPLO 5.

En una prueba de lectura aplicada a 6 nios se obtuvieron las siguientes calificaciones:

Nio No. 1 2 3 4 5 6

Aspecto 1 46 80 57 59 94 76

Aspecto 2 48 48 61 65 86 65

Aspecto 3 64 60 63 68 41 66

Aspecto 4 76 64 68 67 68 28

Aspecto 5 78 59 72 71 67 68

Aspecto 6 54 62 64 72 61 67

Aspecto 7 39 57 57 75 69 61

Elaborar el histograma que represente los datos anteriores. SOLUCION 1. Calculamos el rango. Rango = observacin mxima observacin mnima = 94 28 = 66.

2.

La amplitud de cada clase la calculamos si tomamos 6 clases tenemos. Amplitud = (rango) / (nmero de clases) = 66/6 = 11.

Es necesario escoger las clases de tal manera que cada medicin (observacin) caiga en una y slo una clase. Cuando se utiliza el mtodo de inclusin a la izquierda de la clase, pero no su lmite derecho, se elimina cualquier confusin respecto a dnde colocar una medicin que cae sobre un punto lmite de la clase.

Luego, para conocer los lmites o fronteras de cada intervalo, empezamos con el lmite inferior de la primera clase tomando el valor mnimo 28. Para conocer el lmite superior le sumamos la amplitud de clase esto es 28 + 11 =39.

Para calcular la frontera superior del segundo intervalo sumamos nuevamente la amplitud del intervalo = 50.

39 + 11

Elabor: Julio Csar Rosas Cruz

Pgina 9

COORDINACIN DE MATEMTICAS

De forma similar, podemos encontrar las fronteras para obtener la tabla siguiente.

NMERO DE CLASE 1 2 3 4 5 6

FRONTERA INFERIOR 28 39 50 61 72 83

FRONTERA SUPERIOR 39 50 61 72 83 94

3.

Ahora calculamos las marcas de clase.

MC = (front. Sup + front. Inf.)/2. MC1 = (28 +39)/2 = 33.5, MC2 = (39 + 50)/2 = 44.5, MC3 = (50 + 61)/2 = 55.5, MC4 = (61 + 72)/2 = 66.5, MC5 = (72 + 83)/2 = 77.5 MC6 = (83 + 94)/2 = 88.5. 4. Contamos las frecuencias absolutas (observaciones) en cada clase obteniendo:

CLASE FRECUENCIA

1 2

2 4

3 10

4 19

5 5

6 2

5.

Con estos datos calculamos las frecuencias relativas (%), frecuencias acumuladas y acumuladas relativas.

CLASE FRECUENCIA RELATIVA (%) FRECUENCIA ACUMULADA FRECUNCIA ACUMULADA RELATIVA

1 (2/42)100=4.76

2 9.52

3 23.81

4 45.24

5 11.91

6 4.76

16

35

40

42

4.76

14.28

38.09

83.33

95.23

100

Como resumen se puede elaborar una sola tabla que contenga todos los datos quedando:

CLASE 28 -39 39 50 50 61 61 72

MARCA DE CLASE 33.5 44.5 55.5 66.5

FRECUENCIA 2 4 10 19

FRECUENCIA RELATIVA 4.76 9.52 23.81 45.24

FRECUENCIA ACUMULADA 2 6 16 35

FREC. ACUM. RELATIVA 4.76 14.28 38.08 83.33

Elabor: Julio Csar Rosas Cruz

Pgina 10

COORDINACIN DE MATEMTICAS
72 83 83 94 77.5 88.5 5 2 11.91 4.76 40 42 95.23 100

La forma de hacer las grficas es como sigue:

El histograma: en el eje horizontal tendremos la variable (calificaciones) y en el eje vertical la frecuencia (absoluta o relativa) y su representacin es:

El otro tipo de grfica es el llamado polgono de frecuencias, que es una lnea poligonal que tiene por vrtices los puntos (marca de clase, frecuencia), comenzando en el punto medio de la clase inmediata antes de la ms baja y terminando en el punto medio de la ltima clase y la figura es:

Tambin es posible representar a la distribucin de frecuencias acumuladas mediante una grfica llamada ojiva. Para construirla se coloca un punto en el lmite inferior de la primera clase en el eje de las x para mostrar que no existe observacin de esta magnitud o menor.

Elabor: Julio Csar Rosas Cruz

Pgina 11

COORDINACIN DE MATEMTICAS
Despus directamente encima de el limite superior de la primera clase colquese un punto en altura igual a la frecuencia acumulada de la clase. Continuar en esta forma hasta que se coloque un punto que represente a la frecuencia acumulada total en un lugar inmediatamente encima del lmite superior de la ltima clase y la figura queda as:

EJEMPLO 6.

Se entrevistaron a 25 amas de casa para una investigacin de mercado. En la tabla se enlista la

cantidad de litros de leche que se compraron durante una semana en particular. 0 2 1 4 2 3 1 1 3 2 5 3 2 2 2 4 1 0 2 3 3 2 1 2 4

Trazar un histograma relativo.

SOLUCION.

La variable que se desea medir es el nmero de litros de leche la cul es una variable discreta (slo

adopta valores enteros). En este caso es sencillo seleccionar las clases o intervalos como valores enteros en el rango de valores observados 0, 1, 2, 3, 4 y 5 como si fueran categoras. En la siguiente tabla se da el cuadro estadstico: (LLENAR ESTA TABLA)

N DE LITROS

FRECUENCIA

FRECUENCIA RELATIVA

FRECUENCIA ACUMULADA

FREC. ACUM. RELATIVA

El histograma relativo se muestra en la siguiente figura:

Elabor: Julio Csar Rosas Cruz

Pgina 12

COORDINACIN DE MATEMTICAS

1.4.

INTERPRETACION DE LAS GRAFICAS

Una vez que se ha elaborado una grfica o ms para un conjunto de datos, Qu debe buscarse cuando se intenta describir los datos? primero verifique las escalas horizontal y vertical para que tenga claro qu se est midiendo. Examine la ubicacin de la distribucin de datos, Dnde est el centro de la distribucin en el eje horizontal? Examine la forma de la distribucin. la distribucin tiene un mximo, un punto que est ms alto que cualquier otro? Si es as, sta es la medicin o categora que ocurre con ms frecuencia. Hay ms de un mximo? hay un nmero aproximadamente igual de datos especficos a la izquierda y a la derecha del mximo? Busque cualquier medicin inusual o valor atpico es decir es alguna medicin mucho ms grande o pequea que las dems? Estos valores atpicos podran no ser representativos de los otros valores del conjunto.

Las distribuciones de datos a menudo se describen de acuerdo con sus formas en: a. b. Simtricas si su lado izquierdo y derecho forman imgenes idnticas cuando se dividen por su valor medio. Sesgada a la derecha si una proporcin mayor de los datos especficos se localiza a la derecha de valor mximo. Estas distribuciones contienen algunas medidas muy grandes. c. Sesgada a la izquierda si una proporcin mayor de datos especficos se ubica a la izquierda del valor mximo. Estas distribuciones contienen algunos datos especficos extraordinariamente pequeos. d. Una distribucin es unimodal si tiene un solo mximo, es bimodal si tiene dos mximos.

Se puede usar un histograma de frecuencias relativas para describir la distribucin de un conjunto de datos en trminos de su localizacin y forma, y para verificar los valores atpicos como se hace otras grficas.

Elabor: Julio Csar Rosas Cruz

Pgina 13

COORDINACIN DE MATEMTICAS
Como la grfica de barras trazada en cada clase representa la frecuencia relativa o proporcin de los datos especficos en esa clase esta altura, puede usarse para obtener mayor informacin como: a. b. La proporcin de datos especficos que caen en una clase o grupo de clases particulares. La probabilidad de que los datos especficos tomados al azar del conjunto estn en una clase o grupo de clases

particulares. 1.5. INTERPRETACION DE OJIVAS.

La ojiva presenta la relacin entre un lmite cualquiera y los elementos que tienen menos de ese lmite. La frecuencia acumulada de cada clase seala cuntos elementos de la distribucin de frecuencias estn incluidos desde el lmite inferior de la primera clase hasta el lmite superior de la clase.

Esto equivale a decir cuntos elementos tienen menos de... o cundo mucho, hasta el lmite superior de la clase. El manejo numrico de las frecuencias acumuladas permite tambin determinar el nmero de elementos que se encuentran incluidos en dos o ms clases de la distribucin de frecuencias. EJEMPLO 7. La siguiente tabla representa las estaturas de la poblacin adulta.

CLASE A B C D E

INTERVALO ----- --- 1.20 1.21 ---150 1.51 ---170 1.71 --- 180 181 ---- --

FRECUENCIA 315 2824 9087 1618 752

FRECUENCIA ACUMULADA 315 3139 12226 13844 14596

Determine cuntos habitantes: a).- Miden ms de 1.70 m b).- Miden 1.50 m o menos. c).-Miden entre 1.21 y 1.80 m. SOLUCION. a. La columna de la frecuencia acumulada nos muestra que la poblacin adulta es de 14596 (clase E) y la clase C nos muestra que existen 12226 habitantes que miden menos de 1.70 m. Luego los de ms de 1.70m son 14596 12226 = 2370, que equivale a sumar las clases D y E. b. La frecuencia acumulada muestra el nmero de habitantes que miden 1.50m menos. De la tabla se obtiene el resultado es de 3139 habitantes esto es, la suma de las frecuencias de las clases A y B. c. A la frecuencia acumulada hasta 1.80m (13844) se le puede restar la frecuencia acumulada hasta antes de 1.21m (315) y obtener as el nmero de habitantes que mide entre 1.21m y 1.80m, es decir 1.21m ms, pero hasta 1.80m menos. El resultado es 13844 -315 = 13529 habitantes. Este resultado es equivalente a sumar las frecuencias de las clases B, C y D.

Elabor: Julio Csar Rosas Cruz

Pgina 14

COORDINACIN DE MATEMTICAS

Unidad 2 Representacin numrica para datos en una muestra y datos agrupados 2.1. DESCRIPCION DE UN CONJUNTOS DE DATOS MEDIANTE MEDIDAS NUMRICAS.

INTRODUCCIN.

Las grficas permiten representar la forma bsica de una distribucin de datos, pero el uso de los mtodos grficos tiene limitaciones, un ejemplo de limitacin es que las grficas son en cierto modo imprecisas si se desean usar en inferencia estadstica. Por ejemplo, suponga que se desea utilizar un histograma de la muestra para inferir informacin respecto a un histograma de la poblacin Cmo se pueden medir las similitudes y las diferencias entre los dos histograma de manera concreta? Si fueran idnticas se dira son iguales pero si son distintas es difcil establecer el grado de diferencia.

Otro ejemplo de dificultad, suponga que se necesita comunicar informacin por telfono, entonces no se puede mostrar grficas!, por tanto se tiene que encontrar otra manera de comunicar una imagen mental de los datos a su interlocutor.

Una manera de superar estos problemas es usar medidas numricas, las cuales se calculan para una muestra o una poblacin de mediciones. Existen dos tipos de medidas, las conocidas como de tendencia central (o de posicin) y las de dispersin (o de variabilidad), en las primeras destacan la media o promedio, la mediana y la moda mientras que en la segunda las ms comunes son el rango, la varianza y la desviacin estndar las cuales estudiaremos enseguida.

2.1.1.

MEDIDAS DE POSICION Las medidas de posicin o tendencia central, as como las de dispersin, pueden calcularse para un

conjunto de datos individuales como para una tabla de distribucin de frecuencias. 2.1.2. LA MEDIA La media, valor medio o promedio aritmtico. Es el valor correspondiente a una lnea imaginaria

que compensa los valores que se exceden de la media y las que quedan por debajo de sta; de esta manera la media es mayor que el valor ms pequeo y menor que el valor ms grande y se obtiene sumando todos los valores de las variables y dividiendo la suma por el nmero de sumandos esto es: MEDIA =

suma de valores nmero de valores

Nota.

El smbolo matemtico que por lo general se usa para denotar una suma es

, la letra sigma del alfabeto

griego, usado por s la primera letra de la palabra suma.

Elabor: Julio Csar Rosas Cruz

Pgina 15

COORDINACIN DE MATEMTICAS

Tomando en consideracin esta notacin tendremos para la media de X1, X2, X3,X n (n valores). Se define la media denotada por

EJEMPLO 4. Si una muestra consta de los datos 8, 7, 11, 8,12, 14, la media es:

Propiedades de la media aritmtica

1.

La suma de las desviaciones o diferencias de cada valor respecto a la media es igual a cero, esto es: (X i)=0

i =1

2.

La suma de los cuadrados de las desviaciones de cada valor respecto a la media es un valor mnimo.

i =1

(X i-

) =mnimo

3.- La media puede utilizarse para determinar el valor total de la poblacin. Total de la poblacin = (nmero de elementos)*(media) 4.- La media se afecta sustancialmente hacia arriba o hacia abajo con la presencia de valores extremos (muy grandes o muy pequeos) respecto a la media. 2.1.3. LA MEDIANA

La mediana.

Es la observacin central de los datos individuales ordenados de mayor a menor o viceversa, y

es el punto que marca la mitad de valores mayores que el y la mitad de valores menores que l, es decir, est a la mitad, con el 50% de valores a su derecha y el 50% de valores a su izquierda. Propiedades de la mediana

1. 2. 3. 4.

El valor de la mediana se afecta por el nmero de datos, no por la magnitud de ningn valor extremo. Es igualmente probable que cualquier observacin escogida al azar sea mayor o menor que la mediana. Se puede determinar, incluso en distribuciones con intervalos abiertos. La suma de los cuadrados de las desviaciones respecto a la mediana (m) es un valor mnimo.

Elabor: Julio Csar Rosas Cruz

Pgina 16

COORDINACIN DE MATEMTICAS

i =1

(xi-m) = mnimo

Mtodo para calcular la mediana (m)

1. 2.

Ordene los datos de menor a mayor o viceversa. Calcule la posicin de la mediana con:

3.

Determine el elemento de la posicin central (si el nmero de datos es par deber obtener el promedio del valor

de los elementos centrales).

Observe que cuando el nmero de datos es impar, la posicin de la mediana es nica, mientras que si el nmero de datos es par, la posicin exacta de la mediana se encuentra entre dos valores, los que por lo general, se promedian para obtener la mediana. EJEMPLO 5. Calcular la mediana de la muestra 34, 29, 26, 37, 31.

SOLUCIN. 1. Ordenamos los datos 26, 29, 31, 34, 37.

2.

3.

La mediana es el dato que ocupa la tercera posicin esto es m=31

EJEMPLO 6.

Calcular la mediana de la muestra 34, 29, 26, 37, 31, 34.

SOLUCIN. 1. Ordenando los datos tenemos 26, 29, 31,34, 34, 37.

2.

3.

La mediana es el nmero intermedio entre las observaciones 3 y 4 (las dos centrales) o sea

Nota: en casos en que los datos contengan valores extremos y considerando la cuarta propiedad de la media, es mejor utilizar la mediana en lugar de la media como medida de tendencia central. LA MODA La moda. Se define como la observacin en una muestra que ocurre con mayor frecuencia.

Elabor: Julio Csar Rosas Cruz

Pgina 17

COORDINACIN DE MATEMTICAS

En ocasiones se presentan dos o ms valores que se repiten con mayor frecuencia. En este caso, a los datos se les conoce como bimodales o multimodales, respectivamente. Nota: la moda es la nica medida de tendencia central que se puede aplicar a datos de tipo cualitativo.

Ejemplo 7. Determinar la moda de la muestra que tiene como datos 14, 19, 16, 21, 18, 19, 24, 15, 19.

Solucin. Como 19 es el dato que se presenta ms veces (tres) la moda es igual a 19.

Ejemplo 8. Determinar la moda de la muestra que tiene como datos 6, 7, 7,3, 8, 5, 3, 9.

Solucin. El 7 y el 3 son los datos de mayor frecuencia (dos), luego, la moda es 7 y 3 y la muestra es bimodal.

Problema 1. Los salarios por hora de una muestra de trabajadores (en dlares) son $20, $16, $17, $16 y $21. Determinar la media, la mediana y la moda. Solucin. La media:

La mediana:

Los valores ordenados son: 16, 16, 17, 20, 21. Luego, la mediana m=17 que es la que ocupa la posicin 3. La moda es el valor $16 se presenta dos veces y los dems slo una, por lo que, en este ejemplo la moda es $16. DATOS AGRUPADOS Con anterioridad hablamos sobre la manera de determinar las medidas de localizacin de una muestra. Si hay muchas observaciones, las sumas requeridas y ordenamientos se vuelven muy tediosos y conviene clasificar los datos antes de calcular las medidas.

Aunque las medidas de tendencia central y dispersin calculadas a partir de una tabla de distribucin de frecuencias no son tan precisas como las calculadas con los datos originales, (en ocasiones no sostienen estos o es imprctico procesarlos) se aplican formulas aproximadas correspondientes a la medida que se desee, utilizando los datos de una tabla de distribucin de frecuencias.

Elabor: Julio Csar Rosas Cruz

Pgina 18

COORDINACIN DE MATEMTICAS
La media, mediana y moda de datos agrupados son los mismos conceptos que cuando se aplican a datos individuales, aunque su clculo es ms complejo y su exactitud es slo aproximada en comparacin con el clculo basado en datos individuales.

A continuacin se presenta un razonamiento para obtener la media.

Al clasificar los datos, las observaciones individuales pierden identidad. Para calcular la media de datos, se supone que cada observacin dentro de una clase tiene un valor igual al del punto intermedio de la clase a que pertenece. Si tenemos f1 observaciones en la primera clase, el valor total de las observaciones en la primera clase es el producto M1 f1 en el que M1 denota la marca de clase, el valor total e las observaciones en la segunda clase sera M2 f2 y as sucesivamente.

Recordando que la media de la muestra se ha definido como la suma de observaciones dividida entre el nmero de ellas, tenemos

Es decir:

Suma (marca de clase* frecuencia de cada clase) Media = Suma (frecuencia de cada clase)

En forma casi similar para la mediana

Donde: CM =clase que contiene la mediana N=suma de frecuencia de cada clase

Elabor: Julio Csar Rosas Cruz

Pgina 19

COORDINACIN DE MATEMTICAS

Suma (Frecuencia de cada clase) +1 Posicin de la mediana = 2 En smbolos

fi + 1
N

Para la moda

Lmite inf. + de MA
Moda =

Frecuencia de MA Frecuencia antes de MA

Ancho del intervalo de la MA

2 (frecuencia de MA) (Frecuencia antes de MA)-W

Donde MA = Clase ms abundante o clase Modal W= frecuencia de la clase siguiente a MA Ejemplo 10. Determine la media, la moda y la mediana de la siguiente tabla

Clase

Lmite inf.

Lmite sup.

Marca de clase

Frecuencia

Frecuencia acumulada

1 2 3 4 5

30.5 35.5 40.5 45.5 50.5

35.5 40.5 45.5 50.5 55.5

33 38 43 48 53

3758 3635 3084 3796 435

3758 7393 10477 14273 14708

Solucin

Para La mediana tenemos que: La posicin de le mediana

Elabor: Julio Csar Rosas Cruz

Pgina 20

COORDINACIN DE MATEMTICAS
El valor se localiza en la segunda clase, ya que como lo indica la columna de frecuencias acumuladas, esta clase contiene de la observacin nmero 3759 a la 7393, esta clase se llama de la mediana o CM. Luego para la frmula tomando CM, se tiene: Limite inferior de CM= 35.5

FRECUENCIA ACUMULADA ANTES DE CM =3758 Frecuencia de la CM= 3635 N= nmero de observaciones = 14708 Ancho o amplitud de la clase mediana = 40.5 35.5 = 5

Sustituyendo en la formula se tiene

Para calcular la moda se tiene: de acuerdo a la tabla la clase ms abundante (MA) es la cuarta, ya que tiene 3796 observaciones.

Para esta clase Limite inferior = 45.5 Frecuencia de MA= 3796 Frecuencia antes de MA= 3048 W= frecuencia de la clase siguiente a MA = 435 Amplitud de la MA= 55.5- 50.5 = 5

Sustituyendo

NOTA: La marca de la clase ms abundante (en este caso 48) puede considerarse como un valor aproximado de la moda

2.3.

MEDIDAS DE DISPERSIN O VARIACIN

Los conjuntos de datos pueden tener el mismo centro, pero verse diferentes debido a la forma en que los valores se dispersan a partir del centro.

La variabilidad o dispersin es una caracterstica muy importante de los datos, pueden calcularse tanto para un conjunto de datos individuales como para una tabla de distribucin de frecuencias.

Elabor: Julio Csar Rosas Cruz

Pgina 21

COORDINACIN DE MATEMTICAS
Las medidas de dispersin ms comunes son el rango, la varianza y la desviacin estndar.

El rango se define como observacin mayor menos observacin menor.

R= X mx. X min.

Esta sencilla medida nos permite identificar la variacin mxima entre dos datos del conjunto que se analiza, o bien ver en qu intervalo se encuentran todos los datos del conjunto.

Como ya se vio la primera propiedad de la media indica que la suma de las diferencias de cada valor respecto a la media es igual a cero. Esto es fcil de entender si se considera que los valores mayores que la media son mayores en la misma proporcin que los valores menores que la media.

La segunda propiedad de la media afirma que la suma de los cuadrados de las diferencias de cada valor respecto a la media es un valor mnimo. Si ese valor se divide entre el nmero de datos, se obtiene una medida importante de dispersin conocido como:

Varianza =

(x
n i =1

x)

Estos se puede definir como:

La varianza de una poblacin de N mediciones se define como el promedio de los cuadrados de las desviaciones de las mediciones respecto a la media formula anterior , la varianza de la poblacin se denota por

2 y se determina la

Como la mayora de las veces no se dispone de todos los datos de la poblacin, pero se necesita calcular la varianza de una muestra de n mediciones entonces:
2

La varianza de una muestra (denotada por s ) de n mediciones se define como la suma de los cuadrados de las desviaciones de las mediciones respecto a su, media dividida entre (n-1) o sea:

s2 =

(x
n i =1

n 1

La varianza se mide en trminos del cuadrado de las unidades originales de medicin; si las medidas originales estn en metros, la varianza se expresa en metros cuadrados. Si se calcula la raz cuadrada de la varianza se obtiene otra medida llamada desviacin estndar, la cual regresa a la medida de variabilidad a la unidad de medida original con lo que:

Elabor: Julio Csar Rosas Cruz

Pgina 22

COORDINACIN DE MATEMTICAS
La Desviacin estndar de un conjunto de mediciones es igual a la raz cuadrada positiva de la varianza. O sea: = s =

s2

para poblacin para muestra


2 2

NOTA: El valor de s o siempre es mayor o igual a cero tan grande como sea el valor de s s ( o ) ser tambin la variabilidad del conjunto de datos.
2 2

Si s s ( o ) es igual a cero, todas las mediciones deben tener el mismo valor.

Para medir la variabilidad en las mismas unidades que las de las observaciones originales se calcula la desviacin estndar :

s =

s2

Ejemplo 11. A partir de los siguientes valores determine el rango, la desviacin media absoluta, la varianza y la desviacin estndar; 13,14,15,9,5,9,2,14,10,6,10,11,13,14 y 14. Solucin

El rango se calcula utilizando la definicin, esto es: Rango= valor mayor- valor menor = 15-2=13 Para los dems medidas se necesita la media como ya se vio

x
La desviacin media absoluta = DMA=
i =1

x
=

El calculo de la varianza por definicin:

Elabor: Julio Csar Rosas Cruz

Pgina 23

COORDINACIN DE MATEMTICAS

Otra forma de calcular la varianza es desarrollando la frmula y obteniendo la desviacin estndar por definicin:

xi2 N x
=
i =1

Desviacin estndar = Luego

var ianza = 2

13.973 = 3.738

El problema se resolvi suponiendo que los datos representan la poblacin. En el caso que representaran una muestra los resultados seran los mismos difiriendo la varianza muestral y desviacin estndar muestral, lo cual sera:

Y la desviacin estndar muestral es:

S=

s 2 = 14.971 = 3.869

EJEMPLO 12. Determine la desviacin estndar de las ventas de dos pequeos negocios y en base a ellos decir cual es ms estable, los datos de ventas se presentan a continuacin:

NEGOCIO 1 NEGOCIO 2 SOLUCIN:

VENTAS= $20.00 $16.00 $17.00 $16.00 y $21.00 VENTAS= $18.00 $17.00 $18.00 $19.00 y $ 18.00

Para calcular la desviacin estndar se necesita la varianza y para esta necesitamos la media:

Elabor: Julio Csar Rosas Cruz

Pgina 24

COORDINACIN DE MATEMTICAS

Luego:

20 + 16 + 17 + 16 + 21 = $18.00 5
18 + 17 + 18 + 19 + 18 90 = = $18.00 5 5

(x
Varianza1 = =
i =1

x) 2 =

n
= 1 (20 18 ) 2 + (16 18 )2 + (17 18 )2 + (16 18 )2 + (21 18 )2 5
2 2 2 2

1 n ( x1 x) 2 N i =1

]=

22 = 4.4 5
2 2 2 2

( ) ( ) ( ) ( ) ( ) ( ) ( ) () Varianza 2 = 18 18 + 17 18 + 18 18 + 19 18 + 18 18 = 0 + 1 + 0 + 1 = 1 + 1 = 2 = .4
2

Desviacin estndar 1 = Desviacin estndar 2=

2 = var ianza = 4.4 =2.0976


.4 = .6325

Observe que a pesar de que ambos negocios tienen el mismo promedio de ventas, las ventas del negocio 2 son ms estables lo que se refleja en su desviacin estndar menor. 2.3.1. RANGO, VARIANZA Y DESVIACIN ESTANDAR PARA DATOS AGRUPADOS

El rango, la varianza y la desviacin estndar de una distribucin de frecuencias son conceptos similares a los estudiados para datos individuales, los cuales se pueden calcular mediante las frmulas:

Rango= limite superior de la ltima clase limite inferior de la primera clase

Varianza =

= =
2

[(M
n i =1

x) f i
2 i

]
y

f
i =1

= 2

Como ya se vio:

Varianza=

Elabor: Julio Csar Rosas Cruz

Pgina 25

COORDINACIN DE MATEMTICAS

EJEMPLO 13. Determine el rango, la varianza y la desviacin de la siguiente tabla de distribucin de frecuencias.

Nmero de clase 1 2 3 4 5 SOLUCIN.

clase 31-35 36-40 41-45 46-50 51-55

Marca de clase 33 38 43 48 53

frecuencia 3558 2135 3048 3796 2135

La tabla siguiente presenta una forma de calcular la varianza, resolvindola por parciales:

Limites 31-35 36-40 41-45 46-50 51-55 sumas

Mi
33 38 43 48 52

fi
3558 2135 3084 3796 2135 14708

(Mi x )

(Mi x )

fi

2.1024 21.1324 0.1624 29.1924 108.2224 250.8120

327700.33 45117.37 500.84 110814.35 231054.82 715188.01

Luego

=
2

[(M
n i =1

x) f i
2 i

]
=

f
i =1

715188.01 = 48.626 14708

48.626 =6.9732

el rango= 55-31=24 Desarrollando la frmula, para la varianza se obtiene otra frmula (simplificada) que es: Varianza=

=
2

(M
n i =1

2 i

n 2 fi fi x i =1

f
i =1

Utilizando esta frmula tendremos (calculando la media primero):

Elabor: Julio Csar Rosas Cruz

Pgina 26

COORDINACIN DE MATEMTICAS

x=

(M f )
n i =1 2 i i

f
i =1

(133)(3558) + (38)(2135) + (43)(3084) + (48)(3796) + (53)(2135) = 626519 = 42.597


3558 + 2135 + 3048 + 3796 + 2135 14708

Luego:

2 =
=

(1332 )(3558 + (382 )(2135 + (432 )(3084 + (482 )(3796 + (532 )(2135 (14708 42.5972 ) ) ) ) ) ) )( 14708

715387 = 48.639 14708

Nota: la diferencia es explicable en funcin del nmero de decimales utilizas en las operaciones Desviacin estndar=

= 2 = 48.639 = 6.974

Problemas

Nota: Las soluciones de los problemas 40 en adelante se encuentran al final (pg. 66).

1. a)

Identifique cada variable como cuantitativa o cualitativa. Tiempo que toma armar un rompecabezas sencillo.

b) Nmero de estudiantes en un saln de clases de primer grado. c) Evaluacin del desempeo de un poltico recin elegido (excelente, bueno, regular, malo).

d) Estado donde vive una persona. 2. a) b) c) d) Identifique las siguientes variables cuantitativas como discretas o continuas. Poblacin en un rea particular de Estados Unidos. Peso de los peridicos recuperados para reciclaje en un da. Tiempo para terminar un examen. Nmero de consumidores en una encuesta aplicada a 1000 personas que consideran importante la informacin nutrimental que contienen los empaques de los productos alimenticios. 3. Un conjunto de datos consta de las edades que tenan al morir cada uno de los 41 presidentes

anteriores de Estados Unidos. a) b) c) Este conjunto de datos especficos es una poblacin o una muestra? Cul es la variable que se est midiendo? La variable del inciso b) es cuantitativa o cualitativa?

Elabor: Julio Csar Rosas Cruz

Pgina 27

COORDINACIN DE MATEMTICAS
4. Un investigador mdico quiere estimar el tiempo de supervivencia de un paciente despus del inicio de

un tipo especfico de cncer y despus de un rgimen particular de radioterapia. a) b) c) d) e) Cul es la variable de inters para el investigador mdico? La variable del inciso a) es cualitativa, cuantitativa discreta o cuantitativa continua? Identifique la poblacin de inters para el investigador mdico. Describa cmo podra seleccionar el investigador una muestra de la poblacin. Qu problemas podran surgir al tomar una muestra de la poblacin?

5. a) b) c) d)

Identifique cada variable como cuantitativa o cualitativa: Origen tnico de un candidato a un puesto pblico. Calificacin (0-100) de un examen de colocacin. Concentracin de mercurio en una muestra de atn. Establecimiento de comida que prefiere un trabajador.

6. a) b) c) d)

Identifique cada variable como discreta o continua. Nmero de homicidios en una ciudad. Tiempo que transcurre entre la llegada de los pacientes en una clnica externa. Nmero de errores al mecanografiar una pgina de un manuscrito. Nmero de focos defectuosos en un paquete de cuatro.

7. a) b) c) d)

Seale si las variables son continuas o discretas. Peso de dos docenas de camarones. Temperatura corporal de una persona. Personas que esperan atencin en la sala de urgencias de un hospital. Nmero de propiedades en venta de una agencia de bienes races.

8. a) b) c) d)

Seale si las variables son discretas o continuas. Nmero de personas formadas en la caja de un supermercado. Altura que alcanza la nieve en una tormenta. Tiempo que tarda un conductor en reaccionar ante un choque inminente. Nmero de aviones que llegan al aeropuerto de Mxico en una hora determinada.

9.

Cincuenta personas estn agrupadas en cuatro categoras A, B, C y D, y el nmero de personas que se

encuentran en cada categora se muestra en la siguiente tabla.

Categora Frecuencia a) b) c)

A 11

B 14

C 20

D 5

Cul es la variable que se est midiendo? Es cualitativa o cuantitativa? Trace una grfica de barras para describir los datos. Elabore una grfica de sectores para describir los datos.

Elabor: Julio Csar Rosas Cruz

Pgina 28

COORDINACIN DE MATEMTICAS
d) La forma de la grfica de barras del inciso b) cambia dependiendo del orden de presentacin de las cuatro categoras? Es importante el orden de presentacin? e) f) Qu proporcin de las personas est en la categora B, C o D? Que porcentaje de las personas no estn en la categora B?

10.

El estado civil de 50 empleados recientemente contratadas por una compaa

est expresada a

continuacin en la siguiente tabla de frecuencias.

Empleados Solteros Casados Divorciados Viudos Total Construya una grfica de sectores. 11.

Frecuencia 25 15 7 3 50

Los salarios semanales de 50 estudiantes universitarios se organizan en una

distribucin de

frecuencias. Se emplea la letra x para denotar el punto medio del intervalo de clase, y sus frecuencias se muestran a continuacin.

X Fr (x)

55 2

60 3

65 4

70 5

75 8

80 10

85 8

90 6

95 4

a) b) c) 12.

Trcese un histograma para la distribucin de frecuencias relativas. Trcese un polgono para la distribucin de frecuencias relativas Trcese una ojiva para la distribucin de frecuencias relativas acumuladas. Se seleccionaron aleatoriamente mil televidentes y se llev cabo una entrevista telefnica para

determinar el nivel educativo de aquellos que ven el noticiero vespertino. Se obtuvo la siguiente informacin.

NIVEL EDUCATIVO Escuela primaria Secundaria o preparatoria Universitarios sin graduar Universitarios graduados Maestra con grado Doctorado o equivalente Total

# DE ESPECTADORES 150 250 300 150 100 50 1000

Elabor: Julio Csar Rosas Cruz

Pgina 29

COORDINACIN DE MATEMTICAS
Trcese una grfica de sectores y una de barras.

13. a) b)

Los pesos de 5 estudiantes son como sigue: 120, 140, 150, 160, y 180 lbs. Encontrar el peso promedio. Encontrar la desviacin media de los pesos.

14.

El promedio de peso de 6 toros seleccionados al azar en un enorme rancho ganadero debe ser por lo

menos 425 Kg. Ya se han seleccionado 5 toros y sus pesos han sido 408, 441, 418, 429 y 422 Kg. Cunto debe pesar el ltimo toro para que el peso promedio de los 6 toros sea el que se quiere?

15.

Calcule la media, mediana y moda de la siguiente tabla de distribucin de frecuencias:

Clase 1 2 3 4 5

Lmite Inferior 115 150 185 220 255

Lmite Superior 145 180 215 250 285

Frecuencia Absoluta 6245 7264 11450 2923 8152

16.

A continuacin presentamos los datos de una muestra de la tasa de produccin diaria de lotes de

leche condensada. 17 21 18 27 17 21 20 22 18 23

El gerente de produccin de la compaa siente que una desviacin estndar de ms de tres lotes por da indica variaciones de tasas de produccin inaceptables. Deber preocuparse por las tasas de produccin de la planta?

17.

Calcule la varianza y la desviacin estndar de la siguiente tabla de distribucin de frecuencias:

Clase 1 2 3 4 5

Lmite inferior 115 150 185 220 255

Lmite superior 145 180 215 250 285

Frecuencia absoluta 6245 7264 11450 2923 8152

Elabor: Julio Csar Rosas Cruz

Pgina 30

COORDINACIN DE MATEMTICAS

18. frecuencias:

Calcule el rango, la varianza y la desviacin estndar de la siguiente

tabla de

distribucin de

Clase 1 2 3 4 5

Lmite inferior 1.15 1.50 1.85 2.20 2.55

Lmite superior 1.45 1.80 2.15 2.50 2.85

Frecuencia absoluta 6245 7264 11450 2923 8152

19.

La produccin de automviles para el mercado internacional, de acuerdo con las empresas, en el

periodo 1990-1995, esta dada por la siguiente tabla: Ao 1990 1991 1992 1993 1994 1995 a) Chrysler 52472 64567 83724 57636 46816 15624 Ford 45987 55021 68167 52533 26804 9317 G. M. 32782 38862 49590 50534 41962 14985 Nissan 79953 77967 95776 98946 92286 28039 Volkswagen 134357 142411 131812 129854 14517 33414

Determina la produccin media de cada una de las empresas durante este periodo.

Elabor: Julio Csar Rosas Cruz

Pgina 31

S-ar putea să vă placă și