Sunteți pe pagina 1din 37

I.

ESTADISTICA DESCRIPTIVA

1.1 INTRODUCCIÓN

QUE ES LA ESTADÍSTICA

A menudo la gente cree que la estadística es una simple recolección de números. De hecho
éste era su significado original: era la recolección de información económica y de la
población vital para el estado. Sin embargo, actualmente la estadística es mucho mas que
eso, se ha convertido en un método científico de análisis ampliamente aplicado en la
administración, economía y en todas las ciencias sociales y naturales y obviamente en todas
las disciplinas de las Ingeniarías.
Atendiendo a los campos que podemos distinguir en Estadística tenemos:

A_.Estadística Descriptiva, la cual es una de las primeras técnicas utilizadas, consiste


esencialmente en la recopilación de datos, su organización y presentación (en forma tabular
y/o gráfica), así como el cálculo de medidas estadísticas representativas con el objeto de
poder analizar en forma fácil y rápida al conjunto de datos y luego poder realizar
conclusiones adecuadas.
B_.Estadística Inferencial, Podemos decir que la estadística inferencial es una extensión de la
Descriptiva, es decir que la parte inferencial es la interpretación y generalización de los
resultados obtenidos del estudio descriptivo para su utilización en la toma de decisiones;
por ejemplo: suponga que usted es docente de la asignatura de Estadística e imparte la
materia a 4 grupos de clase y desea estimar la calificación promedio de todos sus grupos;
pero debido a factores tales como el tiempo y costo, únicamente analiza las calificaciones de
un grupo y calcula el promedio correspondiente a este grupo, ahora a partir de este dato,
puede generalizar el resultado y estimar la calificación promedio de los 4 grupos, para ello,
tendrá que recurrir a técnicas inferenciales, como es posible observar en este ejemplo.
Debemos de estar claro que a una parte representativa (muestra) del total de los elementos
(población) de interés se le calculó el promedio y con base en este estudio se hacen
conclusiones referente al problema planteado, pero cualquier conclusión a la que se llegue
contendrá elementos de incertidumbre, puesto que se esta tomando la decisión partiendo
únicamente de la información obtenida de una parte del total de los elementos.

Esta incertidumbre es inherente a cualquier proceso en el que se extienden conclusiones


hacia un conjunto mayor (cuatro grupos) que aquel sobre el que se tiene la información (un
grupo). El método de razonamiento que nos conduce a esta extensión es conocido como
INDUCTIVO.
Bien, ahora cabe preguntarnos, entonces: Que relación existe entre la Estadística y el
Método Inductivo, la respuesta es sencilla el papel de la estadística es cuantificar la
incertidumbre mediante el uso de los conceptos y técnicas de la Probabilidad, las cuales
integran el área de la Estadística Inferencial.

1
Escribiendo de manera formal un poco mas acertada la definición de Estadística podemos
decir que:
Es un conjunto de técnicas para la colección, organización, presentación, manejo,
descripción y análisis de información, de manera que las conclusiones obtenidas de ellas
tengan un grado de confiabilidad especificado.
Partiendo de la definición se puede observar en forma clara que el objetivo de la Estadística
consiste en Hacer inferencias (predicciones, decisiones) acerca de una población, sobre la
base de la información contenida en una muestra.

En otras palabras, la Estadística es el intrigante estudio sobre como es posible describir un


mundo desconocido abriendo solo algunas de sus ventanas.

En nuestro país tenemos maravillosos paisajes naturales. Una generosa tierra que nos brinda
su fruto y también, desafortunadamente, continuos desastres naturales. En Managua,
nuestra capital uno de los desastres que más ocurre, es el desborde de los cauces en
invierno; así como la inundación de algunos barrios, sobre todo en zonas marginales. Es por
eso que casi todos los años debemos crear puestos de emergencias. Esto hace necesario
establecer promedios de personas, porcentajes de acuerdo al sexo, edad, intervalos para las
edades con el objetivo de conocer la edad mas frecuente. Todo esto se obtiene con el
levantado de datos de las personas involucradas, esta información requiere su ordenación y
su posterior manipulación, que es precisamente el quehacer de la estadística descriptiva.
Esta parte de la estadística que por su sencillez es de las más utilizadas en cualquier rama
de las ciencias e ingenierías.

En esta unidad nos ocuparemos de: levantar, organizar y construir estadísticos con el fin de
poder conocer y comprender los fenómenos bajo estudio. Es nuestro deseo que lo aprendido
lo podas aprovechar y poner en práctica en esta situación real y de esa manera podamos
colaborar con la sociedad.

La importancia de la estadística radica principalmente en sus aplicaciones, las que tienen un


campo ilimitado, se ha extendido ahora a la agricultura, biología, negocios, química,
comunicaciones, economía, educación, electrónica, medicina, física, sicología y otros muchos
campos de las ciencias y las ingenierías.
La ciencia Estadística suele aplicarse a dos tipos de problemas:
1. Recolectar, resumir, describir y explorar datos.
2. Utilizar datos de una muestra para inferir la naturaleza del conjunto de datos del que
se escogió la muestra.

La estadística se ha dividido en dos grandes ramas que son: ESTADÍSTICA DESCRIPTIVA Y


ESTADÍSTICA INFERENCIAL.

2
1.2 CONCEPTOS BASICOS

Estadística Descriptiva:
Estudia los métodos adecuados que nos conducen a recopilar, organizar, sintetizar y
describir una información (conjunto de datos) a través de tablas, gráficos y medidas
descriptivas.
Estadística Inferencial:
Estudia los métodos adecuados que nos conducen a tomar decisiones generales acerca de
una población, utilizando los datos de una muestra, o sea: es la interpretación y
generalización de los resultados obtenidos del estudio descriptivo.

Población:
Una población es el conjunto total de mediciones de interés en las que se estudia una
característica dada. El tamaño de las poblaciones es el número de elementos o mediciones
que contiene.
 Por ejemplo. En un estudio sobre los costos de construcción, la población puede
consistir en los precios unitarios de los materiales de construcción.
 En un estudio socio-económico, la población puede consistir en el número de
personas que habitan en un municipio determinado.
 En un estudio de control de calidad, la población puede consistir en la valoración
(numérica o cualitativa) de cada artículo que contiene un lote.

Una tarea importante para el investigador es definir cuidadosamente y completamente la


población, antes de diseñar y recolectar la muestra. La definición debe contener una
descripción de los elementos que forman parte de la población y una especificación de las
mediciones que se van a considerar, ya que estos dos elementos están interrelacionados.

Muestra:
Es un subconjunto de la población que contiene las mediciones obtenidas mediante un
experimento estadístico.

Los métodos estadísticos proporcionan las técnicas necesarias para el diseño de


experimentos o encuestas, y su procesamiento. Da los criterios para decidir el tamaño
adecuado de una muestra, como obtener una muestra, como definir y probar hipótesis y
proporciona una medida de la bondad o confiabilidad de las inferencias.

VARIABLES:
Una variable se simboliza con letras mayúsculas del Alfabeto tal como X, Y, H, etc; pueden
tomar un conjunto prefijado de valores, llamado dominio de esa variable. Las variables
pueden ser cualitativas o cuantitativas.
1. Cuantitativas

Si la variable en estudio se puede expresar numéricamente, entonces se llama variable


cuantitativa. Estas pueden ser discretas o continuas.

3
DISCRETAS: cuando únicamente asumen valores enteros. Son resultado de contar un
número de objetos u observaciones.

Ejemplos
 Número de viviendas en una cuadra
 Número de hijos por vivienda
 Número de automóviles que cruzaron un puente en una hora determinada.
CONTINUAS: cuando pueden asumir cualquier valor en una escala continua (real).

Ejemplos:
 La carga máxima que soporta un cable
 La vida útil de una lámpara
 El área de una parcela
 La distancia entre dos puntos.

2. Cualitativas

Si la variable en estudio es no numérica, se llama variable cualitativa. Estudiaremos las


nominales y ordinales.

Nominales: Cuando se obtienen a partir de la definición de categorías y se pueden contar


los elementos de esa categoría.

Ejemplos
 Sexo (masculino o femenino)
 Estado civil (soltero o casado)
 Departamento de origen (Managua, León, Granada, etc.)
 Nivel educativo (Pre-escolar, primaria, secundaria, ect.)

Ordinales o Jerarquizados: Cuando son susceptibles de un ordenamiento relativo, pero


no de mediciones cuantitativas: primero, segundo, tercero, etc.
Ejemplos

 Valoración de un arbitro
 Preferencias de un cliente
Es interesante saber que muchas poblaciones puedan dar origen a los cuatro tipos de datos
en dependencia de la variable de interés.

Cuando se trabaja con datos cualitativos es adecuado codificarlos para su posterior


procesamiento.

Por ejemplo, la variable sexo se puede codificar así:


0, si la persona es del sexo masculino
X=
1, si la persona es del sexo femenino

4
1.3 DESCRIPCIÓN DE DATOS

Los datos estadísticos, obtenidos de experimentos, muestras o cualquier colección de


mediciones, comúnmente son tantos que, para poder describirlos y analizarlos, requieren ser
reducidos a una forma más adecuada. Comenzaremos con la presentación de datos
agrupados en una tabla y posteriormente en forma de gráficos.
1.3.1. Distribución de Frecuencia

Es una ordenación tabular de datos estadísticos que muestran cuantos elementos o que
parte de los datos están en diferentes intervalos (clases o categorías) en los cuales se
agrupan los datos. La distribución de frecuencia pueden ser distribuciones numéricas o
cualitativas.

1.3.2 Construcción de una Tabla de Distribución de Frecuencias

Para la construcción de una TDF, existen varias técnicas, en general se recomienda que el
número de clases deban oscilar entre cinco y quince; y esto dependerá del número de
elementos que tenga la información que se agrupará en ella.

La técnica que mostraremos a continuación, es una técnica que de antemano se debe dar el
número de clases, los pasos son los siguientes:

1º) Hallar el rango; R = Vmayor – Vmenor

2º) Establecer el cociente R / K ; donde K es el número de intervalos

3º) Seleccionar la amplitud de las clases, la denotaremos con la letra: C; para la selección
de la amplitud de los intervalos, debe tomarse en cuenta el número de decimales en que
vienen dado los datos. En este caso se encuentra la unidad de los datos;

Ejemplo: u = 1, si los datos son enteros


u = 0.1, si al menos un dato tiene como máximo un decimal
u = 0.01, si al menos un dato tiene como máximo dos decimales.
Etc.
Dicho en forma breve, la unidad queda determinada por el máximo número de decimales.
Luego
C = (R / K)truncado + u;
El truncamiento de este cociente se debe hacer hasta el # de decimales que tenga la unidad
de los datos.

4º) Construir el primer intervalo: las clases contienen dos columnas:


Li = Vmenor (limite inferior)
Ls = Vmenor + C – u (limite superior)

5
5º) Para los demás intervalos solamente se suma la amplitud al límite anterior. El último
intervalo deberá contener al dato mayor.

Posteriormente con un ejemplo, se construirá una TDF completa, ya que los pasos
enumerados anteriormente solamente son para obtener las clases, que es una parte
importante en esta forma de representar información, pero hay otros elementos que
también son de interés en una TDF.
Nota:
Otro caso para construir una TDF, es cuando se determina el número de clases que debe
tener la TDF y una técnica para determinar K, es usar la siguiente expresión:
K=1+3.322Log (n), donde n es en número de datos a agrupar. El valor que resulta se
aproxima al entero inmediato superior.

Ejemplo 1
En una cooperativa de taxis de Managua se midió el consumo de gasolina,
obteniendo los kilómetros que hicieron 40 vehículos por galón de consumo. Los
resultados fueron los siguientes:

45 38.4 44.3 44.2 43.6 45.3 44.5 39.8 44.2 44.4


43.2 44.0 43.8 43.8 45.5 44.5 44.6 44 45.2 38.7
44.4 44.7 44.1 44.3 43.9 44.1 45.8 42.2 41.2 40.6
42.1 45.6 44.5 39.7 40.7 42.3 45.2 43.3 44.7 38.6

Agrupe estos datos en una distribución de frecuencias que tenga 7 clases


Solución:
1) Hallar el rango; R = 45.8-38.4=7.4
2) Establezca el cociente R / K; K: número de intervalos
7.2
 1.057
7
3) Para la selección de la amplitud de las clases, debe tomarse en cuenta el número
de decimales en los datos.

En este caso u = 0.1 (dos decimales).


Luego, 1.057 se trunca hasta un decimal; es decir:
C = 1.0 + 0.1 = 1.1

4) Construir el primer intervalo:


Li = Vmenor = 38.4 (limite inferior)
Ls = Vmenor + C – u = 38.4 + 1.1 – 0.1 = 39.4 (limite superior)

5) Para obtener los límites de los demás intervalos, solamente se suma la amplitud a cada
límite anterior.

Notas: 1) El último intervalo deberá contener al dato mayor.

2) Ls = Li +C – u; para cualquier clase.

6
La TDF contiene la siguiente información, la cual se agrega en columnas a la
par de las clases:
-
La frecuencia, denotada por f, representa el número de datos que están contenidos en
cada clase.
-
La frecuencia relativa, denotada por fr, definida como: fr = fi/n, donde i = 1 hasta
k, donde k representa a las clases y n es el total de datos.
-
El porcentaje de la frecuencia, denotada por %f, definida como:
%f = 100 fr.
-
La frecuencia acumulada, denotada por F, definida como: F = Σf i (i = 1 hasta k,
donde k representa a las clases).
-
El porciento de la frecuencia acumulada, denotada por %F, definida por:
-
%F = (F /n) 100.
-
La marca de clase, denotada por X, definida como el punto medio de cada clase.
X = (Li + Ls) / 2.
-
Los limites reales, LIR = LI - u/2 y LSR = LS + u/2. Para los limites reales,
vamos a convenir que tienen esta forma: (LIR, LSR], abiertos por la izquierda y cerrados
por la derecha.

DIAGRAMA DE TRONCO Y HOJAS

Los datos se pueden ordenar en un diagrama de Tronco y hojas, para facilitar la


construcción de la TDF.
Ordenación de los datos en tronco y hojas, para obtener la frecuencia absoluta, en este caso
tomamos como tronco los enteros y como hojas los decimales.
Tronco Hojas
38 4, 6, 7
39 7, 8
40 6, 7
41 2
42 1, 2, 3
43 2, 3, 6, 8, 8, 9
44 0, 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 5, 6, 7, 7
45 0, 2, 2, 3, 5, 6, 8
Tabla 1.1
T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua

LI LS f F X LIR LSR
38.4 39.4 3 3 38.9 38.35 39.45
39.5 40.5 2 5 40 39.45 40.55
40.6 41.6 3 8 41.1 40.55 41.65
41.7 42.7 3 11 42.2 41.65 42.75
42.8 43.8 5 16 43.3 42.75 43.85
43.9 44.9 17 33 44.4 43.85 44.95
45 46 7 40 45.5 44.95 46.05

7
Ejercicios

1. En la zona baja de Managua hay 27 pozos, que suministran agua a la ciudad


Capital, los caudales de dichos pozos se miden en galones por minuto
(GPM) y sus mediciones son las siguientes:

800 2200 1212 1200 2230 1115 1100 511 1100


1000 800 800 1000 1200 800 750 710 700
1200 600 550 450 400 380 350 1200 1000

a) agrupe estos datos en una distribución que tenga 6 clases.

2. Los datos son mediciones de intensidad solar directa (en watts/m2) realizados en distintos
días en una localidad.

562 869 708 775 704 775 809


856 655 806 878 909 918 558
768 870 918 940 946 661 820
898 935 952 957 693 835 905
a) Construya una T.D.f con 5 clases
b) interprete la cuarta clase.

3. Los contenidos de nicotina, en miligramos, de 40 cigarrillos de cierta marca


son:

1.09 1.79 2.03 1.63 1.69 0.85 1.64 1.51


1.74 1.37 1.86 2.31 1.88 2.17 1.75 1.82
1.58 1.75 0.72 1.97 1.40 1.68 2.28 1.67
2.11 1.92 2.46 1.70 2.37 1.85 1.24 2.09
1.64 1.47 1.93 1.90 1.79 2.08 2.55 1.69
a) Construya una T.D.F con 6 intervalos.

4. En la redacción de un diario, el tiempo requerido para formar la primera


página completa fue registrado durante 50 días. Los datos redondeados a la
décima de un minuto más cercana, se dan a continuación:

20.8 22.8 21.9 22 20.7 20.9 25 22.2 22.8 20.1


25.3 20.7 22.5 21.2 23.8 20.9 22.9 23.3 23.5 19.5
23.7 20.3 23.6 19 25.1 19.5 24.1 24.2 25 21.8
21.3 21.5 23.1 19.9 24.2 24.1 19.8 23.9 22.8 22.7
19.7 24.5 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7
a) Agrupe estos datos en una distribución que tenga 7 clases.
b) Interprete la quinta clase.

8
5. Uno de los pozos que suministra agua a la ciudad capital, Managua es el
“Olof Palme”, en dicho pozo se midió la cantidad de cloruros en 30 días
diferentes del año 1993, los resultados fueron los siguientes:

32 38 42 39 41 35.4 47.8 40 36.7 38.3


36.7 41.5 39.6 41.52 15.7 43.6 39.4 45.6 49.4 48
43.7 42.6 45.6 44 48.6 34.2 31.2 47.6 43.5 30.4

a) Construya una tabla de distribución de frecuencia utilizando 6 clases


b) interprete la cuarta clase.

1.3.3 REPRESENTACIÓN GRAFICA

REGLA DE LOS ¾

La mayoría de las graficas estadísticas se presentan en el plano cartesiano.


Para las dimensiones de las gráficas, se acostumbra usar el criterio de los ¾; es decir, que
la altura máxima de la información que se presenta en el eje de las ordenadas, sea: 3/4 de
la dimensión de la información que se presenta en el eje de las abcisas; o sea:

Y = (3/4) X.

HISTOGRAMA DE FRECUENCIAS

Un histograma de frecuencia consiste en una serie de rectángulos que tiene sus bases
sobre el eje horizontal (x), con centros en las marcas de clases y longitud igual al tamaño
de los intervalos de clase. Las alturas sobre el eje vertical (y) son proporcionales a las
frecuencias de las clases.

Frecuencia

HISTOGRAMA
4

0
Límites Reales

9
POLIGONO DE FRECUENCIAS.

Es un gráfico que une los puntos cuyas coordenadas corresponden a cada marca de clase
como abcisa y su frecuencia correspondiente como ordenada.

Frecuencia POLIGONO

6
5
4
3
2
1
0
Marcas de clases

OJIVA O POLIGONO DE FRECUENCIAS ACUMULADAS.

Es un gráfica que muestra las frecuencias acumuladas para cada valor o clase.

18
OJIVA
16
FREC. ACUMULADA

14

12

10

0
1 2 3 4 5 6 7

LIM. SUPERIORES REALES

DIAGRAMA DE BARRAS.

Similares a los histogramas, las alturas de las barras representan las frecuencias de las
clases, pero no hay una escala horizontal continua.

10
DIAGRAMA CIRCULAR

Es un círculo que se divide en sectores circulares proporcionales con las categorías o clases
que se muestran. Los ángulos correspondientes a cada sector se encuentran a través de una
regla de tres. De igual forma los porcentajes que se muestran.

El diagrama circular se acompaña de una leyenda, donde se especifica la información que


se muestra en cada uno de los sectores del círculo.
DIAGRAMA CIRCULAR

13%

40%
20%

27%

DIAGRAMA DE PARETO

Es una grafica de barras de frecuencias que se presenta en orden de mayor a menor (de la
barra mas alta a la mas baja).
Los diagramas de pareto son herramientas graficas muy utilizadas en control de procesos y
de calidad, puede ayudar a los ingenieros a identificar defectos importantes y sus causas.

11
Ejemplo 1
La siguiente tabla muestra la preferencia que 1250 personas televidentes tienen en relación
a cuatro noticieros que dan diariamente por la televisión en la ciudad de Managua

Noticiero # de personas que lo prefieren


A 200
B 300
C 300
D 100
E 250
F 100
Mostraremos esta información, primero en un diagrama de barras y posteriormente en un
diagrama circular

Ilustración 1: Diagrama de Barras

# de personas que prefieren los Noticieros

350

300

250

200

150

100

50

0
A B C D E F

Ilustración 2: Diagrama Circular

# de personas que prefieren los Noticieros

8%
16%

20%

24%

8%

24%

12
Leyenda
-
El 16% prefiere el noticiero A
-
El 24% prefiere el noticiero B
-
El 24% prefiere el noticiero C
-
El 8% prefiere el noticiero D
-
El 20% prefiere el noticiero E
-
El 8% prefiere el noticiero F

Ejemplo 2
En un proceso de producción se inspeccionaron las piezas maquinadas y se obtuvieron los
siguientes resultados:

Defectos en partes maquinadas f fr


Piezas sin terminar 10 0.105
Ralladuras superficiales 52 0.547
Grietas superficiales 15 0.158
Piezas con forma incorrecta 10 0.105
Otros 8 0.084
Haremos un grafico de Diagrama de Pareto con esta información

Ilustración 3: Diagrama de Pareto

Defectos en partes maquinadas

60
50
40
30
20
10
0
Ray. Sup. Griet. Sup. Sin Term. Forma
Incor. Otros
Se puede deducir que: aproximadamente el 70.5% de los defectos se deben a ralladuras y
grietas superficiales.

13
Ejemplo 2
Del ejemplo 1, de la sección 1.3 (página 7) , obtendremos el histograma, el polígono y la
ojiva.
Solución:
La TDF es:
T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua

LI LS f F X LIR LSR
38.4 39.4 3 3 38.9 38.35 39.45
39.5 40.5 2 5 40 39.45 40.55
40.6 41.6 3 8 41.1 40.55 41.65
41.7 42.7 3 12 42.2 41.65 42.75
42.8 43.8 5 17 43.3 42.75 43.85
43.9 44.9 17 33 44.4 43.85 44.95
45 46 7 40 45.5 44.95 46.05
b)

Histogram
18
15
12
9
6
3
0
38.35 39.45 40.55 41.65 42.75 43.85 44.95 46.05

Poligono
18
15
12
9
6
3
0
38.9 40 41.1 42.2 43.3 44.4 45.5

14
Ojiva
40
35
30
25
20
15
10
5
0
39.45 40.55 41.65 42.75 43.85 44.95 46.05

Ejercicios

1. En cada uno de los ejercicios de la sección anterior graficar: histograma,


polígono y ojiva.

2. Interpretar la tercera clase en cada uno de los gráficos del ejercicio anterior.

3. En una empresa de zona franca, producen 5 tipos de prendas de vestir, la


producción en una semana de éstas se muestra a continuación:

Prendas de vestir Producción semanal


Camisas manga corta 1500
Camisas manga larga 1800
Pantalones de vestir 1400
Pantalones de azulón 1700
Otro tipo 1200
a) grafique un diagrama de pareto
b) cuál es la proporción de las dos prendas que más se produce en dicha
empresa.

4. En una Imprenta se contabilizaron los defectos en cada una de las actividades que
se realizan en elaboración de libros y se obtuvo la siguiente información:

Actividad f fr
Corte de hojas 60 0.43
Mala impresión 40 0.29
Tinta irregular 20 0.14
Encuadernación 12 0.09
Portada 6 0.04
Lomo 2 0.01

15
a) Grafique un diagrama de Pareto
b) ¿Cual es la proporción de las dos actividades para elaborar libros que más se
comete errores en dicha Imprenta?

1.4 MEDIDAS DESCRIPTIVAS (ESTADÍGRAFOS)

1.4.1 Medidas de Tendencia Central:

Las medidas de tendencia central son la media aritmética, la mediana y la moda, las cuales
calcularemos para datos agrupados y no agrupados.

Nota: Consideraremos que los datos están agrupados, cuando están


representados en una TDF.

MEDIA ARITMÉTICA

La media aritmética, representa el valor promedio de los datos, se denota por:


x : Media aritmética para una muestra
μ : Media aritmética para una población.

Estaremos utilizando la notación para una muestra, aunque los cálculos son validos para las
medidas o parámetros poblacionales.

Para datos agrupados se define como:


k

f X
i 1
i i
x = ; donde:
n
f: es la frecuencia absoluta,
X: es la marca de clase y
n: el número de observaciones.

Para datos no agrupados se define como:


n

x
i 1
x = ; donde:
n

X: es cada observación
n: el número de observaciones.

16
LA MEDIANA

Es un valor central que tiene la característica de dividir en dos partes iguales las
observaciones. Un 50% de las observaciones son menores o iguales a la mediana y el otro
50% mayor o igual, se denota por Me.

Para datos agrupados se define:


n 
2 F
Me = Lir +   . C ; donde
 f 
 

Lir: Limite inferior real del intervalo que contiene a la Me.


F: Frecuencia acumulada anterior al intervalo que contiene a la Me.
f: Frecuencia absoluta del intervalo que contiene a la Me.
C: Amplitud de clase.
Para obtener la Mediana, identificamos la clase que contiene a la mediana, la cual será
donde la primera frecuencia acumulada es mayor o igual a: n/2.

Para datos no agrupados: se ordenan los datos y se escoge el valor central del
conjunto datos; para esto se debe considerar cuando el número de datos es par o impar.

Si n es impar, entonces:
 n 1 
Me =  Dato [ posición ( )]
 2 
Ejemplo:
Sean los datos 3,4,4,5,6,7,,8,8,9,9,10. (n =11)

Me = Dato (6) = 7

Si n es par, entonces:

 n n2 
 Dato [ posición ( 2 )]  Dato [ posición ( 2 )] 
Me =  
 2 
 
O sea: el promedio de los dos datos centrales.

Ejemplo: 3,4,4,5,6,7,8,8,9,9,10,11. (n =12)

Me = (Dato (6) + Dato (7))/ 2 = (7 + 8) / 2 = 7.5

17
LA MODA:

De una serie de datos es: el número que ocurre con mayor frecuencia, el que más se repite
(datos no agrupados). Basta observar el número que más se repite.

Para datos agrupados, la moda esta en la mayor concentración de datos (mayor frecuencia),
la clase con mayor frecuencia es la clase modal. La moda si existe puede ser no única y se
denota por Mo, se define como:

Mo = Lir +
 1  . C ; donde
 
 1   2 
Lir: Limite interior real del intervalo Modal.
1: Mayor frecuencia menos la inmediata anterior
2: Mayor frecuencia menos la inmediata posterior
C: Amplitud de Clases

Formas de la Distribución:
-
Muchas distribuciones de variables continuas se pueden representar de manera grafica
mediante una curva en forma de campana.
-
Se dice que una distribución es simétrica, si se puede doblar a lo largo de un eje
vertical de modo que los lados coincidan, en este caso la x, Me y Mo coinciden, en el
punto de simetría.

Mo = Me = x

- Se dice que es “Asimétrica positiva” o “Sesgada a la derecha” si Mo< Me < x .

Mo < M e < x

18
-
Se dice que “Asimétrica Negativa” o “Sesgada a la izquierda, si x < Me < Mo.

x <Me<Mo
1.4.2. MEDIDAS DE POSICIÓN:

Son medidas de posición, ya que, por debajo de ellas se ubica un determinado tanto por
ciento.

Cuartiles
Dividen en cuatro partes iguales a la información y se representa por Qi.

Deciles
Dividen en diez partes iguales a la información y se representan por Di.

Percentiles
Dividen en cien partes iguales a la información y se representa por Pi.

Estudiaremos estas medidas para datos agrupados.

La fórmula para los Cuartiles, Deciles y Percentiles para datos agrupados son:
  n 
 i  4  F 
Qi  Lir      c :; ( i  1, 2, 3, 4)
 f 
 
 

  n  
 i   F
Di  Lir    10   c :; ( i  1, 2, 3.......10)
 f 
 
 
  n  
 i  100   F 
Pi  Lir      c; ( i  1, 2, 3..........100)
 f 
 
 
Donde:

Lir: Limite inferior real del intervalo que contiene a la medida.


F: Frecuencia acumulada anterior al intervalo que contiene a la medida.
f: Frecuencia absoluta del intervalo que contiene a la medida.
C: Amplitud de clase.

19
Para obtener los Cuartiles, Deciles, Percentiles, identificamos la clase que contiene a la
medida buscada, la cual será la primera clase donde la frecuencia acumulada es mayor o
igual a: i (n/4) (para cuartiles) o i (n/10) (para decciles) o i (n/100) (para percentiles).

Para datos no agrupados calcularemos solamente los cuartiles, los cuales se hallan
semejantes al caso de la mediana.
Los datos se ordenan de menor a mayor.

SI n ES IMPAR

El Q2 = Dato [posición {(n +1)/2}]. El cuartil 2 es exactamente la mediana.

Para el cuartil 1 y 3, se debe considerar si (n +1) / 2 es par o impar.

Si: (n +1) / 2 es par, entonces:

El Q1 = {Dato [posición {(n +1)/4}] + Dato [posición {(n +5)/4}]} / 2.

El Q3 = {Dato [posición {(3n -1)/4}] + Dato [posición {(3n +3)/4}]} / 2


Si: (n +1) / 2 es Impar

El Q1 = Dato [posición {(n +3)/4]

El Q3 = Dato [posición {(3n +5)/4}]

SI n ES PAR

Q2 = (Dato [posición (n/2)] + Dato [posición {(n +2)/2)}]) / 2; o sea:


el promedio de los datos centrales.

Para el cuartil 1 y 3, se debe considerar si n / 2 es par o impar

Si: n / 2 es par

El Q1 = {Dato [posición (n /4)] + Dato [posición ((n +4)/4)]} / 2.

El Q3 = {Dato [posición (3n /4)] + Dato [posición ((3n +4)/4)]} / 2

Si: n / 2 es Impar

El Q1 = Dato [posición ((n +2)/4)]

El Q3 = Dato [posición ((3n +2)/4)]

20
1.4.3. MEDIDAS DE VARIABILIDAD:

Son medidas que expresan variabilidad o dispersión alrededor de un valor promedio. Una
vez localizado el centro de distribución de un conjunto de datos nos vemos en la necesidad
de medir el grado en que se dispersan o diseminan los datos alrededor del valor promedio.

Una característica de casi todos los datos es que los valores no son todos iguales de ser así
el grado de dispersión alrededor del promedio sería cero. Para medir el grado de dispersión
lo hacemos a través de la varianza y desviación estándar.

Varianza

Expresa variabilidad al cuadrado de los datos alrededor del valor promedio se representa
por S2 (para una muestra) y como σ2 (para una población) y se obtiene:

Datos agrupados Datos no agrupados

S2 
n  x2i f i  ( xf i ) 2
S2 
 ( x  x) 2
n( n  1) n 1

x: marca de clase x: datos


f: frecuencia x : media aritmética
n: total de datos n: total de datos

La varianza es un valor no negativo.

Desviación Estándar

Expresa variabilidad lineal de los datos alrededor del valor promedio. Es la raíz cuadrada
de la varianza.
Se representa por: S, para una muestra
y como: σ, para una población.
Se obtiene: tanto para datos agrupados como para no agrupados.

Coeficiente de Variación

s
CV = 
x

Se utiliza para comparar la variabilidad de dos o más distribuciones, será más


representativa (menos variabilidad) la que tenga el CV más pequeño.

21
1.4.4. MOMENTOS

Si: y1, y 2, ….. , yn son las observaciones de una variable, el i-ésimo momento de la variable
Y, se denota como: ŷ i y se define como:
n

y
i

j
j 1
ŷ i = (y1i + y2i + y3i + ….+ yni ) / n =
n

Cuando i = 1, se obtiene la media aritmética ( y ).

También se obtiene el i-ésimo momento con respecto a la media ( y ), el cual denotaremos:
Mi y se define:
i
 n 
 y j y 
Mi =  j 1

n

Cuando i = 1, entonces M1= 0.

Probemos esto:

 n 
 y j y  
M1 =  j 1
 = (Σyj - n y ) / n (por propiedad de suma: la suma de n
n

veces una constante es igual: a n por la constante). ( y es una constante).

Sustituyendo y, tenemos:
n

y
j 1
j
(Σyj - n ) / n = 0.
n

Cuando i =2, entonces: M2 = S2 (la varianza).

MOMENTOS PARA DATOS AGRUPADOS

Los momentos también se obtienen para datos agrupados.

Si: y1, y 2,….. , yn ocurren con frecuencias: f1, f 2,….. , fn respectivamente, entonces los
momentos definidos antes, están dados por:

22
n i

 f jy
j 1 j
ŷ i = (f1y1i + f2y2i + f3y3i + ….+ fnyni ) / n =
n

Los momentos para datos agrupados se obtienen así:


i
n 
 f  y j y
 .
j
j 1
Mi =
n
Donde:
Y: marcas de clases.

y : Media aritmética
n: total de datos.

1.4.5. ASIMETRIA O SESGO

En las formas de la distribución se observa la tendencia de un conjunto de observaciones


utilizando la moda, mediana y la media. Una característica importante que puede medirse es
el grado de asimetría de una distribución de datos. Recordemos que: si una
distribución es simétrica, no tiene sesgo o su asimetría es nula. Si una o mas
observaciones son lo suficientemente grandes, la media de la distribución se vuelve mayor
que la mediana o la moda, en este caso se dice que la distribución tiene asimetría
positiva o sesgo positivo, de lo contrario, si la media es menor que las otras
medidas de tendencia central entonces se dice que la distribución tiene asimetría
negativa o sesgo negativo.

Matemáticamente podemos calcular esta tendencia mediante el coeficiente de asimetría


el cual se obtiene:

3( x  Me)
Sesgo =
S

1.4.6. CURTOSIS O APUNTALAMIENTO

Otra manera de medir la forma de la distribución es con la Curtosis, la cual nos dice que
tan puntiaguda es la grafica de una distribución, esta se presenta de tres tipos:

Platicúrtica: la forma geométrica de la distribución es aplanada.


Leptocúrtica. La forma geométrica es puntiaguda o esbelta.
Mesocúrtica: en este caso no es ni puntiaguda, ni aplanada.

23
Platicúrtica Leptocúrtica Mesocúrtica

La calculamos en función de l valor b.

Si: b = 0, decimos que es mesocúrtica,


Si: b > 0, decimos que es leptocúrtica,
Si: b < 0 diremos que es platicúrtica.
La ecuación matemática de b es:

M4 M4
b= 4
= 2
S M 2

Otra manera de medir la Curtosis es usando cuartiles y percentiles. A este valor se le llama:
coeficiente percentil de curtosis (K), esta dado por:

Q
K= , donde Q = ½ (Q3 – Q1 ).
P90  P10
A Q se le conoce como: rango semi-intercuartil.

Ejemplo 3

Del ejemplo 1 , sección 1.3 (Página 7) calcularemos e interpretaremos las medidas


descriptivas para datos agrupados.

T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua

LI LS f F X LIR LSR fX f X2
38.4 39.4 3 3 38.9 38.35 39.45 116.7 4539.63
39.5 40.5 2 5 40 39.45 40.55 80 3200
40.6 41.6 3 8 41.1 40.55 41.65 123.3 5067.63
41.7 42.7 3 11 42.2 41.65 42.75 126.6 5342.52
42.8 43.8 5 16 43.3 42.75 43.85 216.5 9374.45
43.9 44.9 17 33 44.4 43.85 44.95 754.8 33513.12
45 46 7 40 45.5 44.95 46.05 318.5 14491.75
1736.4 75529.1

24
Solución:

Medidas de tendencia central


-
x = 1736..4/40 = 43.41.
Los taxis recorren en promedio 43.41 Km. por galón de gasolina.
-
Para le mediana se calcula primero: n/2 = 20, luego se observa en la columna de las
frecuencias acumuladas, cual es la primera clase que contiene a 20. En este caso es la
sexta clase, entonces:

Me = 43.85 + [(20 – 16) / 17] 1.1 = 44.3.


El 50% de los vehículos usados como taxis recorren menos de 44.3
Km. Por galón de gasolina.
-
Para la moda se ubica la clase que contiene a la moda, que es: la que tiene la
mayor frecuencia, en este caso la sexta.

Mo = 43.85 + [(12/(12+10))] 1.1 = 44.45.


Lo mas común es que los vehículos usados en la cooperativa de Taxis, recorran 44.45
Km. Por galón de gasolina.

Nota: con estas medidas se deduce que la forma de la distribución es asimétrica


negativa, ya que la media es menor que la mediana y la moda.

Medidas de posición

Calcularemos el cuartil 1, el decil 6 y el percentil 76.


-
para el cuartil 1, se calcula primero: i n/4 = 1(40)/4= 10. Luego se procede igual que la
mediana, se busca en la columna de las frecuencias acumuladas, cual es la primera clase
que contiene a 10. En este caso es la cuarta clase, entonces:
Q1 = 41.65 + [(10 – 8) / 3] 1.1 = 42.383.
El 25% de los vehículos usados como taxis recorren menos de 42.383 Km. Por galón de
gasolina.
-
Para el decil 6, se calcula primero: i n/10 = 6(40)/10= 24. Luego se procede igual que la
mediana y el cuartil, se busca en la columna de las frecuencias acumuladas, cual es la
primera clase que contiene a 24. En este caso es la sexta clase, entonces:
D6 = 43.85 + [(24 – 16) / 17] 1.1= 44.3676.
El 60% de los vehículos usados como taxis recorren menos de 44.3676 Km. Por galón de
gasolina.
-
Para el percentil 76, se calcula primero: i n/100 = 76(40)/100 = 30.4. Luego se procede
igual que la mediana, el cuartil y el decil, se busca en la columna de las frecuencias
acumuladas, cual es la primera clase que contiene a 30.4. En este caso es la sexta clase,
entonces: P76 = 43.85 + [(30.4 – 16) / 17] 1.1 = 44.782.

25
El 76% de los vehículos usados como taxis recorren menos de 44.782 Km. Por galón de
gasolina.

Medidas de variabilidad

Para la varianza se obtienen los productos de las dos últimas columnas de la tabla anterior y
sus respectivas sumas. Las unidades de la varianza son cuadradas.

-
S2 = [40 (75529.1) – (1736.4)2] / (40*39) = 3.8968 (Km por galón)2 .
La variabilidad cuadrática del kilometraje recorrido por los taxis alrededor de la
media es de 3.8968 (Km por galón)2.
-
La desviación estándar se obtiene extrayendo la raíz cuadrada a la varianza y sus
unidades son lineales, entonces:
S =1.974
La variabilidad lineal del kilometraje recorrido por los taxis es de 1.974 Km., alrededor de la
media.
-
Para el coeficiente de variación, simplemente se divide la desviación estándar
entre la media.
CV = 1.974/43.41 = 0.04547.

3(43.41  44.3)
Nota: El sesgo es igual a: = -1.353.
1.974

Ejercicios resueltos

1. Los siguientes datos representan los pesos, en libras, de dos grupos de


estudiantes, compuestos por 5 varones y 5 mujeres. ¿Qué grupo
tiene relativamente un peso más estable?

Mujeres 130 150 145 158 165 140

Hombres 90 128 205 140 165 160

Solución:
Se obtienen las siguientes medidas para datos no agrupados:

x M = 148 SM = 12.5698 CVM = 0.085

x H = 148 SH = 38.7556 CVH = 0.262

26
El promedio de ambos grupos es de 148 libras, sin embargo la variabilidad del grupo de
hombres es mayor que el de las mujeres, dado que su coeficiente de variación es mayor; lo
que nos indica, que el grupo que tiene un peso más estable es: el de mujeres.

2. La siguiente distribución de frecuencia representa el tiempo promedio,


en minutos, que 20 clientes de un banco, llevan a cabo una transacción bancaria.

Clientes Tiempo
promedio a) Complete la distribución de frecuencia
3 b) Calcular S e interprete
4 2.1 c) ¿Qué porcentaje de clientes realizo su transacción
6 bancaria entre 1.95 y 5.50 minutos
3
2 6.0
2

Solución:

a) Una técnica para encontrar las marcas de clases, después de haber encontrado la primera
es: sumarle la amplitud de clases (C) a la anterior, para obtener la siguiente. De aquí resulta
la siguiente ecuación:

6.0  2.1
6.0 – 2.1 = 3C  C  1.3 , u = 0.1
3
Para completar las marcas de clase, sumamos C (si se baja) o restamos C (si se sube)

K Lim. Reales f F x fx fx2


LIR LSR
1 0.15 1.45 3 3 0.8 2.4 1.92
2 1.45 2.75 4 7 2.1 8.4 17.34
3 2.75 4.05 6 13 3.4 20.4 69.36
4 4.05 5.35 3 16 4.7 14.1 66.27
5 5.35 6.65 2 18 6.0 12 72
6 6.65 7.95 2 20 7.3 14.6 106.58
f = 20 fx = 71.9 fx2 = 333.77

Con las marcas de clase y la amplitud se encuentran los límites reales. Para encontrar los
límites inferiores reales, se le resta c/2 a cada marca de clase y para encontrar los
límites superiores reales se suma C/2 a cada marca de clase.

Nota: se debe observar que la amplitud de las clases reales es: C

27
LS = LI +C – U, entonces: LS – LI = C – U.
LSR = LS + U/2 y LIR = LI – U/2, por lo tanto se deduce lo siguiente:
la amplitud de las clases reales es: C

LIR LI LS LSR
U/2 C-U U/2

C
n x 2 f   xf 
2
b) S 
2
n(n  1)

20333.77   71.92
S  1.99
20(19)

c) 1.95 minutos y 5.50 minutos son percentiles, debemos buscar su posición (%).
Vamos a suponer que la posición para 1.95 es: i y para 5.50 es: j.

 in 
 100  f  ; Pi = 1.95; Pj = 5.50.
Pi  Li   C
 f 
 
Sustituimos y despejamos i

 0.2i  3 
1.95  1.45   1.3  0.2i 
 1.95  1.45  4  3
 4  1.3
i = 22.69
Sustituimos y despejamos j
 0.2 j  16   5.50  5.35  2
5.50  5.35    1.3  0.2 j   16
 2 1.3
j = 81.15
El porcentaje es: j – i = 81.15 – 22.69 = 58.46%

Pi Pj
1.95 5.50

58.46%

28
3. Se utilizan tres moldes diferentes en una máquina para fabricar botellas de vidrio.
La cantidad de disconformidad o defectos en 1000 botellas producidas por un
molde interesa al departamento de control de calidad como una medida del
rendimiento del proceso. Se seleccionan al azar cinco lotes de 1000 botellas de la
producción de cada molde (lo cual es posible, pues los números de cada molde se
encuentran marcados en el fondo de cada botella) y los datos fueron:

Molde
1: 8 4 3 6 4
2: 5 2 3 6 4
3: 12 10 8 11 9
a) ¿Qué número de molde es relativamente más variable y cual es más consistente.

Solución:
a) molde x s CV
1: 5 2 40
2: 4 1.581 39.53
3: 10 1.581 15.81%
Respuesta: El molde “1” es el más variable, porque el CV es el mayor
El molde “3” es el más consistente, porque el CV es el menor

4. A continuación se presenta 20 observaciones en orden del tiempo de falla, en


horas, de un material aislante eléctrico.

204 228 252 300 224 444 624 720 816 912
1176 1296 1392 1488 1512 2520 2856 3192 3528 3710
Calcule e interprete Q1, Q2 , Q3

Solución:

Se deben ordenar los datos de menor a mayor.


204 224 228 252 300 444 624 720 816 912
1176 1296 1392 1488 1512 2520 2856 3192 3528 3710

n es par

912  1176
Q2 =  1044
2

El 50% del material aislante eléctrico dio un tiempo de falla menor o igual a 1044 horas y el
otro 50% mayor.

Para el cuartil 1 y 3 observamos, si n/2 es par o impar.

En este caso n/2 es par, por lo tanto:

29
224  444
El Q1 = {Dato [posición (n /4)] + Dato [posición ((n +4)/4)]} / 2 =  384
2
El 25% del material aislante eléctrico dio un tiempo de falla menor o igual a 384 horas y el
otro 75% mayor.

El Q3 = {Dato [posición (3n /4)] + Dato [posición ((3n +4)/4)]} / 2 =

1512  2520
=  2016
2
El 75% del material aislante eléctrico dio un tiempo de falla menor o igual a 2016 horas y el
otro 25% mayor.

1.5 USO DE LA COMPUTADORA PARA CALCULAR MEDIDAS DESCRIPTIVAS

Usaremos el paquete de Microsoft Excel 2003, dado que es bien accesible y de fácil
manejo.

Microsoft Excel proporciona un conjunto de herramientas para el análisis de los


datos (denominado Herramientas para análisis) que podrá utilizar para ahorrar pasos en el
desarrollo de análisis estadísticos. Cuando utilice una de estas herramientas, deberá
proporcionar los datos y parámetros para cada análisis; la herramienta utilizará las funciones
de macros estadísticas o técnicas correspondientes y, a continuación, mostrará los
resultados en una tabla de resultados. Algunas herramientas generan gráficos además de
tablas de resultados.

Excel incluye muchas otras funciones estadísticas, financieras y de ingeniería. Algunas de las
funciones estadísticas están integradas y otras están disponibles después de instalar las
Herramientas para análisis.

COMO OBTENER ACCESO A LAS HERRAMIENTAS DE ANÁLISIS DE DATOS

Las Herramientas para análisis incluyen las herramientas que se describen a continuación.

Para tener acceso a ellas, haga clic en Análisis de datos en el menú Herramientas. Si el
comando Análisis de datos no está disponible, deberá cargar el programa desde la página
del menú Herramientas, haciendo clic en: Complementos. Luego en la página de
complementos, aparecerá una línea con el nombre: Herramientas para análisis, con el
ratón hace un clic en el cuadrito de la izquierda y aparecerá un Check (√), luego se hace clic
en aceptar y de esta forma el comando Análisis de datos ya estará disponible. Veremos
un ejemplo.

30
Ejemplo

Los datos se muestran a continuación en la hoja de EXCEL, se introducen en una columna,


para estudiar una sola variable o un solo conjunto de datos

Archivo Edición Ver Insertar Formato Herramientas Datos Ventana

A B C D
1 69
2 57
3 68
4 73
5 45
6 39
7 47
8 52
9 62
10 64
11 68
12 48
13 87
14 62
15 65
16 74
17 38
18 63
19 45
20 76
21 64
22 53
23 62
24 64
25 55
26 82
27 90
28 65
29 54
30 66

31
31 85
32 43
33 48
34 65
35 64
36 63
37 56
38 75
38 62
40 72
41 57

Para proceder a obtener las medidas descriptivas:

1. Con el ratón hacemos un clic en Herramientas, parte superior de la página.

2. Luego en Análisis de datos


3. En dicha ventamos Buscamos: Estadística Descriptiva y le damos un clic con el ratón,
esta línea se sombreará y luego damos otro clic en aceptar.

4. Los datos se introducen en la celdita Rango de entrada, el cursor debe estar en dicha celda, luego
en la página de datos, se ubica el cursor en el primero y apretando el ratón en la tecla izquierda, se
arrastra hasta el último dato, de esa manera los datos quedan introducidos en dicha celdita. En la
misma ventana de Estadística Descriptiva, hacemos un check, en el cuadrito a la izquierda de:
Resumen de estadísticas, luego en aceptar. Aparecerá en una hoja de salida, la siguiente Tabla, la
cual nos proporciona las siguientes medidas:

Columna1

Media 62.12195122
Error típico 1.958469762
Mediana 63
Moda 62
Desviación estándar 12.5403252
Varianza de la muestra 157.2597561
Curtosis -0.162306794
Coeficiente de asimetría 0.144032551
Rango 52
Mínimo 38
Máximo 90
Suma 2547
Cuenta 41

32
EJERCICIOS

1. En el ejercicio 1 sección 1.3, con la TDF:


a) Calcule e interprete: x , Mo, Me, P78 y S
b) analice la forma de la distribución.
c) Encuentre entre que valores se encuentra el 26% central de los datos.

2. En el ejercicio 2 sección 1.3, con la TDF: Analice la forma de la distribución.

3. En el ejercicio 3 sección 1.3, con la TDF:


a) Hallar e interpretar Mo, Me, x , Q3 y S.
b) Encuentre entre que valores se encuentra el 26% central de los datos.

4. En el ejercicio 4 sección 1.3, con la TDF:


a) Hallar e interpretar Mo, Me, x, P32 y S
b) Hallar sesgo y curtosis.

5. En el ejercicio 5 sección 1.3, con la TDF:


a) calcule e interprete: Q1 , D6 Y P46.
b) que forma tiene la distribución.

6. La siguiente tabla representa los pagos por almacenamiento, en miles de


córdobas, para los 50 más grandes detallistas.

X f
1.48 4
1
2
14
5.48 11
9
7
2
a) Completar la tabla de distribución de frecuencia
b) Hallar Mo, Q1, Me, S. (Interprete cada una)
c) Encuentre el porcentaje de detallistas que pagan entre 1.92 y 5.25 por
almacenamiento.

7. Los siguientes son los tiempos de ignición de ciertos materiales utilizados en


Tapicería expuestos al fuego, expresados a la mas cercana centésima de segundo:

2.51 2.58 4.32 2.2 4.04 6.43 1.58


3.87 1.38 6.75 5.84 4.54 5.12 5.15
8.75 2.46 6.25 9.45 2.65 7.86 4.71
5.39 11.2 7.95 10.6 5.33 8.64 7.41

33
a) agrúpense estos datos en cinco clases.
b) que porcentaje de estos materiales tiene un tiempo de ignición entre
2.6 y 7.9 segundos.

8. Una entrega reciente de pernos por parte de un nuevo proveedor fue enviada
a un laboratorio para determinar la fuerza necesaria para romper cada uno de
los pernos. A continuación se dan los resultados en miles de libras-fuerza.

147.8 125.2 141.1 145.7 137.4


119.9 142.3 138.7 125.7 133.3
142.0 129.8 141.2 134.9 130.8
125.0 142 118.6 133 128.9
151.1 126.3 140.9 138.2 125.7

a) agrupe estos datos en 6 clases.


b) calcule e interprete la Me.
c) que porcentaje de estos pernos se rompen con una fuerza entre 125000 y 140000
libras - fuerza.

9. El número de accidentes en 60 operaciones de máquinas que fueron analizados


en 3 meses consecutivos, se dan en la tabla siguiente:

# de accidentes f
0 27
1 12
2 6
3 6
4 3
5 3
6 2
7 1
Utilizando expresiones correspondientes a estos datos, hallar:
a) Moda, mediana, Media, desviación estándar. (Interprete)

10. Una compañía de computadoras recopilo datos con respecto al tiempo (en minutos) que
requerían cada uno de sus 40 vendedores para realizar una venta, la siguiente tabla
representa la distribución del tiempo requerido por vendedor:
Clases f fr
1 10 0.075
11 20 1
21 30 4
31 40
41 50 2
51 60 0.395
61 60 0.235
71 80 5

34
a) proporcione los datos faltantes
b) interprete la cuarta clase con porciento de frecuencia acumulada
c) interprete la séptima clase con frecuencia absoluta
d) analice la forma de la distribución

11. Una fabrica de cremalleras manufactura 15 productos básicos. La compañía tiene


registros del número de elementos de cada producto fabricado al mes, con el fin
de examinar los niveles relativos de producción. A partir de los datos obtenidos,
la dirección de la compañía construyo la siguiente tabla:

Clases f
9700 9899 3
9900 10099 8
10100 10299 2
10300 10499 0
10500 10699 2
a) ¿que nivel de producción excedió el 75% de sus productos durante ese mes?
b) ¿que nivel de producción excedió el 90% de sus productos durante ese mes?
c) analice la forma de la distribución.

12. Las que siguen son las edades de 20 personas designadas como el cuerpo de un
jurado por una corte:
48, 58, 33, 42, 57, 32, 52, 25, 46, 60, 61, 49, 38, 53, 30, 47, 52, 63, 41 y 34.
Mediante las expresiones correspondientes , hallar:
a) Media, mediana, Q1, Q3
b) Desviación estándar. (Interprete)

13. El responsable de una biblioteca de cierta Universidad ordeno un estudio del


tiempo que un alumno tiene que esperar (en minutos) para que le sea
entregado el libro solicitado para consulta. Los datos fueron tomados durante un
día normal a una muestra de 20 alumnos:

12 16 11 10 14 3 11 17 9 18 16 4 7 14 15 16 5 6 7 7
a) Hallar: media, moda, mediana
b) ¿Cuánto tiempo máximo, se debe suponer que el 75% de los alumnos debe
esperar para obtener su libro de consulta?

14. Los siguientes son los precios de cierre de dos almacenes en cinco viernes
consecutivos:

Almacén A: 17 5/8 18 ¼ 17 3/8 18 1/8 18


Almacén B: 20 19 7/8 20 ½ 20 3/8 20 ¼

¿Cual de estos almacenes tiene precios de cierre más estable?

35
15. Los siguientes datos representan el número de horas que dos tipos diferentes de
calculadoras científicas de bolsillo operan antes de que requiera recargarlas.

Tipo A: 5.6 6.3 4.6 6.3 5.0 6.2 5.8 5.1 5.5
Tipo B: 4.8 4.3 4.2 4.0 4.9 4.5 5.2 4.5 3.8
¿Qué tipo de calculadora es relativamente más consistente?

16. En sus recorridos, el autobús A transporta a 15, 24, 19, 12, 20 pasajeros y el
autobús B transporta a 18, 21, 16, 14 y 16 pasajeros.

a) ¿Qué autobús promedio más pasajeros transportados en los recorridos?


b) Determine si el número de pasajeros es relativamente más variable para el
autobús A o para el autobús B.
c) Hallar Q3 para el autobús A ; Q1 para el autobús B.

17. Una empresa agrícola vende tres categorías de semillas que se diferencian entre
si, de acuerdo con el desarrollo de germinación. El laboratorio de pruebas de
semillas del Estado tiene una muestra de cada categoría y los resultados de las
pruebas acerca del número de semillas que germinan, de 100, son:

Regular 88 91 92 89 79
Extra 87 92 88 90 92
Súper 90 89 79 93 83
Basándose en la dispersión relativa, ¿tiene sentido la clasificación de semillas que
hace la empresa?

18. En una empresa los empleados se clasifican en tres categorías como lo muestra
la tabla:

Categoría # de Empleados Salario medio semanal $

Especialistas 5 200
Técnicos 40 120
Administrativos 10 100

En la discusión para fijar los salarios de 1999 han hecho tres propuestas:

a) La elevación de todos los salarios en 5%


b) La elevación de todos los salarios en 10$
c) La elevación de los salarios según lo siguiente:
5% especialista: 4% técnicos y 5.5% administrativo.

¿Cuál de las tres alternativas tiene mayor efecto para reducir la dispersión relativa inicial de
los salarios para el conjunto de la empresa?

36
19. A cuatro pozos que abastecen de agua potable a la ciudad de Managua se les
midió la cantidad de Nitrato (NO3), en miligramos por litro (mg/L), los
resultados en días diferentes fueron los siguientes:

Rafaela Herrera #1 Reparto Shick # 1 Sabana Grande # 1 San Judas # 1


4.2 3.1 1.2 1.4
3.1 4.3 4.9 4.2
4.8 5.6 4.1 8
2.7 4.9 3.2 5.4
3.1 8.9 4.3 1.6
2.7 7 8.4 7
5.4 6.2 8.8 5.1
6.3 3.2 7.6 6.3
7 4.6 7 4
5.1 3.7 5.1
3.6 6
4.2

a) ¿En cual de los pozos la concentración de cloruro es mas Variable?

20. Para los datos de los ejercicios propuestos 7, 8, 12 y 13, obtener el Resumen de
Estadísticas con el paquete Microsoft Excel.

37

S-ar putea să vă placă și