Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICA DESCRIPTIVA
1.1 INTRODUCCIÓN
QUE ES LA ESTADÍSTICA
A menudo la gente cree que la estadística es una simple recolección de números. De hecho
éste era su significado original: era la recolección de información económica y de la
población vital para el estado. Sin embargo, actualmente la estadística es mucho mas que
eso, se ha convertido en un método científico de análisis ampliamente aplicado en la
administración, economía y en todas las ciencias sociales y naturales y obviamente en todas
las disciplinas de las Ingeniarías.
Atendiendo a los campos que podemos distinguir en Estadística tenemos:
1
Escribiendo de manera formal un poco mas acertada la definición de Estadística podemos
decir que:
Es un conjunto de técnicas para la colección, organización, presentación, manejo,
descripción y análisis de información, de manera que las conclusiones obtenidas de ellas
tengan un grado de confiabilidad especificado.
Partiendo de la definición se puede observar en forma clara que el objetivo de la Estadística
consiste en Hacer inferencias (predicciones, decisiones) acerca de una población, sobre la
base de la información contenida en una muestra.
En nuestro país tenemos maravillosos paisajes naturales. Una generosa tierra que nos brinda
su fruto y también, desafortunadamente, continuos desastres naturales. En Managua,
nuestra capital uno de los desastres que más ocurre, es el desborde de los cauces en
invierno; así como la inundación de algunos barrios, sobre todo en zonas marginales. Es por
eso que casi todos los años debemos crear puestos de emergencias. Esto hace necesario
establecer promedios de personas, porcentajes de acuerdo al sexo, edad, intervalos para las
edades con el objetivo de conocer la edad mas frecuente. Todo esto se obtiene con el
levantado de datos de las personas involucradas, esta información requiere su ordenación y
su posterior manipulación, que es precisamente el quehacer de la estadística descriptiva.
Esta parte de la estadística que por su sencillez es de las más utilizadas en cualquier rama
de las ciencias e ingenierías.
En esta unidad nos ocuparemos de: levantar, organizar y construir estadísticos con el fin de
poder conocer y comprender los fenómenos bajo estudio. Es nuestro deseo que lo aprendido
lo podas aprovechar y poner en práctica en esta situación real y de esa manera podamos
colaborar con la sociedad.
2
1.2 CONCEPTOS BASICOS
Estadística Descriptiva:
Estudia los métodos adecuados que nos conducen a recopilar, organizar, sintetizar y
describir una información (conjunto de datos) a través de tablas, gráficos y medidas
descriptivas.
Estadística Inferencial:
Estudia los métodos adecuados que nos conducen a tomar decisiones generales acerca de
una población, utilizando los datos de una muestra, o sea: es la interpretación y
generalización de los resultados obtenidos del estudio descriptivo.
Población:
Una población es el conjunto total de mediciones de interés en las que se estudia una
característica dada. El tamaño de las poblaciones es el número de elementos o mediciones
que contiene.
Por ejemplo. En un estudio sobre los costos de construcción, la población puede
consistir en los precios unitarios de los materiales de construcción.
En un estudio socio-económico, la población puede consistir en el número de
personas que habitan en un municipio determinado.
En un estudio de control de calidad, la población puede consistir en la valoración
(numérica o cualitativa) de cada artículo que contiene un lote.
Muestra:
Es un subconjunto de la población que contiene las mediciones obtenidas mediante un
experimento estadístico.
VARIABLES:
Una variable se simboliza con letras mayúsculas del Alfabeto tal como X, Y, H, etc; pueden
tomar un conjunto prefijado de valores, llamado dominio de esa variable. Las variables
pueden ser cualitativas o cuantitativas.
1. Cuantitativas
3
DISCRETAS: cuando únicamente asumen valores enteros. Son resultado de contar un
número de objetos u observaciones.
Ejemplos
Número de viviendas en una cuadra
Número de hijos por vivienda
Número de automóviles que cruzaron un puente en una hora determinada.
CONTINUAS: cuando pueden asumir cualquier valor en una escala continua (real).
Ejemplos:
La carga máxima que soporta un cable
La vida útil de una lámpara
El área de una parcela
La distancia entre dos puntos.
2. Cualitativas
Ejemplos
Sexo (masculino o femenino)
Estado civil (soltero o casado)
Departamento de origen (Managua, León, Granada, etc.)
Nivel educativo (Pre-escolar, primaria, secundaria, ect.)
Valoración de un arbitro
Preferencias de un cliente
Es interesante saber que muchas poblaciones puedan dar origen a los cuatro tipos de datos
en dependencia de la variable de interés.
4
1.3 DESCRIPCIÓN DE DATOS
Es una ordenación tabular de datos estadísticos que muestran cuantos elementos o que
parte de los datos están en diferentes intervalos (clases o categorías) en los cuales se
agrupan los datos. La distribución de frecuencia pueden ser distribuciones numéricas o
cualitativas.
Para la construcción de una TDF, existen varias técnicas, en general se recomienda que el
número de clases deban oscilar entre cinco y quince; y esto dependerá del número de
elementos que tenga la información que se agrupará en ella.
La técnica que mostraremos a continuación, es una técnica que de antemano se debe dar el
número de clases, los pasos son los siguientes:
3º) Seleccionar la amplitud de las clases, la denotaremos con la letra: C; para la selección
de la amplitud de los intervalos, debe tomarse en cuenta el número de decimales en que
vienen dado los datos. En este caso se encuentra la unidad de los datos;
5
5º) Para los demás intervalos solamente se suma la amplitud al límite anterior. El último
intervalo deberá contener al dato mayor.
Posteriormente con un ejemplo, se construirá una TDF completa, ya que los pasos
enumerados anteriormente solamente son para obtener las clases, que es una parte
importante en esta forma de representar información, pero hay otros elementos que
también son de interés en una TDF.
Nota:
Otro caso para construir una TDF, es cuando se determina el número de clases que debe
tener la TDF y una técnica para determinar K, es usar la siguiente expresión:
K=1+3.322Log (n), donde n es en número de datos a agrupar. El valor que resulta se
aproxima al entero inmediato superior.
Ejemplo 1
En una cooperativa de taxis de Managua se midió el consumo de gasolina,
obteniendo los kilómetros que hicieron 40 vehículos por galón de consumo. Los
resultados fueron los siguientes:
5) Para obtener los límites de los demás intervalos, solamente se suma la amplitud a cada
límite anterior.
6
La TDF contiene la siguiente información, la cual se agrega en columnas a la
par de las clases:
-
La frecuencia, denotada por f, representa el número de datos que están contenidos en
cada clase.
-
La frecuencia relativa, denotada por fr, definida como: fr = fi/n, donde i = 1 hasta
k, donde k representa a las clases y n es el total de datos.
-
El porcentaje de la frecuencia, denotada por %f, definida como:
%f = 100 fr.
-
La frecuencia acumulada, denotada por F, definida como: F = Σf i (i = 1 hasta k,
donde k representa a las clases).
-
El porciento de la frecuencia acumulada, denotada por %F, definida por:
-
%F = (F /n) 100.
-
La marca de clase, denotada por X, definida como el punto medio de cada clase.
X = (Li + Ls) / 2.
-
Los limites reales, LIR = LI - u/2 y LSR = LS + u/2. Para los limites reales,
vamos a convenir que tienen esta forma: (LIR, LSR], abiertos por la izquierda y cerrados
por la derecha.
LI LS f F X LIR LSR
38.4 39.4 3 3 38.9 38.35 39.45
39.5 40.5 2 5 40 39.45 40.55
40.6 41.6 3 8 41.1 40.55 41.65
41.7 42.7 3 11 42.2 41.65 42.75
42.8 43.8 5 16 43.3 42.75 43.85
43.9 44.9 17 33 44.4 43.85 44.95
45 46 7 40 45.5 44.95 46.05
7
Ejercicios
2. Los datos son mediciones de intensidad solar directa (en watts/m2) realizados en distintos
días en una localidad.
8
5. Uno de los pozos que suministra agua a la ciudad capital, Managua es el
“Olof Palme”, en dicho pozo se midió la cantidad de cloruros en 30 días
diferentes del año 1993, los resultados fueron los siguientes:
REGLA DE LOS ¾
Y = (3/4) X.
HISTOGRAMA DE FRECUENCIAS
Un histograma de frecuencia consiste en una serie de rectángulos que tiene sus bases
sobre el eje horizontal (x), con centros en las marcas de clases y longitud igual al tamaño
de los intervalos de clase. Las alturas sobre el eje vertical (y) son proporcionales a las
frecuencias de las clases.
Frecuencia
HISTOGRAMA
4
0
Límites Reales
9
POLIGONO DE FRECUENCIAS.
Es un gráfico que une los puntos cuyas coordenadas corresponden a cada marca de clase
como abcisa y su frecuencia correspondiente como ordenada.
Frecuencia POLIGONO
6
5
4
3
2
1
0
Marcas de clases
Es un gráfica que muestra las frecuencias acumuladas para cada valor o clase.
18
OJIVA
16
FREC. ACUMULADA
14
12
10
0
1 2 3 4 5 6 7
DIAGRAMA DE BARRAS.
Similares a los histogramas, las alturas de las barras representan las frecuencias de las
clases, pero no hay una escala horizontal continua.
10
DIAGRAMA CIRCULAR
Es un círculo que se divide en sectores circulares proporcionales con las categorías o clases
que se muestran. Los ángulos correspondientes a cada sector se encuentran a través de una
regla de tres. De igual forma los porcentajes que se muestran.
13%
40%
20%
27%
DIAGRAMA DE PARETO
Es una grafica de barras de frecuencias que se presenta en orden de mayor a menor (de la
barra mas alta a la mas baja).
Los diagramas de pareto son herramientas graficas muy utilizadas en control de procesos y
de calidad, puede ayudar a los ingenieros a identificar defectos importantes y sus causas.
11
Ejemplo 1
La siguiente tabla muestra la preferencia que 1250 personas televidentes tienen en relación
a cuatro noticieros que dan diariamente por la televisión en la ciudad de Managua
350
300
250
200
150
100
50
0
A B C D E F
8%
16%
20%
24%
8%
24%
12
Leyenda
-
El 16% prefiere el noticiero A
-
El 24% prefiere el noticiero B
-
El 24% prefiere el noticiero C
-
El 8% prefiere el noticiero D
-
El 20% prefiere el noticiero E
-
El 8% prefiere el noticiero F
Ejemplo 2
En un proceso de producción se inspeccionaron las piezas maquinadas y se obtuvieron los
siguientes resultados:
60
50
40
30
20
10
0
Ray. Sup. Griet. Sup. Sin Term. Forma
Incor. Otros
Se puede deducir que: aproximadamente el 70.5% de los defectos se deben a ralladuras y
grietas superficiales.
13
Ejemplo 2
Del ejemplo 1, de la sección 1.3 (página 7) , obtendremos el histograma, el polígono y la
ojiva.
Solución:
La TDF es:
T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua
LI LS f F X LIR LSR
38.4 39.4 3 3 38.9 38.35 39.45
39.5 40.5 2 5 40 39.45 40.55
40.6 41.6 3 8 41.1 40.55 41.65
41.7 42.7 3 12 42.2 41.65 42.75
42.8 43.8 5 17 43.3 42.75 43.85
43.9 44.9 17 33 44.4 43.85 44.95
45 46 7 40 45.5 44.95 46.05
b)
Histogram
18
15
12
9
6
3
0
38.35 39.45 40.55 41.65 42.75 43.85 44.95 46.05
Poligono
18
15
12
9
6
3
0
38.9 40 41.1 42.2 43.3 44.4 45.5
14
Ojiva
40
35
30
25
20
15
10
5
0
39.45 40.55 41.65 42.75 43.85 44.95 46.05
Ejercicios
2. Interpretar la tercera clase en cada uno de los gráficos del ejercicio anterior.
4. En una Imprenta se contabilizaron los defectos en cada una de las actividades que
se realizan en elaboración de libros y se obtuvo la siguiente información:
Actividad f fr
Corte de hojas 60 0.43
Mala impresión 40 0.29
Tinta irregular 20 0.14
Encuadernación 12 0.09
Portada 6 0.04
Lomo 2 0.01
15
a) Grafique un diagrama de Pareto
b) ¿Cual es la proporción de las dos actividades para elaborar libros que más se
comete errores en dicha Imprenta?
Las medidas de tendencia central son la media aritmética, la mediana y la moda, las cuales
calcularemos para datos agrupados y no agrupados.
MEDIA ARITMÉTICA
Estaremos utilizando la notación para una muestra, aunque los cálculos son validos para las
medidas o parámetros poblacionales.
f X
i 1
i i
x = ; donde:
n
f: es la frecuencia absoluta,
X: es la marca de clase y
n: el número de observaciones.
x
i 1
x = ; donde:
n
X: es cada observación
n: el número de observaciones.
16
LA MEDIANA
Es un valor central que tiene la característica de dividir en dos partes iguales las
observaciones. Un 50% de las observaciones son menores o iguales a la mediana y el otro
50% mayor o igual, se denota por Me.
Para datos no agrupados: se ordenan los datos y se escoge el valor central del
conjunto datos; para esto se debe considerar cuando el número de datos es par o impar.
Si n es impar, entonces:
n 1
Me = Dato [ posición ( )]
2
Ejemplo:
Sean los datos 3,4,4,5,6,7,,8,8,9,9,10. (n =11)
Me = Dato (6) = 7
Si n es par, entonces:
n n2
Dato [ posición ( 2 )] Dato [ posición ( 2 )]
Me =
2
O sea: el promedio de los dos datos centrales.
17
LA MODA:
De una serie de datos es: el número que ocurre con mayor frecuencia, el que más se repite
(datos no agrupados). Basta observar el número que más se repite.
Para datos agrupados, la moda esta en la mayor concentración de datos (mayor frecuencia),
la clase con mayor frecuencia es la clase modal. La moda si existe puede ser no única y se
denota por Mo, se define como:
Mo = Lir +
1 . C ; donde
1 2
Lir: Limite interior real del intervalo Modal.
1: Mayor frecuencia menos la inmediata anterior
2: Mayor frecuencia menos la inmediata posterior
C: Amplitud de Clases
Formas de la Distribución:
-
Muchas distribuciones de variables continuas se pueden representar de manera grafica
mediante una curva en forma de campana.
-
Se dice que una distribución es simétrica, si se puede doblar a lo largo de un eje
vertical de modo que los lados coincidan, en este caso la x, Me y Mo coinciden, en el
punto de simetría.
Mo = Me = x
Mo < M e < x
18
-
Se dice que “Asimétrica Negativa” o “Sesgada a la izquierda, si x < Me < Mo.
x <Me<Mo
1.4.2. MEDIDAS DE POSICIÓN:
Son medidas de posición, ya que, por debajo de ellas se ubica un determinado tanto por
ciento.
Cuartiles
Dividen en cuatro partes iguales a la información y se representa por Qi.
Deciles
Dividen en diez partes iguales a la información y se representan por Di.
Percentiles
Dividen en cien partes iguales a la información y se representa por Pi.
La fórmula para los Cuartiles, Deciles y Percentiles para datos agrupados son:
n
i 4 F
Qi Lir c :; ( i 1, 2, 3, 4)
f
n
i F
Di Lir 10 c :; ( i 1, 2, 3.......10)
f
n
i 100 F
Pi Lir c; ( i 1, 2, 3..........100)
f
Donde:
19
Para obtener los Cuartiles, Deciles, Percentiles, identificamos la clase que contiene a la
medida buscada, la cual será la primera clase donde la frecuencia acumulada es mayor o
igual a: i (n/4) (para cuartiles) o i (n/10) (para decciles) o i (n/100) (para percentiles).
Para datos no agrupados calcularemos solamente los cuartiles, los cuales se hallan
semejantes al caso de la mediana.
Los datos se ordenan de menor a mayor.
SI n ES IMPAR
SI n ES PAR
Si: n / 2 es par
Si: n / 2 es Impar
20
1.4.3. MEDIDAS DE VARIABILIDAD:
Son medidas que expresan variabilidad o dispersión alrededor de un valor promedio. Una
vez localizado el centro de distribución de un conjunto de datos nos vemos en la necesidad
de medir el grado en que se dispersan o diseminan los datos alrededor del valor promedio.
Una característica de casi todos los datos es que los valores no son todos iguales de ser así
el grado de dispersión alrededor del promedio sería cero. Para medir el grado de dispersión
lo hacemos a través de la varianza y desviación estándar.
Varianza
Expresa variabilidad al cuadrado de los datos alrededor del valor promedio se representa
por S2 (para una muestra) y como σ2 (para una población) y se obtiene:
S2
n x2i f i ( xf i ) 2
S2
( x x) 2
n( n 1) n 1
Desviación Estándar
Expresa variabilidad lineal de los datos alrededor del valor promedio. Es la raíz cuadrada
de la varianza.
Se representa por: S, para una muestra
y como: σ, para una población.
Se obtiene: tanto para datos agrupados como para no agrupados.
Coeficiente de Variación
s
CV =
x
21
1.4.4. MOMENTOS
Si: y1, y 2, ….. , yn son las observaciones de una variable, el i-ésimo momento de la variable
Y, se denota como: ŷ i y se define como:
n
y
i
j
j 1
ŷ i = (y1i + y2i + y3i + ….+ yni ) / n =
n
Cuando i = 1, se obtiene la media aritmética ( y ).
También se obtiene el i-ésimo momento con respecto a la media ( y ), el cual denotaremos:
Mi y se define:
i
n
y j y
Mi = j 1
n
Probemos esto:
n
y j y
M1 = j 1
= (Σyj - n y ) / n (por propiedad de suma: la suma de n
n
veces una constante es igual: a n por la constante). ( y es una constante).
Sustituyendo y, tenemos:
n
y
j 1
j
(Σyj - n ) / n = 0.
n
Si: y1, y 2,….. , yn ocurren con frecuencias: f1, f 2,….. , fn respectivamente, entonces los
momentos definidos antes, están dados por:
22
n i
f jy
j 1 j
ŷ i = (f1y1i + f2y2i + f3y3i + ….+ fnyni ) / n =
n
y : Media aritmética
n: total de datos.
3( x Me)
Sesgo =
S
Otra manera de medir la forma de la distribución es con la Curtosis, la cual nos dice que
tan puntiaguda es la grafica de una distribución, esta se presenta de tres tipos:
23
Platicúrtica Leptocúrtica Mesocúrtica
M4 M4
b= 4
= 2
S M 2
Otra manera de medir la Curtosis es usando cuartiles y percentiles. A este valor se le llama:
coeficiente percentil de curtosis (K), esta dado por:
Q
K= , donde Q = ½ (Q3 – Q1 ).
P90 P10
A Q se le conoce como: rango semi-intercuartil.
Ejemplo 3
LI LS f F X LIR LSR fX f X2
38.4 39.4 3 3 38.9 38.35 39.45 116.7 4539.63
39.5 40.5 2 5 40 39.45 40.55 80 3200
40.6 41.6 3 8 41.1 40.55 41.65 123.3 5067.63
41.7 42.7 3 11 42.2 41.65 42.75 126.6 5342.52
42.8 43.8 5 16 43.3 42.75 43.85 216.5 9374.45
43.9 44.9 17 33 44.4 43.85 44.95 754.8 33513.12
45 46 7 40 45.5 44.95 46.05 318.5 14491.75
1736.4 75529.1
24
Solución:
Medidas de posición
25
El 76% de los vehículos usados como taxis recorren menos de 44.782 Km. Por galón de
gasolina.
Medidas de variabilidad
Para la varianza se obtienen los productos de las dos últimas columnas de la tabla anterior y
sus respectivas sumas. Las unidades de la varianza son cuadradas.
-
S2 = [40 (75529.1) – (1736.4)2] / (40*39) = 3.8968 (Km por galón)2 .
La variabilidad cuadrática del kilometraje recorrido por los taxis alrededor de la
media es de 3.8968 (Km por galón)2.
-
La desviación estándar se obtiene extrayendo la raíz cuadrada a la varianza y sus
unidades son lineales, entonces:
S =1.974
La variabilidad lineal del kilometraje recorrido por los taxis es de 1.974 Km., alrededor de la
media.
-
Para el coeficiente de variación, simplemente se divide la desviación estándar
entre la media.
CV = 1.974/43.41 = 0.04547.
3(43.41 44.3)
Nota: El sesgo es igual a: = -1.353.
1.974
Ejercicios resueltos
Solución:
Se obtienen las siguientes medidas para datos no agrupados:
26
El promedio de ambos grupos es de 148 libras, sin embargo la variabilidad del grupo de
hombres es mayor que el de las mujeres, dado que su coeficiente de variación es mayor; lo
que nos indica, que el grupo que tiene un peso más estable es: el de mujeres.
Clientes Tiempo
promedio a) Complete la distribución de frecuencia
3 b) Calcular S e interprete
4 2.1 c) ¿Qué porcentaje de clientes realizo su transacción
6 bancaria entre 1.95 y 5.50 minutos
3
2 6.0
2
Solución:
a) Una técnica para encontrar las marcas de clases, después de haber encontrado la primera
es: sumarle la amplitud de clases (C) a la anterior, para obtener la siguiente. De aquí resulta
la siguiente ecuación:
6.0 2.1
6.0 – 2.1 = 3C C 1.3 , u = 0.1
3
Para completar las marcas de clase, sumamos C (si se baja) o restamos C (si se sube)
Con las marcas de clase y la amplitud se encuentran los límites reales. Para encontrar los
límites inferiores reales, se le resta c/2 a cada marca de clase y para encontrar los
límites superiores reales se suma C/2 a cada marca de clase.
27
LS = LI +C – U, entonces: LS – LI = C – U.
LSR = LS + U/2 y LIR = LI – U/2, por lo tanto se deduce lo siguiente:
la amplitud de las clases reales es: C
LIR LI LS LSR
U/2 C-U U/2
C
n x 2 f xf
2
b) S
2
n(n 1)
20333.77 71.92
S 1.99
20(19)
c) 1.95 minutos y 5.50 minutos son percentiles, debemos buscar su posición (%).
Vamos a suponer que la posición para 1.95 es: i y para 5.50 es: j.
in
100 f ; Pi = 1.95; Pj = 5.50.
Pi Li C
f
Sustituimos y despejamos i
0.2i 3
1.95 1.45 1.3 0.2i
1.95 1.45 4 3
4 1.3
i = 22.69
Sustituimos y despejamos j
0.2 j 16 5.50 5.35 2
5.50 5.35 1.3 0.2 j 16
2 1.3
j = 81.15
El porcentaje es: j – i = 81.15 – 22.69 = 58.46%
Pi Pj
1.95 5.50
58.46%
28
3. Se utilizan tres moldes diferentes en una máquina para fabricar botellas de vidrio.
La cantidad de disconformidad o defectos en 1000 botellas producidas por un
molde interesa al departamento de control de calidad como una medida del
rendimiento del proceso. Se seleccionan al azar cinco lotes de 1000 botellas de la
producción de cada molde (lo cual es posible, pues los números de cada molde se
encuentran marcados en el fondo de cada botella) y los datos fueron:
Molde
1: 8 4 3 6 4
2: 5 2 3 6 4
3: 12 10 8 11 9
a) ¿Qué número de molde es relativamente más variable y cual es más consistente.
Solución:
a) molde x s CV
1: 5 2 40
2: 4 1.581 39.53
3: 10 1.581 15.81%
Respuesta: El molde “1” es el más variable, porque el CV es el mayor
El molde “3” es el más consistente, porque el CV es el menor
204 228 252 300 224 444 624 720 816 912
1176 1296 1392 1488 1512 2520 2856 3192 3528 3710
Calcule e interprete Q1, Q2 , Q3
Solución:
n es par
912 1176
Q2 = 1044
2
El 50% del material aislante eléctrico dio un tiempo de falla menor o igual a 1044 horas y el
otro 50% mayor.
29
224 444
El Q1 = {Dato [posición (n /4)] + Dato [posición ((n +4)/4)]} / 2 = 384
2
El 25% del material aislante eléctrico dio un tiempo de falla menor o igual a 384 horas y el
otro 75% mayor.
1512 2520
= 2016
2
El 75% del material aislante eléctrico dio un tiempo de falla menor o igual a 2016 horas y el
otro 25% mayor.
Usaremos el paquete de Microsoft Excel 2003, dado que es bien accesible y de fácil
manejo.
Excel incluye muchas otras funciones estadísticas, financieras y de ingeniería. Algunas de las
funciones estadísticas están integradas y otras están disponibles después de instalar las
Herramientas para análisis.
Las Herramientas para análisis incluyen las herramientas que se describen a continuación.
Para tener acceso a ellas, haga clic en Análisis de datos en el menú Herramientas. Si el
comando Análisis de datos no está disponible, deberá cargar el programa desde la página
del menú Herramientas, haciendo clic en: Complementos. Luego en la página de
complementos, aparecerá una línea con el nombre: Herramientas para análisis, con el
ratón hace un clic en el cuadrito de la izquierda y aparecerá un Check (√), luego se hace clic
en aceptar y de esta forma el comando Análisis de datos ya estará disponible. Veremos
un ejemplo.
30
Ejemplo
A B C D
1 69
2 57
3 68
4 73
5 45
6 39
7 47
8 52
9 62
10 64
11 68
12 48
13 87
14 62
15 65
16 74
17 38
18 63
19 45
20 76
21 64
22 53
23 62
24 64
25 55
26 82
27 90
28 65
29 54
30 66
31
31 85
32 43
33 48
34 65
35 64
36 63
37 56
38 75
38 62
40 72
41 57
4. Los datos se introducen en la celdita Rango de entrada, el cursor debe estar en dicha celda, luego
en la página de datos, se ubica el cursor en el primero y apretando el ratón en la tecla izquierda, se
arrastra hasta el último dato, de esa manera los datos quedan introducidos en dicha celdita. En la
misma ventana de Estadística Descriptiva, hacemos un check, en el cuadrito a la izquierda de:
Resumen de estadísticas, luego en aceptar. Aparecerá en una hoja de salida, la siguiente Tabla, la
cual nos proporciona las siguientes medidas:
Columna1
Media 62.12195122
Error típico 1.958469762
Mediana 63
Moda 62
Desviación estándar 12.5403252
Varianza de la muestra 157.2597561
Curtosis -0.162306794
Coeficiente de asimetría 0.144032551
Rango 52
Mínimo 38
Máximo 90
Suma 2547
Cuenta 41
32
EJERCICIOS
X f
1.48 4
1
2
14
5.48 11
9
7
2
a) Completar la tabla de distribución de frecuencia
b) Hallar Mo, Q1, Me, S. (Interprete cada una)
c) Encuentre el porcentaje de detallistas que pagan entre 1.92 y 5.25 por
almacenamiento.
33
a) agrúpense estos datos en cinco clases.
b) que porcentaje de estos materiales tiene un tiempo de ignición entre
2.6 y 7.9 segundos.
8. Una entrega reciente de pernos por parte de un nuevo proveedor fue enviada
a un laboratorio para determinar la fuerza necesaria para romper cada uno de
los pernos. A continuación se dan los resultados en miles de libras-fuerza.
# de accidentes f
0 27
1 12
2 6
3 6
4 3
5 3
6 2
7 1
Utilizando expresiones correspondientes a estos datos, hallar:
a) Moda, mediana, Media, desviación estándar. (Interprete)
10. Una compañía de computadoras recopilo datos con respecto al tiempo (en minutos) que
requerían cada uno de sus 40 vendedores para realizar una venta, la siguiente tabla
representa la distribución del tiempo requerido por vendedor:
Clases f fr
1 10 0.075
11 20 1
21 30 4
31 40
41 50 2
51 60 0.395
61 60 0.235
71 80 5
34
a) proporcione los datos faltantes
b) interprete la cuarta clase con porciento de frecuencia acumulada
c) interprete la séptima clase con frecuencia absoluta
d) analice la forma de la distribución
Clases f
9700 9899 3
9900 10099 8
10100 10299 2
10300 10499 0
10500 10699 2
a) ¿que nivel de producción excedió el 75% de sus productos durante ese mes?
b) ¿que nivel de producción excedió el 90% de sus productos durante ese mes?
c) analice la forma de la distribución.
12. Las que siguen son las edades de 20 personas designadas como el cuerpo de un
jurado por una corte:
48, 58, 33, 42, 57, 32, 52, 25, 46, 60, 61, 49, 38, 53, 30, 47, 52, 63, 41 y 34.
Mediante las expresiones correspondientes , hallar:
a) Media, mediana, Q1, Q3
b) Desviación estándar. (Interprete)
12 16 11 10 14 3 11 17 9 18 16 4 7 14 15 16 5 6 7 7
a) Hallar: media, moda, mediana
b) ¿Cuánto tiempo máximo, se debe suponer que el 75% de los alumnos debe
esperar para obtener su libro de consulta?
14. Los siguientes son los precios de cierre de dos almacenes en cinco viernes
consecutivos:
35
15. Los siguientes datos representan el número de horas que dos tipos diferentes de
calculadoras científicas de bolsillo operan antes de que requiera recargarlas.
Tipo A: 5.6 6.3 4.6 6.3 5.0 6.2 5.8 5.1 5.5
Tipo B: 4.8 4.3 4.2 4.0 4.9 4.5 5.2 4.5 3.8
¿Qué tipo de calculadora es relativamente más consistente?
16. En sus recorridos, el autobús A transporta a 15, 24, 19, 12, 20 pasajeros y el
autobús B transporta a 18, 21, 16, 14 y 16 pasajeros.
17. Una empresa agrícola vende tres categorías de semillas que se diferencian entre
si, de acuerdo con el desarrollo de germinación. El laboratorio de pruebas de
semillas del Estado tiene una muestra de cada categoría y los resultados de las
pruebas acerca del número de semillas que germinan, de 100, son:
Regular 88 91 92 89 79
Extra 87 92 88 90 92
Súper 90 89 79 93 83
Basándose en la dispersión relativa, ¿tiene sentido la clasificación de semillas que
hace la empresa?
18. En una empresa los empleados se clasifican en tres categorías como lo muestra
la tabla:
Especialistas 5 200
Técnicos 40 120
Administrativos 10 100
En la discusión para fijar los salarios de 1999 han hecho tres propuestas:
¿Cuál de las tres alternativas tiene mayor efecto para reducir la dispersión relativa inicial de
los salarios para el conjunto de la empresa?
36
19. A cuatro pozos que abastecen de agua potable a la ciudad de Managua se les
midió la cantidad de Nitrato (NO3), en miligramos por litro (mg/L), los
resultados en días diferentes fueron los siguientes:
20. Para los datos de los ejercicios propuestos 7, 8, 12 y 13, obtener el Resumen de
Estadísticas con el paquete Microsoft Excel.
37