Sunteți pe pagina 1din 18

Capı́tulo 1

Estadı́stica descriptiva

1.1. Qué estudia la estadı́stica?


Aproximación a una definición. La estadı́stica trata del diseño de experimentos o encues-
tas mediante muestras, para obtener una cantidad determinada de información a un costo
mı́nimo, y del uso de esta información para hacer inferencias con respecto a una población.
Otra posible definición: Ciencia que crea, desarrolla y aplica técnicas de modo que pueda
evaluarse la incertidumbre de inferencias inductivas.
La estadı́stica ayuda al investigador a contestar preguntas como:

¿Qué técnicas uso para recolectar datos?

¿Cómo registro y presento mis datos?

¿Qué modelos uso para analizar mis datos?

¿Cómo pruebo determinada hipótesis?

¿Cómo diseño un experimento de tal forma que los datos obtenidos sean susceptibles
de analizar con métodos estadı́sticos?

1.2. Escalas de medición


Medir es asignar números o atributos a individuos o cosas de acuerdo con reglas previamente
establecidas. Existen básicamente cuatro escalas de medidas: nominal, ordinal, intervalo y
razón.

1
2 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

1.2.1. Escala Nominal


Es el nivel más bajo de medición y se utiliza para clasificar, etiquetar o nominar a los
individuos u objetos por medio de atributos que pueden ser nombres o números. Cuando se
asignan números estos no son susceptibles de operaciones matemáticas puesto que el objetivo
es mostrar un código que indique diferencias. Esta escala establece una relación equivalencias
entre objetos o individuos con igual caracterı́stica.

Ejemplo 1 a. El carácter de sexo puede clasificarse en hembras y varones y puede asignarse


el número uno (1) para hembras y el (2) para varones.

b. El estado civil, en el cual los individuos pueden clasificarse en solteros, casados, viudos y
separados; también puede asignarse a los cuatro estados los números 1, 2, 3 y 4.

En esta escala se pueden hacer algunas operaciones estadı́sticas como sacar frecuencias, por-
centajes, modas, y también aplicar algunas pruebas de hipótesis como la chi cuadrado (χ2 )
en el caso de tablas de contingencia.

1.2.2. Escala Ordinal


En esta escala se asignan números, que además de establecer relación de equivalencia, poseen
una relación de orden (menor que o mayor que) de manera que se asignan números más
grandes a los elementos que posean más de la caracterı́stica estudiada. Estos números no
son susceptibles de operaciones matemáticas ya que solo permiten diferenciación y el orde-
namiento de las categorı́as de la variable.

Ejemplo 2 a. El nivel económico de las personas puede medirse, con los atributos alto,
medio, bajo y pobre con los números 4, 3, 2, y 1 de tal forma que se puede establecer la
relación de orden 4 > 3 > 2 > 1.

b. el escalafón de los docentes universitarios los cuales poseen las categorı́as auxiliar, asis-
tente, asociado y titular que también podrı́an señalarse con los números 1, 2, 3 ,4 re-
spectivamente o también usar los números 2, 4, 6 y 8 sin que pierda sentido o calidad la
clasificación.

Para analizar este tipo de datos la medida estadı́stica de tendencia central más apropiada es
la mediana, y se pueden aplicar todos los métodos estadı́sticos no paramétricos.

1.2.3. Escala de Intervalo


La escala de intervalo utiliza números que además de clasificar y ordenar agrega la posibilidad
de interpretar la diferencia entre dos medidas, mediante el ordenamiento de intervalos iguales.
1.3. TIPOS DE VARIABLES. 3

En esta escala es arbitraria tanto la unidad de medida como el punto cero da la escala. Su
propiedad más importante es que distancias numéricamente iguales representan distancias
empı́ricamente iguales (lo cual no necesariamente ocurre en la escala ordinal, donde interesa
el orden más que la distancia).

Ejemplo 3 La temperatura en grados centı́grados es un ejemplo tı́pico de la escala de in-


tervalo. La relación que podemos establecer entre dos intervalos es independiente de la unidad
de medida usada y del punto cero (o sea, la unidad de medida y el cero son arbitrarios). Esto
se advierte bien cuando comparamos dos escalas distintas de temperatura ( Fahrenheit y Cel-
sius), pudiendo transformarse una en otra mediante fórmulas de conversión a pesar de tener
distintas unidades de medida y distinta ubicación del punto cero. Por lo tanto la relación de
las diferencias en una de las escalas es igual a la relación de las diferencias equivalentes en
la otra escala:
Celsius 0 10 30 100
Fahrenheit 32 50 86 112

Nótese que
30 − 10 86 − 50
=
10 − 0 50 − 32
pero las razones son distintas

1.2.4. Escala de Razón


Presenta todas las propiedades anteriores, más un punto cero verdadero en su origen. Estamos
en una escala de razón cuando se pueden establecer cuatro tipos de relaciones: equivalencia,
mayor o menor que, relación entre dos intervalos cualesquiera, y relación entre dos valores
cualesquiera de la escala. Sólo es arbitraria la unidad de medida, pero no el cero.

Ejemplo 4 La longitud y el peso son ejemplos tı́picos de medidas de razón.

1.3. Tipos de variables.


Cualquier caracterı́stica que cambie (o varı́e) de un individuo a otro es una variable.Las
variables pueden ser cualitativas o cuantitativas

1.3.1. Variables Cualitativas


Aquellas en las que no es posible hacer mediciones sino que sus valores corresponden a clases
o categorı́as. Ejemplo: Sexo, estado civil, el color de los ojos, tipo documento (publico o
privado), el estrato de una familia, etc.
4 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

1.3.2. Variables Cuantitativas


Son las que se pueden hacer corresponder a valores numéricos. Ejemplo: Peso, longitud, tem-
peratura, ingreso mensual, el gasto promedio mensual de una familia, el número de kilovatios
de energı́a consumido en una fabrica, el ı́ndice de pobreza o desempleo de un municipio, el
número de hijos por familia.
Las variables cuantitativas se clasifican en: continuas y discretas.

Continuas

Son las que pueden tomar cualquier valor dentro de un intervalo numérico, son ejemplos de
variables continuas el tiempo, peso, longitud, temperatura, Humedad relativa entre otras.

Discretas

Son las que pueden tomar un número finito o infinito contable de valores.

1.4. Presentación de datos


Existen múltiples formas de representar datos. El tipo de gráfico a usar depende de la nat-
uraleza (Cualitativa o cuantitativa) de la variable medida. Para variables cualitativas se los
más populares son el diagrama de barras y el de sectores; para datos cuantitativos se usan
los histogramas, Box Plot , diagramas de tallos y hojas, entre otros.

1.4.1. Presentación de datos cualitativos


Diagrama de sectores

Es un gráfico que se basa en una proporcionalidad entre la frecuencia y el ángulo central de


una circunferencia, de tal manera que a la frecuencia total le corresponde el ángulo central
de 360◦ . Para determinar el ángulo que corresponde a cada categorı́a se aplica la siguiente
fórmula
fi × 360
θi = P
fi
donde fi es la frecuencia de la i−ésima categorı́a.

Ejemplo 5 La siguiente tabla muestra los resultados de un sondeo a cerca de la preferencia


de algunos clientes con respecto al sabor del yogur.
1.4. PRESENTACIÓN DE DATOS 5

Sabor No. Personas


Fresa 210
Melocotón 80
Pasas 120

Representar los datos en un diagrama de sectores.

P
Solución Las frecuencias son: f1 = 210, f2 = 80 y f3 = 120 y fi = 410. Los ángulos
correspondientes son entonces:

Sabor Ángulo en grados (θi )


210×360
Fresa 410
= 184,39
80×360
Melocotón 410
= 70,24
120×360
Pasas 410
= 105,36

Una vez se tienen los ángulos se procede a dividir el circulo según estos, como se muestra a
continuación
Fresa

51.21 %

19.51 %
Melocotón 29.28 %

Pasas

Distribución de preferencias
de los clientes según el sabor

Figura 1.1: Diagrama de sectores


6 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

1.4.2. Presentación de datos cuantitativos


Distribuciones de frecuencia
La distribución de frecuencia es una tabla que divide un conjunto de datos en un número
de clases o categorı́as apropiadas, mostrando también el número de elementos de la case. La
tabla sacrifica parte de la información contenida en los datos; en lugar de conocer el valor
exacto del elemento, solo sabemos que pertenece a una clase determinada. Por otra parte,
este tipo de agrupamiento hace resaltar caracterı́sticas importantes de los datos.
El procedimiento para construir una tabla de frecuencia es el siguiente:

1. Se establece cierto numero de clases (intervalos) para agrupar los valores observados,
en general el número de clases que usemos depende del número de observaciones, pero
tiene muy poca utilidad usar menos de 5 o mas de 15. Para unificar criterios usaremos
la siguiente formula empı́rica para determinar el número de clases

K ≈ 1 + 3,3 log(n)

donde K es el número de clases, log es el logaritmo en base 10 y n es el numero de


datos

2. Se obtiene el rango o amplitud (R), que es la diferencia entre el valor mas grande y el
más pequeño.

3. Se define el ancho de clase dividiendo el rango entre el número de clases, A = R/K.

4. El limite inferior del primer intervalo (clase) es el menor de los datos, el limite su-
perior del primer intervalo se obtiene sumando al dato menor el ancho de clase. El
segundo intervalo se obtiene sumando el ancho de clase al limite superior del primero
y ası́ sucesivamente.

5. A cada clase se hace corresponder el numero de observaciones incluidas en ellas, el cual


constituye la frecuencia de clase.

Ejemplo 6 La demanda diaria, en kilogramos, de un producto industrial durante 30 dı́as


fue:

38 35 76 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
49 78 48 42 72 52
47 66 58 44 44 56
1.4. PRESENTACIÓN DE DATOS 7

Construir una tabla que contenga la distribución de frecuencia relativa y frecuencia relativa
acumulada.

Solución

1. Determinamos el número de clases mediante la formula

1 + 3,3 log(30) = 5,8745 ≈ 6 = K

2. Se obtiene el rango o amplitud R = 78 − 25 = 53

3. Se obtiene el ancho de clase dividiendo la amplitud entre el número de clases ası́:


A = 53/6 = 8,83

4. El limite inferior de la primera clase es el menor de los datos (25), para obtener el limite
superior de la primera clase, al dato menor se le suma el ancho de clase: 25 + 8,83 =
33,83 de esa forma la primera clase es [25, 33,83). El limite inferior de la segunda clase
es el superior de la primera y el superior es: 33,83 + 8,83 = 42,66 ası́ que la segunda
clase es [33,83, 42,66) con ese procedimiento se continua hasta agotar las seis clases. Se
debe tener en cuenta que el limite superior de la última clase es el mayor de los datos.

5. Una vez se tienen todas las clases se cuenta el número de datos que pertenecen a cada
intervalo. La tabla se muestra a continuación

Li Ls Frec Frec Acum Frec Rel Frec Rel Acum


25 33,83 4 4 0,133 0,13
33,83 42,66 4 8 0,133 0,27
42,66 51,49 7 15 0,233 0,50
51,49 60,32 7 22 0,233 0,73
60,32 69,15 5 27 0,166 0,90
69,15 78.00 3 30 0,100 1,00

Representación Gráfica
La forma más común de representar una distribución de frecuencias es el histograma. Para
construir el histograma de una distribución de frecuencia se colocan los intervalos de clase
en el eje horizontal de un plano cartesiano y sobre estos se dibujan rectángulos cuyas alturas
son las frecuencias de clase.
8 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

6
Frecuencia
4

2
25.00

33.83

42.66

51.49

60.32

69.15

78.00
Clases

Figura 1.2: Histograma de frecuencias

Diagramas de ramas y hojas.

Es una forma rápida de obtener una representación visual ilustrativa del conjunto de datos,
para construir un diagrama de tallo y hoja primero se debe seleccionar uno ó más dı́gitos
iniciales para los valores de tallo, el dı́gito o dı́gitos finales se convierten en hojas, luego se
hace una lista de valores de tallo en una columna vertical. Prosiguiendo a registrar la hoja
por cada observación junto al valor correspondiente de tallo. Este se usa para listas grandes y
es un método resumido de mostrar los datos, posee la desventaja que no proporciona sino los
datos, y no aparece por ningún lado información sobre frecuencias y demás datos importantes.
El diagrama de tallos y hojas para los datos de nuestro ejemplo se muestra a continuación.

2 5 8
3 2 3 5 6 8
4 2 4 4 7 8 8 9
5 1 2 3 6 7 8 8 9 6
6 1 3 6 7 9
7 2 6 8

Figura 1.3: Diagrama de tallos y hojas


1.4. PRESENTACIÓN DE DATOS 9

Diagrama de caja y bigotes.


Este tipo de gráfico también llamado box and whisker plot, facilita la lectura sobre localización,
variabilidad, simetrı́a y presencia de datos atı́picos (outliers según la literatura estadı́stica
inglesa). Este diagrama de consiste en una caja y guiones con una linea a través de la caja
que representa la mediana (segundo cuartil Q2 ). El extremo inferior de la caja es el primer
cuartil Q1 y el superior es el tercer cuartil Q3 .
El bigote superior se extiende desde el tercer cuartil hasta la observación más grande
que es menor o igual que Q3 + 1,5 × (Q3 − Q1 )1 . El bigote inferior se extiende hasta
la observación más pequeña que es mayor o igual que Q1 − 1,5 × (Q3 − Q1 ) 2 Las
observaciones que sean mayores que el cerco interno superior o menores que el cerco interno
inferior se clasifican como datos atı́picos y se marcan en el diagrama.
3
X El segundo cuartil es el dato que ocupa la posición
n+1
si n es impar
2
o el promedio de las observaciones que ocupan las posiciones
n n
y + 1 si n es par
2 2
.
X El primer cuartil es el segundo cuartil de la primera mitad de los datos después de
ordenarlos.
X El tercer cuartil es el segundo cuartil de la segunda mitad de los datos
Para construir el diagrama de caja siga los siguientes pasos:

a. Dibujar y marcar un eje de medida vertical (eje de coordenadas).


b. Construir un rectángulo cuyo borde inferior se ubica en el cuartil inferior (Q 1 ) y cuyo
borde superior se ubica en el cuartil superior (Q3 ).
c. Dibujar un segmento de recta horizontal dentro de la caja justo en la mediana.
d. Prolongar una recta (el bigote) desde el extremo superior de la caja hasta la observación
más grande que es menor o igual que Q3 + 1,5 × (Q3 − Q1 ).
e. Prolongar una recta (el otro bigote) desde el extremo inferior de la caja hasta la observación
más pequeña que es mayor o igual que Q1 − 1,5 × (Q3 − Q1 )
1
Q3 + 1,5 × (Q3 − Q1 ) se conoce como cerco interno superior
2
Q1 − 1,5 × (Q3 − Q1 ) se conoce como cerco interno inferior
3
Es la mediana que veremos más adelante
10 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

f. Dibujar un ◦ para ubicar (e identificar) cada observación que queden fuera del alcance de
los bigotes.

Ejemplo 7 Los datos que se muestran en la siguiente tabla corresponden a el peso (en
kilogramos) de 25 niños al momento de nacer

2.536 2.505 2.652 2.573 2.382


2.443 2.617 2.556 2.489 2.415
2.434 2.491 2.345 2.350 2.536
2.577 2.464 2.571 2.550 2.437
2.472 2.580 2.436 2.200 2.851

Representar estos datos mediante un diagrama de caja.

Solución Lo primero que hay que hacer es ordenar los datos de menor a mayor, con el fin
de obtener los cuartiles. Los datos ordenados se muestran en la tabla 1.1.

1 2 3 4 5 6 7 8 9 10
2.200 2.345 2.350 2.382 2.415 2.434 2.436 2.437 2.443 2.464
11 12 13 14 15 16 17 18 19 20
2.472 2.489 2.491 2.505 2.536 2.536 2.550 2.556 2.571 2.573
21 22 23 24 25
2.577 2.580 2.617 2.652 2.851

Tabla 1.1: Datos del ejemplo 7 ordenados

El Segundo cuartil (Q2 ) Como n = 25 es impar entonces el segundo cuartil (la mediana)
es la observación que ocupa la posición

n+1 25 + 1
= = 13
2 2
es decir
Me = 2,491
1.5. MEDIDAS DESCRIPTIVAS. 11

Cuartil inferior El cuartil inferior es la mediana de la primera mitad de los datos (los que
están antes de Q2 ) que son 12 luego se calcula como el promedio de las observaciones
que ocupan las posiciones
12 12
=6y +1=7
2 2
2,434 + 2,436
Q1 = = 2,435
2
Cuartil superior El cuartil superior es la observación que está en la posición las mismas
posiciones 6 y 7 pero contando del final de los datos hacia atrás es decir el promedio
de las observaciones 19 y 20
2,571 + 2,573
Q3 = = 2,572
2

El bigote superior debe extenderse hasta la observación más grande que sea menor o igual
a
Q3 + 1,5 × (Q3 − Q1 ) = 2,572 + 1,5 × (2,572 − 2,435) = 2,777
es decir hasta la observación 24. La observación 25 queda por fuera de este lı́mite, por
eso debe marcarse en el diagrama con una ◦

El bigote inferior debe extenderse hasta la observación más pequeña que sea mayor o igual
a
Q1 − 1,5 × (Q3 − Q1 ) = 2,435 − 1,5 × (2,572 − 2,435) = 2,229
es decir hasta la observación 2. La observación 1 queda por fuera de este lı́mite, por
eso debe marcarse en el diagrama con una ◦. El boxplot se muestra en la figura 1.4

1.5. Medidas descriptivas.


1.5.1. Medidas de tendencia central
Media aritmética.
La media aritmética de un conjunto de n observaciones y1 , y2 , y3 · · · yn es igual a la suma de
las observaciones dividida entre n (el numero de datos). Se indica con y
n
P
yi
i=1 y1 + y 2 + y 3 + · · · + y n
y= = (1.1)
n n

Ejemplo 8 Considere las siguientes 15 mediciones


12 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

2.9–

2.8–
2.7–
2.6–
2.5–
2.4–
2.3–
2.2– ◦

Figura 1.4: Diagrama de caja y bigotes (boxplot) del ejemplo ejemplocuartiles

8 10 4 3 8
5 6 8 7 6
7 7 5 11 7
Calcular la media
Solución
8 + 5 + 7 + ··· + 8 + 6 + 7 102
y= = = 6,8
15 15

Media ponderada.
Útil cuando se deben promediar diferentes medias que provienen de muestras con diferente
número de observaciones, donde es conveniente usar ponderaciones que dependen del número
de observaciones, se calcula con la siguiente fórmula:
P
wi y
yw = P i (1.2)
wi
Ejemplo 9 Promediar las siguientes medias y 1 = 45, y 2 = 32, y 3 = 60, provenientes de
muestras de tamaño 25, 12 y 21 respectivamente.
3
P
Solución wi = 58,
i=1
25 × 45 + 32 × 12 + 21 × 60 2769
yw = = = 47,74
58 58
1.5. MEDIDAS DESCRIPTIVAS. 13

Mediana.

Como se definió en la sección 1.4.2, la mediana de un conjunto de valores y1 , y2 , y3 , · · · ,


yn es el valor que se ubica en el centro cuando las observaciones están colocadas en orden
de magnitud. Cuando el número es par la mediana se obtiene promediando los dos valores
centrales.

Ejemplo 10 Obtener la mediana de los siguientes valores 8, 3, 2, 4, 5, 6, 9.

Solución Ordenando se obtiene 2, 3, 4, 5, 6, 8, 9. La mediana es 5.

Ejemplo 11 Obtener la mediana de los siguientes valores 9, 2, 7, 11, 14, 6.

Solución Ordenando se obtiene 2, 6, 7, 9, 11, 14. Como el numero de observaciones es


par y las dos observaciones centrales son 7 y 9, la mediana es 7+9
2
= 16
2
= 8.

Moda.

Es el valor (si existe) que ocurre con mayor frecuencia. Si es un valor único se dice que la
distribución es unimodal, si tiene dos o mas valores con la misma frecuencia máxima, se dice
que la distribución es bimodal, trimodal, etc.

Ejemplo 12 Los tamaños de las camadas de una estación porcı́cola fueron los siguientes:
4, 5, 6, 8, 10, 9, 8, 8. Hallar la moda.

Solución 8 es la moda porque es el valor que se repite con mayor frecuencia. M o = 8.

La moda puede no existir cuando los valores se presentan todos con la misma frecuencia.
En una tabla de frecuencias resulta útil para propósitos descriptivos, indicar
la clase modal, que es la clase con mayor frecuencia. Para calcular la moda se
usa el punto medio de la clase modal .

1.5.2. Medidas de dispersion.


Las medidas de dispersion indican el grado de variabilidad entre las observaciones, las mas
comunes son la varianza, la amplitud o rango, la desviación estándar y el coeficiente de
variación.
14 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Amplitud.
Se obtiene como la diferencia entre el mayor y el menor de los valores del conjunto de obser-
vaciones, tiene la desventaja de dejarse influenciar por valores extremos. Resulta útil cuando
no se conoce la varianza de distribuciones normales, para estimar de manera aproximada la
desviación estándar.

Ejemplo 13 En el punto 2 del ejemplo 6 (página 6) se calculó el rango de los datos corre-
spondientes a la demanda diaria de un producto industrial.

Varianza.
La varianza (s2 ), de un conjunto de observaciones se define como la suma de cuadrados de las
desviaciones de las observaciones respecto a su media, dividida por el número de observaciones
menos uno. n
(yi − y)2
P

S 2 = i=1 (1.3)
n−1
una fórmula alternativa para calcular la varianza es
n
yi2 − ny 2
P
i=1
S2 = (1.4)
n−1

Desviación estándar.
Se define como la raı́z cuadrada de la varianza

S = S2 (1.5)

Ejemplo 14 Calcular la varianza y la desviación estándar del siguiente conjunto de datos.

4 7 3 6 5

Solución Para estos datos tenemos que n = 5 y y = 5.

Varianza
(4 − 5)2 + (7 − 5)2 + (3 − 5)2 + (6 − 5)2 + (5 − 5)2
s2 =
4
(−1)2 + 22 + (−2)2 + 12 + 02 1+4+4+1+0 10
= = = = 2,5
4 4 4
1.5. MEDIDAS DESCRIPTIVAS. 15

Desviación Estándar
p
S= 2,5 = 1,58114

Una forma práctica para calcular la varianza es por medio de una tabla como la siguiente

i yi yi − y (yi − y)2
1 4 −1 1
2 7 2 4
3 3 −2 4
4 6 1 1
5 5 0 0
Sumas 25 0 10

Ejemplo 15 Se ilustrará el uso de la formula alternativa (1.4) para calcular la varianza,


usaremos los datos del ejemplo 14.

Solución En este caso ny 2 = 5 × 52 = 5 × 25 = 125, calculamos los cuadrados de cada uno


de los datos y sumamos, como se muestra en la siguiente tabla:

i yi yi2
1 4 16
2 7 49
3 3 9
4 6 36
5 5 25
Sumas 25 135

5
yi2 = 135 por lo tanto
P
se tiene que
i=1

135 − 125 10
S2 = = = 2,5
4 4

que como se esperaba coincide con el resultado del ejemplo 14.


16 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Coeficiente de variación.
El coeficiente de variación (CV ) de un conjunto de datos se define como el cociente entre la
desviación estándar y la media.
S
CV = (1.6)
y
El coeficiente de variación es una medida de la dispersión relativa de un conjunto de datos.
Con frecuencia esta relación se indica en porcentajes. Resulta de gran utilidad para comparar
la variabilidad de diferentes conjuntos de datos.

Ejemplo 16 El coeficiente de variación de los datos del ejemplo 14 es

S 1,58114
CV = = = 0,3162 ≡ 31,62 %
y 5

1.6. Ejercicios.
1. La siguiente tabla muestra el número de artı́culos rechazados por control de calidad
discriminados según las causas de rechazo:

Causa de rechazo Número de artı́culos


Falla eléctrica 210
Falla mecánica 110
Mal acabado 80

Representar los datos en un diagrama de sectores y en un diagrama de barras.

2. Para el siguiente conjunto de datos

10.0 9.1 9.9 8.7 10.5 9.8 11.4 9.4


10.1 10.3 9.5 10.8 10.1 9.9 9.7 11.2

(a) Agrupe los datos en una tabla de frecuencias (Use 5 clases)


(b) represente los datos por medio de un histograma de frecuencias.
(c) Calcule la media, moda, mediana de los datos.
(d) Calcule la varianza, desviación estándar, el rango y CV
1.6. EJERCICIOS. 17

3. Para decidir acerca del número de mostradores de servicio que serán necesarios en las
tiendas que se construirán en el futuro, una cadena de supermercados querı́a obtener
información sobre el tiempo (en minutos) requerido para atender a los clientes. Para
obtener información acerca de la distribución de los tiempos de atención de los clientes,
se obtuvo una muestra de 60 clientes y se registró el tiempo empleado en atender a
cada uno de ellos, los datos se muestran a continuación.

3.6 1.0 0.3 0.8 0.4 0.6 0.4 0.8 1.1 1.8
1.9 1.4 1.1 1.7 2.3 2.8 1.3 1.0 2.2 0.3
2.1 1.8 0.5 1.4 1.8 2.5 0.8 0.9 1.6 1.1
0.3 1.6 1.2 0.2 4.5 1.1 1.3 0.7 1.9 0.6
0.8 1.1 0.6 1.3 0.9 0.4 1.1 3.1 5.2 0.7
0.2 1.8 1.1 3.1 0.7 1.2 1.2 1.7 0.5 0.6

(a) Construya una tabla de frecuencias relativas de los datos.


(b) Construya un histograma de frecuencias relativas de los datos.
(c) Construya un diagrama de tallos y hojas.
(d) Construya un diagrama de caja (BoxPlot)
(e) Calcule la media, la mediana, la moda (si existe)
(f) Calcule el rango, la varianza, la desviación estándar y el coeficiente de variación de
los datos.

4. Los siguientes datos son los numeros de torsiones requeridas para 12 barras de cierta
aleación:

33 24 39 48 26 35
38 54 23 34 29 37

(a) Calcular la media, la mediana y la moda.


(b) calcular la varianza, la desviación estándar, el rango, y el CV

5. Los siguientes datos son el número de minutos que en 15 dı́as laborales una persona
tiene que esperar el autobús que la llevará a su trabajo

10 1 13 9 5 9 2 10 3 8 6 17 2 10 15

(a) Calcular la media, la mediana y la moda.


18 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

(b) calcular la varianza, la desviación estándar, el rango, y el CV

6. Los siguientes datos son 12 lecturas de temperatura en varios puntos de un gran horno
(en grados Fahrenheit):

475 500 460 425 460 410 470 475 460 510 450 415

a) Calcular la media, la mediana y la moda.


b) calcular la varianza, la desviación estándar, el rango, y el CV

S-ar putea să vă placă și