Sunteți pe pagina 1din 28

Análisis de Datos

LII 2051
MÉTODOS GRÁFICOS
Presentación Gráfica de los Datos
La estadística descriptiva puede dividirse en dos grandes
áreas: métodos gráficos y métodos numéricos, los cuales
son técnicas para mostrar y resumir datos.
Métodos Gráficos.
Diagrama de puntos.

Es una gráfica muy útil para visualizar un conjunto


pequeño de datos. Ejemplo:
Se describe un experimento en el que el ingeniero agrega
un polímero de látex a un mortero de cemento portland,
para determinar los efectos del polímero sobre la
resistencia a la tensión (en kgf/cm2).
Presentación Gráfica de los Datos

Los datos obtenido de este experimento son

16.85, 16.40, 17.21, 16.35, 16.52, 17.04, 16.96, 17.15,


16.59, y 16.57
Presentación Gráfica de los Datos

La gráfica permite ver con rapidez y facilidad la ubicación o


tendencia central de los datos, así como su dispersión o
variabilidad.
Por ejemplo, nótese que la parte media de los datos está
muy próxima a 16.8, y que los valores de resistencia a la
tensión caen dentro del intervalo definido por los valores
16.3 y 17.2 kgf/cm2.
Presentación Gráfica de los Datos

A menudo, los diagramas de puntos son útiles al comparar


dos o más conjuntos de datos. Por ejemplo, los siguientes
son diez datos de resistencia a la tensión de un mortero
portland sin modificar:

17.5, 17.63, 18.25, 18.00, 17.86, 17.75, 18.22, 17.9, 17.96


y 18.15
Presentación Gráfica de los Datos
Presentación Gráfica de los Datos
Nótese que el diagrama de puntos revela de inmediato que
el mortero modificado parece tener una menor resistencia
a la tensión, pero que la variabilidad inherente a ambos
grupos de medición es casi la misma.

Si el número de observaciones es pequeño, a menudo es


difícil identificar algún patrón de variación específico; sin
embargo, con frecuencia el diagrama de puntos es útil y
puede proporcionar información sobre características poco
usuales en los datos. Cuando el número de observaciones
es moderadamente grande, pueden ser más útiles otros
tipos de gráficas.
Presentación Gráfica de los Datos
Diagrama de tallo y hoja.
Es una buena manera de obtener una presentación visual
informativa del conjunto de datos x1, x2, …, xn donde cada
xi está formado al menos por dos dígitos. Para construir un
diagrama de este tipo, los números xi se dividen en dos
partes: un tallo, formada por uno o más de los dígitos
principales, y una hoja, la cual contiene el resto de los
dígitos.

Ejemplo:
Considere los datos de la siguiente tabla:
Presentación Gráfica de los Datos
Presentación Gráfica de los Datos

Estos datos representan la resistencia a la tensión, en


libras por pulgada cuadrada (psi), de 80 muestras de una
nueva aleación de aluminio y litio, que está siendo
evaluada como posible material para la fabricación de
elementos estructurales de aeronaves. Los datos fueron
registrados conforme se realizaba la prueba, y en este
formato no conlleva mucha información con respecto a la
resistencia a la tensión.

¿Qué porcentaje de las muestras fallaron debajo de los


120 psi?
Presentación Gráfica de los Datos

En general, debe escogerse un número relativamente


pequeño de tallos en comparación con el número de
observaciones. Lo usual es seleccionar entre 5 y 20 tallos.

Una vez elegido el conjunto de tallos, éstos se enlistan en


la parte izquierda del diagrama. Al lado de cada tallo, se
ponen todas las hojas que corresponden a los valores
observados, ordenados tal como se encuentran en el
conjunto de datos.
Presentación Gráfica de los Datos
Presentación Gráfica de los Datos

Ejercicio:
En las pruebas médicas de un instituto, se toma la altura
de los cuarenta alumnos de una clase. El médico está
interesado en representar gráficamente la variable y opta
por el diagrama de tallo y hoja.
Presentación Gráfica de los Datos

Distribución de frecuencias para Datos Nominales y


Jerarquizados.
Quizá las distribuciones de frecuencias más fáciles sean
las que se utilizan para datos nominales y jerarquizados.
Los datos nominales se obtienen cuando se definen las
categorías y se cuenta el número de observaciones que
queda en cada una.
Los datos jerarquizados constan de valores relativos
asignados para denotar orden (primero, segundo, tercero,
cuarto y así sucesivamente). Esta simplicidad radica en el
hecho de que las clases se ponen de manifiesto con más
datos nominales, de modo que los cálculos son mínimos
Presentación Gráfica de los Datos

Por ejemplo, considere los datos nominales de la siguiente


tabla que representan las ventas de refrescos ordenadas
en una tabla de frecuencias.

Las categorías son los diversos sabores de los refrescos.


Dicha información se presentará mediante una gráfica de
líneas o barras, lo que significa que las categorías no se
tocan o son nominales.
Presentación Gráfica de los Datos
Presentación Gráfica de los Datos

Diagramas circulares.
• El diagrama circular (también llamado diagrama de
sectores o diagrama de pastel) sirve para
representar variables cualitativas o discretas. Se utiliza
para representar la proporción de elementos de cada
uno de los valores de la variable.
• Consiste en partir el círculo en porciones proporcionales.
Entiéndase como porción la parte del círculo que
representa a cada valor que toma la variable.
• Ejemplo:
Presentación Gráfica de los Datos
Ventas relativas
1%

4%
5%

10%

20% 60%
Presentación Gráfica de los Datos

Distribución de frecuencias e histograma para datos


cuantitativos.

La distribución de frecuencias ofrece un resumen más


compacto de los datos que el diagrama de tallo y hoja.

Para construir una distribución de frecuencias:


1. Determinara el rango de los datos.
Rango = Amplitud de datos = R = Xmáx – Xmin

2. Calcular el número de clases, resulta satisfactorio usar


entre 5 y 20 clases.
Presentación Gráfica de los Datos

a) Regla de Sturges

Número de clases = m ≈ 1 + 3.3 log n


donde n representa el número de datos.

b) m≈ 𝑛

3. Determinar la amplitud de clase.


c = Rango/número de clases = R / m
Presentación Gráfica de los Datos

Otra regla para definir el número de clases:

Cantidad de datos (m)


Menos de 50 5–7
50 -100 6 – 10
100 -250 7 – 12
Más de 250 10 – 20
Presentación Gráfica de los Datos

Ejemplo:
Presentación Gráfica de los Datos

Diagrama de caja y bigote.


El diagrama de tallo y hoja y el histograma proporcionan
una impresión visual general del conjunto de datos,
mientras que 𝑥ҧ o s brindan información sobre una sola
característica de los datos.
El diagrama de caja es una presentación visual que
describe al mismo tiempo varias características
importantes de un conjunto de datos, tales como el centro,
la dispersión, la desviación de la simetría y la identificación
de observaciones que se alejan de manera poco usual del
resto de los datos.
Presentación Gráfica de los Datos

El diagrama presenta los tres cuartiles, y los valores


mínimo y máximo de los datos sobre un rectángulo,
alineado horizontal o verticalmente. El rectángulo delimita
el rango intercuartílico con la arista izquierda o inferior
ubicada en el primer cuartil, Q1, y la arista derecha (o
superior) en el tercer cuartil, Q3. Se dibuja una línea a
través del rectángulo en la posición que corresponde al
segundo cuartil (que es igual al percentil 50 o a la
mediana), Q2 = Me.

De cualquier arista del rectángulo se extiende una línea, o


bigote, que va hacia los valores extremos.
Presentación Gráfica de los Datos
Presentación Gráfica de los Datos
El diagrama indica que las distribuciones de la resistencia
es bastante simétrica con respecto al valor central, ya que
los bigotes izquierdo y derecho, así como la longitud de los
rectángulos izquierdo y derecho de la mediana, son casi
los mismos.

Los diagramas de caja son muy útiles al hacer


comparaciones gráficas entre conjuntos de datos, ya que
tienen un gran impacto visual y son fáciles de comprender.
Por ejemplo, en la siguiente figura los diagramas de caja
comparativos para un índice de calidad de fabricación de
dispositivos semiconductores en tres plantas distintas.
Presentación Gráfica de los Datos
Presentación Gráfica de los Datos

El examen de este diagrama revela que existe mucha


variabilidad en la planta 2, y que es necesario que las
plantas 2 y 3 incrementen sus índices de calidad.

S-ar putea să vă placă și