Sunteți pe pagina 1din 29

Tema 2

Distribuciones de frecuencias y
representaciones grficas
1. Recogida y organizacin de datos.
2. Datos individuales y agrupados.
3. Distribuciones de frecuencias: frecuencias absolutas,
relativas.
4. Funcin de distribucin: frecuencias acumuladas.
5. Representaciones grficas: diagrama de dispersin,
diagrama de barras, histograma.
6. Aplicaciones a la Ingeniera Informtica.

Tema 2: Representacin

.
Frecuencias y distribuciones de frecuencias
Definicin. Una distribucin de frecuencias es
una lista o una tabla . . .
conteniendo agrupaciones de clases (categoras o intervalos
donde toman valor los datos) . . .
y las correspondientes frecuencias mediante las cuales los
datos toman valor dentro de cada clase o categora.
Frecuencias:
frecuencia absoluta es el (nmero de veces que el valor
aparece en la muestra).
frecuencia relativa es el (proporcin de veces que el valor
aparece en la muestra).

Tema 1: Introduccin

Por qu usar distribuciones de frecuencias?


Una distribucin de frecuencias es una forma
de resumir los
datos.
La distribucin condensa los datos primarios
en una forma
ms til . . .
y permite una interpretacin visual rpida de
los datos.

Tema 1: Introduccin

Agrupaciones por clases: datos categricos y discretos


Frec. Frec.
Frec. Frec. Absol. Relat.
Clase, xi Absol., ni Relat., fi Acumul., Ni Acumul., Fi
x1 n1 f1 = n1
n N1 = n1 F1 = f1
x2 n2 f2 = n2
n N2 = N1 + n2 F2 = F1 + f2
...
...
...
...
...
xk nk fk = nk
n Nk = n Fk = 1
Total n 1 vaco vaco
Nota:
ni = nmero de xi en la muestra, fi = nmero de xi
n
Ni = Ni.1 + ni , Fi = Fi.1 + fi
0 fi , Fi 1
Fi y Ni no tienen sentido para variables categricas nominales

Tema 1: Introduccin

Agrupaciones por clases


Ejemplo 1: Los datos inferiores muestran el
grupo sanguneo al
que pertenecen los 40 individuos de una
muestra.
AB, A, B, O, A, A, A, B, O, AB,
B, O, B, B, B, A, A, A, AB, B,
O, A, A, A, AB, AB,O, B, B, AB,
O, B, O, O, A, A, O, B, AB, AB
Qu tipo de variable es grupo sanguneo?
Obtn la
distribucin de frecuencias de los datos.
Qu porcentaje de la gente de la muestra
pertenece al grupo
sanguneo A?
Qu porcentaje de la gente de la muestra
pertenece a un
grupo sanguneo diferente de O?

Tema 1: Introduccin

Agrupaciones por clases


Ejemplo 1 cont.:
Categrica, nominal con 4 clases diferentes. La
distribucin de
frecuencias es:
Frecuencia Frecuencia
Clase Absoluta Relativa
A 12 0.300
B 11 0.275
AB 8 0.200
O 9 0.225
Total 40 1
30%
100% . 22.5% = 77.5%

Tema 1: Introduccin

Agrupaciones por clases


Ejemplo 2: La tabla inferior muestra diferentes niveles de
satisfaccin (I=insatisfecho, M=muy, S=satisfecho) en relacin a
901 empleados.
Frecuencia
Clase Absoluta
MI 62
I 108
S 319
MS 412
Total 901
Qu tipo de variable se est estudiando? Obtn la
distribucin de frecuencias de los datos.
Qu porcentaje de la gente muestreada est satisfecha?
Cuntos individuos estn insatisfechos o peor? En %?
Cuntos individuos estn al menos satisfechos? En %?

Tema 1: Introduccin

Ejemplo 2 cont.:
Categrica, ordinal con 4 clases diferentes. La distribucin de
frecuencias es:
Frecuencia Frecuencia
Frecuencia Frecuencia Absoluta Relativa
Clase Absoluta Relativa Acumulada Acumulada
MI 62 0.07 62 0.07
I 108 0.12 170 0.19
S 319 0.35 489 0.54
MS 412 0.46 901 1
Total 901 1
35%
170, 19%
319 + 412 = 731 901 . 170 = 731, 35% + 46% = 81%
100% . 19% = 81%

Tema 1: Introduccin

Agrupaciones por clases


Agrupaciones por clases
Ejemplo 3: De entre las plantas que han sido tratadas con un
nuevo pesticida, se seleccionaron 50 para evaluar el
comportamiento del nuevo pesticida. En cada una de las plantas
muestreadas se cont el nmero de hojas atacadas por un hongo.
El resultado se muestra a continuacin.
Frecuencia
xi Absoluta
06
1 10
2 12
38
45
54
63
81
10 1
Total 50

Tema 1: Introduccin

Agrupaciones por clases


Ejemplo 3 cont.:
Qu puedes decir acerca de la variable en estudio? Obtn su
distribucin de frecuencias.
Qu porcentaje de las plantas muestreadas tuvo slo 3 hojas
atacadas?
Cuntas plantas muestreadas tuvieron no ms de 3 hojas
atacadas?
Cuntas plantas muestreadas tuvieron al menos 6 hojas
atacadas?
Qu porcentaje de las plantas muestreadas tuvo entre 3 y 5
hojas atacadas?
Qu porcentaje de las plantas muestreadas tuvo al menos 8
hojas atacadas?
Qu porcentaje de las plantas muestreadas tuvo a lo sumo 2
hojas atacadas?
Tema 1: Introduccin

10

Agrupaciones por clases


Ejemplo 3 cont.:
Numrica, discreta con 9 valores diferentes. La
distribucin de
frecuencias es:
Frecuencia Frecuencia
Frecuencia Frecuencia Absoluta Relativa
xi Absoluta Relativa Acumulada Acumulada
0 6 0.12 6 0.12
1 10 0.20 16 0.32
2 12 0.24 28 0.56
3 8 0.16 36 0.72
4 5 0.10 41 0.82
5 4 0.08 45 0.90
6 3 0.06 48 0.96
8 1 0.02 49 0.98
10 1 0.02 50 1
Total 50 1

Tema 1: Introduccin

11

Agrupaciones por clases


Ejemplo 3 cont.:
16%
36
3 + 1 + 1 50 . 45 = 5
16% + 10% + 8% = 34% (8 + 5 + 4)/50 = 34%
2%+2% = 4% 100% . 96% = 4%
56%

Tema 1: Introduccin

12

Agrupaciones por clases que son intervalos: datos


continuos (y discretos)
Intervalo Marca de clase
[li.1, li ) xi = li+li.1
2 ni fi Ni Fi
[l0, l1) x1 n1 f1 N1 F1
[l1, l2) x2 n2 f2 N2 F2
...
...
...
...
...
...
[lk.1, lk ) xk nk fk n 1
Total n 1 vaco vaco
Nota:
Se incluye el extremo izquierdo, pero se excluye el extremo
derecho (convencin tpica).
Es posible aplicar la convencin en sentido opuesto - verifica
su definicin en el software.
til para tabular datos discretos si X toma muchos valores
diferentes.

Tema 1: Introduccin

13

Agrupaciones por clases que son intervalos:


datos
continuos (y discretos)
Muy frecuentemente los intervalos tomados
como clases
poseen la misma amplitud.
Determinar la amplitud a para cada intervalo
mediante
a=
nmero mayor - nmero menor
nmero de intervalos deseados
Cuntos intervalos? Aproximadamente entre
5 y 20. Ms
concretamente:
k.

n side
n es
peque.no.
Frmula
Sturges:
K @ 1+log2 (n) = 1+ 3.22 log10(n)
k . 1 + 3.22 log(n) si n es grande.
Los intervalos nunca se solapan.
Redondea la amplitud del intervalo para
obtener los extremos
de los intervalos deseados.
Tema 1: Introduccin

14

Agrupaciones por clases que son intervalos: datos


continuos (y discretos)
Ejemplo 4: Un fabricante de aislantes selecciona al azar 20 das de
invierno y anota la temperatura ms elevada del da (en grados
Fahrenheit)
24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Obtn la distribucin de frecuencias de los datos.
Se ordenan los datos primarios en orden ascendente: 12, 13,
17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Se obtiene el rango (valor mayor . valor menor): 58 . 12 = 46
Se selecciona el nmero de clases: es decir k = 5
Se calcula la amplitud de los intervalos: 10 (46/5
redondeo).
Se determinan los extremos: 10 pero menor que 20, 20 pero
menor que 30, etc.
Se cuentan las observaciones que corresponden a cada clase.

Tema 1: Introduccin

15

Agrupaciones por clases que son intervalos:


datos
continuos (y discretos)
Ejemplo 4 cont.:
Intervalo Marca de clase ni fi Ni Fi
[10, 20) 15 3 0.15 3 0.15
[20, 30) 25 6 0.30 9 0.45
[30, 40) 35 5 0.25 14 0.70
[40, 50) 45 4 0.20 18 0.90
[50, 60) 55 2 0.10 20 1
Total 20 1
En cuntos das la temperatura se
encontraba por debajo de
30oF? En %?
(3 + 6 = 9, que es el 45 %)
En cuntos das la temperatura se
encontraba en al menos
45oF? En %?
(2 + 445.40
50.40 = 4, que es el 20 %)
Tema 1: Introduccin

16

Representacion grafica de datos


Una vez obtenida la distribucion de frecuencias de los datos, se
pueden determinar las siguientes representaciones graficas:
Categorico Numerico

diagrama de sectores histograma


diagrama de barras polgono de frecuencias
diagrama de caja

Tema 2: Representacin

17

Graficos para datos cualitativos: diagrama de sectores


Ejemplo 1: La siguiente tabla de frecuencias corresponde a los
datos de grupos sanguneos obtenidos de una muestra de 40
individuos.
Frecuencia Frecuencia
Clase Absoluta Relativa
A 12 0.300
B 11 0.275
AB 8 0.200
O 9 0.225
Total 40 1

Tema 2: Representacin

18

Diagrama de sectores
Ejemplo 1 cont.:
_ Cada sector es una fraccion del total del crculo.
_ Los sectores estan etiquetados con los nombres de las clases.
_ Muchos programas ordenan las clases en orden alfabetico.
_ Aunque es vistoso, es mas complejo de leer que el diagrama
de barras.
_ Evitar los diagramas de sectores en 3D, ya que los sectores
traseros tienden a parecer menores que los sectores delanteros.

Tema 2: Representacin

19

Graficos para datos cualitativos: diagrama de barras


Ejemplo 2: La tabla inferior muestra diferentes niveles de
satisfaccion en relacion a 901 empleados.
Frecuencia Frecuencia
Frecuencia Frecuencia Absoluta Relativa
Clase Absoluta Relativa Acumulada Acumulada
MI 62 0.07 62 0.07
I 108 0.12 170 0.19
S 319 0.35 489 0.54
MS 412 0.46 901 1
Total 901 1

Tema 2: Representacin

20

Diagrama de barras
Ejemplo 2 cont.:
_ Las barras tienen la misma amplitud y son equidistantes, con
alturas correspondientes a las frecuencias (absolutas).
_ Existen huecos entre las barras.
_ Las barras estan etiquetadas con los nombres de las clases.
_ Muchos programas ordenan las clases en orden alfabetico.

Tema 2: Representacin

21

Diagrama de barras
_ Los

diagramas de barras pueden construirse tambien para


datos discretos si no existen demasiados valores diferentes.
_ Este es el diagrama de barras para el Ejemplo 3 del Tema 1,
donde se consideraba el numero de hojas infectadas por un
hongo en una muestra de 50 plantas.
0 1 2 3 4 5 6 7 8 9 10
FRECUENCIAS
0 2 4 6 8 10 12

Tema 2: Representacin

22

Cartograma

Tema 2: Representacin

23

Diagrama de tallos y hojas


(Stem-and-Leaf Diagram)

5,03
6,02
6,18
6,37
6,48
6,55
7,02
7,07
7,2
7,25
7,32
7,37
7,5

Distribucin de frecuencias

8,02
8,05
8,2
8,24
8,32
8,37

Histograma

8,51
9,02
9,07
9,24
9,32
9,37
10,02

Se separan los ltimos dgitos.

10,07
10,32
10,37
11,02

5.03 7.32 9.02 11.07 13.32 15.07 16.50 18.32 20.07 22.38 6.02 7.37 9.07 11.32 13.37 15.20 17.02 18.37 20.20
6.18 7.50 9.24 11.37 13.50 15.32 17.07 18.50 20.32 6.37 8.02 9.32 12.02 14.02 15.37 17.20 19.02 20.37 6.48
8.05 9.37 12.07 14.07 15.50 17.32 19.07 20.50 6.55 8.20 10.02 12.32 14.20 16.02 17.37 19.20 21.02 7.02 8.24
10.07 12.37 14.32 16.07 17.50 19.32 21.07 7.07 8.32 10.32 13.02 14.37 16.20 18.02 19.37 21.20 7.20 8.37
10.37 13.07 14.50 16.32 18.07 19.50 21.32 7.25 8.51 11.02 13.20 15.02 16.37 18.20 20.02 21.37

11,07
11,32
11,37
12,02
12,07
12,32
12,37
13,02
13,07
13,2
13,32
13,37
13,5
14,02
14,07
14,2
14,32
14,37
14,5
15,02
15,07
15,2
15,32
15,37
15,5
16,02
16,07
16,2
16,32
16,37
16,5
17,02
17,07
17,2
17,32
17,37
17,5
18,02
18,07
18,2
18,32
18,37
18,5
19,02
19,07
19,2
19,32
19,37
19,5
20,02
20,07
20,2
20,32
20,37
20,5
21,02
21,07
21,2
21,32

Tema 2: Representacin

21,37

24

22,38

Graficos para datos cuantitativos: histograma y polgono


de frecuencias
Ejemplo 4: La distribucion de frecuencias de la temperatura mas
alta del da (en grados oF) tomada en 20 das de invierno es como
sigue:
Intervalo Marca de clase ni fi Ni Fi
[10, 20) 15 3 0.15 3 0.15
[20, 30) 25 6 0.30 9 0.45
[30, 40) 35 5 0.25 14 0.70
[40, 50) 45 4 0.20 18 0.90
[50, 60) 15 2 0.10 20 1
Total 20 1

Tema 2: Representacin

25

Histograma y polgono de frecuencias


_ No

hay huecos entre las barras/cajas.


_ Amplitud de cajas amplitud de intervalos (identicos) y los
lmites de las clases se marcan en el eje horizontal.
_ Alturas de cajas frecuencias (aqu, absoluta).
_ Las areas de cajas son proporcionales a las frecuencias.

Tema 2: Representacin

26

Histogramas de area 1 (sobre una escala de densidad)


_ Amplitud de

cajas amplitud de intervalos (no


necesariamente identicos).
_ alturas de cajas = fi
lili1

_ areas

de cajas = fi

Tema 2: Representacin

27

Pirmide de poblacin

Tema 2: Representacin

28

Pictograma

Tema 2: Representacin

29

S-ar putea să vă placă și