Sunteți pe pagina 1din 11

Análisis Descriptivo De Los

Datos

Te invito a compartir estos conceptos:


¿Qué es dato estadístico?
¿Cómo se clasifican los datos estadísticos?
¿Qué es una distribución de frecuencias?

Toda investigación ya sea censo, encuesta,


registro continuo se obtienen datos o
informaciones, dando origen como se http://3.bp.blogspot.com/-
mostró en el tema anterior a dos tipos de eJ1PUScBytU/Vg6-
variables: cualitativas (atributo) y 3l5CIdI/AAAAAAAAFAw/zwi6CocpzvY/s160
cuantitativas (dentro de estas discretas y 0/Aplicacion%2Bde%2Bla%2Bestadistica%
continuas). 2Ben%2Bla%2Badministracion.jpg

Para que los datos sean útiles, necesitamos organizar nuestras observaciones
de modo que podamos distinguir patrones y llegar a conclusiones lógicas, para
esto, elaboramos las Tablas de Frecuencias que nos permiten agrupar y
clasificar datos para determinar la frecuencia con que se repite el atributo o el
valor que toma una variable, si las observaciones se enumeran de modo
desorganizado la vamos a denominar datos no agrupados.

Distribución De Frecuencias

Consiste en agrupar los datos a través de clases y frecuencias, o mas bien,


ordenarlos en intervalos de clases indicando el número de datos comprendido
en cada clase, además, con este método podemos estudiar el comportamiento
de un conjunto de datos.

Podemos Utilizar Tablas De Frecuencias Cuando:


a) Organizamos los datos que provienen de una Encuesta
b) Presentamos las calificaciones obtenidas en X estudiantes de la carrera de
Mercadeo
c) Presentamos los resultados para los Partidos Políticos en las elecciones
d) Clasificamos las edades de una población
e) Clasificamos el peso en libras de una población de estudiantes
f) Organizamos los sueldos y salarios de los empleados de una empresa
g) Organizamos una población por género
h) Presentamos los municipios del país, por Región
i) Elaboramos las cuentas por cobrar de una compañía

1
j) Cuando presentamos la matricula por carrera en la Universidad, entre
otras.

Características De Una Distribución De Frecuencias


1- Toda tabla de frecuencias debe estar titulada.
2- Las clases deben ser mutuamente excluyente, es decir un dato solo puedo
formar parte de una sola clase.
3- Las clases deben ser exhaustivas, quiere decir que todos los datos deben
estar dentro de algunas de las clases de la distribución.
4- Las clases deben tener la misma amplitud o intervalos de clases iguales.
5- La cantidad de clases a utilizar es un proceso subjetivo, por lo que se
recomiendo de 5 a 15 clases para evitar que algunas características
importantes de los datos queden ocultas, o por el contrario se queden sin
valor cuando existen demasiadas clases.
6- El intervalo y el número de clase deben ser variables discretas, es decir un
número entero.
7- Si es posible evitamos clases abiertas.

Términos A Utilizar En Una Distribución De Frecuencias Para


Variables Cualitativas o Atributo

N= numero de datos u observaciones.

Frecuencia Simple De Clase: es el número de veces que se repite cada clase,


se identifica como fi.

Frecuencia Relativa Simple: Es el cociente de dividir la frecuencia simple (fi)


de clase por el total de observaciones N. Se identifica como fr minúscula

fr= fi/n=frecuencia simple de clase/número total de observaciones

Veamos el siguiente ejemplo:

Se les pregunta a 30 empleados de una empresa cual es su estado civil


según sexo obteniendo las siguientes informaciones:
Casado Casado Casado Casado Casado
Casado Soltero Divorciado Divorciado Divorciado
Soltero Soltero Casado Soltero Unión Libre
Viudo Unión Libre Soltero Unión Libre Unión Libre
Unión Libre Divorciado Divorciado Divorciado Divorciado
Casado Viudo Viudo Casado Unión Libre
2
Es evidente que estas características son cualitativas o de atributos y la
construcción de esta tabla de frecuencias es sencilla ya que sólo se cuantifica
mediante conteo el número de veces que se repita la característica investigada.

Veamos:
Casado Casado Casado Casado Casado
Casado Soltero Divorciado Divorciado Divorciado
Soltero Soltero Casado Soltero Unión Libre
Unión
Viudo Unión Libre Soltero Libre Unión Libre
Unión Libre Divorciado Divorciado Divorciado Divorciado
Casado Viudo Viudo Casado Unión Libre

fi
Estado Civil (no.de empleados) fr %
Casado 9 9 ÷ 30 = 0.30 0.30 * 100 = 30%
Soltero 5 5 ÷ 30 = 0.17 0.17 * 100 = 17%
Unión libre 6 6 ÷ 30 = 0.20 0.20 * 100 = 20%
Viudo 3 3 ÷ 30 = 0.10 0.10 * 100 = 10%
Divorciado 7 7 ÷ 30 = 0.23 0.23 * 100 = 23%
Total 30 ∑ = 1.00 ∑ = 100%

El número de empleados de cada atributo es la frecuencia absoluta (fi), donde


podemos ver que 5 de los 30 empleados son solteros. Sin embargo como 30
es el número de muestras y asumiendo que estas muestras son
representativas de la población, podemos afirmar que el 17% de los empleados
de la empresa son solteros y así sucesivamente para cada característica.

Distribución De Frecuencias Para Variables Cuantitativas


Los Términos tomados en cuenta para la elaboración de una tabla de
distribución de frecuencia para variables cuantitativas son:
• Frecuencia Simple De Clase: es el número de veces que se repite cada
clase, se identifica como fi, donde f es la frecuencia e (i) define el orden de
las clases
• Frecuencia Relativa Simple: Es el cociente de dividir la frecuencia simple
de clase por el total de observaciones. Se identifica como fr
fr= fi/n=frecuencia simple de clase dividido por el número total de
3
Observaciones
• Frecuencia Acumulada Simple: Se identifica como Fi, se obtiene a través
de la suma sucesiva de la frecuencia simple partiendo de la frecuencia
simple uno (1), la última frecuencia acumulada será igual al total de datos.
• Frecuencia Relativa Acumulada: Se
identifica como Fr y se obtiene por la
suma sucesiva de la frecuencia relativa
simple o por división de la frecuencia
acumulada y el total de observaciones.
• Recorrido o Rango: Se identifica como
R, es la diferencia existente entre el valor
máximo observado y el mínimo en una
distribución u ordenamiento. http://www.universoformulas.com/wp-
R= Recorrido=Xmàx – Xmìn content/uploads/2014/04/frecuencia-relativa-
acumulada.jpg

• Intervalo de clase: Esta definido por la diferencia entre el límite superior o


frontera de clase y el límite inferior o frontera inferior de una clase, este
indica el recorrido o rango de los valores incluidos en una clase.

Ci= Límite superior – Límite inferior

• Punto medio de clase o marca de clase: Para fines de análisis de datos,


los valores de las clases se representan a través del punto medio de clase o
marca de clase, esta se define como la semi-suma de los límites de clase,
se identifica como Xi.
𝐿𝐼+𝐿𝑆
Donde: 𝑋𝑖 = 2
Li límite inferior de la clase

Ls Límite superior de la clase

Pasos Para Construir Una Distribución De Frecuencias

Con los conocimientos teóricos necesarios adquiridos para la construcción y


comprensión de una distribución de frecuencias, procedemos a mostrar los
pasos para su ejecución.

1ro. Calcular el Recorrido o Rango


R=Xmàx – Xmìn
2do. Calcular el intervalo de clases, siempre que se conozca el número de
clases
Ci=R/NC
4
3ro. Calcular el número de clases, siempre que se conozca el intervalo de
clases.
NC=R/Ci
Observamos que en el segundo y tercer paso resultaría difícil resolver estas
ecuaciones por simple métodos matemáticos porque cada una de ellas
presenta dos incógnitas.
Como la solución para este caso surge la ecuación de Sturgees que se
expresa de la manera siguiente:
Ci=R/1 + 3.22 log N

Dónde: Ci = intervalo de clase.

R= recorrido

N= número total de valores

Vamos a mostrar algunos ejemplos que contribuyen a formalizar el


conocimiento práctico del manejo de conjunto de datos, generados por una
variable, a través de una tabla de distribución de frecuencias.

Ejemplo #1:
Las siguientes observaciones corresponden al número de hijos de 30
empleados de una zona franca.
Xi= 0,0,0,0,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5.
Observamos que ésta es una variable discreta, por lo que la tabla de
frecuencias es de construcción sencilla, ya que son pocas informaciones y su
rango es mínimo es decir que las informaciones están relativamente
concentradas. Veamos la siguiente tabla:

Número de hijos de 30 empleados de una zona franca.


fi
(no. de
No. Hijos empleados) FI fr %
0 4 4 4 ÷ 30 = 0.13 0.13 * 100 =13%
1 3 4+3 = 7 3 ÷ 30 = 0.1 0.10 * 100 =10%
2 8 7 + 8 = 15 8 ÷ 30 = 0.27 0.27 * 100 =27%
3 4 15 + 4 =19 4 ÷ 30 = 0.13 0.13 * 100 =13%
4 6 19 + 6 =25 6 ÷ 30 = 0.2 0.20 * 100 =20%
5 5 25 + 5 =30 5 ÷ 30 = 0.17 0.17 * 100 =17%
Total ∑ = 30 ∑= 1 ∑= 100%
5
Ejemplo #2:
Las informaciones siguientes rebelan los salarios mensuales en miles de pesos
de los trabajadores de zona franca.
Salarios:
12, 13, 22, 23, 15, 17, 19, 19, 20, 5, 7, 45, 7 ,9, 31, 35,
38, 10, 11, 21 ,23, 24,25, 26,27, 28, 30, 40, 41, 42, 50
El proceso de de distribución de frecuencias para variables continuas como es
este caso deben ser tratados con más cuidado, hay que considerar los
aspectos siguientes:
a) Ordenar los datos, preferiblemente en orden ascendente (de menor a
mayor)
5, 7, 7, 9, 10, 11, 12, 1 3, 15, 17, 19, 19, 20, 21,
22, 23, 23, 24, 25, 26, 27 ,28, 30, 31, 35, 38, 40, 41, 42, 45, 50
b) Determinar el recorrido o rango (R): la diferencia entre el valor máximo y el
valor mínimo. En las muestras anteriores el valor máximo es 45 y el mínimo
es 5.
R= 50 – 5 = 45
c) Determinar el intervalo de clase (CI): es el cociente de dividir el rango entre
el número de clase. (NC)
𝑹
𝑪𝑰 =
𝑵𝑪
Pero si el NC no se conoce entonces tenemos que utilizar la fórmula de
stuggess: Valores
constantes

𝑁𝐶 = 1 + 3.22 𝐿𝑜𝑔 𝑁

NC= número de clases.


N= número de observaciones (datos) que en este caso son 30.

Sustituyendo a N en la formula tenemos:


NC= 1 + 3.22 Log 30 = 1 + 3.22 (1.477) = 1 + 4.76 = 5.76
El NC es una variable discreta, por lo que redondeamos siempre hacia el valor
mayor siguiente:
NC= 6
Entonces, una vez encontrado del NC buscamos el valor del CI sustituyendo en
la fórmula del CI:
𝑅 45
CI = 𝑁𝐶 = 6
= 7.5
6
El intervalo de clase (CI) también es otra variable discreta entonces tenemos
que redondear:
CI = 7.5 ≈ 8
Conocido ya el intervalo de clase y el número de clase, procedemos a construir
una distribución de frecuencias.

Cada clase tiene un límite inferior (Li) y un límite superior (Ls), la diferencia
numérica entre estos dos valores es el valor del intervalo de clase (CI).
En este caso vamos a iniciar escribiendo el número más pequeño de las
muestras que es 5. Ese será el primer límite inferior, luego para encontrar el
límite superior de esa clase sólo tenemos que sumarle el valor del intervalo de
clase a 5.
Veamos cómo queda conformada la primera clase: 5 - 13

CI
LI LS

5 + 8 = 13

 La segunda clase es: 13 - 21

CI

13 + 8 = 21

Seguimos así con las demás clases hasta completar las 6 clases que
anteriormente calculamos, al final la columna matriz estará conformada de la
siguiente manera

Límite
Sueldos en
Inferior: LI Límite
Miles de Superior: LS
NC pesos
1 5 -- 13
2 13-- 21
3 21—29
4 29--37
5 37--45
6 45--53

7
En la tabla anterior se puede observar que hay 6 clases y cada una de ellas
tiene un límite inferior y un límite superior.
Una vez construidas las clases, se procede a determinar la frecuencia simple
(fi) de cada clase (número de veces que ser repite cada clase), además de los
demás tipos de frecuencias y el punto medio de clase.

Al momento de hacer el conteo se cuentan los


sueldos que estén de 5 a menos de 13, o sea el
13 no se incluye en esa clase porque se debe
incluir en la siguiente. Debe repetir ese
procedimiento de conteo en todas las clases.

Sueldos en fi (No. de
NC Miles de pesos trabajadores) fr FI FR Xi
1 5 – 13 7 7 ÷ 30 = 0.23 7 0.23 9
2 13—21 6 6 ÷ 30 = 0.20 7 + 6 = 13 0.23 + 0.20 = 0.43 17
3 21—29 8 8 ÷ 30 = 0.27 13 + 8 = 21 0.43 + 0.27 = 0.70 25
4 29—37 3 3 ÷ 30 = 0.10 21 + 3 = 24 0.70 + 0.10 = 0.80 33
5 37—45 4 4 ÷ 30 = 0.13 24 + 4 = 28 0.80 + 0.13 = 0.93 41
6 45—53 2 2 ÷ 30 = 0.07 28 + 2 = 30 0.93 + 0.07 = 1.00 49
TOTAL 30 1.00

Ejemplo 3:

A continuación se muestran las ventas de un mes, en miles de RD$(pesos), de


30 vendedores de una compañía de artículos ferreteros. (Carlos Custodio.
2007)

26 29,4 64.3 56.5 48,5 57 30,4 28.6 70 81.4


40.5 32.3 50.4 76.9 68 83 27.8 36.9 82.4 78
44.5 35.6 88 67 22 52.8 76.4 63.4 64.3 73

a) Construya una distribución de frecuencias


8
Solución:
Procedemos a dar los pasos citados anteriormente, veamos:
R=Xmàx – Xmìn
R=88 – 22=66
Como no conocemos el intervalo de clase ni el número de clases vamos a
aplicar la fórmula de Sturgees
Ci=R/1+3.22 log N
Ci=66/1+ 3.22 log 30 = 66/5.75 =11.5

Recordando: Como se puede observar, según la resultados de la fórmula


anterior el valor de Ci =11.5 y NC=5.75; sucede que el NC (número de clases)
es una variable discreta que no admite fraccionamiento y por tanto no puede
ser, en la práctica, igual a 5.75, por lo cual debemos aproximar a un valor
entero, que en este saso seria NC=6.

De esta manera y por redondeo: NC=6 y Ci=12.

Dados los pasos anteriores procedemos a la construcción de la distribución de


frecuencias,

Ventas de un mes de 30 vendedores


En miles de RD$

Ventas Vendedores fr Fi Fr Xi
(Miles RD$) fi
22 – 34 7 7 ÷30 = 0.233 7 7 ÷30 = 0.233 28
34 - 46 4 4 ÷30 = 0.133 7+4=11 11 ÷30 = 0.366 40
46 – 58 5 5 ÷30 = 0.167 11+5=16 16 ÷30 = 0.533 52
58 – 70 5 5 ÷30 = 0.167 16+5=21 21 ÷30 = 0.7 64
70 – 82 6 6 ÷30 = 0.2 21+6=27 27 ÷30 = 0.9 76
82 – 94 3 3 ÷30 = 0.1 27+3=30 1 88
Tot al 30 1
Los diferentes indicadores obtenidos anteriormente se interpretan de la
siguiente manera:

9
• Por ejemplo, si le interesa interpretar el resultado de la frecuencia simple
de la quinta clase, puede expresar que: seis vendedores efectuaron ventas
durante ese mes entre 70 mil y menos de 82 mil pesos.
• Así mismo, puede señalar, al interpretar la frecuencia relativa simple de la
cuarta clase, que el 16.7% de los vendedores realizo ventas durante ese
mes por montos comprendidos entre 58 mil y menos de 70 mil pesos.
• Al interpretar el resultado de la frecuencia acumulada de la quinta clase,
podemos señalar que 27 vendedores durante ese mes realizaron ventas por
un monto comprendido entre 22 mil pesos y menos de 82 mil pesos.
• De igual manera el 53.3 % de los vendedores efectuaron ventas durante
ese mes por montos comprendidos entre 22 mil pesos y 58 mil pesos
explicando este resultado el contenido de la frecuencia acumulada de la
tercera clase de la distribución.
En lo referente al punto medio de cada clase, éste es usado para representar
mediante un solo valor el recorrido de cada clase y sirve además para los fines
de análisis estadísticos de los datos.

Ejemplo 4:

Construir una distribución de frecuencias con las puntuaciones de coeficiente


de inteligencia de 70 personas tomadas al azar, considerando un intervalo de
clase igual a 10.-________________________________________________
64 142 107 67 125 124 91 102 135 105
82 114 126 93 107 128 123 91 116 133
100 151 51 104 101 118 123 98 90 67
112 107 123 121 115 93 73 116 105 107
118 153 109 78 98 104 140 117 147 121
89 95 98 143 114 118 123 102 89 83
135 101 120 84 76 158 78 136 107 105
_______________________________________________________________
Solución:

Tal y como señalamos en el caso anterior, para la distribución de frecuencia


debemos conocer:
1ro. R= Xmàx – Xmìn
R =158 – 51= 107
2do. Ci= 10 (conocido previamente)
3ro. NC=R/Ci = 107/10 =10.7 =11
En caso, tendremos una distribución de frecuencias con un intervalo de clases
igual diez, (Ci=10), y 11 clases.

10
Coeficiente de inteligencia de 70 personas

Coeficiente Frec. Frec. Frec.Acumulada Frec.relativa Punto


inteligencia Simple Relativa (Fi) Acum (Fr) medio
(fi) Simple (fr) Xi
50 – 60 1 1/70=0.014 1 0.014 55
60 - 70 3 3/70=0.043 1+3=4 0.014+0.043=0.057 65
70 – 80 4 4/70=0.057 4+4=8 0.057+0.057=0.114 75
80 – 90 5 5/70=0.072 8+5=13 0.114+0.072=0.186 85
90 – 100 9 9/70=0.129 13+9=22 0.186+0.129=0.315 95
100 – 110 16 16/70=0.228 22+16=38 0.315+0.228=0.543 105
110 – 120 10 10/70=0.143 38+10=48 0.543+0.143=0.686 115
120 – 130 11 11/70=0.157 48+11=59 0.686+0.157=0.843 125
130 – 140 4 4/70=0.057 59+4=63 0.843+0.057=0.90 135
140 – 150 4 4/70=0.057 63+4=67 0.90+0.057=0.957 145
150 -160 3 3/70=0.043 67+3=70 0.957+0.043=1.00 155
T otal 70 1.00
a) Interprete el valor de la frecuencia acumulada de la sexta clase.
Significa que 38 personas tienen un coeficiente de inteligencia por debajo de
110
b) Interprete el valor de la frecuencia relativa de la octava clase.
Significa que el 15.7% de las personas tienen un coeficiente de
Inteligencia comprendido entre 120 y 130.

Referencias Bibliográficas

• Custodio, Carlos (2007) Estadística Básica, 4ta. Edición, Editora Búho,


República Dominicana.
• Johnson, Robert; Kuby, Patricia (2008) Estadística Elemental, Lo esencial,
Edición 1, Edición 2008, Editorial: Cengage Learning, Argentina.
• Pea, Daniel, Fundamentos de Estadística (2008), 2da. Edicion, Editorial:
Alianza, España.
• Richard I. Levin & David S. Rubin (2004), Estadística para
Administradores, 7ma. Edición, Editorial Printice Hall, México.
• Weiers, Ronad M. (2006) Introducción a la Estadística para Negocios,
5ta. Edición, Editorial Thomson, México.

11

S-ar putea să vă placă și