Sunteți pe pagina 1din 10

ORGANIZACIN Y CLASIFICACIN DE DATOS

2.1. INTRODUCCIN
Frente a un conjunto de datos, el primer paso a dar debe ser expresado y clasificarlo de acuerdo a criterios
convenientes, en alguna forma simple que permita ver rpidamente todas las caractersticas posibles para
obtener conclusiones tiles, ya sea directamente o por medio clculos posteriores. Se consideran los
siguientes pasos:
- Revisin y correccin de los datos
- Construccin de tablas de frecuencias
- Representacin tabular o cuadros estadsticos y grficas.

2.2. REVISIN Y CORRECCIN DE DATOS


Ningn anlisis estadstico, por acabado y seguro que sea, es capaz de suministrar respuestas adecuadas
a un problema en estudio, si aquel se basa en una informacin incorrecta. De aqu que la revisin y la
correccin de la informacin recolectada debe ser obligadamente el paso previo a la clasificacin y
computacin de los datos.

2.3. TABLA DE DISTRIBUCIN DEFRECUENCIAS


Las tablas se caracterizan por presentar los datos que pasaron por un proceso de clasificacin segn la
naturaleza de la variable y del cmputo o tabulacin correspondiente, mostrando las frecuencias.
Por ello es conveniente definir los diversos tipos de frecuencia que suelen utilizarse en las tablas de
frecuencias.

2.3.1. FRECUENCIA ABSOLUTA. - Las frecuencias absolutas son:


FRECUENCIA ABSOLUTA SIMPLE. - Es el nmero de veces que se repite un valor de una variable. Se
Denota por fi cumple lo siguiente:
n
fi Z 0 fi n fi
i 1
FRECUENCIA ABSOLUTA ACUMULADA. - Es la suma de los distintos valores de la frecuencia absoluta.
La ltima frecuencia es igual al nmero de observaciones. Denotamos por Fi .
Donde:
Fk f1 f 2 f3 ... f k
i
Fk fi
j 1

As tenemos:
F1 f1
F2 f1 f 2 F1 f1
F3 f1 f 2 f3 F2 f3

Fk f1 f 2 f3 ... f k

Observacin
i. F1 f1
F2 f1 f 2 f1 f 2 0
ii. F1 F2 f1 f 2 0

F1 F2 F3 Fk
Tambin debe cumplir:
f1 F1 F2 F3 Fk n
2.3.2. FRECUENCIA RELATIVA. - Las frecuencias relativas son:
FRECUENCIA RELATIVA SIMPLE. - Es el cociente de la frecuencia absoluta y el nmero total de
observaciones. Lo denotamos por hi y est definido por:
fi
hi
n
Las frecuencias relativas deben cumplir lo siguiente:
i. hi 0
ii. 0 hi 1 0 hi 1
n
iii. hi 1
i 1
FRECUENCIA RELATIVA ACUMULADA. - Es la suma de los distintos valores de la frecuencia relativa. La
ltima frecuencia relativa acumulada es igual a la unidad.
Denotamos por Hi.
Donde:
H k H1 H 2 H 3 ... H k
H1 h1
H 2 h1 h2 H1 h2
H 3 h1 h2 h3 H 2 h3

H k h1 h2 h3 ... hk
Tambin se cumple: h1 H1 H 2 H 3 H k 1,00

2.4. DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUALITATIVAS


Supongamos que en una muestra de n unidades estadsticas, se observa k categoras o
modalidades diferentes c1, c2, ... ,ck de alguna variable cualitativa x.
La tabulacin de estos n datos, es la distribucin de frecuencias por categoras del siguiente
cuadro:
CUADRO N-------
DISTRIBUCIN DE LA VARIABLE CUALITATIVA

Categora de
variable Xi fi hi %hi Fi Hi %Hi
C1 f1 h1 %h1 F1 H1 %H1
C2 f2 h2 %h2 F2 H2 %H 2
C3 f3 h3 %h3 F3 H3 %H 3
... ... ... ... ... ... ...
Ck fk hk % hk Fk Hk %H k
Total n 1.00 100.00 - - -

FUENTE

2.4.1. GRFICAS PARA VARIABLES CUALITATIVAS


GRAFICA DE BARRAS. - Los datos de cada una de las modalidades se representan por una barra
rectangular vertical (u horizontal) cuya altura (o largo) es proporcional a su frecuencia. Las barras se
dibujan dejando un espacio entre ellas.
GRAFICA DE SECTORES. - Los datos de cada categora Si se representan por un sector circular cuyo
ngulo en el centro es igual a:
si hi 3600
Si la grfica por sectores circulares es tridimensional es denominada de pastel.

EJEMPLO 01
Estudio del nivel socio econmico de 20 familias las que viven en el distrito de Independencia en el
ao 2 008. Para un mejor estudio de dar los siguientes valores: bajo (B), medio (M), alto (A), los
resultados fueron: M B B M A B B M M B M B B A M B M A M B
Cul es la variable en estudio? Qu tipo de variable es? Cul es su escala de medicin?
Construir la distribucin de frecuencias.
Graficar
SOLUCION
- La variable en estudio (V.E):
- Tipo de variable: (T.V):

CUADRO N 01:
DISTRIBUCIN DE 20 FAMILIAS DEL DISTRITO DE INDEPENDENCIA SEGN SU NIVEL SOCIO
ECONMICO EN EL AO 2 008

NIVEL SOCIOECONMICO fi hi Fi Hi %hi %Hi

Datos obtenidos en forma ficticia


INTERPRETACIN
f1 9
h3 0,15
H2 0,85
F15 15
%h1 45

GRFICO DE BARRAS:
GRFICO N 01

GRFICO DE SECTORES:
GRFICO N 02

2.5. DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


2.5.1. VARIABLES CUANTITATIVAS DISCRETAS.
Suponga que se han recolectado n valores de alguna variable discreta Yi . El procedimiento ms simple
de organizar estos n datos consiste en ordenar estos valores numricos en forma ascendente. Si todos los
n datos son distintos entre si se obtendr una distribucin de frecuencias de n valores de la variable Y,
donde cada uno de estos valores tienen frecuencia absoluta.
La distribucin de frecuencias de estos n datos se resumen en el cuadro.

CUADRO N ....
DISTRIBUCIN DE FRECUENCIAS DE VARIABLE DISCRETA.
Variable
fi hi Fi Hi %hi %Hi
Yi
Y1 f1 h1 F1 H1 %h1 %H1
Y2 f2 h2 F2 H2 %h2 %H 2
Y3 f3 h3 F3 H3 %h3 %H 3
... ... ... ... ... ... ...
Yk fk hk Fk Hk % hk %H k
Total n 1.00 - - 100,00 -
FUENTE:
2.5.1.1. GRFICAS PARA VARIABLES CUANTITATIVAS DISCRETAS
GRFICA DE BASTON. - Consiste en trazar en cada valor distinto de la variable, segmento de recta
proporcionales a su frecuencia.

GRAFICA DE ESCALERA. -Se trabaja con la funcin denominada funcin de distribucin acumulada.
Tiene la una forma escalonada, por eso se la conoce como grafica de las escaleras.

EJEMPLO 02:
Una empresa dedicada a la confeccin de casacas de cuero realiza su pedido de 20 lotes de cuero y
cada lote contiene 48 artculos encontrndose el siguiente nmero de artculos defectuosos por lote.
3 , 2 , 5 , 0 , 1 , 3 , 2 , 1 , 0 , 1 , 3 , 4 , 2 , 4 , 4 , 3 , 4 , 3 , 2 , 3 .
a.- Construir la distribucin de frecuencias
b.- Interpretar f2 F4 % H2 % h5
c.- Graficar con frecuencias simples
d.- Graficar con frecuencias acumuladas
e.- Qu porcentaje de lotes tienen dos o ms pero menos de 4 artculos defectuosos?
SOLUCIN
CUADRO N 02
DISTRIBUCIN DE 20 LOTES SEGN EL NMERO DE ARTCULOS DEFECTUOSOS.
Artculos
Defectuosos fi hi Fi Hi %hi %Hi
(Yi)

Datos obtenidos en forma ficticia

b.- INTERPRETACIN:
f2 3
F4 15
%h5 20
%H2 25

GRFICO DE BASTONES:
GRFICO N 03
GRFICO D E 20 LOTES SEGN EL NMERO DE ARTCULOS DEFECTUOSOS.

GRFICO DE ESCALERAS:
GRFICO N 04
GRFICO D E 20 LOTES SEGN EL NMERO DE ARTCULOS DEFECTUOSOS.

e.- Dos o ms peso menos de 4, es decir, con dos o tres defectuosos. 0.20+0.30=0.50 es decir, el 50%.

2.5.2. VARIABLES CUANTITATIVAS CONTINUA.


La distribucin de frecuencias por intervalo o clases se usa cuando la variable estadstica es continua o
cuando el nmero de valores distintos de una variable discreta es muy grande.
Para construir la distribucin de frecuencias de intervalo hay varios procedimientos:
1. En situaciones especiales se podr tener intervalos de clase de amplitud diferentes. Eso depende del
problema en cuestin y del criterio del investigador.
2. Cuando es conveniente ampliar la amplitud del recorrido de tal manera que resulte un nmero
manejable en futuros clculos, esta ampliacin en lo posible debe hacerse en forma simtrica, es
X
decir a la izquierda X min y a la derecha max .
3. Respecto al nmero de clases (m) no existe un consenso unnime entre los autores. Bradfor Hill
seala que debe elegir no ms de 20 intervalos ni menos de 5 ya que muchos intervalos pueden
complicar innecesariamente los clculos de las descriptivas y pocos intervalos podran omitir
caractersticas importantes de los datos.
4. Definir los extremos de los intervalos de clase y considerarlos como intervalos de nmeros reales
abiertos a la izquierda y cerrados a la derecha.
5. Distribucin de frecuencias por intervalos.
DISTRIBUCIN DE FRECUENCIAS DE VARIABLE CONTINUA
CUADRO N.
Ii Conteo
Y f i h i F i i Hi %hi %Hi Fi Hi
I1 |||.. Y1 f1 h1 F1 H1 %h1 %H1 *
F1 *
H1
I2 |||.. Y2 f2 h2 F2 H2 %h2 %H 2 *
F2 *
H2
I3 |||.. Y3 f3 h3 F3 H3 %h3 %H 3 * *
F3 H3

Ik Yk fk hk Fk Hk % hk %H k *
Fk *
Hk
|||..
Total - - 1,00 - - 100 - - -

FUENTE:
2.5.2.1. CONSTRUCCIN DE LA DISTRIBUCIN DE FRECUENCIAS
Uno de los mtodos para construir la distribucin de frecuencias es:
1. Determinar el rango (R) de variacin de los datos que se define por:
R = Xmax Xmin.
2. Determine el N de intervalos, K. Un valor aproximado de nmero de intervalos, K nos proporciona
la regla de Sturges donde:
m = 1 + 3,3 log (n) n 10
Redondeado el nmero al entero inmediato mayor.

3. Determinar la amplitud (C) del intervalo dividiendo el rango entre el nmero de intervalos. Esto es:
R
C
K
4. Determinar los extremos de los intervalos en la siguiente manera.
I 1 = [Xmin , Xmin + C)
I 2 = [Xmin + C , Xmin + 2C)
I 3 = [Xmin +2C , Xmin + 3C)

I k = [Xmin +(K-1) C , Xmin + KC)

5. Marca de clase. - (Y i) Se define como el punto medio del intervalo


I i Yi , , Yi , 1
Yi , Yi , 1
Yi
2
2.5.2.2. GRAFICA DE LA DISTRIBUCIN POR INTERVALOS
HISTOGRAMA. - Es una grfica de barras rectangulares verticales juntas la base de cada barra es
proporcional a la amplitud del intervalo y la altura es proporcional a su frecuencia. (Absoluta o
relativa o porcentaje).
Grfico N

Fuente
POLGONO. - Es una grfica poligonal cerrada que se obtiene uniendo con segmento de rectas los
puntos que tienen proporcionalmente como abscisa a la marca de clase y como ordenada a la
frecuencia respectiva. Se cierra en ambos extremos en las marcas de clase adyacentes de frecuencia
cero.
Grfico n
Titulo

Fuente

OJIVAS.- La ojiva se obtiene uniendo con segmento de recta los puntos cuya abscisa es proporcional
,
al lmite superior Yi 1 de cada intervalo y cuya ordenada es proporcional a la frecuencia acumulada
respectiva (absoluta relativa o porcentaje).
Grfico n
Titulo

Fuente

EJEMPLO 03:
La inversin anual, en miles de dlares, de una muestra de 40 pequeas empresas de la ciudad de Huaraz
en el 2007 fueron:
31 17 27 20 28 10 34 25 4 24
15 39 18 30 41 26 12 46 18 23
36 19 29 37 33 27 27 24 26 31
25 28 33 28 22 23 31 29 35 21
a) Cul es la variable en estudio?
b) Qu tipo de variable es?
c) Construir una distribucin

d) interpretar: f 2 , F4 , %h5 , H 2 , F4 , %H 2 , H 3
e) Graficar el Histograma con los porcentajes
f) Graficar el polgono con las frecuencias absolutas
g) Graficar el Ojiva con los porcentajes
h) Determinar el porcentaje de empresas con una inversin entre 14 mil a ms pero menos de 20 mil
dlares.
EJEMPLO 04:
Un gerente una empresa de esprrago esta interesado en saber cuales son los tiempos que necesitan los
trabajadores para encender las mquinas y empezar el proceso del empaquetado de esprrago, para ello
se toma los tiempos promedios en minutos de 30 trabajadores que estn encargados de dicha operacin.
1.4 1.8 2 2.2 2.4
1.4 1.9 2 2.2 2.5
1.5 1.9 2.1 2.2 2.6
1.6 2 2.1 2.3 2.6
1.6 2 2.2 2.3 2.9
1.7 2 2.2 2.4 3.5
Obtenga:

a) Tabla de frecuencias e interpretar: f 2 , F4 , %h5 , H 2 , F4 , %H 2 , H 3
b) Graficar el Histograma
c) Graficar el Ojiva

S-ar putea să vă placă și