Documente Academic
Documente Profesional
Documente Cultură
ESTADSTICAS
DISTRIBUCIONES
DE FRECUENCIAS.
Una distribucin de frecuencia es una
tabla en la cual se agrupan en clases
los valores posibles para una variable y
se registra el nmero de valores
observados que corresponde a cada
clase. Los datos organizados en una
distribucin de frecuencias se
denominan datos agrupados. Por el
contrario, para los datos no agrupados
se consideran todos los valores
observados de la variable.
1
EJEMPLO
La siguiente tabla muestra una
distribucin de frecuencias de
salarios.
Salario ($)
Nmero de
obreros (f)
2400-2599
2600-2799
20
2800-2999
33
3000-3199
25
3200-3399
11
3400-3599
4
Total
100
INTERVALOS DE CLASE
Por cada una de las clases de una
distribucin de frecuencias, los
lmites nominales de la clase
superior e inferior indican los valores
incluidos dentro de la clase.
Para ciertos propsitos los valores de
una clase se representan a menudo
por el punto medio de clase, que se
determina sumando la mitad del
intervalo de clase a su lmite inferior.
3
de clase
exactos de
clase
2400-2599
2499.5
2399.52599.5
2600-2799
20
2699.5
2599.52799.5
2800-2999
33
2899.5
2799.52999.5
3000-3199
25
3099.5
2999.53199.5
3200-3399
11
3299.5
3199.53399.5
3400-3599
3499.5
3399.53599.5
Total
100
$200
5
DESCRIPCIN DE DATOS DE
NEGOCIOS:
MEDIDAS DE POSICIN
MEDIDAS DE POSICIN EN
CONJUNTOS DE DATOS
Una medida de posicin es un valor
que se calcula para un grupo de
datos y que se utiliza para
describirlos de alguna manera.
Normalmente se desea que el valor
sea representativo de todos los
valores incluidos en el grupo y, por
ello se desea alguna clase de
promedio.
LA MEDIA ARITMTICA
La media aritmtica o promedio aritmtico,
se define como la divisin de la suma de
todos los valores entre el nmero de
valores.
X
X
n
EJEMPLO 1
En determinado mes, 8 vendedores
de artculos electrnicos vendieron
las siguientes cantidades de equipos
o aparatos:
8,11,5,14,8,11,16,11.
Considerando a ste mes como la
poblacin
de unidades
X el promedio
84
10.5unidad
vendidas
es:
LA MEDIA PONDERADA
La media ponderada o promedio ponderado
es una media aritmtica, en la cual se
considera a cada uno de los valores de
acuerdo con su importancia en el grupo
Su expresin matemtica es:
( pX )
P oX p p
Cada uno de los valores del grupo (X) se
multiplica por el factor de ponderacin
apropiado (p) y despus se suman stos
productos y la suma se divide entre los
pesos o ponderaciones
9
6.8%
MEDIA PONDERADA
Product
o
Margen
de
utilidad
(X) %
Ventas (p) $
Px
4.2
30,000,000
1,260,000
5.5
20,000,000
1,100,000
7.4
5,000,000
370,000
10.1
3,000,000
303,000
SUMA p=
$58,000,000
SUMA
Px=$3,033,000
(pX )
$3,033,000
P oX p p $58,000,000 5.2%
11
LA MEDIANA
La mediana de un grupo de datos es el
valor del dato que ocupa un lugar de
cuando se les agrupa a todos en orden
ascendente o descendente. Para un
grupo con un nmero par de elementos,
se supone que la mediana se encuentra a
la mitad entre los dos valores adyacentes
del centro. Cuando el conjunto de datos
contiene un nmero grande de valores,
resulta til la siguiente frmula para
determinar la posicin de la mediana en
el conjunto ordenado:
Med X(( n / 2 ) (1 / 2 ))
12
Med X (( n / 2 ) (1 / 2 ))
Med X ((8 / 2 ) (1 / 2 ))
Med=4+1/2=4.5
El valor de la mediana se encuentra entre los
valores cuarto y quinto de ste conjunto
ordenado de datos, como los dos son
iguales a 11 en ste caso la mediana es 11
13
LA MODA
La moda es el valor que se presenta con
mayor frecuencia en un conjunto de datos.
Para un conjunto de datos poco numerosos en
los que no se repite ningn valor, no existe
moda. Cuando dos valores no adyacentes
tienen frecuencias mximas similares, se dice
que la distribucin es bimodal. A las
distribuciones de frecuencias que tienen
varias modas se les denomina multimodales.
Los 8 vendedores que se describieron en
el ejemplo 1 vendieron:
8,11,5,14,8,11,16 y 11. La moda para
ste grupo de valores es el de mayor
frecuencia o moda=11
14
Ejemplo Embotelladora
500540
550590
600640
650690
700740
750790
800840
850890
900940
950990
530
570,590
600,600,600,610,610,620,620,620,620,630,630
1
1
650,650,650,660,670,670,680,680,680,690
1
0
710,710,710,720,720,730,730,730,730,740,740,740
1
2
750,750,750,750,750,750,750,760,760,760,760,770,770,780,78 2
0,780,780,780,790,790,790
1
800,810,820,820,830,840
6
850,850,850,860,870,880,880,880,890
900,930,930,940
950,950,960,970
15
X 60820
760.25ml
N
80
16
MEDIANA
Med
(( n / 2 ) (1 / 2 ))
17
530, 570,590,
600,600,600,610,610,620,620,620,620,630,63
0, 650,650,650,660,670,670,680,680,680,690,
710,710,710,720,720,730,730,730,730,740,74
0,
740,750,750,750,750,750,750,750,760,760,76
0,
760,770,770,780,780,780,780,780 ,
790,790,790, 800,810,820,820,830,840,
850,850,850,860,870,880,880,880,890,
900,930,930,940, 950,950,960,970
Mediana =(750+750)/2=750
18
MODA
Moda =750
19
500-540
550-590
600-640
650-690
700-740
750-790
800-840
850-890
900-940
1
2
11
10
12
21
1
3
14
24
36
57
520
570
620
670
720
770
6
9
4
63
72
76
820
870
920
fX
520
1140
6820
6700
8640
1617
0
4920
7830
3680
20
(fX) 60300
MediaX
753.75ml
n
80
21
Mediana
n / 2 fa
Mediana Li (
)i
fc
Donde Li= lmite exacto inferior de la clase que contiene la mediana
N= nmero total de observaciones en la distribucin de frecuencia (n para muestra
fa=la frecuencia acumulada de la clase que precede a la clase que contiene la
mediana
.fc=nmero de observaciones en la clase que contiene la mediana
i=intervalo de clase
.
22
n / 2 fa
Mediana Li (
)i
fc
Por lo tanto: Li=(650+640)/2=645, n=80, fa=18, fc=10, i=50
Sustituyendo valores:
Mediana=745+((80/2)-36))/10*50=645+(40-36)/10*50=754.52
Mediana=754.52
23
24
Datos:
Li=(750+740/2=745
d1=9
d2 =15
i=50
Sustituyendo valores:
d1
Moda L i (
)i
d1 d 2
9
Moda 745 (
)10 763.5
9 15
25
Cuartiles, deciles y
percentiles de datos
agrupados
primer cuartil
mediana
segundo cuartil
tercer cuartil
100
26
fc
D3(tercer decil)=Li+[(3n/10)-fa]*i
fc
P70 (percentil 70)=Li+[(70n/100)fa]*i
fc
27
Q1(primer cuartil)=Li+[(n/4)-fa)]*i
fc
Donde:
Li=(650+640)/2=645, n=80, fa=
Sustituyendo valores:
Q1=645+[(80/4)-24)]*50/21
Q1=685.48
28
Tercer decil
D3(tercer decil)=Li+[(3n/10)-fa]*i
fc
Donde Li=(650+640)/2=645
D3=645+[(3*80/10)-14)]*50/21
D3=668
29
Percentil 70
P70 (percentil 70)=Li+[(70n/100)fa]*i
fc
Donde Li=(850+840)/2=845
P70=845+[(70*80)/100)-63)]*50/21
P70=861
30
MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad de
tendencia central son tiles para
identificar el valor tpico en un conjunto
de datos.
En contraste, las medidas de variabilidad
se ocupan de describir precisamente la
variabilidad entre los valores y son:
Rango, desviacin media, varianza,
desviacin estndar y coeficiente de
variacin.
31
Ejemplo
Suponer que dos mquinas empacadoras
distintas dan como resultado paquetes
con un peso promedio de 10 gramos de
caf, pero que en un caso todos los
paquetes se encuentran dentro de 0.10
gramos de ste peso, en tanto que en el
otro caso los pesos pueden variar hasta
en un gramo en cualquier direccin. Medir
la variabilidad o dispersin de las
cantidades que se empacan es tan
importante como medir el promedio.
32
EL RANGO
El rango R, es la diferencia entre los valores mayor y
menor del conjunto de datos.
R=My-Mn
Donde:
My= mayor valor del grupo
Mn=Menor valor del grupo
Ejemplo: Durante un mes determinado del verano, ocho
vendedores de aparatos electrnicos de una empresa
vendieron el siguiente nmero de
ventiladores:8,11,5,14,8,11,16,11. el rango del
nmero de unidades vendidas es:
R=My-Mn=16-5=11 unidades
33
DESVIACIN MEDIA
La desviacin media o DM se basa en la
diferencia entre el valor absoluto de
cada uno de los elementos conjuntos de
datos y la media del grupo. Despus se
calcula la media de esas desviaciones.
DM poblacional=X I
valor absoluto
N
de X-
Para los datos utilizados del ejemplo anterior
del equipo elctrico, la media aritmtica es
(8,11,5,14,8,11,16,11)/8=10.5
34
DESVIACIN MEDIA
X
X-
X-
-5.5
5.5
-2.5
2.5
-2.5
2.5
11
0.5
0.5
11
0.5
0.5
11
0.5
0.5
14
3.5
3.5
16
5.5
5.5
Total
21.0
35
LA VARIANZA Y DESVIACIN
ESTNDAR
La varianza es
similar a la desviacin
media porque se basa en la diferencia
entre cada uno de los valores del
conjunto de datos y la media del grupo.
La diferencia consiste en que antes de
sumarlas, se eleva al cuadrado cada
una de las diferencias.
Para una poblacin se representa la
varianza mediante v(X) o, en forma ms
tpica, mediante .
( X )
La frmula es: v(X)==
N
2
36
37
Desviacin estndar
muestral
( X ) / n 1
2
38
39
X-
(X-)
-5.5
30.25
-2.5
6.25
-2.5
6.25
11
0.5
0.25
11
0.5
0.25
11
0.5
0.25
14
3.5
12.25
16
5.5
30.25
Total 86
40
Uso de la desviacin
estndar
La desviacin estndar es la medida de
dispersin ms importante. En anlisis
estadstico a una curva de frecuencias
simtrica y mesocrtica se le denomina
curva normal. Para una distribucin que
tiene distribucin normal, se sabe que
aproximadamente el 68% de las
mediciones se encuentran a no ms de 1
desviacin estndar y el 95% de las
mediciones a no ms de dos desviaciones
estndar.
41
COEFICIENTE DE ASIMETRA DE
PEARSON
42
Ejemplo
Para los datos de ventas de los aparatos
elctricos vistos: 5,8,8,11,11,11,14,16.
La media es =84/8=10.5
La
mediana=(n/2)+(1/2)=8/2+1/2=4.5=11
CAP=Asimetra=3(-Med)/=3(10.5-11)/3.3=0.45
As , la distribucin de las unidades vendidas
tiene una ligera asimetra negativa, es decir est
sesgada hacia la izquierda.
43
Z=(X-)/=(13.2-13)/0.1=+2
P(13 X 13.2) P(0 Z 2.0) 0.4772
Valor obtenido de tablas
13.0
13.2
45
13
13.25
Z=(X-)/=(13.25-13)/0.1=+2.5
P(X>13.25)=P(z>2.5)=0.500-0.4938=0.0062
De tablas se obtiene el valor de 0.4938
46
valor de 0.3413
Z2=(X2-)/ =(13.1-13)/0.1=+1 y de tablas se obtiene el
valor de 0.3413
12.9
X1
13.0 13.1
X2
47
48