Sunteți pe pagina 1din 55

0

50
100
150
200
250
300
Series1
0
100
200
300
400
500
600
700
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63
Series1
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
0
100
200
300
400
500
600
700
6
5
.
4
4
4
4
4
4
4
4
6
4
.
3
3
3
3
3
3
3
3
6
8
.
7
7
7
7
7
7
7
8
6
3
.
2
2
2
2
2
2
2
2
M
o
r
e
5
9
.
8
8
8
8
8
8
8
9
5
7
.
6
6
6
6
6
6
6
7
5
6
.
5
5
5
5
5
5
5
6
5
1
5
2
.
1
1
1
1
1
1
1
1
3
5
.
4
4
4
4
4
4
4
4
3
.
2
2
2
2
2
2
2
2
2
4
1
3
3
.
2
2
2
2
2
2
2
2
4
9
.
8
8
8
8
8
8
8
9
1
2
.
1
1
1
1
1
1
1
1
2
.
1
1
1
1
1
1
1
1
1
2
1
3
4
.
3
3
3
3
3
3
3
3
2
3
.
2
2
2
2
2
2
2
2
4
8
.
7
7
7
7
7
7
7
8
5
.
4
4
4
4
4
4
4
4
4
2
7
.
6
6
6
6
6
6
6
7
8
.
7
7
7
7
7
7
7
7
8
1
7
.
6
6
6
6
6
6
6
7
1
9
.
8
8
8
8
8
8
8
9
3
2
.
1
1
1
1
1
1
1
1
4
3
.
2
2
2
2
2
2
2
2
2
2
.
1
1
1
1
1
1
1
1
2
8
.
7
7
7
7
7
7
7
8
1
5
.
4
4
4
4
4
4
4
4
2
9
.
8
8
8
8
8
8
8
9
F
r
e
q
u
e
n
c
y

Bin
Histogram
Frequency
Cumulative %
Representacin grfica de los datos
Los grficos permiten visualizar en forma global y
rpida el comportamiento de los datos.
Para datos cuantitativos agrupados en clases,
comnmente se utilizan tres grficos:
Histogramas.
Polgono de frecuencias.
Ojiva o Polgono de frecuencias acumuladas.
Representacin grfica de los datos
Histograma
Representacin grfica de los datos
Histograma y Polgono de Frecuencias
Ojiva
Representacin grfica de los datos
Representacin grfica de los datos
Para Diferencias en Magnitud
Barras
Barras
Representacin grfica de los datos
Barras
100.8
96.7
79.8
92.9
92.3
99.6
91.2
94.2
88.8
94.2
93.7
81.6
106.5
106.1
87.2
114.8
105.9
111.3
105.3
106.4
90.9
105.8 105.4
90.4
0
20
40
60
80
100
120
140
T
C
H

INGENIOS
Comparativo de Toneladas Mtricas de Caa Acumulado Al
04 de Marzo de 2012, Zafra 2011/2012
2010/2011 Acumulado 2011/2012 Acumulado
10.29
10.46
8.50
10.47
10.18
11.72
9.82
9.52 9.52
10.15
9.63
9.04
10.88
11.54
9.28
12.91
11.85
12.58
11.02
10.73
9.98
11.30 11.18
9.98
0
2
4
6
8
10
12
14
T
A
H

INGENIOS
Comparativo de Toneladas Mtricas de Azcar
Acumulado Al 04 de Marzo de 2012, Zafra 2011/2012
2010/2011 Acumulado 2011/2012 Acumulado
Representacin grfica de los
datos
Para tendencias en el tiempo en
momentos equidistantes.
lineal (curvas)


96
97
98
97
100
99
100
99
98
98
97
96
95
95
94
93
93
92
92
91
91
91
91
90
98
106
104
106
108
109 109
107
106 106
106
105
104
104
103
102
102
101
101
99
99
99
99
98 98 98 98
98
108
108
108
109 109
108
106
105
104
102
101
99
98
97
97
96
95
94
94
94
93
93
92 92
92
92
111
105
106
105
106
105
104
103
103
103
102
101
100
98
98
97
96
95
94
94
93
93
92
92
92
92
111
113
112
111 110
110
110
110
110
109
109
109
108
107
107
107
105
105
105
104
104
104 104
104 104 104 103
113
107
106
103
102
102
101
100
100
99
98
97
96
95
94
93
92
91
90
90
89
89
89 89 89 89
91
106
109
111
112 112
112
111
111
110
110
109
108
108
107
107
106
88
90
92
94
96
98
100
102
104
106
108
110
112
114
116
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
T
C
H

Semanas
Comparacin de TCH, rea Administrada. Zafras 05/06 a 11/12
Zafra 2005/06 Zafra 2006/07 Zafra 2007/08 Zafra 2008/09 Zafra 2009/10 Zafra 2010/11 Zafra 2011/12
NOV DIC ENE FEB MAR ABR MAY
10.14
10.36
10.68
10.76
11.20
11.17
11.21
11.11
11.06
10.93
10.86
10.83
10.74
10.69
10.63
10.58
10.54
10.49
10.42
10.39
10.36
10.32
10.31
10.25
10.11
11.09
10.75
11.24
11.67
11.74
11.79
11.68
11.48
11.55
11.58
11.48
11.60 11.59
11.49
11.41
11.33
11.26
11.20
11.10
11.12
10.98
11.04
11.00
10.98
10.94
10.91 10.91
10.96
11.65
11.71
11.77
11.87
11.79
11.64
11.52
11.39
11.19
11.03
10.94
10.82
10.69
10.62
10.48
10.38
10.30
10.26
10.18
10.10
10.02
9.93
9.89
9.85
9.82
11.81
11.08
11.39
11.42
11.50
11.40
11.38
11.24 11.24 11.24
11.14
11.04
10.90
10.84
10.76
10.69
10.66
10.58
10.50
10.43
10.35
10.30
10.25
10.22
10.20
10.18
10.44
11.17
11.24
11.33 11.31
11.20
11.28
11.33
11.26
11.23 11.23 11.23
11.19
11.14
11.11 11.10
11.06
11.03
11.00 10.99
10.95
10.92 10.91
10.87
10.83
10.76
10.73
11.20
10.66
10.90
10.64 10.64
10.74 10.75
10.70
10.64
10.57
10.47
10.37
10.27
10.19
10.07
10.01
9.90
9.83
9.73
9.64
9.59
9.55
9.52
9.49 9.49 9.49
9.04
11.17
11.59
11.86
12.03
12.06
12.03
11.97
11.88
11.84
11.76
11.65
11.61
11.53
11.43
11.40
11.30
9.0
9.3
9.6
9.9
10.2
10.5
10.8
11.1
11.4
11.7
12.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
T
A
H

Semanas
Comparacin de TAH, rea Administrada. Zafras 05/06 a 11/12
Zafra 2005/06 Zafra 2006/07 Zafra 2007/08 Zafra 2008/09 Zafra 2009/10 Zafra 2010/11 Zafra 2011/12
NOV DIC ENE FEB MAR ABR MAY
Representacin Grfica de los Datos
Para representar un todo
Pastel (sectores)
82%
18%
MANEJO EN % DE AREA ZAFRA
2010/2011
ADMINISTRADA PROVEEDORES
Medidas de tendencia central o posicin
Corresponden a valores que generalmente se
ubican en la parte central de un conjunto de
datos.
Forma como los datos pueden condensarse en
un solo valor central alrededor del cual todos
los datos muestrales se distribuyen.
Medidas de tendencia central o posicin
Las medidas de tendencia central ms
importantes son:
Media: Aritmtica y Aritmtica ponderada.
Mediana.
Moda.
Media Aritmtica
Es la suma de todas las observaciones dividida entre el nmero total
de observaciones.

Expresada de forma ms intuitiva, podemos decir que la media
aritmtica es la cantidad total de la variable distribuida a partes
iguales entre cada observacin.

Por ejemplo, si en una habitacin hay tres personas, la media de
dinero que tienen en sus bolsillos sera el resultado de tomar todo el
dinero de los tres y dividirlo a partes iguales entre cada uno de ellos.
Es decir, la media es una forma de resumir la informacin de una
distribucin (dinero en el bolsillo) suponiendo que cada observacin
(persona) tendra la misma cantidad de la variable.
Clculo de la media aritmtica
Para datos no agrupados:

n
x
X
n
i
i
=
=
1
Para datos agrupados:

n
f m
X
k
i
i i
=
=
1
Donde: m
i
: punto medio de la clase i
f
i
: frecuencia absoluta de la clase i
k: cantidad de clases

Propiedades, ventajas y desventajas de la
media
Propiedades:
La suma de las diferencias entre las media muestral y el
valor de cada observacin es cero.
La media de una constante es la constante.
Si todas las observaciones x
i
se multiplican por una
constante a, la X tambin se debe multiplicar por ese
mismo valor constante.
Propiedades, ventajas y desventajas de la
media
Ventajas:
Emplea en su clculo toda la informacin
disponible.
Se expresa en las mismas unidades que la
variable en estudio.
Es el centro de gravedad de toda la
distribucin, representando a todos los
valores observados.
Es una valor nico.
Propiedades, ventajas y desventajas de la
media
Se trata de un concepto familiar para la
mayora de las personas.
Es til para llevar a cabo procedimientos
estadsticos como la comparacin de medias
de varios conjuntos de datos.
Propiedades, ventajas y desventajas de la
media
Desventajas:
Se ve adversamente afectada por valores extremos,
perdiendo representatividad.
Si el conjunto de datos es muy grande puede ser tedioso su
clculo manual.
No se puede calcular para datos cualitativos.
No se puede calcular para datos que tengan clases de
extremo abierto, tanto superior como inferior.
Mediana
Es el valor que ocupa la posicin central de un
conjunto de observaciones, una vez que han
sido ordenados en forma ascendente o
descendente.
Divide al conjunto de datos en dos partes
iguales.
Clculo de la mediana
Para datos no agrupados:
Si n es impar: posicin donde se ubica la mediana
es igual a (n+1)/2.
Si n es par: (n+1)/2 no es entero, por lo tanto la
mediana ser igual al promedio de las dos
posiciones centrales.

Clculo de la mediana
Datos agrupados: clase mediana es la que
contiene a la observacin que ocupa la posicin
n/2.
Cm
x f
x F
n
Lm Md
m
m
) (
) (
2
1
1

+
+ =
Donde: Lm: lmite inferior de la clase mediana.
F(x
m-1
): frecuencia acumulada de la clase
anterior a la clase mediana.
f(x
m
): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
Ventajas y desventajas de la mediana
Ventajas:
Fcil de calcular si el nmero de
observaciones no es muy grande.
No se ve influenciada por valores
extremos, ya que solo influyen los valores
centrales.
Fcil de entender.
Ventajas y desventajas de la mediana
Se puede calcular para cualquier tipos de
datos cuantitativos, incluso los datos con clase
de extremo abierto.
Es la medida de tendencia central ms
representativa en el caso de variables que solo
admiten la escala ordinal.
Ventajas y desventajas de la mediana
Desventajas:
No utiliza en su clculo toda la informacin
disponible.
No pondera cada valor por el nmero de veces
que se ha repetido.
Hay que ordenar los datos antes de
determinarla.
Moda
Observacin o clase que tiene la mayor
frecuencia en un conjunto de observaciones.
Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
Es la nica medida de tendencia central que se
puede determinar para datos de tipo
cualitativo.
Clculo de la moda
Para datos no agrupados: es simplemente la
observacin que ms se repite.
Para datos agrupados:
Cm Lim Mo
2 1
1
A + A
A
+ =
Donde: Lim: lmite inferior de la clase modal.
A
1
: diferencia entre f
i
de la clase modal y la
anterior.
A
2
: diferencia entre f
i
de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
Ventajas y desventajas de la moda
Ventajas:
No requiere clculos.
Puede usarse para datos tanto cuantitativos
como cualitativos.
Fcil de interpretar.
No se ve influenciada por valores extremos.
Se puede calcular en clases de extremo
abierto.
Ventajas y desventajas de la moda
Desventajas:
Para conjuntos pequeos de datos su valor
no tiene casi utilidad, si es que de hecho
existe. Solo tiene significado en el caso de
una gran cantidad de datos.
No utiliza toda la informacin disponible.
No siempre existe, si los datos no se
repiten.
Ventajas y desventajas de la moda
Desventajas:
Para conjuntos pequeos de datos su valor
no tiene casi utilidad, si es que de hecho
existe. Solo tiene significado en el caso de
una gran cantidad de datos.
No utiliza toda la informacin disponible.
No siempre existe, si los datos no se
repiten.
Ventajas y desventajas de la moda
En ocasiones, el azar hace que una sola
observacin se no representativa se el valor
ms frecuente del conjunto de datos.
Difcil de interpretar si los datos tiene 3 o ms
modas.

Relacin entre la media, la mediana y
la moda
Cuando los datos son sesgados es mejor emplear la Md
Estadstica Aplicada
Medidas de variabilidad o dispersin
Importancia de las medidas de dispersin
Estadstica Aplicada
Medidas de dispersin, variacin o
variabilidad.
Son valores numricos que indican o
describen la forma en que las observaciones
estn dispersas o diseminadas, con respecto al
valor central.
Medidas de dispersin, variacin o
variabilidad.
Rango.
Desviacin media
Varianza.
Desviacin estndar
Coeficiente de variacin.
Medidas de dispersin: Rango
Rango (amplitud o recorrido):
Est determinado por los dos valores
extremos de los datos muestrales, es
simplemente la diferencia entre la mayor
y menor observacin.
Es una medida de dispersin absoluta, ya
que depende solamente de los datos y
permite conocer la mxima dispersin.
Medidas de dispersin: Rango
Casi no se emplea debido a que depende
nicamente de dos valores.
No proporciona una medida de variabilidad de
las observaciones con respecto al centro de la
distribucin.
Notacin: R
No dice nada de valores intermedios.
Estadstica Aplicada
Desviacin media
Considera sola la desviacin absoluta de cada
observacin con respecto a su media.

Considera todas las observaciones
Mejor medida de dispersin que el rango
Es poco til en inferencia estadstica.

Medidas de dispersin: Varianza
Es un valor numrico que mide el grado de
dispersin relativa porque depende de la
posicin de los datos x
1
,x
2
,,x
n
con respecto a
la media.
Es el promedio al cuadrado de las
desviaciones de cada observacin con
respecto a la media.
Notacin: s
2
, o
2
, var(X)
Estadstica Aplicada
Varianza
Desviacin cuadrada media
o
2
= (Xi - )
2
N
i = 1
N
E
s
2
= (Xi - X)
2
n - 1
i = 1
n
E
Propiedades, Ventajas y Desventajas
de la Varianza
Propiedades:
1. Siempre es mayor o igual a cero y menor que
infinito.
2. La varianza de una constante es cero.
Propiedades, Ventajas y Desventajas
de la Varianza
Ventajas:
Es til cuando se compara la variabilidad de dos o ms
conjuntos de datos.
Utiliza toda la informacin disponible.
Desventajas:
No proporciona ayuda inmediata cuando se estudia la
dispersin de un solo conjunto de datos.
Difcil de interpretar por tener sus unidades elevadas al
cuadrado.
Estadstica Aplicada
Desviacin estndar
Medida de dispersin en unidades lineales
o = o
2
S = S
2
Ventajas y Desventajas de la
Desviacin Estndar
Ventajas:
Esta expresada en las mismas unidades que la
variable en estudio.
Utiliza todas las observaciones en su clculo.
Fcil de interpretar.
Desventajas:
No tiene.
Medidas de dispersin:
Coeficiente de Variacin
Es una medida de dispersin relativa que permite
comparar el nivel de dispersin de dos muestras de
variables estadsticas diferentes.
No tiene dimensiones.
Notacin: CV
% 100 =
x
s
CV
Ventajas y Desventajas del
Coeficiente de Variacin
Ventajas:
Es la nica MD que permite comparar el nivel
de dispersin de dos muestras de variables
diferentes.
Emplea toda la informacin disponible en su
clculo.
Fcil de calcular.
Ventajas y Desventajas del
Coeficiente de Variacin
Desventaja:
No es una MD con respecto al centro de la
distribucin de los datos.
Estadstica Aplicada
Usos e interpretacin de la desviacin estndar

S-ar putea să vă placă și