Documente Academic
Documente Profesional
Documente Cultură
LOJA
2014
SEGUNDO CICLO
010
ASIGNATURA
GEOESTADSTICA
SEGUNDO CICLO
NOCIONES BSICAS DE LA
GEOESTADISTICA
Pgin
a
1.2.
1.3.
1.4.
1.5.
1.6.
1.7.
1.8.
CLASIFICACIN DE ESTADSTICA........................................................................... 20
1.9.
X , ........................................... 27
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
2
2
Varianza ; S . ........................................................................................ 56
Desviacin tpica......................................................................................... 57
2.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
CAPITULO UNO
ESTUDIO DE LA GEOESTADSTICA
Introduccin.
la Geoestadstica, las
personajes que
Resea Histrica.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
variabilidad
de
los suelos es
principalmente cualitativo.
del
suelo
(Burguess
&
Webster,
1980,b;
Webster
&
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
Geoestadstica.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
Fundamentos de la Geoestadstica
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
completo
de
la
teora
descrita
se
requiere
tener
GEOESTADSTICA
SOPORTE DE
INFORMACIN
VARIOGRAMAS
Optimizacin
del muestreo
Patrones de
variabilidad
espacial
Krigeaje
GEOESTADSTICA
Simulacin
Condicional
SEGUNDO CICLO
Pgin
a
10
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
11
REAS DE APLICACIN
Hidrogeologa
Minera
Biodiversidad
Geoqumica
GEOESTADSTICA
FRM
Geofsica
SIG
Riesgos geolgicos
CO2
1.2.
Teledeteccin
actividad
cotidiana.
Dentro
del
mbito
de
las
ciencias
debemos
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
12
mtodos
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
13
1.3.
la
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
14
1.4.
reservas
minerales,
determinacin
de
concentraciones
promedio,
hidrogrficas,
deslizamientos,
muros
ciclpeos),
anlisis
de
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
15
entre la multiplicidad de
actividades.
1.5.
CONSIDERACIONES BSICAS.
Descriptiva
que
se
ocupa
de
la
descripcin
de
datos
de
datos sobre
alguna
caractersticas
de
ciertos individuos
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
16
2.
Propiedad Asociativa.
, , ( + ) + = + ( + )
GEOESTADSTICA
SEGUNDO CICLO
3.
Pgin
a
17
4.
5.
+ () = () + = 0
Propiedad Conmutativa.
,
+ = +
=1
=
=1
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
18
= + + + =
=1
= 1 + 2 + + = (1 + 2 + + )
=1
=
=1
=1
( + ) = (1 + ) + (2 + ) + + ( + )
=1
= 1 + 2 + + + + +. . +
( + ) = +
=1
=1
= ( + 1)2 , =
=
Ejercicios
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
19
a).
9
=1
b).
( + 8)
=1
7
c).
5
=1
d).
( + 1)
=1
e).
( 2)
=1
1.7.
DEFINICIN DE ESTADSTICA
Como vocablo derivado del latn status, que significa estado, posicin o
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
20
1.8.
CLASIFICACIN DE ESTADSTICA
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
21
y resumir un
1. Recoleccin de datos.
2. Clasificacin de los datos.
3. Presentacin de los datos (texto, tablas, grficos).
4. Anlisis de los datos.
5. Interpretacin.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
22
1. Formulacin de hiptesis
2. Elaboracin de un plan investigativo
3. Recoleccin de datos
4. Anlisis de los datos
5. Aceptacin o rechazo de las hiptesis
6. Conclusiones.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
23
hacer
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
24
( Fi a ) y la Frecuencia acumulada
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
25
comn y constante que asigna un nmero real a todos los pares de objetos
en un conjunto ordenado.
La escala de proporcin
POBLACIN Y MUESTRA
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
26
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
27
1.9.
X,
Para Series
i 1
xi
N
n
f x
i
i 1
f
i 1
Donde :
x media
f frecuencia
N f i total de casos
i 1
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
28
...e, f , g , h, i, j...
gh
Md
2
2 f am
i
Md Li
f
Dnde:
i = intervalo o razn.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
29
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
30
EJERCICIOS DE APLICACIN:
EJERCICIO 1
Se estudia la ley de cobre en una mina y se recoge una muestra
de 30
54
63
58
60
57
55
55
56
55
70
75
56
77
66
60
67
71
58
69
64
60
57
70
59
60
65
80
58
62
65
amplitud ( a )
a
i
razn ( i )
Nc
26
3,25 razn
8
DISTRIBUCIN DE FRECUENCIAS
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
31
Intervalos
Vi
Fi
Pi
Frecuencia
Acumulada
Pia
Fia
ViFi
53,8-57,1
55,45
8/30=0,27
8/30=0,27
57,1-60,4
58,75
8/30=0,27
16
16/30=0,53 470,00
60,4-63,7
62,05
2/30=0,07
18
18/30=0,60 124,10
63,7-67,0
65,35
5/30=0,17
23
23/30=0,77 326,75
67,0-70,3
68,65
3/30=0,10
26
26/30=0,87 205,95
70,3-73,6
71,95
1/30=0,03
27
27/30=0,90
71,95
73,6-76,9
75,25
1/30=0,03
28
28/30=0,93
75,25
76,9-80,2
78,55
2/30=0,07
30
30/30=1,00 157,10
30
1.00
TOTAL
443,60
1874,70
Media Aritmtica:
F Vi
i
i 1
1874,70
62,49
30
i 1
30
Mediana: = =15
2 2
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
32
La celda seleccionada que contiene el valor de la mediana es: 57,1- 60,4; por lo
tanto, el valor del lmite para la mediana = 57,1
fa
2
i
.Md Li
f
30
8
2
3,3 59,987
Md 57,10
8
Mo Li
L1 L2
d1
i
d1 d 2
Mo 57,10
80
80 82
3,3 58,99
EJERCICIO 2
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
56
72
70
75
49
61
59
91
58
53
77
51
61
57
56
72
46
68
69
63
89
56
69
61
80
47
58
56
73
88
65
70
64
66
72
61
60
50
78
64
49
46
59
33
48
63
44
46
88
70
74
Ni k 1
a
Ni 1
i
a
i
Ni 1
Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a =amplitud o recorrido de la variable
Otra forma para determinar los diferentes lmites de las celdas ser:
En el presente ejercicio se considera un nmero de 9 celdas
amplitud a dato mayor Xs dato menor Xi
a 91 44 47
amplitud (a)
a
No de celdas Nc
i
razn (i )
Nc
47
i
5,22 razn 5,3
9
el valor del primer Intervalo:
0,9
5,3 5,2 0,1 9
0,45
2
44 0,45 43,55 43,55 5,3 48,85
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
34
Intervalos
Vi
Fi
Frecuencia
Acumulada
Pi
Pia
Fia
ViFi
43,55-48,85
46,20
6/50=0,12
6/50=0,12 277,20
48,85-54,15
51,50
5/50=0,10
11
11/50=0,22 257,50
54,15-59,45
56,80
9/50=0,18
20
20/50=0,40 511,20
59,45-64,75
62,10
9/50=0,18
29
29/50=0,58 558,90
64,75-70,05
67,40
8/50=0,16
37
37/50=0,74 539,20
70,05-75,35
72,70
6/50=0,12
43
43/50=0,86 436,20
75,35-80,65
78,00
3/50=0,06
46
46/50=0,92 234,00
80,65-85,95
83,30
0/50=0,00
46
46/50=0,92
85,95-91,25
88,60
4/50=0,08
50
50/50=1,00 354,40
50
1.00
TOTAL
0,00
3168,60
Media Aritmtica:
F Vi
i 1
F
i 1
3168,60
63,372
50
Mediana:
N
50
25
2
2
Li
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
fa
2
i
.Md Li
f
35
50
20
2
5,3 62,39
Md 59,45
9
Moda o modo:
Es el nmero que ms se repite se encuentra en dos celdas, por tanto el valor
promedio est comprendido entre 54,15 y 64,75 que define la clase muestral
para la moda cuya frecuencia se halla en el punto
Mo Li
d1
i
d1 d 2
Mo 62,10
95
95 98
5,3 59,45
EJERCICIO 3
A partir de la informacin de la Turbiedad
expresada en
NTU (Unidades
56
72
70
75
49
61
59
91
70
58
53
77
51
61
57
56
48
74
GEOESTADSTICA
72
46
68
69
63
89
56
63
69
61
80
47
58
56
73
44
88
65
70
64
66
72
61
46
60
50
78
64
49
46
59
88
SEGUNDO CICLO
Pgin
a
36
Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a =amplitud o recorrido de la variable
Ni k 1
a
Ni 1
i
a
i
Ni 1
a 91 44 47
Ni k 1 Ni 6 1 7
i
a
47
47
i
i
7,8333
Ni 1
7 1
6
DISTRIBUCION DE FRECUENCIAS
Intervalos
Vi
Fi
Pi
Frecuencia
Acumulada
Pia
Fia
ViFi
44,00-51,84
47,92
10
10/50=0,20
10
10/50=0,20
479,20
51,84-59,68
55,76
10
10/50=0,20
20
20/50=0,40
557,60
59,68-67,52
63,60
11
11/50=0,22
31
31/50=0,62
699,60
67,52-75,36
71,44
12
12/50=0,24
43
43/50=0,86
857,28
75,36-83,20
79,28
3/50=0,06
46
46/50=0,92
237,84
83,20-91,04
87,12
4/50=0,08
50
50/50=1,00
348,48
TOTAL
GEOESTADSTICA
50
1.00
3180,00
SEGUNDO CICLO
Pgin
a
37
Media Aritmtica:
F Vi
i 1
3180
63,60
50
i 1
Mediana:
N
50
25
2
2
fa
2
i
.Md Li
f
Li
50
20
2
7,84 63,244
Md 59,68
11
Moda o Modo:
Mo Li
d1
i
d1 d 2
GEOESTADSTICA
Mo
12 11
44 67,52
SEGUNDO CICLO
Pgin
a
38
EJERCICIO 4
Los resultados del estudio de la ley de oro en una mina, luego del anlisis de
una muestra de 40 porciones de roca con concentraciones expresadas (en
gr/Tn), se obtienen los siguientes datos. A partir de la informacin
correspondiente: obtenga las medidas de tendencia central.
11,1
12,5
32,4
7,8
21
16,4
11,2
22,3
4,4
6,1
27,5
32,8
18,5
16,4
15,1
6,0
10,7
15,8
25,0
18,2
12,2
12,6
4,7
23,5
14,8
22,6
16
19,1
7,4
9,2
10,0
26,2
3,5
16,2
14,5
3,2
8,1
12,9
19,1
13,7
2k N
2 5 32 no se recomienda
2 6 64 se recomienda desde 6 celdas en adelante
Ni k 1
a
1
i
a
i
Ni 1
Ni
GEOESTADSTICA
Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a =amplitud o recorrido de la variable
SEGUNDO CICLO
Pgin
a
39
amplitud (a)
a
i
razn (i )
( Ni 1)
29.6
4,933 razn 4,94
7 1
el valor del primer Intervalo :
0,06
0,03
2
3.2 0,03 3,17 3,17 4,94 8,11
4,94 4,93 0,01 6
DISTRIBUCION DE FRECUENCIAS
Intervalos
Vi
Fi
Frecuencia
Acumulada
Pi
Pia
Fia
ViFi
3,17-8,11
5,64
9/40=0,244
9/40=0,225
50,76
8,11-13,05
10,58
9/40=0,244
18
18/40=0,45
95,22
13,05-17,99
15,52
9/40=0,244
27
27/40=0,675
139,68
17,99-22,93
20,46
7/40=0,175
34
34/40=0,85
143,22
22,93-27,87
25,40
4/40=0,10
38
38/40=0,95
101,60
27,87-32,81
30,34
2/40=0,05
40
40/40=1,00
60,68
TOTAL
40
1.00
591,16
Media Aritmtica:
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
40
F Vi
i 1
F
i 1
591,16
14,779
40
Mediana:
N
40
20
2
2
fa
2
i
.Md Li
f
Li 13,05
40
18
2
4,94 14,15
Md 13,05
9
Moda o Modo:
Mo Li
d1
i
d1 d 2
GEOESTADSTICA
Mo
90
3,17 17,99
SEGUNDO CICLO
Pgin
a
OTRAS
MEDIDAS
DE
POSICIN.
(MEDIA
41
GEOMTRICA,
f
f
f
f
MG = X11 X22 X33 Xnn
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
42
f3
f1
f2
fn
MG = Xm1
Xm2
Xm3
Xmn
1
1 1
1
1
(1 + 2 + + )
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
43
Media Ponderada.( )
1 1 + 2 2 + 3 3 + 4 4 + +
1 + 2 + 3 + 4 + +
=1
=1
Podemos decir; que los Cuantiles son medidas de posicin que dividen a la
distribucin en un cierto nmero de partes de manera que en cada una de ellas
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
44
CUARTILES
Q1: Primer cuartil, que es el valor de la variable por debajo del cual queda 1/4
(25%) de los elementos de la serie estudiada.
Q3: Tercer cuartil, que es el valor de la variable por debajo del cual quedan
los 3/4 (75%) de los elementos que constituyen la serie.
4 f am
i
Q 1 Li
f
Dnde:
Se debe considerar el valor de la frecuencia acumulada mayor e igual a 25%
(0,25). Que define la clase del primer cuartil
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
45
N
4 = suma de las frecuencias dividida una cuarta parte (N/4) que define la
i = intervalo o razn.
Q3; el tercer cuartil se hallar aplicando la siguiente expresin matemtica:
3N
4 f am
i
Q 3 Li
f
Dnde:
Se debe considerar el valor de la frecuencia acumulada mayor e igual a 75%
(0,75). Que define la clase del tercer cuartil
DECILES
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
46
D1: Primer decil se considera el 10% de los valores de la serie por debajo de
N
l.
10
10 f am
i
D 1 Li
f
De acuerdo a la mediana y los cuartiles y como el primer decil las frmulas son
anlogas como ocurre con el resto de los deciles como en el caso D2, D3 al
D9. Por ejemplo el decil 7, deja el 70% de la masa o puntuacin de datos
investigados por debajo de l; y, su expresin ser:
D7: Sptimo decil se considera el 70% de los valores de la serie por debajo de
7N
l.
10
7N
10 f am
i
D 7 Li
f
PERCENTILES
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
47
100 f am
i
D 7 Li
f
P65: El percentil 65l se considera el 65% de los valores de la serie por debajo
65N
de l.
100
65 N
100 f am
i
D 7 Li
f
12,1
12,5
23,4
10,8
21,0
16,4
13,2
22,3
8,4
12,1
27,5
32,8
28,5
26,4
GEOESTADSTICA
25,1
16,0
15,7
13,9
23,5
23,9
32,2
32,6
14,7
22,5
14,8
20,6
19,9
19,1
17,4
9,2
16,0
21,2
13,5
19,2
25,8
14,5
23,2
18,1
13,9
23,1
18,7
27,9
12,8
8,9
9,1
11,1
18,8
14,4
7,8
SEGUNDO CICLO
Pgin
a
48
2 6 64 k 6 celdas en adelante
log 2 (n) K k log 2 (49)
Ni k 1
a
1
i
a
i
Ni 1
Ni
Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a = amplitud o recorrido de la variable
amplitud (a)
a
i
razn (i )
( Ni 1)
25
5 razn 5
6 1
el valor del primer Intervalo :
DISTRIBUCION DE FRECUENCIAS
Intervalos
Vi
Fi
Frecuencia
Acumulada
Pi
Pia
Fia
ViFi
7,8-12,8
10,3
10
10/49=0,204
10
10/49=0,204
100,3
12,8-17,8
15,3
14
14/49=0,286
24
24/49=0,49
214,2
17,8-22,8
20,3
9/49=0,184
33
33/49=0,637
182,7
22,8-27,8
25,3
11
11/49=0,225
44
44/49=0,889
278,3
27,8 -32,8
30,3
5/49= 0,102
49
49/49=1
152,5
49
1.00
TOTAL
GEOESTADSTICA
928,0
SEGUNDO CICLO
Pgin
a
49
Media Aritmtica:
F Vi
i 1
F
i 1
928,0
18,94
49
Primer Cuartil:
El primer cuartil, corresponde a la celda seleccionada es: 12,80-17,8; por lo
tanto, el valor del lmite para la mediana = 12,8
N
49
12,25
4
4
N
fa
4
i
.Q1 Li
f
Li 12,8
49
10
4
5 13,61
Q1 12,8
14
Segundo Cuartil:
El segundo cuartil; o mediana, corresponde a la celda seleccionada es: 17,8022,8; por lo tanto, el valor del lmite para la mediana = 17,8
N
49
24,5
4
2
N
fa
2
i
.Q2 Li
f
GEOESTADSTICA
Li 17,8
49
24
2
5 18,08
Q2 17,8
9
SEGUNDO CICLO
Pgin
a
50
Tercer Cuartil:
El valor del tercer cuartil; la celda seleccionada que contiene el valor es: 22,8027,8; por lo tanto, el valor del lmite para la mediana = 22,8
3N
3(49)
36,75
4
4
3N
fa
4
i
.Q3 Li
f
Li 22,8
3 * 49
33
4
5 24,5
Q3 22,8
11
Primer Decil:
El valor del primer decil; la celda seleccionada que contiene el valor es: 7,8012,8; por lo tanto, el valor del lmite para la mediana = 7,8
N
49
4,9
10
10
N
fa
10
i
.D1 Li
f
Li 7,8
49
0
10
5 10,25
D1 7,8
10
Segundo Decil:
El valor del segundo decil; la celda seleccionada que contiene el valor es:
7,80-12,8; por lo tanto, el valor del lmite para la mediana = 7,8
2N
2 * 49
9,8
10
10
2N
fa
10
i
.D2 Li
f
Li 7,8
98
0
10
5 12,7
D2 7,8
10
Tercer Decil:
El valor del tercer decil; la celda seleccionada que contiene el valor es: 12,8017,8; por lo tanto, el valor del lmite para la mediana = 12,8
3N
3 * 49
14,7
10
10
GEOESTADSTICA
Li 12,8
SEGUNDO CICLO
3N
fa
10
i
.D3 Li
f
Pgin
a
51
147
10
10
5 14,48
D3 12,8
14
Noveno Decil:
El valor del noveno decil; la celda seleccionada que contiene el valor es:
27,80-32,8; por lo tanto, el valor del lmite para la mediana = 27,8
9N
9 * 49
44,1
10
10
9N
fa
10
i
.D9 Li
f
Li 27,8
147
44
10
5 27,9
D9 27,8
5
Primer Percentil:
El valor del primer percentil; la celda seleccionada que contiene el valor es:
7,80-12,8; por lo tanto, el valor del lmite para la mediana = 7,8
N
49
0,49
100 100
N
fa
100
i
.P1 Li
f
Li 7,8
49
100
5 8,05
P1 7,8
10
15 N
735
7,35
100
100
15 N
fa
100
i
P15 Li
f
GEOESTADSTICA
Li 7,8
735
100
5 11,475
P15 7,8
10
SEGUNDO CICLO
Pgin
a
52
25 N
1225
12,25
100
100
25 N
fa
100
i
P25 Li
f
Li 12,8
1225
10
100
5 13,604
P25 12,8
14
53N
2597
25,97
100
100
53N
fa
100
i
P53 Li
f
Li 12,8
2597
10
100
5 18,5
P53 12,8
14
Nonagsimo percentil
El valor del nonagsimo percentil; la celda seleccionada que contiene el valor
es: 27,80-32,80; por lo tanto, el valor del lmite para la mediana = 12,8
90 N
4410
44,1
100
100
90 N
fa
100
i
P90 Li
f
GEOESTADSTICA
Li 27,8
4851
44
100
5 28,3
P90 27,8
5
SEGUNDO CICLO
Pgin
a
53
99 N
4851
48,51
100
100
99 N
fa
100
i
P99 Li
f
Li 27,8
4851
44
100
5 32,31
P99 27,8
5
EJERCICIO 2
Se realiza la determinacin del peso (gramos) de seis muestras de una roca
obtenindose los siguientes valores: 320, 750, 720, 820, 940y, 997. Con estos
valores determinar la media geomtrica.
f
f
f
f
MG = X11 X22 X33 Xnn
MG = 1,328 1017
MG = 714,27
EJERCICIO 3
Supngase que una familia realiza un viaje en automvil a un ciudad y cubre
los primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los ltimos
100 km a 80 km/h. Calcular, en esas condiciones, la velocidad media realizada.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
54
1
1 1
1
1
(1 + 2 + + )
1
= 69,041
1 1
1
1
(
+
+
)
3 60 70 80
EJERCICIO 4
En un curso de Matemticas Superiores; se asignan pesos de importancia, de
la siguiente forma: Unida I (20% del curso), Unidad II (25% del curso), Unidad
III (20% del curso), Unidad IV (15% de la calificacin), Unidad V (20% de la
calificacin). Si las calificaciones de un alumno son 8 en la primera unidad, 5 en
la segunda, 8 en la tercera unidad, 10 en la cuarta unidad y 8 en la ltima
unidad. Es decir, se tienen la siguiente tabla:
Unidad
I
II
III
IV
V
Ponderacin (Wi)
20% = 0.2
25% = 0.35
20% = 0.2
15% = 0.15
20% = 0.10
Datos (Wi)
8
5
8
10
8
=1
=1
GEOESTADSTICA
7,25
= 7,25
1
SEGUNDO CICLO
Pgin
a
55
Dm
i 1
xi x
N
Dm
x
i 1
x fi
N
GEOESTADSTICA
SEGUNDO CICLO
Dmc
x
i 1
Dmc
x
i 1
Pgin
a
56
fi
2
2
Varianza ; S .
La varianza poblacional.
Datos no acumulados 2
f i xi x
i 1
x
n
i 1
La varianza muestral
Datos acumulados S 2
GEOESTADSTICA
f
i 1
xi x
n 1
SEGUNDO CICLO
Pgin
a
57
Desviacin estndar
Desviacin tpica.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
i 1
f i xi x
x
i 1
58
x fi
2
Desviacin estndar
La desviacin estndar para una muestra se utiliza como estimador de la
desviacin estndar de una poblacin. Segn se observ antes la desviacin
estndar poblacional es la raz cuadrada
de la varianza poblacional. De
f
i 1
xi x
N 1
En poblacione s
x
n
i 1
GEOESTADSTICA
n
xi
n
i 1
2
xi
N
S i 1
N
n
xi
n
i 1
2
xi f i
N
S i 1
N
SEGUNDO CICLO
Pgin
a
59
En muestras
n
xi
n
i 1
2
xi
n
i 1
N 1
x
f
i
i
n
i 1
2
xi f i
N
i 1
N 1
Coeficiente de Variacin:
En estadstica, cuando se desea hacer referencia a la relacin entre el tamao
de la media y la variabilidad de la variable, se utiliza el coeficiente de variacin.
Su frmula expresa la desviacin estndar como porcentaje de la media
aritmtica, mostrando una mejor interpretacin porcentual del grado de
variabilidad que la desviacin tpica o estndar. Por otro lado presenta
problemas ya que a diferencia de la desviacin tpica este coeficiente es
variable ante cambios de origen. Es importante que todos los valores sean
positivos y su media ser por tanto, un valor positivo. A mayor valor del
coeficiente de variacin mayor heterogeneidad de los valores de la variable; y a
menor coeficiente de variacin, mayor homogeneidad en los valores de la
variable.
Por lo cual, exige que:
Sx
x
100
CV = |xx| 100
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
60
Ejemplo de Aplicacin:
EJERCICIO 1
Para los resultados en el estudio de la ley de oro en una mina, se tiene que en
una muestra de 40 porciones de roca: los anlisis realizados para determinar
su concentracin (en gr/Tn), sus valores se sintetizan en el siguiente cuadro. A
partir de la informacin determine las medidas de dispersin estudiadas con
anterioridad.
11,1
12,5
32,4
7,8
21
16,4
11,2
22,3
4,4
6,1
27,5
32,8
18,5
16,4
15,1
6,0
10,7
15,8
25,0
18,2
12,2
12,6
4,7
23,5
14,8
22,6
16
19,1
7,4
9,2
10,0
26,2
3,5
16,2
14,5
3,2
8,1
12,9
19,1
13,7
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
61
Dnde:
Ni = nmero de celdas o intervalos.
i = ancho de celda.
a =amplitud o recorrido de la variable
Ni k 1
a
Ni 1
i
a
i
Ni 1
amplitud (a)
a
i
razn (i )
( Ni 1)
29.6
4,933 razn 4,94
7 1
el valor del primer Intervalo :
0,06
0,03
2
3.2 0,03 3,17 3,17 4,94 8,11
4,94 4,93 0,01 6
Intervalos
xi
fi
xi f i
xi x
f i xi x
3,17 - 8,11
5,64
50,76
9,139
82,251
83,5213
751,69189
8,11 - 13,05
10,58
95,22
4,199
37,791
17,631601
158,6844
13,05 - 17,99
15,52
139,68
0,741
6,669
0,549081
4,941729
17,99 - 22,93
20,46
143,22
5,681
39,767
32,27376
225,9163
22,93 - 27,87
25,40
101,60
9,621
38,484
92,56364
370,2546
27,87 - 32,81
30,34
60,68
15,561
31,122
242,1447
484,2894
... =40
... =591,16
... =236,084
xi x
f i xi x
...
=1995,77832
a. Media Aritmtica:
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
62
F Vi
i 1
F
i 1
591,16
14,779
40
b. Desviacin media
Dm
x
i 1
x fi
Dm
236,084
5,9021
40
c. La Varianza:
S x2
f
i 1
xi x
n 1
1995,77832
51,1738
40 1
d. Desviacin Estndar:
Sx
f
i 1
xi x
n 1
1995,77832
51,1738 7,1536
39
e. Coeficiente de Variacin:
CV
GEOESTADSTICA
Sx
x
100 CV
7,1536
100 48,4%
14,779
SEGUNDO CICLO
Pgin
a
63
EJERCICIO 2
Para el estudio y tratamiento de inmersin para determinar el fosforo orgnico;
y , las diferentes especies de fsforo en aguas naturales (prueba de campo in
situ), se obtiene los resultados que se detallan a continuacin: Sobre la base
de la informacin detallada, determine las medidas de dispersin
54
43
44
45
38
38
39
40
42
34
33
37
35
34
37
36
35
34
33
34
37
28
29
30
31
32
32
28
29
30
31
23
24
27
23
24
25
26
18
19
18
19
19
13
14
15
16
17
9
10
xi
fi
xi f i
xi x
f i xi x
6,5-11,5
18
20,4
40,8
416,16
832,32
11,5-16,5
14
56
15,4
61,6
237,16
948,64
16,5-21,5
19
114
10,4
62,4
108,16
648,96
21,5-26,5
24
144
5,4
32,4
29,16
174,96
26,5-31,5
29
261
0,4
3,6
0,16
1,44
31,5-36,5
34
11
374
4,6
50,6
21,16
232,76
36,5-41,5
39
273
9,6
67,2
92,16
645,12
41,5-46,5
44
176
14,6
58,4
213,16
852,64
46,5-51,5
49
19,6
0,0
384,16
0,00
51,5-56,5
54
54
24,6
24,6
605,16
605,16
GEOESTADSTICA
... =401,6
xi x
f i xi x
... =4942
SEGUNDO CICLO
Pgin
a
64
amplitud (a )
a
i
razn ( i )
Nc
45
4,5 razn 5
10
el valor del primer Intervalo :
i
5
2,5
2
9 2,5 6,5 6,5 5 11,5
5 4,5 0,5 10 5
a) Media aritmtica
n
i 1
xi
f
i 1
1470
29,4
50
b. Desviacin media
Dm
x
i 1
x fi
Dm
401,6
8,032
50
c) La Varianza:
S x2
GEOESTADSTICA
f
i 1
xi x
n 1
4942
100,8571
49
SEGUNDO CICLO
Pgin
a
65
d) Desviacin Estndar:
n
Sx
i 1
xi x
n 1
4942
100,8571 10,043
49
e) Coeficiente de Variacin:
CV
Sx
x
100 CV
10,043
100 34,16%
29,4
LA COVARIANZA
La covarianza estadsticamente es una medida de la variacin comn a dos
variables y, por tanto, una medida del grado y tipo de su relacin. Por lo cual
se constituye en una medida del grado en que dos variables aleatorias se
mueven en la misma direccin o en direcciones opuestas la una respecto a la
otra. En otras palabras, si dos variables aleatorias generalmente se mueven en
la misma direccin se dir que tienen una covarianza positiva. Si tienden a
moverse en direcciones opuestas, se dir que tienen una covarianza negativa.
La covarianza se mide como el valor que se espera de los productos de las
desviaciones de dos variables aleatorias respecto a sus correspondientes
medias. Una varianza es un caso especial de covarianza.
S xy
GEOESTADSTICA
1 n
x i x y i y
n 1 i 1
SEGUNDO CICLO
Pgin
a
66
Desviacin ( x )
Desvicin ( y )
x n 1
x n 1
S S
y n 1
y n 1
1 n
x i x
n 1 i 1
1 n
y i y
n 1 i 1
LA CORRELACIN Y REGRESIN
En las unidades de geometra, algebra, algebra lineal generalmente la relacin
entre las variables es de tipo determinista; esto es, dado un valor de una de las
variables, el valor de la otra variable se determina automticamente; y podra
afirmarse sin error. Entre tanto en estadstica estamos interesados en
relaciones entre variables aleatorias; y, por tanto una de las variables no queda
determinada por completo por otra de las variables, por lo cual se espera
determinar slo estimaciones.
Las relaciones estadsticas se obtienen mediante una primera fase de
exploraciones conocida como anlisis de correlacin, que consiste en analizar
los datos para conocer el grado de asociacin o correlacin entre dos o ms
variables de una poblacin. El grado de correlacin se expresa como un
nmero comprendido entre (-1 y +1) y se le conoce como coeficiente de
correlacin. Por ello como corresponde a un estudio exploratorio, el anlisis de
correlacin no es un fin en s mismo sino que su objetivo es establecer la
pertinencia de la segunda fase o anlisis de regresin; el mismo que nos facilita
establecer una funcin = () , que describe estadsticamente la asociacin o
relacin entre las variables de estudio; y, por lo tanto, su fin no es calcular sin
error sino obtener predicciones del valor de una variable, para un valor dado de
una variable.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
67
LA CORRELACIN
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
68
vara de +1 a 1 Lo cual nos indica la fuerza de la relacin que existe entre las
variables. Cuando
expresa una
relacin negativa, mientras que = 0 indica que no hay relacin (o que las
variables son independientes y no estn relacionadas). Cuando el valor de
= 1 describe una correlacin positiva perfecta y
si el valor de = 1 ,
( < , )
Negativa fuerte
( , < < , )
Negativa moderada
( , < )
Negativa dbil
( )
No existe
( < . )
Positiva dbil
(. < < . )
Positiva moderada
(. < )
Positiva fuerte
(+)
Positiva perfecta
GEOESTADSTICA
Negativa perfecta
SEGUNDO CICLO
Fuerza de relacin
( , ); , (+ + , )
Fuerte
(, , ); , (+, + , )
Moderada
(, , ); , (+, + , )
Dbil
(, + , )
Pgin
a
69
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
70
xy
S xy
SxSy
(, ) (,)
1
=
[( )( )]
1
=1
Desviacin ( x)
S S
Desvicin ( y )
S S
x n 1
y n 1
x n 1
y n 1
1 n
x
i
n 1 i 1
1 n
y i y
n 1 i 1
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
xi x
yi y
20
16
14
12
8
18
15
12
10
5
10
12
12
10
7
16
14
9
8
2
7
3
1
-1
-5
5
2
-1
-3
-8
0
2
2
0
-3
6
4
-1
-2
-8
x y i y
0
6
2
0
15
30
8
1
6
64
x =130 y =100
49
9
1
1
25
25
4
1
9
64
... =132
71
0
4
4
0
9
36
16
1
4
64
xy
y 10
S xy
Sx Sy
Covarianza x , y S xy
n 10
S xy
1
132 14,67
10 1
Desviacin ( x )
Desvicin ( x)
n 10
n 10
Desvicin ( y )
GEOESTADSTICA
n 11
S 1 S
x
188 20,89
n 1 4,57
S x n 1
n 10
1 n n
2
1
x n 1
x n 1
n 1 ix1 i x 2
S x n 1 S x n 1
n
Desviacin ( x)
S x n 1
1 n
x i x y i y
n 1 i 1
S y n 1
i 1
x n 1
x n 1
i 1
10 1
1
188 20,89 4,57
10 1
S S
y n 1
y n 1
1 n
y
i
n 1 i 1
1
138 15,333 3,92
10 1
SEGUNDO CICLO
xy
S xy
SxSy
xy
14,67
0,82
4,57 3,92
Pgin
a
72
xy 0,82
DIAGRAMA DE DISPERSIN:
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
73
EJERCICIO 1
Utilizando los datos obtenidos para una altitud de 926 metros, con valores
promedios mensuales y que se detallan en el cuadro de valores; se requiere
conocer y cuantificar la relacin entre las variables que participan en el
diagrama de dispersin (climograma). Con las variables que son caractersticas
para las determinaciones climticas dentro del anlisis correspondiente:
ALTITUD: 926 m.
MES
ENERO
FEBRERO
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
SEPTIEMBRE
OCTUBRE
NOVIEMBRE
DICIEMBRE
PROMEDIO MENSUAL
TEMPERATURA PRECIPITACIN
C
mmH2O
2,8
57
4
42
8
57
10
43
13
52
17
41
20
18
20
17
17
36
12
49
4
57
7
63
70
60
50
40
30
20
10
0
0
10
15
20
25
TEMPERATURA [c]
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
74
EJERCICIO 2
Utilizando los datos para la altitud de 58 metros, que se detallan en el cuadro
de valores siguientes: Se desea cuantificar la relacin entre las variables que
participan en el diagrama de dispersin (climograma). Con el objetivo de definir
las variables que son caractersticas climticas para su anlisis:
ALTITUD: 58 m
MES
ENERO
FEBRERO
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
SEPTIEMBRE
OCTUBRE
NOVIEMBRE
DICIEMBRE
PROMEDIO MENSUAL
TEMPERATURA PRECIPITACIN
10,2
131
10,5
104
11,3
86
12,1
83
14,1
78
16,4
49
18,4
25
18,8
29
18,1
62
15,7
104
12,6
116
10,9
128
140
120
100
80
60
40
20
0
0
10
15
20
TEMPERATURA [c]
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
75
EJERCICIO 3
Utilizando los datos de las puntuaciones de prueba y la produccin semanal de
artculos de artesana de seis vendedores en una empresa de produccin, se
tiene los valores definidos en el cuadro siguiente; sobre los cuales se desea
cuantificar la relacin entre las variables que participan en el diagrama de
dispersin:
CODIGO DEL VENDEDOR
PUNTUACIONES
VENTA DOLARES
A-1221-14
250
A-1221-15
325
A-1221-16
12
800
A-1221-17
700
A-1221-18
700
A-1221-19
600
A-1221-20
500
A-1221-21
10
600
900
800
VENTA EN DOLARES
700
600
500
400
300
200
100
0
0
10
12
14
PUNTUACIONES
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
76
COEFICIENTE DE CORRELACIN:
( ) ( )
( 1)
( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
EJERCICIO 1
Utilizando el anlisis de correlacin simple
determinar el coeficiente de
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
77
10
12
12
10
7
16
14
9
8
2
DIAGRAMA DE DISPERSIN
CONTENIDOS DE PLATA (g/Tn)
18
16
14
12
10
8
6
4
2
0
0
10
15
20
25
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
Nmero
de datos
"n"
1
2
3
4
5
6
7
8
9
10
TOTAL
10
12
12
10
7
16
14
9
8
2
100
400
256
196
144
64
324
225
144
100
25
1878
78
X*y
100
144
144
100
49
256
196
81
64
4
1138
200
192
168
120
56
288
210
108
80
10
1432
( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
10(1432) (130)(100)
= 0,8192
EJERCICIO 2
Utilizando los datos obtenidos para una altitud de 926 metros, con valores
promedios mensuales y que se detallan en el cuadro de valores; se requiere
conocer y cuantificar la relacin entre las variables que participan en el
diagrama de dispersin (climograma). Con las variables que son caractersticas
para las determinaciones climticas dentro del anlisis correspondiente:
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
79
TEMPERATURA PRECIPITACIN
"x"
2,8
4
8
10
13
17
20
20
17
12
4
7
"y"
57
42
57
43
52
41
18
17
36
49
57
63
70
60
50
40
30
20
10
0
0
10
15
20
25
TEMPERATURA [c]
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
TEMPERATURA PRECIPITACIN
Nmero
de datos
"n"
1
2
3
4
5
6
7
8
9
10
11
12
TOTAL
"x"
X*y
3249
1764
3249
1849
2704
1681
324
289
1296
2401
3249
3969
26024
159,6
168
456
430
676
697
360
340
612
588
228
441
5155,6
"y"
2,8
4
8
10
13
17
20
20
17
12
4
7
134,8
80
57
42
57
43
52
41
18
17
36
49
57
63
532
7,84
16
64
100
169
289
400
400
289
144
16
49
1943,84
( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
12(5155,6) (134,8)(532)
= 0,8017
EJERCICIO 3
Utilizando los datos para la altitud de 58 metros, que se detallan en el cuadro
de valores siguientes: Se desea cuantificar la relacin entre las variables que
participan en el diagrama de dispersin (climograma). Con el objetivo de definir
las variables que son caractersticas climticas para su anlisis:
a. Diagrama de dispersin de los datos
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
81
140
120
100
80
60
40
20
0
0
10
15
20
TEMPERATURA [c]
b.
1
2
3
4
5
6
7
8
9
10
11
12
TOTAL
Temperatura
Precipitacin
"x"
10,2
10,5
11,3
12,1
14,1
16,4
18,4
18,8
18,1
15,7
12,6
10,9
169,1
X
"y"
131
104
86
83
78
49
25
29
62
104
116
128
995
104,04
110,25
127,69
146,41
198,81
268,96
338,56
353,44
327,61
246,49
158,76
118,81
2499,83
X*y
17161
10816
7396
6889
6084
2401
625
841
3844
10816
13456
16384
96713
1336,2
1092
971,8
1004,3
1099,8
803,6
460
545,2
1122,2
1632,8
1461,6
1395,2
12924,7
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
82
( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
12(12924,7) (169,1)(995)
= 0,8506
REGRESIN
En estadstica, el anlisis de regresin es un proceso estadstico para la
estimacin de relaciones entre variables, lo que permite obtener una nueva
relacin pero de un tipo especial denominado funcin, en la cual la variable
independiente se asocia con un indicador de tendencia central de la variable
dependiente. Incluye muchas tcnicas para el modelado y anlisis de diversas
variables, cuando la atencin se centra en la relacin entre una variable
dependiente y una o ms variables independientes. Ms especficamente, el
anlisis de regresin ayuda a entender cmo el valor tpico de la variable
dependiente cambia cuando cualquiera de las variables independientes es
variada, mientras que se mantienen las otras variables independientes fijas.
Ms comnmente, el anlisis de regresin estima la esperanza condicional de
la variable dependiente dadas las variables independientes - es decir, el valor
promedio de la variable dependiente cuando se fijan las variables
independientes. Con menor frecuencia, la atencin se centra en un cuantil u
otro parmetro de localizacin de la distribucin condicional de la variable
dependiente dadas las variables independientes. En todos los casos, el objetivo
es la estimacin de una funcin de las variables independientes llamada la
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
83
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
84
Donde 0.
( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
objetivo, se realiza la
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
85
= +
= +
( ) ( )( )
( 2 ) ( )2
( )
( )
Donde 0.
Recordemos que:
, =
=
=
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
"x" [m]
-3
-2
-1
0
1
2
3
d.
86
"y" [pH]
7.5
3
0.5
1
3
6
14
"x"
"y"
x*y
-3
7.5
56.25
-22.5
-2
-6
-1
0.5
0.25
-0.5
36
12
14
196
42
35
28
307.5
28
TOTAL
-3
GEOESTADSTICA
-2
-1
SEGUNDO CICLO
Pgin
a
87
( ) ( )( )
[( 2 ) ( )2 ] [( 2 ) ( )2 ]
7(28) (0)(35)
[7(28) (0)2 ] [7(307,5) (35)2 ]
196
= 0,4597
:
:
= +
= +
= +
GEOESTADSTICA
( ) ( )( )
( 2 ) ( )2
7(28) (0)(35)
=1
7(28) (0)2
SEGUNDO CICLO
88
( )
( )
35
7
Pgin
a
0
7
=5
= + = +
= , ()
Por lo cual se concluye que este modelo de ajuste lineal no es el adecuado
para esta base de datos (ndice de correlacin de 0,4597); que ratifica la
ubicacin de los puntos en el diagrama de dispersin correspondiente.
Donde 0.
2 =
GEOESTADSTICA
( )( )
( 2 )( )
) + ( 2
)
( )2
( 2 )
SEGUNDO CICLO
Pgin
a
89
= + +
= + 2 +
2 = 2 + 3 + 4
[ 2
( )( )
( 2 )2
( 2 )( )
( 2 )( )
4
2
3
]
[
]
[
]
[
]
2
2
( )2
( 2 )2
3 ( )( )]
[ 2 ] [ 4
]
[
( 2 )( )
( )( )
( )2
( 2 )( )
2
3
]
[
]
[
] [
]
2
2
( )2
( 2 )2
3 ( )( )]
[ 2 ] [ 4
]
[
( ) ( ) ( 2 )
=[
]
= 2 + +
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
90
"y" [pH]
-3
7.5
-2
-1
0.5
14
"n"
"x"
"y"
xy
x y
-3
7.5
-27
81
56.25
-23
67.5
-2
-8
16
-6
12
-1
0.5
-1
0.25
-0.5
0.5
16
36
12
24
14
27
81
196
42
126
TOTAL
35
28
196
307.5
28
233
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
91
16
14
12
10
8
6
4
2
0
-4
-3
-2
-1
( )( )
( 2 )2
( 2 )( )
( 2 )( )
4
2
3
]
[
]
[
]
[
]
2
2
( )2
( 2 )2
3 ( )( )]
[ 2 ] [ 4
]
[
(28
(28)2
(28)(35)
(28)(0)
0 35
)
(196
) (0
7
7 ) (233
7
7 )
(0)2
(28)2
(28)(0) 2
(28 7 ) (196 7 ) (0
7 )
GEOESTADSTICA
2352
=
2352
SEGUNDO CICLO
[ 2
Pgin
a
92
( 2 )( )
( )( )
( )2
( 2 )( )
2
3
]
[
]
[
] [
]
2
2
( )2
( 2 )2
3 ( )( )]
[ 2 ] [ 4
]
[
(0)2
(28)(35)
(28)(0)
0 35
(28 7 ) (233
) (0
7
7 ) (28 7 )
=
(0)2
(28)2
(28)(0) 2
(28
) (196
) (0
)
7
7
7
2604
= ,
2352
( ) ( ) ( 2 )
=[
]
2 =
1 (28
2 =
GEOESTADSTICA
( )( )
( 2 )( )
2
)
+
( )2
( 2 )
(28)(35)
0 35
)
7 ) + 1,107 (233
7
(35)2
(307,5 7 )
121
= 0,913 = 0,96
132,5
SEGUNDO CICLO
Pgin
a
93
= + +
= + 2 +
2 = 2 + 3 + 4
35 = 7 + (0) + (28) = +
28 = (0) + (28) + (0) = =
233 = (28) + (0) + (196 ) = +
=
= + = =
= ,
= + (, ) =
= ,
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
94
= 2 + +
= , + + ,
Por lo cual se concluye que este modelo de ajuste lineal es el adecuado para
esta base de datos (ndice de correlacin de 0,96). Ecuacin de ajuste que
permite definir la relacin para los nuevos valores de las variables.
Otro tipo de funcin que tiene su aplicacin dentro del anlisis de regresin es
la funcin exponencial como ecuacin de ajuste para un conjunto o serie de
datos. Como resultado, obtenemos una ecuacin de la forma:
= .
Donde , 0.
ln = n ln + ln ()
log() = ln + log()
GEOESTADSTICA
SEGUNDO CICLO
95
[( )] ( )( )
( 2 ) ( )2
() =
Pgin
a
( ) ( )
( )
( )
( )( )
EJERCICIOS DE APLICACIN
"x"
"y"
-3
-2
-1
0
1
2
3
0
GEOESTADSTICA
7,5
3
0,5
1
3
6
14
35
lny
2,015
1,099
-0,693
0
1,099
1,792
2,639
7,951
x
9
4
1
0
1
4
9
28
x(lny)
-6,045
-2,198
0,693
0
1,099
3,584
7,917
5,05
(lny)
4,060
1,208
0,480
0
1,208
3,211
6,964
17,131
SEGUNDO CICLO
96
[( )] ( )( )
( 2 ) ( )2
() =
Pgin
a
( ) ( )
( )
( )
(7,951)0,1804(0)
7
( )( )
(7,951)
7
= 1,136 = 3,1138
(( ) ( )( )
[( 2 ) ( )2 ] [(()2 ) ( ln )2 ]
7(5,05) (0)(7,951)
[7(28) (0)2 ] [7(17,131) (7,951)2 ]
7(5,05)
GEOESTADSTICA
= 0,3362
SEGUNDO CICLO
Pgin
a
97
EJERCICIOS DE APLICACIN
"n"
1
2
3
4
5
TOTAL
"x"
"y"
21,4
15,7
12,1
8,5
5,2
62,9
6,9
12,9
19,8
26,7
35,1
101,4
lny
3,063
2,754
2,493
2,14
1,649
12,099
x
47,61
166,41
392,04
712,89
1232,01
2550,96
x(lny)
21,1347
35,5266
49,3614
57,138
57,8799
221,0406
(lny)
9,382
7,585
6,215
4,58
2,719
30,481
[( )] ( )( )
( 2 ) ( )2
GEOESTADSTICA
( )
( )
SEGUNDO CICLO
( ) ( )
=
=
(12,099)(0,04919)(101,4)
5
Pgin
a
98
( )( )
(7,111134)
5
= 1,422268 = 4,146343
=
(( ) ( )( )
[( 2 ) ( )2 ] [(()2 ) ( ln )2 ]
5(221,0406) (101,4)(12,099)
1105,203 1226,8386
[2472,84] [6,019199]
121,6356
= 0,997
122,00212
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
99
REGRESIN LOGARTMICA
Otro tipo de funcin que tiene su aplicacin dentro del anlisis de regresin es
la funcin logartmica; como ecuacin de ajuste para un conjunto o serie de
datos. Como resultado, obtenemos una ecuacin de la forma:
= + ln()
Donde 0.
[( )] ( )( )
()2 ( )2
( )
(( ) ( )( )
[ ()2 ( )2 ] [( 2 ) ( )2 ]
EJERCICIOS DE APLICACIN
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
100
"n"
1
2
3
4
5
TOTAL
"x"
"y"
29
50
74
103
118
374
1,6
23,5
38
46,4
48,9
158,4
lnX
3,367
3,912
4,304
4,635
4,771
20,989
y
2,56
552,25
1444
2152,96
2391,21
6542,98
Y(lnx)
5,3872
91,932
163,552
215,064
233,3019
709,2371
(lnx)
11,337
15,304
18,524
21,483
22,762
89,41
158,4 = 5 + 20,989
709,2371 = 20,989 + 89,41 (20,989)
=
=
[( )] ( )( )
()2 ( )2
5[709,2371] (158,4)(20,989)
= 34,0190
5(89,41) (20,989)2
=
GEOESTADSTICA
( )
SEGUNDO CICLO
=
=
158,4
5
34,0190
20,989
5
Pgin
a
101
= 111,125
(( ) ( )( )
[ ()2 ( )2 ] [( 2 ) ( )2 ]
5(709,2371) (158,4)(20,989)
221,5279
= 0,9942
222,82
REGRESIN POTENCIAL
Otro tipo de funcin que tiene su aplicacin dentro del anlisis de regresin es
la funcin potencia; como ecuacin de ajuste para un conjunto o series de
datos. Como resultado, obtenemos una ecuacin de ajuste de la forma:
=
(ln ) = ln + ()
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
102
= () + ()
()() = () + ()
EJERCICIOS DE APLICACIN
"x" profundidad
28
30
33
35
38
"y" [Na]
2410
3033
3895
4491
5717
GEOESTADSTICA
20
25
30
35
40
SEGUNDO CICLO
Pgin
a
"n"
1
2
3
4
5
TOTAL
"x"
"y"
28
2410
30
3033
33
3895
35
4491
38
5717
164 19546.0
lnX
3.3322
3.4012
3.4965
3.5553
3.6376
17.423
(lny)(lnx)
25.9491
27.2684
28.9072
29.8999
31.4695
143.494
(lnx)
11.1036
11.5681
12.2256
12.6405
13.2320
60.770
(lny)
60.6433
64.2772
68.3507
70.7253
74.8433
338.840
[( )] ( )( )
()2 ( )2
5[143,494] (41,133)(17,423)
= 2,8011
5(60,770) (17,423)2
=
=
lny
7.7874
8.0173
8.2674
8.4098
8.6512
41.133
103
( )
41,133
17,423
2,8011
= 1.53411306
5
5
= 1.53411306 = 0,215647
(( ) ( )( )
[ ()2 ( )2 ] [ ()2 ( )2 ]
5(143,494) (41,133)(17,423)
0,809741
= 0,99976
0,809932
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
104
y = 0,215647 + 2,8011x
Ejercicio 2
de entre otros
"x" ( % C)
2.5
3
4
5
5.5
6
7
"y"[g de Ca]
12.5
10
7
4.5
4
3
3.5
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
105
14
12
g de Calcio
10
8
6
4
2
0
2
% de Carbono Orgnico
"n"
1
2
3
4
5
6
7
TOTAL
"x"
2.5
3
4
5
5.5
6
7
33
"y"
12.5
10
7
4.5
4
3
3.5
44.5
lnX
0.9163
1.0986
1.3863
1.6094
1.7047
1.7918
1.9459
10.453
lny
(lny)(lnx)
2.5257 2.3143
2.3026 2.5296
1.9459 2.6976
1.5041 2.4207
1.3863 2.3633
1.0986 1.9684
1.2528 2.4378
12.016
16.732
(lnx)
0.8396
1.2069
1.9218
2.5903
2.9062
3.2104
3.7866
16.462
(lny)
6.3793
5.3019
3.7866
2.2622
1.9218
1.2069
1.5694
22.428
[( )] ( )( )
() ( )
7[16,732] (12,016)(10,453)
= 0,2908807387
7(16,462) (12,016)2
GEOESTADSTICA
( )
SEGUNDO CICLO
12,016
7
0,29088
Pgin
a
106
(10,453)
= 1,2822
7
= 1,2822 = 3,6046
(( ) ( )( )
[ () ( ) ] [ () ( ) ]
7(16,732) (10,453)(12,016)
[7(16,462) (10,453)2 ] [7(22,428) (12,016)2 ]
8,47925
=
= 0,9773
8,6762
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
107
Tal como se conoce hoy da, el anlisis de varianza es una tcnica estadstica
que permite analizar datos provenientes de un experimento aleatorio
comparativo. El anlisis de varianza (ANOVA) se constituye en un conjunto de
procedimientos que se ajustan a las caractersticas del diseo experimental
usado en la obtencin de datos. No es un mtodo fijo, por el contrario, se
adapta a cada diseo particular. Si el diseo es unifactorial se aplica ANOVA
de clasificacin simple o de una va; si el diseo es multifactorial, el ANOVA
correspondiente ser de dos vas (dos factores), de tres vas (tres factores), y
as sucesivamente. Si se tiene un factor y una variable de agrupacin (diseo
de bloques) el ANOVA tambin es de dos vas. Si se tiene un factor y dos
variables de agrupacin (diseo de cuadro latino) el ANOVA ser de tres vas,
esto se generaliza al caso de n-vas de clasificacin.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
108
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
109
de
un
modelo
lineal,
tanto
con
el
uso
del
modelo
MUESTRA
MEDICIONES COMPONENTES
A
1
2
3
4
5
6
7
8
Tabla 1. Coordenadas sitio de muestreo y Caractersticas de la muestras
HIPTESIS
(Plantear la hiptesis)
ENUNCIADO
OPERACIONAL
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
110
ANLISIS DE VARIANZA.
1. SUMA TOTAL DE LOS CUADRADOS ( ):
( )
GEOESTADSTICA
( )
( )
]
SEGUNDO CICLO
Pgin
a
111
Para obtener la suma de los cuadrados dentro de los grupos se resta cada
puntuacin, grupo por grupo, de la media del grupo, se elevan al cuadrado las
diferencias y se suman los resultados obtenidos. Caso contrario se analiza
cada uno de los grupos cuyos valores son:
Para el Grupo 1:
x2 = X2
( X)2
N
x2 = X2
( X)2
N
Para el Grupo 2
Para el Grupo 3
( X)2
x = X
N
2
En el anlisis se tiene a partir del nmero de casos, por lo que los grados de
libertad: gl = (N 1), y de manera semejante se determina para cada grupo.
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
112
5. EL ANLISIS DE LA VARIANZA
GRADOS DE
LIBERTAD [gl]
SUMA DE
CUADRADOS [SC]
CUADRADOS
MEDIOS [CM]
F=
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
113
por fila superior y con el nmero de grados de libertad del cuadrado medio
menor por la columna izquierda. Cuando el valor calculado de F es mayor por
tanto NO SE ACEPTA LA HIPTESIS NULA esto es que existe una diferencia
significativa de las medias a nivel del 5 por 100. Es importante recordar que
aunque en este contraste se utiliza un estadgrafo que es la razn de dos
varianzas, la hiptesis Nula consiste en afirmar la igualdad de las medias de las
muestras esto es: H0 : 1 = 2 = 3
Al
PROBLEMAS DE APLICACIN:
N casos
CONSERVADORES
1
2
3
4
1
2
1
2
GEOESTADSTICA
MODERADOS
1
3
2
2
LIBRERALES
1
2
2
2
RADICALES
3
2
1
1
SEGUNDO CICLO
Pgin
a
MUESTRA
114
SOLUCIN NUTRITIVA
CUADRADO DE LAS CONCENTRACIONES
CONCENTRACIN EN KNO3 (g/L) de agua TC- A
TC- B
TC- C
TC- D
M1
M2
M3
M4
TC- A
1
2
1
2
TC1
3
2
2
TC-C
1
2
2
2
TC- D
3
2
1
1
X2
1
4
1
4
SUMATORIA
10
1,5
1,75
1,75
X2
1
9
4
4
18
X3
1
4
4
4
13
X4
9
4
1
1
15
1,75
ANLISIS DE VARIANZA.
SUMA TOTAL DE LOS CUADRADOS ( ):
( ) = ( + + + )
( )
( + + + )
=
( )
( )
]
GEOESTADSTICA
SEGUNDO CICLO
= [
Pgin
a
115
()
()
]
=
X2= 10 + 8 + 13 + 15 = 56
XT = 6 + 8 + 7 + 7 = 28
T = 7 / 4 = 1.75
Clculo de:
SCinter = (
T)2 n
x1 = 6 x12 = 10
= 1.5
n=
4
x2 = 8 x22 = 18
=2
n = 4 xT = 28
x3 = 7
= 1.75 n = 4 T = 1.75
x32
= 13
x4 = 8 x42 = 15
= 1.75 n = 4 XT2 = 56
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
116
Clculo de:
Comprobacin
SCT = SCinter + SCintra
SCintra = SCT - SCinter
SCinter = 0.48 = 0.5
SCintra = 6.5
SCT = 6.5 + 0.5 = 7
SCintra = 7 - 05 = 6.5
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
117
15 12 12 14 10
Se aprecia que varan las medias de los grupos. Esta variacin de las medias de grupo a
partir de la media total o global de todos los grupos, se conoce como varianza
intergrupal, la variabilidad promedio de las puntuaciones en cada grupo se denominan
varianza intergrupal. Ahora se colocan todas las puntuaciones de CI en una gran urna y
se mezclan en forma adecuada. Puede desentenderse por el momento cules
puntuaciones pertenecen a que grupos. Estas puntuaciones varan. La variacin de estas
puntuaciones individuales se denominan variacin total. El meollo del anlisis de
varianza radica en el siguiente hecho: si los grupos son muestras aleatorias provenientes
de la misma poblacin, las varianzas, intergrupal e intragrupal, son estimaciones
insesgadas de la misma varianza poblacional. Se prueba la significacin de la diferencia
de los 2 tipos mediante la prueba F.
Ejemplo:
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
118
X2= 10 + 8 + 13 + 15 = 56
XT = 6 + 8 + 7 + 7 = 28
T = 7 / 4 = 1.75
Clculo de:
SCinter = (
T)2 n
x1 = 6 x12 = 10
= 1.5
n=
4
x2 = 8 x22 = 18
=2
n = 4 xT = 28
x3 = 7
= 1.75 n = 4 T = 1.75
x32
= 13
x4 = 8 x42 = 15
= 1.75 n = 4 XT2 = 56
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
119
Clculo de:
Comprobacin
SCT = SCinter + SCintra
SCintra = SCT - SCinter
SCinter = 0.48 = 0.5
SCintra = 6.5
SCT = 6.5 + 0.5 = 7
SCintra = 7 - 05 = 6.5
GEOESTADSTICA
SEGUNDO CICLO
Pgin
a
120
glinter = K - 1 = 4 - 1 = 3
glintra = NT + K = 16 - 4 = 12
Otras medidas:
Coeficiente de Asimetra:
1 n
x i x 3
n
a x i 1
S x 3
GEOESTADSTICA
1 n
x i x 3 f i
n
a x i 1
S x 3
SEGUNDO CICLO
Pgin
a
121
Ejercicio de Aplicacin
La altura de las 30 cascadas ms altas del mundo expresada en pies se detalla
a continuacin:
1112 1200 - 1230 1280 1259 1304 1325 1340 1476 1400
1476 1400 - 1500 1540 1612 1650 1600 1787 1841 1904 2000
2154 2120 2121- 2200 2415 2540 2625 - 3110 - 3212
GEOESTADSTICA
SEGUNDO CICLO
2.
Pgin
a
122
BIBLIOGRAFA.
FANTONI, Camba Hctor Curso de Estadstica General (Anlisis
Metodolgico). Segunda Edicin. 1975 Guayaquil- Ecuador.. Tomo I., 168
Pgs.
HABER,
Runyon.
Estadstica
General.
1986.
Addison-Wesley.
GEOESTADSTICA
SEGUNDO CICLO
GEOESTADSTICA
Pgin
a
123
SEGUNDO CICLO